Makine öğrenmesi, bir bilgisayarın verilen bir veri kümesine dayanarak öğrenmesi demekti. Farklı şekillerde öğrenme gerçekleşebilr, veri kümesine göre denetimli, denetimsiz veya yarı denetimli olabilir.
Denetimli öğrenme, veri kümesine eşlik eden etiketler veya çıktılar ile beraber verilmektedir. Örneğin, bir makine öğrenme modeli veri kümesindeki resimlerin etiketlerine göre öğrenir ve bunların hangi sınıflara ait olduğunu tahmin etmeye çalışır. Denetimli öğrenme, sınıflandırma ve regresyon gibi problemleri çözmek için kullanılır.
Denetimsiz öğrenme ise veri kümesine eşlik eden etiketler veya çıktılar olmadan verilir. Örneğin, bir denetimsiz öğrenme modeli, veri kümesindeki müşteri verilerini inceleyerek, müşterilerin hangi özelliklere sahip olduğunu ve hangi özelliklerin benzer olduğunu tahmin etmeye çalışır. Denetimsiz öğrenme, kümeleme gibi problem türlerinde tercih edilmektedir.
Yarı denetimli öğrenme ise veri kümesine eşlik eden bazı etiketler veya hedeflerle birlikte verilir. Örneğin, bir yarı denetimli öğrenme modeli, veri kümesindeki resimlerin bazılarının etiketlerine sahip olur ve diğerlerinin etiketlerini öğrenmeye çalışır. Yarı denetimli öğrenme, veri kümesinde yeterli etiket olmayan durumlarda kullanılır.
Denetimli öğrenme için Python dilinde bir örnek yapalım. Örnek olarak, veri kümesinde kişilerin yaşlarını tahmin etmeyi amaçlayalım.
İlk olarak, gerekli kütüphaneleri içe aktaralım:
import numpy as np
import pandas as pd
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
Daha sonra, veri kümemizi okuyalım ve eğitim verilerimizi ayıralım:
# veri kümemizi okuyalım
df = pd.read_csv('age_data.csv')
# eğitim verilerimizi ayıralım
X = df[['height', 'weight']]
y = df['age']
# verilerimizi eğitim ve test olarak ayıralım
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
Verilerimizi ayırdıktan sonra, bir doğrusal regresyon modeli oluşturalım ve modelimizi eğitelim:
# doğrusal regresyon modeli oluşturalım
model = LinearRegression()
# modelimizi eğitelim
model.fit(X_train, y_train)
Modelimizi eğittikten sonra, test verilerimizi kullanarak modelimizin performansına bakalım:
# test verilerimizi kullanarak tahminler yapalım
y_pred = model.predict(X_test)
# tahminlerimizin doğruluğunu ölçelim
accuracy = model.score(X_test, y_test)
print('Accuracy:', accuracy)
Bu şekilde, Python dilinde denetimli öğrenme için bir doğrusal regresyon modeli oluşturarak ve modelimizi eğittik Modelimizin performansını ölçtük.