Regresyon Nedir?
Makine öğrenmesinde üretilen çıktılar kategorik ise sınıflandırma (classification) ,nümerik ise regresyon (regression) denir.Regresyon bağımsız ve bağımlı değişkenler arasındaki ilişkiyi matematiksel olarak ifade etmemize yarayan bir istatiksel ölçümdür. Günlük hayatımızdan örnek verirsek su faturasına her sene %10 zam geldiğini düşenelim .Bu orana göre ilerleyen yıllardaki su faturasının fiyatını tahmin etmek mümkündür.Regresyon, geçmişteki verileri kullanarak gelecekteki durumları ön görmemize yarar.
Regresyonun çeşitleri vardır. Aşağıda görülmektedir.
- Lineer Regresyon
- Polynomial Regresyon
- Logistic Regresyon
- Ridge Regresyon
- Lasso Regresyon
- ElasticNet Regresyon
Lineer regresyonu birlikte inceleyelim.
Lineer Regresyon
Verileri sürekli devam eden iki değişkenin arasındaki ilişkiyi düz bir çizgiyle ifade eden regresyon çeşididir.Kare hata maliyeti işlevi kullanılarak hesaplanır.Basit lineer regresyon ve çoklu lineer regresyon olarak ikiye ayrılır.
Basit Lineer Regresyon (Doğrusal Regresyon):
Bir bağımlı ve bir bağımsız değişkenin arasında doğrusal bir oranın bulunduğu regresyon türüdür.
Çoklu Lineer Regresyon :
Birden fazla bağımsız değişkenin farklı oranlarda etki etmesine bağlı olan ve bağımlı değişkenle doğrusal bir oranın hesaplanmasını sağlayan yöntemdir.
Basit liner regresyon ve çoklu liner regresyonun formülleri aşağıda görülmektedir.
Fotoğrafta da görüldüğü gibi basit regresyonda bir bağımlı değişken ,bir bağımsız değişken yer almaktadır. Çoklu lineer regresyonda ise farklı oranlarda etki edebilen bağımsız değişkenler bulunmaktadır.
Kare Hata Maliyeti İşlevi:
Lineer regresyonun temel kavramıdır.Makinenin tahmin ettiği değer ile test setinde bulunan gerçek değer arasındaki uzaklık farkını hesaplayarak doğrusal çizgiyi en uygun şekilde çizmemizi sağlar. Hata değerlerinin toplamını minimize eder.
Pythonda lineer regresyon için örnek uygulamalar aşağıda görülmektedir.
Basit lineer regresyon için:
Çalışma saatlerine bağlı olarak başarı yüzdeleri tahmin edilmiştir.
Çoklu lineer regresyon için:
Çoklu lineer regresyonda ,48 Amerika eyaletindeki benzin tüketiminin; benzin vergisine,asfalt yola,ehliyete sahip nüfusa,kişi başı gelire bağlı gerçek ve tahmini değişkenleri verilmiştir.
Diğer regresyon türlerini ilerleyen yazılarımızda inceleyeceğiz.