ML Algoritmaları

Veri Bilimi ve Yapay Zeka için Kapsamlı Başucu Rehberi

Algoritma	Tür	En İyi Kullanım	Mantık / Formül	Artıları (+)	Eksileri (-)	Gerçek Örnek
Lineer RegresyonRegresyon	Gözetimli	Sürekli değer tahmini	`Y = b0 + b1X + …`	Basit ve hızlı Yorumlanabilir Matematiksel temel	Aykırı değerlere hassas Sadece doğrusal ilişkiler	Ev fiyatı, Maaş tahmini
Lojistik RegresyonSınıflandırma	Gözetimli	İkili (Binary) Sınıflandırma	`Sigmoid Fonksiyonu`	Olasılık verir Uygulaması kolay	Doğrusal olmayan sınırda zayıf Çoklu sınıf zordur	Spam / Spam Değil
KNN (K-En Yakın Komşu)Sınıflandırma	Gözetimli	Benzerlik bazlı tahmin	`Öklid / Manhattan Mesafesi`	Eğitim süresi yok (Lazy) Basit mantık	Büyük veride yavaş Hafıza maliyeti yüksek	Öneri sistemleri
SVM (Destek Vektör)Sınıflandırma	Gözetimli	Net ayrım gerektiren veriler	`Maksimum Marjin (Hyperplane)`	Yüksek boyutlu veride etkili Sağlam (Robust)	Büyük veri setinde yavaş Parametre ayarı zor	Yüz tanıma, Metin kategorisi
Naive BayesOlasılık	Gözetimli	Metin sınıflandırma	`P(A\|B) = P(B\|A)P(A)/P(B)`	Çok hızlı Az veriyle çalışabilir Metinde başarılı	Özellikleri bağımsız varsayar Gerçek hayatta nadir	Duygu analizi, Haber sınıflandırma
Karar Ağacı (Decision Tree)Ağaç	Gözetimli	Karar destek sistemleri	`Entropy / Gini İndeksi`	Görselleştirilebilir Veri hazırlığı az	Aşırı öğrenme (Overfitting) Kararsız yapı	Kredi onayı, Tıbbi teşhis
Rastgele Orman (RF)Ensemble	Gözetimli	Genel amaçlı yüksek doğruluk	`Bagging + Çoklu Ağaç`	Yüksek başarı Overfitting'e dirençli	Yavaş eğitim Yorumlaması zor (Blackbox)	Müşteri kaybı (Churn), Risk analizi
Gradient Boosting (XGBoost)Ensemble	Gözetimli	Kaggle yarışmaları, Tabular veri	`Hata düzeltme odaklı ağaçlar`	Çok yüksek performans Hızlı (XGBoost)	Parametre ayarı zor Gürültüye hassas	Arama sıralaması, Sigorta riski
K-MeansKümeleme	Gözetimsiz	Veriyi gruplara ayırma	`Merkezlere uzaklık minimizasyonu`	Hızlı ve ölçeklenebilir Uygulaması basit	K sayısını seçmek zor Başlangıca duyarlı	Müşteri segmentasyonu
PCABoyut İndirgeme	Gözetimsiz	Veri görselleştirme, Sıkıştırma	`Varyans maksimizasyonu`	Boyutu azaltır Gürültüyü temizler	Veri kaybı olabilir Yorumlaması zorlaşır	Genetik veri analizi
Yapay Sinir Ağları (MLP)Derin Öğrenme	Gözetimli	Karmaşık, doğrusal olmayan veri	`Ağırlık * Girdi + Bias`	Evrensel öğrenici Yüksek kapasite	Çok veri ister Kara kutu (Anlaşılamaz)	El yazısı tanıma
CNN (Konvolüsyonel)Derin Öğrenme	Gözetimli	Görüntü ve Video işleme	`Konvolüsyon + Havuzlama`	Görüntüde SOTA Özellik çıkarımı otomatik	Yüksek donanım (GPU) Eğitim süresi	Otonom araç, MR analizi
RNN / LSTMDerin Öğrenme	Gözetimli	Zaman serisi, Metin	`Hafıza hücreleri`	Sıralı veriyi anlar Bağlamı korur	Unutkanlık sorunu Eğitimi yavaş	Borsa tahmini, Çeviri
Transformer (BERT/GPT)Derin Öğrenme	Gözetimli	NLP, Gen AI	`Self-Attention (Dikkat)`	Paralel işleme Sonsuz bağlam (teorik)	Muazzam maliyet Devasa veri ihtiyacı	ChatGPT, Gemini, Asistanlar
AutoencodersDerin Öğrenme	Gözetimsiz	Anomali tespiti	`Encoder -> Latent -> Decoder`	Etiketsiz öğrenme Gürültü silme	Kayıplı çıktı Eğitim dengesi zor	Siber saldırı tespiti
Hiyerarşik KümelemeKümeleme	Gözetimsiz	Hiyerarşi gerektiren gruplar	`Dendrogram yapısı`	K değerine gerek yok Görselleştirilebilir	Bellek ve işlem gücü yoğun	Genetik taksonomi

Lineer Regresyon

Regresyon

Gözetimli

Kullanım:Sürekli değer tahmini

Mantık:Y = b0 + b1X + …

Örnek:Ev fiyatı, Maaş tahmini

Artılar

+Basit ve hızlı
+Yorumlanabilir
+Matematiksel temel

Eksiler

-Aykırı değerlere hassas
-Sadece doğrusal ilişkiler

Lojistik Regresyon

Sınıflandırma

Gözetimli

Kullanım:İkili (Binary) Sınıflandırma

Mantık:Sigmoid Fonksiyonu

Örnek:Spam / Spam Değil

Artılar

+Olasılık verir
+Uygulaması kolay

Eksiler

-Doğrusal olmayan sınırda zayıf
-Çoklu sınıf zordur

KNN (K-En Yakın Komşu)

Sınıflandırma

Gözetimli

Kullanım:Benzerlik bazlı tahmin

Mantık:Öklid / Manhattan Mesafesi

Örnek:Öneri sistemleri

Artılar

+Eğitim süresi yok (Lazy)
+Basit mantık

Eksiler

-Büyük veride yavaş
-Hafıza maliyeti yüksek

SVM (Destek Vektör)

Sınıflandırma

Gözetimli

Kullanım:Net ayrım gerektiren veriler

Mantık:Maksimum Marjin (Hyperplane)

Örnek:Yüz tanıma, Metin kategorisi

Artılar

+Yüksek boyutlu veride etkili
+Sağlam (Robust)

Eksiler

-Büyük veri setinde yavaş
-Parametre ayarı zor

Naive Bayes

Olasılık

Gözetimli

Kullanım:Metin sınıflandırma

Mantık:P(A|B) = P(B|A)P(A)/P(B)

Örnek:Duygu analizi, Haber sınıflandırma

Artılar

+Çok hızlı
+Az veriyle çalışabilir
+Metinde başarılı

Eksiler

-Özellikleri bağımsız varsayar
-Gerçek hayatta nadir

Karar Ağacı (Decision Tree)

Ağaç

Gözetimli

Kullanım:Karar destek sistemleri

Mantık:Entropy / Gini İndeksi

Örnek:Kredi onayı, Tıbbi teşhis

Artılar

+Görselleştirilebilir
+Veri hazırlığı az

Eksiler

-Aşırı öğrenme (Overfitting)
-Kararsız yapı

Rastgele Orman (RF)

Ensemble

Gözetimli

Kullanım:Genel amaçlı yüksek doğruluk

Mantık:Bagging + Çoklu Ağaç

Örnek:Müşteri kaybı (Churn), Risk analizi

Artılar

+Yüksek başarı
+Overfitting'e dirençli

Eksiler

-Yavaş eğitim
-Yorumlaması zor (Blackbox)

Gradient Boosting (XGBoost)

Ensemble

Gözetimli

Kullanım:Kaggle yarışmaları, Tabular veri

Mantık:Hata düzeltme odaklı ağaçlar

Örnek:Arama sıralaması, Sigorta riski

Artılar

+Çok yüksek performans
+Hızlı (XGBoost)

Eksiler

-Parametre ayarı zor
-Gürültüye hassas

K-Means

Kümeleme

Gözetimsiz

Kullanım:Veriyi gruplara ayırma

Mantık:Merkezlere uzaklık minimizasyonu

Örnek:Müşteri segmentasyonu

Artılar

+Hızlı ve ölçeklenebilir
+Uygulaması basit

Eksiler

-K sayısını seçmek zor
-Başlangıca duyarlı

PCA

Boyut İndirgeme

Gözetimsiz

Kullanım:Veri görselleştirme, Sıkıştırma

Mantık:Varyans maksimizasyonu

Örnek:Genetik veri analizi

Artılar

+Boyutu azaltır
+Gürültüyü temizler

Eksiler

-Veri kaybı olabilir
-Yorumlaması zorlaşır

Yapay Sinir Ağları (MLP)

Derin Öğrenme

Gözetimli

Kullanım:Karmaşık, doğrusal olmayan veri

Mantık:Ağırlık * Girdi + Bias

Örnek:El yazısı tanıma

Artılar

+Evrensel öğrenici
+Yüksek kapasite

Eksiler

-Çok veri ister
-Kara kutu (Anlaşılamaz)

CNN (Konvolüsyonel)

Derin Öğrenme

Gözetimli

Kullanım:Görüntü ve Video işleme

Mantık:Konvolüsyon + Havuzlama

Örnek:Otonom araç, MR analizi

Artılar

+Görüntüde SOTA
+Özellik çıkarımı otomatik

Eksiler

-Yüksek donanım (GPU)
-Eğitim süresi

RNN / LSTM

Derin Öğrenme

Gözetimli

Kullanım:Zaman serisi, Metin

Mantık:Hafıza hücreleri

Örnek:Borsa tahmini, Çeviri

Artılar

+Sıralı veriyi anlar
+Bağlamı korur

Eksiler

-Unutkanlık sorunu
-Eğitimi yavaş

Transformer (BERT/GPT)

Derin Öğrenme

Gözetimli

Kullanım:NLP, Gen AI

Mantık:Self-Attention (Dikkat)

Örnek:ChatGPT, Gemini, Asistanlar

Artılar

+Paralel işleme
+Sonsuz bağlam (teorik)

Eksiler

-Muazzam maliyet
-Devasa veri ihtiyacı

Autoencoders

Derin Öğrenme

Gözetimsiz

Kullanım:Anomali tespiti

Mantık:Encoder -> Latent -> Decoder

Örnek:Siber saldırı tespiti

Artılar

+Etiketsiz öğrenme
+Gürültü silme

Eksiler

-Kayıplı çıktı
-Eğitim dengesi zor

Hiyerarşik Kümeleme

Kümeleme

Gözetimsiz

Kullanım:Hiyerarşi gerektiren gruplar

Mantık:Dendrogram yapısı

Örnek:Genetik taksonomi

Artılar

+K değerine gerek yok
+Görselleştirilebilir

Eksiler

-Bellek ve işlem gücü yoğun