Veri Bilimi ve Yapay Zeka için Kapsamlı Başucu Rehberi
| Algoritma | Tür | En İyi Kullanım | Mantık / Formül | Artıları (+) | Eksileri (-) | Gerçek Örnek |
|---|---|---|---|---|---|---|
Lineer RegresyonRegresyon | Gözetimli | Sürekli değer tahmini | Y = b0 + b1X + … | Basit ve hızlı Yorumlanabilir Matematiksel temel | Aykırı değerlere hassas Sadece doğrusal ilişkiler | Ev fiyatı, Maaş tahmini |
Lojistik RegresyonSınıflandırma | Gözetimli | İkili (Binary) Sınıflandırma | Sigmoid Fonksiyonu | Olasılık verir Uygulaması kolay | Doğrusal olmayan sınırda zayıf Çoklu sınıf zordur | Spam / Spam Değil |
KNN (K-En Yakın Komşu)Sınıflandırma | Gözetimli | Benzerlik bazlı tahmin | Öklid / Manhattan Mesafesi | Eğitim süresi yok (Lazy) Basit mantık | Büyük veride yavaş Hafıza maliyeti yüksek | Öneri sistemleri |
SVM (Destek Vektör)Sınıflandırma | Gözetimli | Net ayrım gerektiren veriler | Maksimum Marjin (Hyperplane) | Yüksek boyutlu veride etkili Sağlam (Robust) | Büyük veri setinde yavaş Parametre ayarı zor | Yüz tanıma, Metin kategorisi |
Naive BayesOlasılık | Gözetimli | Metin sınıflandırma | P(A|B) = P(B|A)P(A)/P(B) | Çok hızlı Az veriyle çalışabilir Metinde başarılı | Özellikleri bağımsız varsayar Gerçek hayatta nadir | Duygu analizi, Haber sınıflandırma |
Karar Ağacı (Decision Tree)Ağaç | Gözetimli | Karar destek sistemleri | Entropy / Gini İndeksi | Görselleştirilebilir Veri hazırlığı az | Aşırı öğrenme (Overfitting) Kararsız yapı | Kredi onayı, Tıbbi teşhis |
Rastgele Orman (RF)Ensemble | Gözetimli | Genel amaçlı yüksek doğruluk | Bagging + Çoklu Ağaç | Yüksek başarı Overfitting'e dirençli | Yavaş eğitim Yorumlaması zor (Blackbox) | Müşteri kaybı (Churn), Risk analizi |
Gradient Boosting (XGBoost)Ensemble | Gözetimli | Kaggle yarışmaları, Tabular veri | Hata düzeltme odaklı ağaçlar | Çok yüksek performans Hızlı (XGBoost) | Parametre ayarı zor Gürültüye hassas | Arama sıralaması, Sigorta riski |
K-MeansKümeleme | Gözetimsiz | Veriyi gruplara ayırma | Merkezlere uzaklık minimizasyonu | Hızlı ve ölçeklenebilir Uygulaması basit | K sayısını seçmek zor Başlangıca duyarlı | Müşteri segmentasyonu |
PCABoyut İndirgeme | Gözetimsiz | Veri görselleştirme, Sıkıştırma | Varyans maksimizasyonu | Boyutu azaltır Gürültüyü temizler | Veri kaybı olabilir Yorumlaması zorlaşır | Genetik veri analizi |
Yapay Sinir Ağları (MLP)Derin Öğrenme | Gözetimli | Karmaşık, doğrusal olmayan veri | Ağırlık * Girdi + Bias | Evrensel öğrenici Yüksek kapasite | Çok veri ister Kara kutu (Anlaşılamaz) | El yazısı tanıma |
CNN (Konvolüsyonel)Derin Öğrenme | Gözetimli | Görüntü ve Video işleme | Konvolüsyon + Havuzlama | Görüntüde SOTA Özellik çıkarımı otomatik | Yüksek donanım (GPU) Eğitim süresi | Otonom araç, MR analizi |
RNN / LSTMDerin Öğrenme | Gözetimli | Zaman serisi, Metin | Hafıza hücreleri | Sıralı veriyi anlar Bağlamı korur | Unutkanlık sorunu Eğitimi yavaş | Borsa tahmini, Çeviri |
Transformer (BERT/GPT)Derin Öğrenme | Gözetimli | NLP, Gen AI | Self-Attention (Dikkat) | Paralel işleme Sonsuz bağlam (teorik) | Muazzam maliyet Devasa veri ihtiyacı | ChatGPT, Gemini, Asistanlar |
AutoencodersDerin Öğrenme | Gözetimsiz | Anomali tespiti | Encoder -> Latent -> Decoder | Etiketsiz öğrenme Gürültü silme | Kayıplı çıktı Eğitim dengesi zor | Siber saldırı tespiti |
Hiyerarşik KümelemeKümeleme | Gözetimsiz | Hiyerarşi gerektiren gruplar | Dendrogram yapısı | K değerine gerek yok Görselleştirilebilir | Bellek ve işlem gücü yoğun | Genetik taksonomi |
Y = b0 + b1X + …Sigmoid FonksiyonuÖklid / Manhattan MesafesiMaksimum Marjin (Hyperplane)P(A|B) = P(B|A)P(A)/P(B)Entropy / Gini İndeksiBagging + Çoklu AğaçHata düzeltme odaklı ağaçlarMerkezlere uzaklık minimizasyonuVaryans maksimizasyonuAğırlık * Girdi + BiasKonvolüsyon + HavuzlamaHafıza hücreleriSelf-Attention (Dikkat)Encoder -> Latent -> DecoderDendrogram yapısı