Uygulamalı örnek: Python ile adım adım spam mail sınıflandırıcı yapımı

Artık teoriyi biliyorsun ama gerçek bir AI projesi nasıl yapılır? Bu yazıda sıfırdan bir spam mail sınıflandırıcı geliştirerek makine öğrenmesi sürecini uçtan uca göreceksin. Veri hazırlamadan model eğitmeye, metriklerle değerlendirmeden sonuç üretmeye kadar her adımı basit ve anlaşılır şekilde uygulayacağız.

Problem: Spam mi, değil mi?

E-posta kutunu düşün. Bazı mailler gerçekten önemliyken bazıları tamamen gereksiz (spam).

Bizim amacımız: Bir mailin spam olup olmadığını otomatik tahmin eden model yapmak Bu bir classification (sınıflandırma) problemidir.

Adım 1: Veri seti

Basit bir veri seti oluşturalım:

import pandas as pd

data = {

"text": [

"Kazandınız! Hemen tıklayın",

"Toplantı saat 3'te",

"Bedava hediye kazandınız",

"Yarın görüşelim",

"Şok indirim fırsatı",

"Proje dosyasını gönderiyorum"

"label": [1, 0, 1, 0, 1, 0] # 1 = spam, 0 = normal

}

df = pd.DataFrame(data)

Adım 2: Metni sayıya çevirme (TF-IDF)

Makine metni anlayamaz, sayıya çevirmemiz gerekir:

from sklearn.feature_extraction.text import TfidfVectorizer

vectorizer = TfidfVectorizer()

X = vectorizer.fit_transform(df["text"])

y = df["label"]

Adım 3: Train-Test split

Modeli doğru test etmek için veriyi bölelim:

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(

X, y, test_size=0.3, random_state=42

)

Adım 4: Model oluşturma ve eğitme

Basit ve güçlü bir model kullanalım:

from sklearn.naive_bayes import MultinomialNB

model = MultinomialNB()

model.fit(X_train, y_train)

Adım 5: Tahmin ve değerlendirme

from sklearn.metrics import accuracy_score

y_pred = model.predict(X_test)

print("Accuracy:", accuracy_score(y_test, y_pred))

İstersen burada:

precision
recall da ekleyebilirsin

Adım 6: Gerçek kullanım

Artık modeli kullanabiliriz:

yeni_mail = ["Bedava iPhone kazandınız"]

yeni_X = vectorizer.transform(yeni_mail)

tahmin = model.predict(yeni_X)

print("Spam" if tahmin[0] == 1 else "Normal")

Bu projede ne öğrendin?

Metin verisi nasıl işlenir
Feature engineering (TF-IDF)
Model eğitme
Model değerlendirme
Gerçek tahmin yapma

Yani aslında küçük ama tam bir AI pipeline kurdun.

Bu proje basit bir örnek ama mantık aynıdır:

Gmail spam filtresi
Sosyal medya yorum analizi
Sahte mesaj tespiti

Hepsi benzer pipeline ile çalışır.

Uygulamalı örnek: Python ile adım adım spam mail sınıflandırıcı yapımı

Yazan

Ertan Dağdelen

Bu yazıyı paylaş

Diğer Yazılar

Uygulamalı örnek: Python ile ev fiyat tahmini modeli geliştirme

Doğru model hangisi: Basit mi, derin mi?

AI Projelerinde Görselleştirme Neden Önemlidir? Veriyi Görmeden Model Kurmayın