MC, 2025

Scikit Learn Tutorial: Komencante kun Maŝina Lernado

Ĉu vi estas komencanto en la kampo de maŝina lernado? Se jes, Scikit Learn estas la perfekta ilo por komenci. En ĉi tiu artikolo, ni esploros la fundamentajn konceptojn de Scikit Learn, unu el la plej popularaj bibliotekoj por maŝina lernado en Python. Ni ankaŭ montras kelkajn konkretajn ekzemplojn, kiuj helpos vin kompreni kiel uzi Scikit Learn en viaj propraj projektoj.

Kio Estas Scikit Learn?

Scikit Learn estas malfermfonteca Python-biblioteko, kiu ofertas al vi potencon por apliki multajn metodojn de maŝina lernado, ekde regresoj ĝis klasifikado, kaj eĉ klastrigo. Ĝi estas unu el la plej uzataj bibliotekoj en la kampo de datenanalizo, pro sia facileco de uzado kaj amplekso de la subtenataj algoritmoj. Scikit Learn estas perfekta por komencantoj kaj spertuloj egale.

Kial Uzi Scikit Learn?

Scikit Learn estas tre populara inter datenanalistoj kaj programistoj de maŝina lernado pro sia simpla interfacado kaj potenca funkcioj. Ĝi subtenas plurajn metodojn de maŝina lernado, kiel klasifikado, regresoj, klastrigo, kaj aliaj teknikoj por analizo de datenoj. Eĉ se vi estas komencanto, vi povos rapide lerni kiel apliki maŝinan lernadon per Scikit Learn.

Kiel Instali Scikit Learn?

Se vi volas uzi Scikit Learn, la unua paŝo estas instali ĝin. Ĉi tio estas tre facila uzante Python-paketilojn kiel pip. Por instali Scikit Learn, malfermu la terminalon kaj tajpu la sekvan komandon:

pip install scikit-learn

Post kiam la instalado estas finita, vi povas komenci uzi la bibliotekon en viaj Python-programoj!

Unua Ekzemplo: Linia Regreso

Ni komencu kun unu el la plej simplaj teknikoj en maŝina lernado – linia regreso. Ĉi tiu metodo estas uzata kiam ni volas prognozi kontinuan valoron, kiel ekzemple prognozi la prezon de domo bazita sur ĝia areo. Jen kiel vi povas fari tion per Scikit Learn:

import numpy as np
from sklearn.linear_model import LinearRegression

# Ekzemplaj datumoj
X = np.array([[1], [2], [3], [4], [5]])  # Eniraj valoroj (ekz. areo de domo)
y = np.array([1, 2, 3, 4, 5])  # Izu la saman valoron kiel la celo (prezo)

# Kreu modelon de linia regreso
model = LinearRegression()

# Trejni la modelon
model.fit(X, y)

# Faru prognozon
predikto = model.predict([[6]])
print("Prognozita valoro por 6:", predikto)

En ĉi tiu ekzemplo, ni uzas Scikit Learn por trejni modelon de linia regreso kun simplaj datumoj. La modelo lernas de la eniraj valoroj (kiel la areo de domo) kaj la celoj (kiel la prezo), kaj poste ni povas fari prognozon por nova datumero (en ĉi tiu kazo, la areo estas 6).

Ekzemplo 2: Klasifikado uzante k-Naj Ĉefaj Viroj

La klasifikado estas alia grava tasko en maŝina lernado, kie ni volas aligi datumojn al unu el pluraj kategorioj. Ekzemple, ni povas uzi klasifikadon por determini, ĉu retpoŝto estas spamo aŭ ne. Unu el la plej popularaj algoritmoj por klasifikado estas k-Naj Ĉefaj Viroj (k-Nearest Neighbors, k-NN). Jen kiel apliki k-NN en Scikit Learn:

from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_iris
from sklearn.metrics import accuracy_score

# Akiri la irisajn datumojn (ampleksa dataset por klasifikado)
data = load_iris()
X = data.data
y = data.target

# Dividi la datumojn en trejnan kaj testan grupon
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)

# Kreu kaj trejni k-NN modelon
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train, y_train)

# Faru prognozon
y_pred = knn.predict(X_test)

# Mezuri la precizecon
print("Precizeco:", accuracy_score(y_test, y_pred))

En ĉi tiu ekzemplo, ni uzas la irisajn datumojn, kiuj estas tre popularaj por klasifikado. La KNeighborsClassifier estas uzata por krei modelon, kiu povas klasifiki la speciojn de floroj. Ni dividas la datumojn en trejnan kaj testan seton, trejnas la modelon kaj poste mezuras ĝian precizecon per la testaj datumoj.

Ekzemplo 3: Klastrigo uzante K-Means

Klastrigo estas alia grava tasko en maŝina lernado, kiu estas uzata por grupigi similajn datumojn en "klastroj". Unu el la plej popularaj algoritmoj por klastrigo estas K-Means. Jen kiel uzi ĝin en Scikit Learn:

from sklearn.cluster import KMeans
import numpy as np

# Kreu randomajn datumojn
X = np.random.rand(100, 2)

# Klastrigi datumojn uzante K-Means
kmeans = KMeans(n_clusters=3)
kmeans.fit(X)

# Akiri la klastrojn
print("Klastroj:", kmeans.labels_)

En ĉi tiu ekzemplo, ni generas randomajn datumojn kaj aplikas la KMeans metodon por dividi ilin en 3 klastrojn. K-Means troviĝas tre utile kiam ni volas grupigi similajn datumojn, ekzemple, por klienta segmentado aŭ analizo de ŝablonoj en datumoj.

Finaj Pensoj pri Scikit Learn

Scikit Learn estas tre potenca ilo, kiu povas helpi vin en multaj aspektoj de maŝina lernado. Ĉu vi laboras kun regresoj, klasifikado, aŭ klastrigo, Scikit Learn ofertas facilan kaj efikan solvon. Ni esperas, ke ĉi tiu tutorialo kun ekzemploj helpis vin kompreni kiel uzi Scikit Learn por solvi realajn problemojn. Se vi estas komencanto, ni rekomendas komenci per simplaj problemoj kaj daŭrigi progresi al pli kompleksaj teknikoj.

Przeczytaj również, bo warto!