Wprowadzenie do uczenia maszynowego
Szkolenie przeznaczone jest dla osób chcących poznać podstawy uczenia maszynowego – machine learning (ML). Omawiane zagadnienia przeplatane są ćwiczeniami, w których kursanci implementują poznane metody ML przy użyciu środowiska scikit-learn.
Sprawdź również:
Podstawy analizy danych w Pythonie
Zaawansowana analiza danych w języku Python
Szkolenie przeznaczone jest dla osób chcących poznać podstawy uczenia maszynowego – machine learning (ML).
Dzięki udziałowi w szkoleniu uczestnicy:
- Poznają podstawy uczenia maszynowego — machine learning (ML)
- Nauczą się implementować poznane metody ML przy użyciu środowiska scikit-learn
Oczekiwana wiedza wstępna:
- Podstawowa znajomość statystyki, języka Python i środowiska PyCharm oraz pakietów NumPy, pandas oraz Matplotlib
Podstawy ML
- Definicja ML
- ML a sztuczna inteligencja
- Obszary zastosowania ML
- Kompetencje w ML
- Cechy/instancje/etykiety/zmienna predykowana
- Klasyfikacja, regresja, klasteryzacja
- Rodzaje ML
- Trening, predykcja, ewaluacja
- Podział na zbiór treningowy i testowy
- Regresja liniowa
- Regresja logistyczna
- Algorytm a model
- Spojrzenie procesowe na ML
- Biblioteki do ML
Wprowadzenie praktyczne
- Przegląd podstawowej funkcjonalności środowiska PyCharm
- Podstawy pakietu NumPy
- Podstawy pakietu pandas
- Podstawy pakietu Matplotlib
- „Hello world” ML, czyli klasyfikacja irysów
Przygotowanie danych
- Problemy z danymi
- Podstawy eksploracji i wizualizacji danych
- Rodzaje cech
- Kodowanie cech
- Standaryzacja i skalowanie cech
- Reguła 3 sigm
- Braki w danych
- Selekcja cech/redukcja wymiarowości
Wybrane zagadnienia ML
- Ocena jakości modelu
- Problem przeuczenia (overfitting) i niedouczenia (underfitting)
- Losowość i odtwarzalność w ML
- Kroswalidacja
- Parametry a hiperparametry
- Optymalizacja hiperparametrów
Klasyczne algorytmy ML
- Taksonomia algorytmów ML
- Algorytm K najbliższych sąsiadów
- Drzewa decyzyjne
- Zespoły modeli (ensembling)
- Lasy losowe
- Klasyfikacja wieloklasowa i wieloetykietowa
- Klasteryzacja: algorytm k-średnich
Podstawy sztucznych sieci neuronowych
- Motywacja i inspiracja biologiczna
- Model neuronu
- Funkcje aktywacji
- Perceptron wielowarstwowy – architektura
- Perceptron wielowarstwowy – działanie
- Perceptron wielowarstwowy – uczenie (propagacja wsteczna)
- Kodowanie obrazu
- Uczenie batchowe
- Rodzaje sieci neuronowych
- Interpretowalność modelu
- Dalsze kierunki kształcenia
- Podsumowanie szkolenia: pytania/komentarze/dyskusja
Stanisław Kaźmierczak - asystent i doktorant Politechniki Warszawskiej w obszarze uczenia maszynowego/data science. Prowadzi zajęcia i szkolenia z obszaru analizy danych, sieci neuronowych, głębokiego uczenia oraz szeroko rozumianej sztucznej inteligencji.