Zaawansowana analiza danych w języku Python

Szkolenie stanowi kontynuację kursu „Podstawy analizy danych” i przeznaczone jest dla osób chcących poznać zaawansowane metody analizy danych ze szczególnym uwzględnieniem wizualizacji oraz analizy statystycznej.

Uczestnicy rozwiną dalsze umiejętności prezentacji danych z użyciem pakietu Seaborn oraz zaznajomią się z narzędziem do interaktywnej wizualizacji danych – pakietem Bokeh. Poznają podstawy prawdopodobieństwa, statystyki oraz wnioskowania statystycznego. Kursanci nauczą się przeprowadzać symulacje losowe oraz testować hipotezy pozwalające określić, czy występujące w populacjach różnice są istotne statystycznie.

Sprawdź również:

Podstawy analizy danych w Pythonie

Wprowadzenie do uczenia maszynowego

Dla kogo?

Szkolenie przeznaczone jest dla osób chcących poznać zaawansowane metody analizy danych ze szczególnym uwzględnieniem wizualizacji oraz analizy statystycznej.

Cele i korzyści

Dzięki udziałowi w szkoleniu uczestnicy:

Rozwiną dalsze umiejętności prezentacji danych z użyciem pakietu Seaborn.
Zaznajomią się z narzędziem do interaktywnej wizualizacji danych – pakietem Bokeh.
Poznają podstawy prawdopodobieństwa, statystyki oraz wnioskowania statystycznego.
Nauczą się przeprowadzać symulacje losowe.
Nauczą się testować hipotezy pozwalające określić, czy występujące w populacjach różnice są istotne statystycznie.

Oczekiwana wiedza wstępna:

Podstawowa znajomość języka Python i środowiska PyCharm oraz pakietów NumPy, pandas oraz Matplotlib.

Program

Zaawansowana wizualizacja danych

Bokeh

Interaktywna wizualizacja
Konfiguracja wyglądu
Wykres liniowy
Wykres rozrzutu
Suwaki i przyciski

Seaborn

Heatmap
Pair plot
Swarm plot
Box plot

Podstawy prawdopodobieństwa i statystyki

Prawdopodobieństwo
Korelacja danych
Rozkład ciągły i dyskretny
Gęstość prawdopodobieństwa
Funkcja masy prawdopodobieństwa
Rozkład standardowy
Centralne twierdzenie graniczne
Reguła 3 sigm

Wnioskowanie statystyczne

Liczby pseudolosowe
Symulacje losowe
p-value
Estymacja punktowa
Estymacja przedziałowa
Bootstrapowy przedział ufności
Metoda Monte Carlo
Testowanie hipotez
Test równości średnich
Test równości proporcji
Test normalności rozkładu

Trenerzy

Stanisław Kaźmierczak - asystent i doktorant Politechniki Warszawskiej w obszarze uczenia maszynowego/data science. Prowadzi zajęcia i szkolenia z obszaru analizy danych, sieci neuronowych, głębokiego uczenia oraz szeroko rozumianej sztucznej inteligencji.