Zaawansowana analiza danych w języku Python
Szkolenie stanowi kontynuację kursu „Podstawy analizy danych” i przeznaczone jest dla osób chcących poznać zaawansowane metody analizy danych ze szczególnym uwzględnieniem wizualizacji oraz analizy statystycznej.
Uczestnicy rozwiną dalsze umiejętności prezentacji danych z użyciem pakietu Seaborn oraz zaznajomią się z narzędziem do interaktywnej wizualizacji danych – pakietem Bokeh. Poznają podstawy prawdopodobieństwa, statystyki oraz wnioskowania statystycznego. Kursanci nauczą się przeprowadzać symulacje losowe oraz testować hipotezy pozwalające określić, czy występujące w populacjach różnice są istotne statystycznie.
Sprawdź również:
Podstawy analizy danych w Pythonie
Wprowadzenie do uczenia maszynowego
Szkolenie przeznaczone jest dla osób chcących poznać zaawansowane metody analizy danych ze szczególnym uwzględnieniem wizualizacji oraz analizy statystycznej.
Dzięki udziałowi w szkoleniu uczestnicy:
- Rozwiną dalsze umiejętności prezentacji danych z użyciem pakietu Seaborn.
- Zaznajomią się z narzędziem do interaktywnej wizualizacji danych – pakietem Bokeh.
- Poznają podstawy prawdopodobieństwa, statystyki oraz wnioskowania statystycznego.
- Nauczą się przeprowadzać symulacje losowe.
- Nauczą się testować hipotezy pozwalające określić, czy występujące w populacjach różnice są istotne statystycznie.
Oczekiwana wiedza wstępna:
Podstawowa znajomość języka Python i środowiska PyCharm oraz pakietów NumPy, pandas oraz Matplotlib.
Zaawansowana wizualizacja danych
Bokeh
- Interaktywna wizualizacja
- Konfiguracja wyglądu
- Wykres liniowy
- Wykres rozrzutu
- Suwaki i przyciski
Seaborn
- Heatmap
- Pair plot
- Swarm plot
- Box plot
Podstawy prawdopodobieństwa i statystyki
- Prawdopodobieństwo
- Korelacja danych
- Rozkład ciągły i dyskretny
- Gęstość prawdopodobieństwa
- Funkcja masy prawdopodobieństwa
- Rozkład standardowy
- Centralne twierdzenie graniczne
- Reguła 3 sigm
Wnioskowanie statystyczne
- Liczby pseudolosowe
- Symulacje losowe
- p-value
- Estymacja punktowa
- Estymacja przedziałowa
- Bootstrapowy przedział ufności
- Metoda Monte Carlo
- Testowanie hipotez
- Test równości średnich
- Test równości proporcji
- Test normalności rozkładu
Stanisław Kaźmierczak - asystent i doktorant Politechniki Warszawskiej w obszarze uczenia maszynowego/data science. Prowadzi zajęcia i szkolenia z obszaru analizy danych, sieci neuronowych, głębokiego uczenia oraz szeroko rozumianej sztucznej inteligencji.