Ogólnie o kursie¶
Ten kurs nauczy Cię, jak myśleć o danych i ich analizowaniu w celu wykonania profesjonalnego raportu eksploracyjnej analizy danych (EDA - Exploratory Data Analysis).
Będzie obejmować stawianie i analizowanie pytań takich jak:
Jak jest formatowany zbiór danych i czy jest to odpowiedni format dla tego, co chcę zrobić? (cz. 1/2)
Czy ten zbiór danych jest reprezentatywny lub czy odzwierciedla obiektywną próbę? (cz. 1/2)
Jakie problemy techniczne powinno się wziąć pod uwagę podczas porządkowania i czyszczenia danych? (cz. 1/2)
Jakiej metody wizualizacji i analizy danych uzyć dla danej skali pomiarowej wybranej zmiennej? (cz. 1/2)
Jak dobrać metodę wnioskowania z próby do zadanego problemu badawczego? (cz. 2/2)
Jaki model jest najbardziej odpowiedni dla tych danych? (cz. 2/2)
Tematy te zostaną omówione w kontekście serii krótkich ćwiczeń praktycznych z rzeczywistymi zestawami danych w środowisku programistycznym Python. Będziemy uzywać Visual Studio Code, formatu notatnika Jupyter Notebook, ew. pliku Markdown (MD) połączonego na stałe z Twoim repozytorium na GitHubie dzięki wtyczce GitLens.
Kluczowe efekty kształcenia¶
Ten kurs ma na celu zapewnienie słuchacz(k)om szeregu narzędzi koncepcyjnych i technicznych. Moim celem jest, abyś pod koniec kursu był(a) w stanie:
Zdiagnozować i naprawić problemy techniczne danych, począwszy od braków danych, obserwacji odstających, brudnych danych (niekonsystencji). (cz. 1/2)
Projektować i wdrażać jasne, zwięzłe i dokładne przekrojowe wizualizacje danych. (cz. 1/2)
Proponować i testować hipotezy dotyczące danych przy użyciu modeli statystycznych na próbie danych. (cz. 2/2)
Logistyka kursu¶
Prowadzący - instruktor¶
Karol Flisikowski: Profesor uczelni w Katedrze Statystyki i Ekonometrii PG.
Konsultacje¶
Kto? | Kiedy? | Gdzie? |
---|---|---|
Karol Flisikowski | Środy 14-15 | Online |
Kiedy/Gdzie? SAD 2.:¶
Sesja 1. 26/09/2025 16:30-19:45 sala 203
Sesja 2. 27/09/2025 13:00-16:15 sala 203
Sesja 3. 14/11/2025 16:30-19:45 sala 203
Sesja 4. 28/11/2025 16:30-19:45 sala 203 z testem o godzinie 19:00
Ocena końcowa¶
Projekt końcowy (SAD 1.)¶
Twoja ocena końcowa z przedmiotu SAD bazuje na wykonaniu w małej grupie projektu końcowego: szczegóły nt. projektu.
Test końcowy (SAD 2.)¶
Ocena końcowa z przedmiotu “Wizualizacja i analiza danych w Pythonie” (SAD 2.) bazuje wyłącznie na podstawie testu z zakresu wnioskowania statystycznego. Aby zaliczyć przedmiot należy uzyskać minimum 60% punktów z testu.
Skala ocen¶
Jeśli bierzesz udział w kursie na ocenę, Twoja ocena zostanie ustalona zgodnie z poniższą skalą.
Należy pamiętać, że liczba po prawej stronie zakresu nie jest zawarta w danym zakresie: to znaczy, że „4.5” waha się od 84% aż do 90.99%, ale nie obejmuje 91% (91% to 5.0).
Procent | Ocena |
---|---|
> 91% | 5.0 |
84-91% | 4.5 |
77-84% | 4.0 |
70-77% | 3.5 |
60-70% | 3.0 |
< 60% | brak zaliczenia |
O zaokrąglaniu¶
Należy pamiętać, że moją zasadą jest nie zaokrąglanie ocen w górę z dwóch powodów:
Jeśli zaokrąglanie jest stosowane wybiórczo (tj. tylko wobec słuchaczy, którzy o to poproszą), jest to niesprawiedliwe wobec innych.
Jeśli zaokrąglanie jest stosowane powszechnie, po prostu redefiniuje granicę między dwiema ocenami literowymi (np. czyniąc 87% punktem odcięcia dla 4.5).
Opóźnione nadesłanie projektu¶
Słuchacze mogą przesyłać spóźnione zadania do 48 godzin po terminie ich składania, uzyskując 75% punktów, które by otrzymali (tj. jeśli uzyskali 90% punktów, otrzymają 67,5% z karą za spóźnienie).
W przeciwnym wypadku - zgodnie z regulaminem studiów podyplomowych i umową, przysługuje Państwu zaliczenie poprawkowe w kolejnej edycji studiów 2026.
Pytania, informacje zwrotne i komunikacja¶
Z instruktorami można skontaktować się w następujący sposób:
Godziny pracy.
Publiczne pytanie na kanale Discord kursu SAD.
Prywatna wiadomość przez Discord.
E-mail.
Dołącz do kanału Discord kursu SAD tutaj: kanał Discord SAD 2025
Należy pamiętać, że generalnie preferujemy komunikację przez Discord, a nie e-mail.
Uczciwość akademicka¶
Prosimy o oddawanie własnych prac. Mimo że zachęcamy do wspólnej pracy nad niektórymi zadaniami, nadal należy rozumieć przesłany kod.
Zestawy zadań i projekt końcowy powinny być wykonywane niezależnie.
Prosimy o zapoznanie się z zasadami uczciwości akademickiej tutaj.
Oszukiwanie i plagiatowanie są nieuczciwe wobec innych i ostatecznie wobec Ciebie. Zamiast tego, jeśli masz z czymś trudności - poproś o pomoc!