STATYSTYCZNA ANALIZA DANYCH
Elżbieta Ferenstein, Jan Mielniczuk

Informacje

Spis tematów wykładów

Wykład 1 - Statystyka opisowa
Metody graficzne prezentacji danych jakościowych (wykresy słupkowe i kołowe) oraz ilościowych skalarnych (diagramy i histogramy). Wskaźniki sumaryczne próbki - miary położenia i rozproszenia.

Wykład 2 - Gęstości rozkładów - wprowadzenie
Idealizacja histogramu przy pomocy wykresu gęstości. Gęstość rozkładu obserwowanej cechy, gęstości normalne i ich własności. Związek wskaźników sumarycznych próbki ze wskaźnikami gęstości. Wykresy kwantylowe.

Wykład 3 - Podstawy rachunku prawdopodobieństwa
Podstawowe pojęcia rachunku prawdopodobieństwa: doświadczenie losowe, zdarzenie losowe, działania na zdarzeniach losowych, aksjomaty prawdopodobieństwa, własności prawdopodobieństw zdarzeń, prawdopodobieństwo warunkowe, niezależność zdarzeń.

Wykład 4 - Wzór Bayesa. Zmienne losowe - wprowadzenie
Zupełny układ zdarzeń, twierdzenie o prawdopodobieństwie całkowitym, wzór Bayesa. Funkcja prawdopodobieństwa i rozkład prawdopodobieństwa dyskretnej zmiennej losowej. Dystrybuanta dyskretnej zmiennej losowej.

Wykład 5 - Dyskretne zmienne losowe
Dystrybuanta zmiennej losowej i jej własności wynikające z własności prawdopodobieństw zdarzeń. Wartość średnia i wariancja dyskretnej zmiennej losowej, ich własności. Przykłady rozkładów dyskretnych zmiennych losowych - rozkład dwupunktowy, dwumianowy, Poissona, geometryczny, hipergeometryczny. Własności rozkładu Poissona.

Wykład 6 - Ciągłe zmienne losowe
Gęstość i dystrybuanta ciągłej zmiennej losowej, wartość średnia i wariancja oraz ich własności, kwantyle ciągłej zmiennej losowej. Przykłady rozkładów ciągłych - jednostajny, normalny, wykładniczy.

Wykład 7 - Pary zmiennych losowych I
Dystrybuanta i rozkład prawdopodobieństwa pary zmiennych losowych. Funkcja prawdopodobieństwa łącznego dwuwymiarowej dyskretnej zmiennej losowej. Funkcja gęstości łącznej ciągłej zmiennej losowej dwuwymiarowej. Rozkłady brzegowe, rozkłady warunkowe.

Wykład 8 - Pary zmiennych losowych II
Niezależne zmienne losowe. Wartość oczekiwana funkcji pary zmiennych losowych. Kowariancja i współczynnik korelacji, własności współczynnika korelacji. Dwuwymiarowy rozkład normalny.

Wykład 9 - Twierdzenia graniczne
Ciągi zmiennych losowych, prosta próba losowa, średnia z prostej próby losowej i jej własności. Prawo wielkich liczb, centralne twierdzenie graniczne.

Wykład 10 - Estymacja punktowa i przedzialowa
Określenie statystyki i estymatora. Nieobciążoność i zgodność estymatorów. Estymatory wartości średniej i wariancji. Błąd średniokwadratowy estymatora, błąd standardowy estymatora. Studentyzacja estymatora. Określenie i interpretacja przedziału ufności. Przedziały ufności dla średniej i wariancji na podstawie prostych prób losowych z populacji normalnych. Przybliżone przedziały ufności dla proporcji.

Wykład 11 - Testowanie hipotez - wprowadzenie
Zadanie testowania hipotez statystycznych. Błędy I i II rodzaju. Parametryczne testy istotności dla średniej rozkładu normalnego, poziom istotności a p-wartość.

Wykład 12 - Testowanie hipotez
Testy dla wariancji populacji normalnych, testy asymptotyczne dla proporcji, testowanie hipotezy o równości średnich populacji normalnych, oraz równości średnich dla pary zmiennych losowych.

Wykład 13 - Regresja liniowa I
Wykres rozproszenia, współczynnik korelacji próbkowej. Wyznaczanie prostej regresji metodą najmniejszych kwadratów, analiza sum kwadratów błędów, współczynnik determinacji. Model zależności liniowej, estymatory współczynników teoretycznej prostej regresji wyznaczone metodą najmniejszych kwadratów oraz ich własności.

Wykład 14 - Regresja liniowa II
Wnioskowanie statystyczne dla modelu zależności liniowej. Testy istotności i przedziały ufności dla współczynników regresji liniowej. Prognoza przyszłej wartości zmiennej objaśnianej, błąd prognozy, analiza wartości resztowych.


Cele kursu

Celem wykładu jest przedstawienie podstaw analizy danych obejmujące:

Podstawowe tematy:

  1. Metody graficzne prezentacji danych jakościowych i ilościowych. Statystyki próbkowe. Histogramy a gęstości prawdopodobieństwa, kwantyle, wykresy kwantylowe.
  2. Prawdopodobieństwo, niezależność zdarzeń, twierdzenie Bayesa.
  3. Zmienne losowe, rozkłady prawdopodobieństwa i ich parametry, wybrane rozkłady prawdopodobieństwa.
  4. Statystyki próbkowe i ich własności, podstawowe przedziały ufności i parametryczne testy istotności, regresja liniowa jednowymiarowa.


Wymagania

Kurs ma charakter podstawowy. Wykorzystuje wiadomości z matematyki z zakresu wykładu Analiza Matematyczna i częściowo Matematyka Dyskretna.


Organizacja studiowania

  1. W tekście wykładów znajdują się rozwiązane zadania i pytania kontrolne mające na celu sprawdzenie opanowanego materiału. Zaleca się znalezienie na nie samodzielnej odpowiedzi.
  2. Każdy wykład kończy się zestawem zadań obowiązkowych, które powinny być rozwiązane i przesłane w wyznaczonych terminach. Każdy wykład powinien być przerobiony w kolejnych tygodniach semestru począwszy od pierwszego tygodnia, a rozwiązania zestawu zadań przesłane do końca odpowiadającego tygodnia.
  3. Studenci mogą korzystać z konsultacji za pomocą poczty elektronicznej i forum dyskusyjnego w systemie EDU.


Kryteria zaliczeń

  1. Student otrzymuje 1 punkt za wykonanie każdego zadania obowiązkowego. Warunkiem zaliczenia semestru jest uzyskanie 80% ogólnej liczby punktów.
  2. Wystawiane są oceny w skali od 2 do 5.
  3. Zaliczenie semestru jest warunkiem dopuszczenia do egzaminu końcowego.
  4. Wykład kończy się egzaminem pisemnym w sesji letniej.


Podręczniki podstawowe

  1. J. Koronacki, J. Mielniczuk, Statystyka dla studentów kierunków technicznych i przyrodniczych. WNT 2001.
  2. D.S. Moore, G.P. McCabe, Introduction to the Practice of Statistics, W.H. Freeman & Co., 2000.