Wykłady
-
Podstawowe pojęcia. Podejście statystyczne, metodologia eksploracji danych i KDD.
-
Zmienne losowe i ich rozkłady gęstości, graficzna prezentacja danych, histogramy.
-
Wskaźniki położenia i rozproszenia. Wstęp do estymacji parametrycznej.
-
Prawo wielkich liczb, centralne twierdzenie graniczne. Estymatory. Zasada największej wiarogodności.
-
Zależności wielowymiarowe danych w próbce. Regresja liniowa. Dyskryminacja liniowa.
-
Estymacja przedziałowa.
-
Testowanie hipotez statystycznych.
-
Probabilistyczne metody klasyfikacji. Naiwny klasyfikator bayesowski.
-
Schematy testowania klasyfikatorów: cross-validation, leave-one-out. Estymacja rozkładu metodą najbliższych sąsiadów.
-
Drzewa decyzyjne. Entropia.
-
Reguły decyzyjne i ich parametry. Algorytm AQ i CN2.
-
Reguły asocjacyjne, algorytm Apriori.
-
Metody grupowania (analiza skupień). Algorytm k-means, centroidów, minimalnego drzewa rozpinającego.
-
Proces KDD, znaczenie wstępnej obróbki danych. Problem indukcji i selekcji cech.