Wykłady

  1. Podstawowe pojęcia. Podejście statystyczne, metodologia eksploracji danych i KDD.
  2. Zmienne losowe i ich rozkłady gęstości, graficzna prezentacja danych, histogramy.
  3. Wskaźniki położenia i rozproszenia. Wstęp do estymacji parametrycznej.
  4. Prawo wielkich liczb, centralne twierdzenie graniczne. Estymatory. Zasada największej wiarogodności.
  5. Zależności wielowymiarowe danych w próbce. Regresja liniowa. Dyskryminacja liniowa.
  6. Estymacja przedziałowa.
  7. Testowanie hipotez statystycznych.
  8. Probabilistyczne metody klasyfikacji. Naiwny klasyfikator bayesowski.
  9. Schematy testowania klasyfikatorów: cross-validation, leave-one-out. Estymacja rozkładu metodą najbliższych sąsiadów.
  10. Drzewa decyzyjne. Entropia.
  11. Reguły decyzyjne i ich parametry. Algorytm AQ i CN2.
  12. Reguły asocjacyjne, algorytm Apriori.
  13. Metody grupowania (analiza skupień). Algorytm k-means, centroidów, minimalnego drzewa rozpinającego.
  14. Proces KDD, znaczenie wstępnej obróbki danych. Problem indukcji i selekcji cech.