Opis przedmiotu

Zajęcia obejmują podstawowe techniki związane z analizą danych. Są to metody zarówno statystyczne, oparte na modelach probabilistycznych, jak i wywodzące się z dziedziny eksploracji danych (data mining). Celem wykładu jest zapoznanie uczestników z podstawowymi pojęciami, intuicjami oraz prostymi technikami analitycznymi, w stopniu wystarczającym do praktycznego ich wykorzystania. Przedstawione zostaną zalety, możliwości i ograniczenia poszczególnych metod.

Wymagania wstępne

Tematy wykładów

  1. Podstawowe pojęcia. Podejście statystyczne, metodologia eksploracji danych i KDD.
  2. Zmienne losowe i ich rozkłady gęstości, graficzna prezentacja danych, histogramy.
  3. Wskaźniki położenia i rozproszenia. Wstęp do estymacji parametrycznej.
  4. Prawo wielkich liczb, centralne twierdzenie graniczne. Estymatory. Zasada największej wiarogodności.
  5. Zależności wielowymiarowe danych w próbce. Regresja liniowa. Dyskryminacja liniowa.
  6. Estymacja przedziałowa.
  7. Testowanie hipotez statystycznych.
  8. Probabilistyczne metody klasyfikacji. Naiwny klasyfikator bayesowski.
  9. Schematy testowania klasyfikatorów: cross-validation, leave-one-out. Estymacja rozkładu metodą najbliższych sąsiadów.
  10. Drzewa decyzyjne. Entropia.
  11. Reguły decyzyjne i ich parametry. Algorytm AQ i CN2.
  12. Reguły asocjacyjne, algorytm Apriori.
  13. Metody grupowania (analiza skupień). Algorytm k-means, centroidów, minimalnego drzewa rozpinającego.
  14. Proces KDD, znaczenie wstępnej obróbki danych. Problem indukcji i selekcji cech.

Organizacja przedmiotu, zaliczenia

Podstawową formą zapoznawania się z przedmiotem są umieszczone w sieci wykłady. Wszelkie wątpliwości można rozstrzygać na cotygodniowym chacie (konsultacjach), a także (w dowolnym terminie) na forum, w wątku dotyczącym odpowiedniego wykładu. Ponadto część zajęć odbędzie się w gmachu uczelni.

Ocena będzie obejmowała aktywność i wykazaną wiedzę na zajęciach na uczelni (mini-projekty), testy z wiadomości wykładowych (zdalnie) oraz wynik teoretycznego egzaminu końcowego.

Literatura