Opis przedmiotu
Hurtownie danych to dziedzina informatyki obejmująca tworzenie zintegrowanych magazynów danych, zawierających ujednolicone dane historyczne dotyczące przedsiębiorstwa. Bazy takie tworzone są w celach analitycznych (w tym wykorzystujących narzędzia eksploracji danych i odkrywania wiedzy) i archiwizacyjnych. Ze względu na ilość przechowywanych danych i odrębne dziedziny zastosowań, zagadnienia projektowania, utrzymywania i rozbudowy hurtowni danych wymagają podejścia zasadniczo odmiennego niż w przypadku klasycznych baz danych. Celem wykładu jest przegląd podstawowych metod projektowania i optymalizacji hurtowni danych, przede wszystkim pod kątem zaawansowanych systemów CRM i eksploracji danych.
Wymagania wstępne
- Analiza danych - znajomość podstawowych zagadnień związanych z procesem KDD (odkrywania wiedzy), oraz podstawowych technik eksploracji danych.
- Relacyjne bazy danych, Systemy baz danych - umiejętność analizy i projektowania baz danych.
Tematy wykładów
-
Wstęp: czym różnią się hurtownie danych od zwykłych baz danych? Typowe zastosowania.
-
Podstawy architektury hurtowni danych. Model pojęciowy, logiczny i fizyczny.
-
Integracja danych źródłowych.
-
Tworzenie modelu pojęciowego hurtowni danych.
-
Modele logiczne hurtowni danych.
-
Zagadnienia związane z odświeżaniem danych.
-
Optymalizacja zapytań.
-
Wielowymiarowe modele danych, operacje OLAP.
-
Wspomaganie zadań eksploracji danych.
-
Czynniki jakości hurtowni danych i ich ocena.
-
Wykorzystanie hurtowni danych w zastosowaniach CRM.
-
Projektowanie hurtowni danych związanych z czasem. Analiza danych czasowych.
-
Hurtownie danych w praktyce: system SAP.
-
Prezentacja narzędzi SAS do tworzenia hurtowni danych i aplikacji BI.
Organizacja przedmiotu, zaliczenia
Podstawową formą zapoznawania się z przedmiotem są umieszczone w sieci wykłady. Wszelkie wątpliwości można rozstrzygać na cotygodniowym chacie (konsultacjach), a także (w dowolnym terminie) na forum, w wątku dotyczącym odpowiedniego wykładu. Ponadto część zajęć odbędzie się w gmachu uczelni.
Ocena będzie obejmowała aktywność i wykazaną wiedzę na zajęciach na uczelni (mini-projekty), testy z wiadomości wykładowych (zdalnie) oraz wynik teoretycznego egzaminu końcowego.
Literatura
- Ch. Todman. Projektowanie hurtowni danych. WNT, Warszawa 2003.
- M. Jarke, M. Lenzerini, Y. Vassiliou, P. Vassiliadis. Hurtownie danych. Podstawa organizacji i funkcjonowania, WSiP, Warszawa 2003.
- V. Poe, P. Klauer, S. Brobst. Tworzenie hurtowni danych. WNT, Warszawa 2000.