Zachodniopomorski Uniwersytet Technologiczny w Szczecinie

Wydział Informatyki - Informatyka (S2)
specjalność: Projektowanie oprogramowania

Sylabus przedmiotu Eksploracja danych:

Informacje podstawowe

Kierunek studiów Informatyka
Forma studiów studia stacjonarne Poziom drugiego stopnia
Tytuł zawodowy absolwenta magister inżynier
Obszary studiów charakterystyki PRK, kompetencje inżynierskie PRK
Profil ogólnoakademicki
Moduł
Przedmiot Eksploracja danych
Specjalność Inteligencja obliczeniowa
Jednostka prowadząca Katedra Metod Sztucznej Inteligencji i Matematyki Stosowanej
Nauczyciel odpowiedzialny Marcin Korzeń <Marcin.Korzen@zut.edu.pl>
Inni nauczyciele Jacek Klimaszewski <Jacek.Klimaszewski@zut.edu.pl>, Przemysław Klęsk <pklesk@wi.zut.edu.pl>
ECTS (planowane) 4,0 ECTS (formy) 4,0
Forma zaliczenia egzamin Język polski
Blok obieralny Grupa obieralna

Formy dydaktyczne

Forma dydaktycznaKODSemestrGodzinyECTSWagaZaliczenie
laboratoriaL2 30 2,00,50zaliczenie
wykładyW2 30 2,00,50egzamin

Wymagania wstępne

KODWymaganie wstępne
W-1Podstawowe wiadomości z rachunku prawdopodobieństwa i statystyki
W-2Podstawowe wiadomości z algorytmów i struktur danych

Cele przedmiotu

KODCel modułu/przedmiotu
C-1Zapoznanie się z podstawowymi algorytmami eksploracji danych
C-2Nabycie umiejętności rozpoznawania róznych zadań eksploracji danych w sytuacjach praktycznych oraz wyboru odpowiednich technik i algorytmów do ich rozwiązywania
C-3Nabycie umiejętności implementacji wybranych algorytmów eksploracji danych.
C-4Przygotowanie do prowadzenia badań naukowych w dyscyplinie Informatyka

Treści programowe z podziałem na formy zajęć

KODTreść programowaGodziny
laboratoria
T-L-1Badania złożoności algortmów indeksowania danych wielowymiarowych: kd-drzewa, drzewa kulkowe.2
T-L-2Implementacja Wybranego algorytmu klasteryzacji (np. grupowanie hierarchiczne, DBSCAN, algorytm EM) oraz porównanie metod grupowania.4
T-L-3Implementacja algorytmu faktoryzacji macierzy nieujemnych oraz eksperymenty na danych tekstowych o obrazach.4
T-L-4Implementacja algorytmu wyszukiwania reguł asocjacyjnych, w oparciu o algorytm apriori lub wykorzystując drzewo wyliczające podzbiory, wyszukiwanie reguł pareto-optymalnych.6
T-L-5Zastosowanie "jawnych" i ukrytych łańcuch Łańcuchów Markowa oraz ich zastowsowanie do pedykcji w szeregach czasowych oraz klasyfikacji.6
T-L-6Zadania dotyczące wnioskowania w modelach graficznych z wykorzystaniem bibliotek BUGS/JAGS, np..: wnioskowanie statystyczne, uczenie nieparametryczne, filtracja sygnałów.4
T-L-7Wybrane zadanie eksploracji danych tekstowych.4
30
wykłady
T-W-1Dane, rodzaje danych, zadania i problemy eksploracji danych.2
T-W-2techniki indeksowania i przeszukiwania danych wielowymiarowych (kd-drzewa, drzewa kulkowe).2
T-W-3Techniki nienadzorowane: Grupowanie danych, algorytmy klasteryzacji: metryki i miary podobieństwa, wykrywanie obserwacji obserwacje odstających, algorytm EM, metody pólnadzorowane.4
T-W-4Wykrywanie reguł i wzorców, algorytmy: apriori, fp-growth, prefixspan, set enumeration tree, Wzorce interesujące, zagadnienia testowania. Wykrywanie wzorców w szeregach czasowych.6
T-W-5Zmienne ukryte, dekompozycja sygnałów, faktoryzacja macierzy nieujemnych, uczenie słownikowe, autoenkoder4
T-W-6Elementy eksploracji danych tekstowych, model bag of words, algorytm page rank.4
T-W-7Twierdzenie Bayesa, prawdopodobieństwo warunkowe, modele graficzne, sieci bayesowskie, wnioskowanie w modelach probabilistycznych, warianty zmiennych dyskretnych i ciągłych, system BUGS.4
T-W-8Łańcuchy Markowa, Ukryte Łańcuchy Markowa, wnioskowanie w łańcuchach, algorytm forward-backward, algorytm Vierbiego, algorytm Bauma-Welcha4
30

Obciążenie pracą studenta - formy aktywności

KODForma aktywnościGodziny
laboratoria
A-L-1Uczestnictwo w zajęciach30
A-L-2Praca nad zadaniami programistycznymi oraz sprawozdaniami20
50
wykłady
A-W-1Uczestnictwo w wykładach30
A-W-2Przygotowanie do egzaminu16
A-W-3Konsultacje2
A-W-4Egzamin2
50

Metody nauczania / narzędzia dydaktyczne

KODMetoda nauczania / narzędzie dydaktyczne
M-1Wykład prezentacja w postaci slajdów, wybrane treść pokazywne na tablicy
M-2Laboratoria praca przy komputerach w środowisku programu Python (ewentulanie do wyboru Matlab), samodzielna impelementacja wybranych algorytmów, oraz wykorzystywnie dostępnych bibliotek w zależności od zadania.

Sposoby oceny

KODSposób oceny
S-1Ocena formująca: laboratorium ocena sprawozdań
S-2Ocena formująca: Laboratorium: ocena zadań programistycznych
S-3Ocena formująca: Laboratorium: ocena pracy na zajęciach
S-4Ocena podsumowująca: egzamin ustny lub pisemny
S-5Ocena podsumowująca: Laboratorium zagregowana ocena łączna z poczególnych ocen cząstkowych

Zamierzone efekty uczenia się - wiedza

Zamierzone efekty uczenia sięOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaOdniesienie do efektów uczenia się prowadzących do uzyskania tytułu zawodowego inżynieraCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
I_2A_D01.04_W01
Student zna główne zadania i algorytmy eksploracji danych.
I_2A_W08, I_2A_W01, I_2A_W04C-4, C-1, C-2, C-3T-L-5, T-L-6, T-L-1, T-L-2, T-L-3, T-L-4, T-L-7, T-W-1, T-W-8, T-W-4, T-W-5, T-W-2, T-W-3, T-W-7, T-W-6M-1, M-2S-5, S-1, S-2, S-4, S-3

Zamierzone efekty uczenia się - umiejętności

Zamierzone efekty uczenia sięOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaOdniesienie do efektów uczenia się prowadzących do uzyskania tytułu zawodowego inżynieraCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
I_2A_D01.04_U01
Student umie rozwiązywać podstawowe zadania eksploracji danych, umie posuługiwać sie wybranymi bibliotekami oraz umie implementować wybrane algorytmy.
I_2A_U03, I_2A_U06, I_2A_U09C-4, C-1, C-2, C-3T-L-5, T-L-6, T-L-1, T-L-2, T-L-3, T-L-4, T-L-7M-1, M-2S-5, S-1, S-2, S-3

Kryterium oceny - wiedza

Efekt uczenia sięOcenaKryterium oceny
I_2A_D01.04_W01
Student zna główne zadania i algorytmy eksploracji danych.
2,0Student nie opanował materiału w stopniu dostatecznym.
3,0Student opanował materiał przedmiotu w stopniu podstawowym, rozróżnia podstawowe zdania eksploracji danych i zna możliwości dostęnych bibliotek eksploracji danych.
3,5Student opanował materiał przedmiotu w stopniu ponad podstawowoym,rozróżnia podstawowe zdania eksploracji danych i zna możliwości dostęnych bibliotek eksploracji danych.
4,0Student opanował materiał przedmiotu w stopniu dobrym, rozróżnia główne zdania eksploracji danych, zna możliwości dostęnych bibliotek eksploracji danych, zna wybrane algorytmy eksploracji danych.
4,5Student opanował materiał przedmiotu w stopniu ponad dobrym, rozróżnia główne zdania eksploracji danych, zna bardzo dobrze możliwości dostęnych bibliotek eksploracji danych, zna wybrane algorytmy eksploracji danych.
5,0Student opanował materiał przedmiotu w stopniu bardzo dobrym, rozróżnia główne zdania eksploracji danych, zna bardzo dobrze możliwości dostęnych bibliotek eksploracji danych, zna gółwne algorytmy i jest biegły w szczególach impelementacyjnych.

Kryterium oceny - umiejętności

Efekt uczenia sięOcenaKryterium oceny
I_2A_D01.04_U01
Student umie rozwiązywać podstawowe zadania eksploracji danych, umie posuługiwać sie wybranymi bibliotekami oraz umie implementować wybrane algorytmy.
2,0
3,0Student opanował materiał przedmiotu w stopniu dostatecznym, rozróżnia podstawowe zdania eksploracji danych i umie je rozwiązywać je za pomocą dostęnych pakietów obliczeniowych.
3,5Student opanował materiał przedmiotu w stopniu ponad dostatecznym, rozróżnia podstawowe zdania eksploracji danych i umie je sprawnie rozwiązywać je za pomocą dostęnych pakietów obliczeniowych.
4,0Student opanował materiał przedmiotu w stopniu dobrym, rozróżnia główne zdania eksploracji danych i umie je sprawnie rozwiązywać za pomocą dostęnych pakietów obliczeniowych, umie zaimplementować wybrane algorytmy.
4,5Student opanował materiał przedmiotu w stopniu ponad dobrym, rozróżnia główne zdania eksploracji danych i umie je sprawnie rozwiązywać za pomocą dostęnych pakietów obliczeniowych, umie zaimplementować wybrane algorytmy.y
5,0Student opanował materiał przedmiotu w stopniu bardzo dobrym, rozróżnia zdania eksploracji danych i umie je biegle rozwiązywać je za pomocą dostęnych pakietów obliczeniowych, jest biegły w impelmentacji algorytmów eksploracji danych.

Literatura podstawowa

  1. Ch. C. Aggarwal, Data Mining: the textbook, Springer, Yorktown Heights, 2015
  2. David MacKay, Information Theory, Inference, and Learning Algorithms, Cambridge University Press, 2003

Treści programowe - laboratoria

KODTreść programowaGodziny
T-L-1Badania złożoności algortmów indeksowania danych wielowymiarowych: kd-drzewa, drzewa kulkowe.2
T-L-2Implementacja Wybranego algorytmu klasteryzacji (np. grupowanie hierarchiczne, DBSCAN, algorytm EM) oraz porównanie metod grupowania.4
T-L-3Implementacja algorytmu faktoryzacji macierzy nieujemnych oraz eksperymenty na danych tekstowych o obrazach.4
T-L-4Implementacja algorytmu wyszukiwania reguł asocjacyjnych, w oparciu o algorytm apriori lub wykorzystując drzewo wyliczające podzbiory, wyszukiwanie reguł pareto-optymalnych.6
T-L-5Zastosowanie "jawnych" i ukrytych łańcuch Łańcuchów Markowa oraz ich zastowsowanie do pedykcji w szeregach czasowych oraz klasyfikacji.6
T-L-6Zadania dotyczące wnioskowania w modelach graficznych z wykorzystaniem bibliotek BUGS/JAGS, np..: wnioskowanie statystyczne, uczenie nieparametryczne, filtracja sygnałów.4
T-L-7Wybrane zadanie eksploracji danych tekstowych.4
30

Treści programowe - wykłady

KODTreść programowaGodziny
T-W-1Dane, rodzaje danych, zadania i problemy eksploracji danych.2
T-W-2techniki indeksowania i przeszukiwania danych wielowymiarowych (kd-drzewa, drzewa kulkowe).2
T-W-3Techniki nienadzorowane: Grupowanie danych, algorytmy klasteryzacji: metryki i miary podobieństwa, wykrywanie obserwacji obserwacje odstających, algorytm EM, metody pólnadzorowane.4
T-W-4Wykrywanie reguł i wzorców, algorytmy: apriori, fp-growth, prefixspan, set enumeration tree, Wzorce interesujące, zagadnienia testowania. Wykrywanie wzorców w szeregach czasowych.6
T-W-5Zmienne ukryte, dekompozycja sygnałów, faktoryzacja macierzy nieujemnych, uczenie słownikowe, autoenkoder4
T-W-6Elementy eksploracji danych tekstowych, model bag of words, algorytm page rank.4
T-W-7Twierdzenie Bayesa, prawdopodobieństwo warunkowe, modele graficzne, sieci bayesowskie, wnioskowanie w modelach probabilistycznych, warianty zmiennych dyskretnych i ciągłych, system BUGS.4
T-W-8Łańcuchy Markowa, Ukryte Łańcuchy Markowa, wnioskowanie w łańcuchach, algorytm forward-backward, algorytm Vierbiego, algorytm Bauma-Welcha4
30

Formy aktywności - laboratoria

KODForma aktywnościGodziny
A-L-1Uczestnictwo w zajęciach30
A-L-2Praca nad zadaniami programistycznymi oraz sprawozdaniami20
50
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta

Formy aktywności - wykłady

KODForma aktywnościGodziny
A-W-1Uczestnictwo w wykładach30
A-W-2Przygotowanie do egzaminu16
A-W-3Konsultacje2
A-W-4Egzamin2
50
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta
PoleKODZnaczenie kodu
Zamierzone efekty uczenia sięI_2A_D01.04_W01Student zna główne zadania i algorytmy eksploracji danych.
Odniesienie do efektów kształcenia dla kierunku studiówI_2A_W08Posiada wiedzę na temat zagadnień sztucznej inteligencji i ich wykorzystania w systemach informatycznych
I_2A_W01Ma poszerzoną i pogłębioną wiedzę w zakresie matematyki stosowanej i inżynierii obliczeniowej
I_2A_W04Ma rozszerzoną wiedzę o problemach, zadaniach i algorytmach analizy, przetwarzania oraz eksploracji danych
Cel przedmiotuC-4Przygotowanie do prowadzenia badań naukowych w dyscyplinie Informatyka
C-1Zapoznanie się z podstawowymi algorytmami eksploracji danych
C-2Nabycie umiejętności rozpoznawania róznych zadań eksploracji danych w sytuacjach praktycznych oraz wyboru odpowiednich technik i algorytmów do ich rozwiązywania
C-3Nabycie umiejętności implementacji wybranych algorytmów eksploracji danych.
Treści programoweT-L-5Zastosowanie "jawnych" i ukrytych łańcuch Łańcuchów Markowa oraz ich zastowsowanie do pedykcji w szeregach czasowych oraz klasyfikacji.
T-L-6Zadania dotyczące wnioskowania w modelach graficznych z wykorzystaniem bibliotek BUGS/JAGS, np..: wnioskowanie statystyczne, uczenie nieparametryczne, filtracja sygnałów.
T-L-1Badania złożoności algortmów indeksowania danych wielowymiarowych: kd-drzewa, drzewa kulkowe.
T-L-2Implementacja Wybranego algorytmu klasteryzacji (np. grupowanie hierarchiczne, DBSCAN, algorytm EM) oraz porównanie metod grupowania.
T-L-3Implementacja algorytmu faktoryzacji macierzy nieujemnych oraz eksperymenty na danych tekstowych o obrazach.
T-L-4Implementacja algorytmu wyszukiwania reguł asocjacyjnych, w oparciu o algorytm apriori lub wykorzystując drzewo wyliczające podzbiory, wyszukiwanie reguł pareto-optymalnych.
T-L-7Wybrane zadanie eksploracji danych tekstowych.
T-W-1Dane, rodzaje danych, zadania i problemy eksploracji danych.
T-W-8Łańcuchy Markowa, Ukryte Łańcuchy Markowa, wnioskowanie w łańcuchach, algorytm forward-backward, algorytm Vierbiego, algorytm Bauma-Welcha
T-W-4Wykrywanie reguł i wzorców, algorytmy: apriori, fp-growth, prefixspan, set enumeration tree, Wzorce interesujące, zagadnienia testowania. Wykrywanie wzorców w szeregach czasowych.
T-W-5Zmienne ukryte, dekompozycja sygnałów, faktoryzacja macierzy nieujemnych, uczenie słownikowe, autoenkoder
T-W-2techniki indeksowania i przeszukiwania danych wielowymiarowych (kd-drzewa, drzewa kulkowe).
T-W-3Techniki nienadzorowane: Grupowanie danych, algorytmy klasteryzacji: metryki i miary podobieństwa, wykrywanie obserwacji obserwacje odstających, algorytm EM, metody pólnadzorowane.
T-W-7Twierdzenie Bayesa, prawdopodobieństwo warunkowe, modele graficzne, sieci bayesowskie, wnioskowanie w modelach probabilistycznych, warianty zmiennych dyskretnych i ciągłych, system BUGS.
T-W-6Elementy eksploracji danych tekstowych, model bag of words, algorytm page rank.
Metody nauczaniaM-1Wykład prezentacja w postaci slajdów, wybrane treść pokazywne na tablicy
M-2Laboratoria praca przy komputerach w środowisku programu Python (ewentulanie do wyboru Matlab), samodzielna impelementacja wybranych algorytmów, oraz wykorzystywnie dostępnych bibliotek w zależności od zadania.
Sposób ocenyS-5Ocena podsumowująca: Laboratorium zagregowana ocena łączna z poczególnych ocen cząstkowych
S-1Ocena formująca: laboratorium ocena sprawozdań
S-2Ocena formująca: Laboratorium: ocena zadań programistycznych
S-4Ocena podsumowująca: egzamin ustny lub pisemny
S-3Ocena formująca: Laboratorium: ocena pracy na zajęciach
Kryteria ocenyOcenaKryterium oceny
2,0Student nie opanował materiału w stopniu dostatecznym.
3,0Student opanował materiał przedmiotu w stopniu podstawowym, rozróżnia podstawowe zdania eksploracji danych i zna możliwości dostęnych bibliotek eksploracji danych.
3,5Student opanował materiał przedmiotu w stopniu ponad podstawowoym,rozróżnia podstawowe zdania eksploracji danych i zna możliwości dostęnych bibliotek eksploracji danych.
4,0Student opanował materiał przedmiotu w stopniu dobrym, rozróżnia główne zdania eksploracji danych, zna możliwości dostęnych bibliotek eksploracji danych, zna wybrane algorytmy eksploracji danych.
4,5Student opanował materiał przedmiotu w stopniu ponad dobrym, rozróżnia główne zdania eksploracji danych, zna bardzo dobrze możliwości dostęnych bibliotek eksploracji danych, zna wybrane algorytmy eksploracji danych.
5,0Student opanował materiał przedmiotu w stopniu bardzo dobrym, rozróżnia główne zdania eksploracji danych, zna bardzo dobrze możliwości dostęnych bibliotek eksploracji danych, zna gółwne algorytmy i jest biegły w szczególach impelementacyjnych.
PoleKODZnaczenie kodu
Zamierzone efekty uczenia sięI_2A_D01.04_U01Student umie rozwiązywać podstawowe zadania eksploracji danych, umie posuługiwać sie wybranymi bibliotekami oraz umie implementować wybrane algorytmy.
Odniesienie do efektów kształcenia dla kierunku studiówI_2A_U03Potrafi dobierać, krytycznie oceniać przydatność oraz stosować metody i narzędzia do rozwiązania złożonego zadania inżynierskiego
I_2A_U06Potrafi stosować metody analityczne i eksperymentalne do rozwiązywania złożonych problemów w tym obliczeniowych
I_2A_U09Ma umiejętność stosowania zaawansowanych technik programowania i metodyki projektowania systemów informatycznych w wybranym obszarze zastosowań
Cel przedmiotuC-4Przygotowanie do prowadzenia badań naukowych w dyscyplinie Informatyka
C-1Zapoznanie się z podstawowymi algorytmami eksploracji danych
C-2Nabycie umiejętności rozpoznawania róznych zadań eksploracji danych w sytuacjach praktycznych oraz wyboru odpowiednich technik i algorytmów do ich rozwiązywania
C-3Nabycie umiejętności implementacji wybranych algorytmów eksploracji danych.
Treści programoweT-L-5Zastosowanie "jawnych" i ukrytych łańcuch Łańcuchów Markowa oraz ich zastowsowanie do pedykcji w szeregach czasowych oraz klasyfikacji.
T-L-6Zadania dotyczące wnioskowania w modelach graficznych z wykorzystaniem bibliotek BUGS/JAGS, np..: wnioskowanie statystyczne, uczenie nieparametryczne, filtracja sygnałów.
T-L-1Badania złożoności algortmów indeksowania danych wielowymiarowych: kd-drzewa, drzewa kulkowe.
T-L-2Implementacja Wybranego algorytmu klasteryzacji (np. grupowanie hierarchiczne, DBSCAN, algorytm EM) oraz porównanie metod grupowania.
T-L-3Implementacja algorytmu faktoryzacji macierzy nieujemnych oraz eksperymenty na danych tekstowych o obrazach.
T-L-4Implementacja algorytmu wyszukiwania reguł asocjacyjnych, w oparciu o algorytm apriori lub wykorzystując drzewo wyliczające podzbiory, wyszukiwanie reguł pareto-optymalnych.
T-L-7Wybrane zadanie eksploracji danych tekstowych.
Metody nauczaniaM-1Wykład prezentacja w postaci slajdów, wybrane treść pokazywne na tablicy
M-2Laboratoria praca przy komputerach w środowisku programu Python (ewentulanie do wyboru Matlab), samodzielna impelementacja wybranych algorytmów, oraz wykorzystywnie dostępnych bibliotek w zależności od zadania.
Sposób ocenyS-5Ocena podsumowująca: Laboratorium zagregowana ocena łączna z poczególnych ocen cząstkowych
S-1Ocena formująca: laboratorium ocena sprawozdań
S-2Ocena formująca: Laboratorium: ocena zadań programistycznych
S-3Ocena formująca: Laboratorium: ocena pracy na zajęciach
Kryteria ocenyOcenaKryterium oceny
2,0
3,0Student opanował materiał przedmiotu w stopniu dostatecznym, rozróżnia podstawowe zdania eksploracji danych i umie je rozwiązywać je za pomocą dostęnych pakietów obliczeniowych.
3,5Student opanował materiał przedmiotu w stopniu ponad dostatecznym, rozróżnia podstawowe zdania eksploracji danych i umie je sprawnie rozwiązywać je za pomocą dostęnych pakietów obliczeniowych.
4,0Student opanował materiał przedmiotu w stopniu dobrym, rozróżnia główne zdania eksploracji danych i umie je sprawnie rozwiązywać za pomocą dostęnych pakietów obliczeniowych, umie zaimplementować wybrane algorytmy.
4,5Student opanował materiał przedmiotu w stopniu ponad dobrym, rozróżnia główne zdania eksploracji danych i umie je sprawnie rozwiązywać za pomocą dostęnych pakietów obliczeniowych, umie zaimplementować wybrane algorytmy.y
5,0Student opanował materiał przedmiotu w stopniu bardzo dobrym, rozróżnia zdania eksploracji danych i umie je biegle rozwiązywać je za pomocą dostęnych pakietów obliczeniowych, jest biegły w impelmentacji algorytmów eksploracji danych.