Zachodniopomorski Uniwersytet Technologiczny w Szczecinie

Wydział Informatyki - Inżynieria cyfryzacji (S1)

Sylabus przedmiotu Eksploracja danych - Przedmiot obieralny II:

Informacje podstawowe

Kierunek studiów Inżynieria cyfryzacji
Forma studiów studia stacjonarne Poziom pierwszego stopnia
Tytuł zawodowy absolwenta inżynier
Obszary studiów nauki techniczne, studia inżynierskie
Profil ogólnoakademicki
Moduł
Przedmiot Eksploracja danych - Przedmiot obieralny II
Specjalność przedmiot wspólny
Jednostka prowadząca Katedra Metod Sztucznej Inteligencji i Matematyki Stosowanej
Nauczyciel odpowiedzialny Marcin Korzeń <Marcin.Korzen@zut.edu.pl>
Inni nauczyciele Przemysław Klęsk <pklesk@wi.zut.edu.pl>, Valery Rogoza <wrogoza@zut.edu.pl>
ECTS (planowane) 2,0 ECTS (formy) 2,0
Forma zaliczenia zaliczenie Język polski
Blok obieralny 3 Grupa obieralna 1

Formy dydaktyczne

Forma dydaktycznaKODSemestrGodzinyECTSWagaZaliczenie
wykładyW5 15 0,80,62zaliczenie
laboratoriaL5 30 1,20,38zaliczenie

Wymagania wstępne

KODWymaganie wstępne
W-1Podstawowe wiadomości z rachunku prawdopodobieństwa i statystyki
W-2Podstawowe wiadomości z algebry liniowej

Cele przedmiotu

KODCel modułu/przedmiotu
C-1Zapoznanie się z różnymi technikami analizy i eksploracji danych
C-2Ukształtowanie umiejętności rozpoznawania róznych metod eksploracji danych w sytuacjach praktycznych oraz wyboru odpowiednich technik to ich rozwiązywania

Treści programowe z podziałem na formy zajęć

KODTreść programowaGodziny
laboratoria
T-L-1Narzędzia analizy danych, Analiza danych w programach Matlab i R, wczytywanie danych, publiczne repozytoria danych4
T-L-2Analiza składowych głównych - zastosowanie do wizualizacji dancyh2
T-L-3Testowanie klasyfikatora, metoda krosswalidacji2
T-L-4Techiniki klasyfikacji: Naiwny klasyfikator Bayesowski, drzewa decyzyjne, k-NN, kasyfikatory funkcyjne: regresjia logistyczna, sieci neuronowe. Zapozninie się z bibliotekami, ekperymentalne porównujące własnośc maszyn kasyfikujących pod względem złożoności próbkowej, skalowanie się algorytmów ze względu na rozmiar danych (liczbę atrybutów i rekordów), eksperymenty na danych rzeczywistych.10
T-L-5Algorytmy grupowania danych: metody hierarchiczne, algorytm k-środków, algorytm EM8
T-L-6Algorytm wyszukiwania reguł asocjacyjnych (implemetacja) warianty apriori lub algorytm wykorzystujący drzewo wyliczające podzbiory, wyszukiwanie reguł pareto-optymalnych4
30
wykłady
T-W-1Komponenty zadania ekslporacji danych, algorytmiczne aspekty eksploracji danych.2
T-W-2Rodzaje zadań eksploracji danych: identyfikacja rozkłądu, klasyfikacja, regresja, wykrywanie reguł i wzorców. Metody preprocesingu danych: braki w danych, skalowanie i dyskretyzacja atrybutów, techiki wizualizacji, metoda PCA, metody identyfikacji rozkładów2
T-W-3Identyfikacja rozkładu i grupwanie, metoda największej wiarygodności, algorytm EM oraz algorytm K-środków2
T-W-4Ocena jakości maszyn klasyfikujących i regresyjnych, testowanie, kroswalidacja, metoda bootstrap2
T-W-5Klasyfikator bayesa, założenie naiwne, optymalny klasyfikator bayesowski2
T-W-6Drzewa klasyfikujące, budowa drzewa, miary zanieczyszczenia, przycinanie, algorytm CART2
T-W-7Wykrywanie reguł asocjacujnych, wsparcie, zaufanie, algorytm apriori, algorytm wykorzystujący drzewo wyliczające podzbiory, reguły pareto-optymalne3
15

Obciążenie pracą studenta - formy aktywności

KODForma aktywnościGodziny
laboratoria
A-L-1Uczestnictwo w zajęciach30
A-L-2przygotowanie do zajęć2
A-L-3praca nad zadaniami programistycznymi oraz sprawozdaniami2
A-L-4Udział w konsultacjach i zaliczeniu2
36
wykłady
A-W-1Uczestnictwo w wykładach15
A-W-2konsultacje2
A-W-3Przygotowanie do egzaminu7
24

Metody nauczania / narzędzia dydaktyczne

KODMetoda nauczania / narzędzie dydaktyczne
M-1Wykład prezentacja w postaci slajdów
M-2Laboratoria praca przy komputerach w środowisku programu Matlab, Python lub R, głównie wykorzystywnie dostępnych bibliotek, oraz przygotowywanie sprawozdań

Sposoby oceny

KODSposób oceny
S-1Ocena formująca: laboratorium ocena sprawozdań
S-2Ocena formująca: Laboratorium: ocena zadań
S-3Ocena formująca: Laboratorium: ocena pracy na zajęciach
S-4Ocena podsumowująca: egzamin ustny

Zamierzone efekty kształcenia - wiedza

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaOdniesienie do efektów kształcenia prowadzących do uzyskania tytułu zawodowego inżynieraCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
IC_1A_O/02-01_W01
Po ukończeniu zajęć student rozróżnia podstawowe pojecia oraz zadania analizy danych, zna podstawowe techniki eksploracji danych oraz umie je stosować w sytuacjach praktycznych w sytuacjach praktycznych, zna wybrane algorytmy eksploracji danych
IC_1A_W04, IC_1A_W07C-2, C-1T-W-6, T-W-3, T-W-7, T-W-5, T-W-4, T-W-1, T-W-2, T-L-1, T-L-3, T-L-2, T-L-6, T-L-5, T-L-4M-1, M-2S-1, S-3, S-4

Zamierzone efekty kształcenia - umiejętności

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaOdniesienie do efektów kształcenia prowadzących do uzyskania tytułu zawodowego inżynieraCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
IC_1A_O/02-01_U01
Student potrafi potrafi stosowac algorytmy elsploracji danych w zadaniach praktycznych oraz umie implementiowac wybrane algorytmy
IC_1A_U19, IC_1A_U24C-2, C-1T-W-6, T-W-3, T-W-7, T-W-5, T-W-4, T-W-1, T-W-2, T-L-1, T-L-3, T-L-2, T-L-6, T-L-5, T-L-4M-1, M-2S-1, S-3, S-4, S-2

Kryterium oceny - wiedza

Efekt kształceniaOcenaKryterium oceny
IC_1A_O/02-01_W01
Po ukończeniu zajęć student rozróżnia podstawowe pojecia oraz zadania analizy danych, zna podstawowe techniki eksploracji danych oraz umie je stosować w sytuacjach praktycznych w sytuacjach praktycznych, zna wybrane algorytmy eksploracji danych
2,0Student nie przyswoił sobie podstawowej wiedzy z zakresu eksploracji danych
3,0Student przyswoił sobie podstawową wiedzę z zakresu eksploracji danych w stopniu zadowalającym
3,5Student przyswoił sobie podstawową wiedzę z zakresu eksploracji danych
4,0Student przyswoił sobie prezentowaną na zajęciach wiedzę z zakresu eksploracji danych
4,5Student przyswoił sobie prezentowaną na zajęciach wiedzę z zakresu eksploracji danych, zna algorytmy aksploracji danych umie je stosować w problemach praktycznych
5,0Student przyswoił sobie prezentowaną na zajęciach wiedzę z zakresu eksploracji danych, zna algorytmy aksploracji danych umie je stosować w problemach praktycznych, zna zalety i ograniczenia stosowanych metod i algorytmów

Kryterium oceny - umiejętności

Efekt kształceniaOcenaKryterium oceny
IC_1A_O/02-01_U01
Student potrafi potrafi stosowac algorytmy elsploracji danych w zadaniach praktycznych oraz umie implementiowac wybrane algorytmy
2,0Student nie przyswoił sobie podstawowych umiejętności rozwiązywania problemów oraz implementacji algorytmów z zakresu ekspoloracji danych
3,0Student przyswoił sobie podstawowe umiejętności rozwiązywania problemów oraz implementacji algorytmów z zakresu ekspoloracji danych w stopniu zadowalającycm
3,5Student przyswoił sobie podstawowe umiejętności rozwiązywania problemów oraz implementacji algorytmów z zakresu ekspoloracji danych
4,0Student przyswoił sobie umiejętności rozwiązywania problemów oraz implementacji algorytmów w zakresie prezentowanym na zajęciach
4,5Student przyswoił sobie umiejętności rozwiązywania problemów oraz implementacji algorytmów w zakresie prezentowanym na zajęciach, przy rozwiazywaniu zadań wykazyje sie pomysłowością i kreatywnością
5,0Student przyswoił sobie umiejętności rozwiązywania problemów oraz implementacji algorytmów w zakresie prezentowanym na zajęciach, umie dodatkowo wybrać optymalny sposób implementacji algorytmu oraz w wskazać najlepsze metody do rozwiazania konkretnego zagadnienia

Literatura podstawowa

  1. J. Ćwik, J. Koronacki, Statystyczne systemy uczące, Akademicka oficyna wydawnicza EXIT, Warszawa, 2008
  2. David MacKay, Information Theory, Inference, and Learning Algorithms, Cambridge University Press, 2003

Treści programowe - laboratoria

KODTreść programowaGodziny
T-L-1Narzędzia analizy danych, Analiza danych w programach Matlab i R, wczytywanie danych, publiczne repozytoria danych4
T-L-2Analiza składowych głównych - zastosowanie do wizualizacji dancyh2
T-L-3Testowanie klasyfikatora, metoda krosswalidacji2
T-L-4Techiniki klasyfikacji: Naiwny klasyfikator Bayesowski, drzewa decyzyjne, k-NN, kasyfikatory funkcyjne: regresjia logistyczna, sieci neuronowe. Zapozninie się z bibliotekami, ekperymentalne porównujące własnośc maszyn kasyfikujących pod względem złożoności próbkowej, skalowanie się algorytmów ze względu na rozmiar danych (liczbę atrybutów i rekordów), eksperymenty na danych rzeczywistych.10
T-L-5Algorytmy grupowania danych: metody hierarchiczne, algorytm k-środków, algorytm EM8
T-L-6Algorytm wyszukiwania reguł asocjacyjnych (implemetacja) warianty apriori lub algorytm wykorzystujący drzewo wyliczające podzbiory, wyszukiwanie reguł pareto-optymalnych4
30

Treści programowe - wykłady

KODTreść programowaGodziny
T-W-1Komponenty zadania ekslporacji danych, algorytmiczne aspekty eksploracji danych.2
T-W-2Rodzaje zadań eksploracji danych: identyfikacja rozkłądu, klasyfikacja, regresja, wykrywanie reguł i wzorców. Metody preprocesingu danych: braki w danych, skalowanie i dyskretyzacja atrybutów, techiki wizualizacji, metoda PCA, metody identyfikacji rozkładów2
T-W-3Identyfikacja rozkładu i grupwanie, metoda największej wiarygodności, algorytm EM oraz algorytm K-środków2
T-W-4Ocena jakości maszyn klasyfikujących i regresyjnych, testowanie, kroswalidacja, metoda bootstrap2
T-W-5Klasyfikator bayesa, założenie naiwne, optymalny klasyfikator bayesowski2
T-W-6Drzewa klasyfikujące, budowa drzewa, miary zanieczyszczenia, przycinanie, algorytm CART2
T-W-7Wykrywanie reguł asocjacujnych, wsparcie, zaufanie, algorytm apriori, algorytm wykorzystujący drzewo wyliczające podzbiory, reguły pareto-optymalne3
15

Formy aktywności - laboratoria

KODForma aktywnościGodziny
A-L-1Uczestnictwo w zajęciach30
A-L-2przygotowanie do zajęć2
A-L-3praca nad zadaniami programistycznymi oraz sprawozdaniami2
A-L-4Udział w konsultacjach i zaliczeniu2
36
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta

Formy aktywności - wykłady

KODForma aktywnościGodziny
A-W-1Uczestnictwo w wykładach15
A-W-2konsultacje2
A-W-3Przygotowanie do egzaminu7
24
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaIC_1A_O/02-01_W01Po ukończeniu zajęć student rozróżnia podstawowe pojecia oraz zadania analizy danych, zna podstawowe techniki eksploracji danych oraz umie je stosować w sytuacjach praktycznych w sytuacjach praktycznych, zna wybrane algorytmy eksploracji danych
Odniesienie do efektów kształcenia dla kierunku studiówIC_1A_W04Posiada wiedzę z zakresu algorytmiki
IC_1A_W07Zna metody gromadzenia i przetwarzania danych
Cel przedmiotuC-2Ukształtowanie umiejętności rozpoznawania róznych metod eksploracji danych w sytuacjach praktycznych oraz wyboru odpowiednich technik to ich rozwiązywania
C-1Zapoznanie się z różnymi technikami analizy i eksploracji danych
Treści programoweT-W-6Drzewa klasyfikujące, budowa drzewa, miary zanieczyszczenia, przycinanie, algorytm CART
T-W-3Identyfikacja rozkładu i grupwanie, metoda największej wiarygodności, algorytm EM oraz algorytm K-środków
T-W-7Wykrywanie reguł asocjacujnych, wsparcie, zaufanie, algorytm apriori, algorytm wykorzystujący drzewo wyliczające podzbiory, reguły pareto-optymalne
T-W-5Klasyfikator bayesa, założenie naiwne, optymalny klasyfikator bayesowski
T-W-4Ocena jakości maszyn klasyfikujących i regresyjnych, testowanie, kroswalidacja, metoda bootstrap
T-W-1Komponenty zadania ekslporacji danych, algorytmiczne aspekty eksploracji danych.
T-W-2Rodzaje zadań eksploracji danych: identyfikacja rozkłądu, klasyfikacja, regresja, wykrywanie reguł i wzorców. Metody preprocesingu danych: braki w danych, skalowanie i dyskretyzacja atrybutów, techiki wizualizacji, metoda PCA, metody identyfikacji rozkładów
T-L-1Narzędzia analizy danych, Analiza danych w programach Matlab i R, wczytywanie danych, publiczne repozytoria danych
T-L-3Testowanie klasyfikatora, metoda krosswalidacji
T-L-2Analiza składowych głównych - zastosowanie do wizualizacji dancyh
T-L-6Algorytm wyszukiwania reguł asocjacyjnych (implemetacja) warianty apriori lub algorytm wykorzystujący drzewo wyliczające podzbiory, wyszukiwanie reguł pareto-optymalnych
T-L-5Algorytmy grupowania danych: metody hierarchiczne, algorytm k-środków, algorytm EM
T-L-4Techiniki klasyfikacji: Naiwny klasyfikator Bayesowski, drzewa decyzyjne, k-NN, kasyfikatory funkcyjne: regresjia logistyczna, sieci neuronowe. Zapozninie się z bibliotekami, ekperymentalne porównujące własnośc maszyn kasyfikujących pod względem złożoności próbkowej, skalowanie się algorytmów ze względu na rozmiar danych (liczbę atrybutów i rekordów), eksperymenty na danych rzeczywistych.
Metody nauczaniaM-1Wykład prezentacja w postaci slajdów
M-2Laboratoria praca przy komputerach w środowisku programu Matlab, Python lub R, głównie wykorzystywnie dostępnych bibliotek, oraz przygotowywanie sprawozdań
Sposób ocenyS-1Ocena formująca: laboratorium ocena sprawozdań
S-3Ocena formująca: Laboratorium: ocena pracy na zajęciach
S-4Ocena podsumowująca: egzamin ustny
Kryteria ocenyOcenaKryterium oceny
2,0Student nie przyswoił sobie podstawowej wiedzy z zakresu eksploracji danych
3,0Student przyswoił sobie podstawową wiedzę z zakresu eksploracji danych w stopniu zadowalającym
3,5Student przyswoił sobie podstawową wiedzę z zakresu eksploracji danych
4,0Student przyswoił sobie prezentowaną na zajęciach wiedzę z zakresu eksploracji danych
4,5Student przyswoił sobie prezentowaną na zajęciach wiedzę z zakresu eksploracji danych, zna algorytmy aksploracji danych umie je stosować w problemach praktycznych
5,0Student przyswoił sobie prezentowaną na zajęciach wiedzę z zakresu eksploracji danych, zna algorytmy aksploracji danych umie je stosować w problemach praktycznych, zna zalety i ograniczenia stosowanych metod i algorytmów
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaIC_1A_O/02-01_U01Student potrafi potrafi stosowac algorytmy elsploracji danych w zadaniach praktycznych oraz umie implementiowac wybrane algorytmy
Odniesienie do efektów kształcenia dla kierunku studiówIC_1A_U19Potrafi wykorzystać w przedsięwzięciach informatycznych metody analityczne, symulacyjne i eksperymentalne
IC_1A_U24Umie zastosować metody sztucznej inteligencji w przedsięwzięciach informatycznych
Cel przedmiotuC-2Ukształtowanie umiejętności rozpoznawania róznych metod eksploracji danych w sytuacjach praktycznych oraz wyboru odpowiednich technik to ich rozwiązywania
C-1Zapoznanie się z różnymi technikami analizy i eksploracji danych
Treści programoweT-W-6Drzewa klasyfikujące, budowa drzewa, miary zanieczyszczenia, przycinanie, algorytm CART
T-W-3Identyfikacja rozkładu i grupwanie, metoda największej wiarygodności, algorytm EM oraz algorytm K-środków
T-W-7Wykrywanie reguł asocjacujnych, wsparcie, zaufanie, algorytm apriori, algorytm wykorzystujący drzewo wyliczające podzbiory, reguły pareto-optymalne
T-W-5Klasyfikator bayesa, założenie naiwne, optymalny klasyfikator bayesowski
T-W-4Ocena jakości maszyn klasyfikujących i regresyjnych, testowanie, kroswalidacja, metoda bootstrap
T-W-1Komponenty zadania ekslporacji danych, algorytmiczne aspekty eksploracji danych.
T-W-2Rodzaje zadań eksploracji danych: identyfikacja rozkłądu, klasyfikacja, regresja, wykrywanie reguł i wzorców. Metody preprocesingu danych: braki w danych, skalowanie i dyskretyzacja atrybutów, techiki wizualizacji, metoda PCA, metody identyfikacji rozkładów
T-L-1Narzędzia analizy danych, Analiza danych w programach Matlab i R, wczytywanie danych, publiczne repozytoria danych
T-L-3Testowanie klasyfikatora, metoda krosswalidacji
T-L-2Analiza składowych głównych - zastosowanie do wizualizacji dancyh
T-L-6Algorytm wyszukiwania reguł asocjacyjnych (implemetacja) warianty apriori lub algorytm wykorzystujący drzewo wyliczające podzbiory, wyszukiwanie reguł pareto-optymalnych
T-L-5Algorytmy grupowania danych: metody hierarchiczne, algorytm k-środków, algorytm EM
T-L-4Techiniki klasyfikacji: Naiwny klasyfikator Bayesowski, drzewa decyzyjne, k-NN, kasyfikatory funkcyjne: regresjia logistyczna, sieci neuronowe. Zapozninie się z bibliotekami, ekperymentalne porównujące własnośc maszyn kasyfikujących pod względem złożoności próbkowej, skalowanie się algorytmów ze względu na rozmiar danych (liczbę atrybutów i rekordów), eksperymenty na danych rzeczywistych.
Metody nauczaniaM-1Wykład prezentacja w postaci slajdów
M-2Laboratoria praca przy komputerach w środowisku programu Matlab, Python lub R, głównie wykorzystywnie dostępnych bibliotek, oraz przygotowywanie sprawozdań
Sposób ocenyS-1Ocena formująca: laboratorium ocena sprawozdań
S-3Ocena formująca: Laboratorium: ocena pracy na zajęciach
S-4Ocena podsumowująca: egzamin ustny
S-2Ocena formująca: Laboratorium: ocena zadań
Kryteria ocenyOcenaKryterium oceny
2,0Student nie przyswoił sobie podstawowych umiejętności rozwiązywania problemów oraz implementacji algorytmów z zakresu ekspoloracji danych
3,0Student przyswoił sobie podstawowe umiejętności rozwiązywania problemów oraz implementacji algorytmów z zakresu ekspoloracji danych w stopniu zadowalającycm
3,5Student przyswoił sobie podstawowe umiejętności rozwiązywania problemów oraz implementacji algorytmów z zakresu ekspoloracji danych
4,0Student przyswoił sobie umiejętności rozwiązywania problemów oraz implementacji algorytmów w zakresie prezentowanym na zajęciach
4,5Student przyswoił sobie umiejętności rozwiązywania problemów oraz implementacji algorytmów w zakresie prezentowanym na zajęciach, przy rozwiazywaniu zadań wykazyje sie pomysłowością i kreatywnością
5,0Student przyswoił sobie umiejętności rozwiązywania problemów oraz implementacji algorytmów w zakresie prezentowanym na zajęciach, umie dodatkowo wybrać optymalny sposób implementacji algorytmu oraz w wskazać najlepsze metody do rozwiazania konkretnego zagadnienia