Zachodniopomorski Uniwersytet Technologiczny w Szczecinie

Wydział Biotechnologii i Hodowli Zwierząt - Biologia (N2)
specjalność: Biologia wód

Sylabus przedmiotu Metody data mining w badaniach biologicznych:

Informacje podstawowe

Kierunek studiów Biologia
Forma studiów studia niestacjonarne Poziom drugiego stopnia
Tytuł zawodowy absolwenta magister
Obszary studiów nauk przyrodniczych
Profil ogólnoakademicki
Moduł
Przedmiot Metody data mining w badaniach biologicznych
Specjalność Biologia molekularna i podstawy analityki
Jednostka prowadząca Katedra Nauk o Zwierzętach Przeżuwających
Nauczyciel odpowiedzialny Wilhelm Grzesiak <Wilhelm.Grzesiak@zut.edu.pl>
Inni nauczyciele Daniel Zaborski <Daniel.Zaborski@zut.edu.pl>
ECTS (planowane) 3,0 ECTS (formy) 3,0
Forma zaliczenia zaliczenie Język polski
Blok obieralny 5 Grupa obieralna 4

Formy dydaktyczne

Forma dydaktycznaKODSemestrGodzinyECTSWagaZaliczenie
ćwiczenia audytoryjneA3 5 1,50,41zaliczenie
wykładyW3 5 1,50,59zaliczenie

Wymagania wstępne

KODWymaganie wstępne
W-1Podstawy statystyki i metod stosowanych w statystyce

Cele przedmiotu

KODCel modułu/przedmiotu
C-1Zapoznanie studentów z różnymi metodami zgłębiania danych w analizach biologicznych

Treści programowe z podziałem na formy zajęć

KODTreść programowaGodziny
ćwiczenia audytoryjne
T-A-1Przygotowywanie dużych zbiorów danych w oparciu o konkretne przykłady, czyszczenie, integracja, selekcja, transformowanie danych1
T-A-2Wykorzystanie analizy dyskryminacji w zagadnieniach klasyfikacyjnych2
T-A-3Zastosowanie drzew decyzyjnych w klasyfikacji i regresji1
T-A-4Reguły asocjacyjne oraz techniki ewaluacji modelu1
5
wykłady
T-W-1Wprowadzenie w problematykę data mining, przegląd programów do eksploracji danych Metody redukcji wymiaru danych, wstępna obrobka danych, poznawanie zbioru danych, badanie relacji1
T-W-2Zadania eksploracyjne - opis, estymacja, predykcja, klasyfikacja, grupowanie i odkrywanie regul1
T-W-3Modele regresji wielorakiej i regresji logistycznej,1
T-W-4Sztuczne sieci neuronowe, rodzaje zastosowania, budowa i algorytmy uczące1
T-W-5Inne modele zgłebiania danych - Naiwny klasyfikator Bayesa, metoda MARS1
5

Obciążenie pracą studenta - formy aktywności

KODForma aktywnościGodziny
ćwiczenia audytoryjne
A-A-1Przygotowanie do zajęć5
A-A-2Samodzielne studiowanie tematyki ćwiczeń audytoryjnych22
A-A-3Przygotowanie do zaliczenia16
A-A-4Zaliczenie pisemne2
45
wykłady
A-W-1udzial studentów w wykładach5
A-W-2Samodzielne pogłebianie wiedzy dotyczącej omawianego zagadnienia25
A-W-3Przygotowanie do pisemnego zaliczenia15
45

Metody nauczania / narzędzia dydaktyczne

KODMetoda nauczania / narzędzie dydaktyczne
M-1wykład inforamcyjny prezentujący poszczególne zagadnienia
M-2Prezentacje multimedialne przy wykorzystaniu komputera i projektora
M-3pokaz oraz symulacja działania programów prezentujących poszczególne metody

Sposoby oceny

KODSposób oceny
S-1Ocena podsumowująca: sprawdzian zaliczeniowy z prowadzonych wykładów i ćwiczeń

Zamierzone efekty kształcenia - wiedza

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
BL_2A_BLM-S-O4.4_W01
umiejętność wykorzystania zaawansowanych metod statystycznych do wnikliwej analizy złożonych danych biologicznych
BL_2A_W05P2A_W01, P2A_W03, P2A_W06C-1T-W-2, T-W-3, T-W-4, T-W-5, T-W-1M-2, M-3, M-1S-1

Zamierzone efekty kształcenia - umiejętności

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
BL_2A_BLM-S-O4.4_U01
Potrafi wykorzystać poznane metody do pogłębionej analizy populacji biologicznej
BL_2A_U07, BL_2A_U15P2A_U02, P2A_U03, P2A_U05, P2A_U06, P2A_U07, P2A_U09, P2A_U10C-1T-A-2, T-A-3, T-A-1, T-A-4M-2, M-3, M-1S-1

Zamierzone efekty kształcenia - inne kompetencje społeczne i personalne

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
BL_2A_BLM-S-O4.4_K01
jest zorientowany w możliwościach wydobywania ukrytej wiedzy z danych ze zdolnością do wykorzystania podejścia naukoego
BL_2A_K01P2A_K04, P2A_K07C-1T-W-1, T-W-5, T-A-3, T-W-2, T-W-3, T-W-4, T-A-1, T-A-4, T-A-2M-2, M-3, M-1S-1

Kryterium oceny - wiedza

Efekt kształceniaOcenaKryterium oceny
BL_2A_BLM-S-O4.4_W01
umiejętność wykorzystania zaawansowanych metod statystycznych do wnikliwej analizy złożonych danych biologicznych
2,0
3,0Student potrafi opisać stosowane na zajęciach metody data mining
3,5
4,0
4,5
5,0

Kryterium oceny - umiejętności

Efekt kształceniaOcenaKryterium oceny
BL_2A_BLM-S-O4.4_U01
Potrafi wykorzystać poznane metody do pogłębionej analizy populacji biologicznej
2,0
3,0Student potrafi w oparciu o program komputerowy przeprowadzić analizę danych za pomoca wybranej metody data mining
3,5
4,0
4,5
5,0

Literatura podstawowa

  1. Stanisz A., Przystępny kurs statystyki. t III Analizy wielowymiarowe., StatSoft, Kraków, 2005
  2. Gatnar E., Podejście wielomodelowe w zagadnieniach dyskryminacji i regresji, PWN, Warszawa, 2008

Literatura dodatkowa

  1. Hastie T., Tibshirani R., Friedman J., The elements of Statistical Learning, Data mining Inference and Prediction, Springer, 2001

Treści programowe - ćwiczenia audytoryjne

KODTreść programowaGodziny
T-A-1Przygotowywanie dużych zbiorów danych w oparciu o konkretne przykłady, czyszczenie, integracja, selekcja, transformowanie danych1
T-A-2Wykorzystanie analizy dyskryminacji w zagadnieniach klasyfikacyjnych2
T-A-3Zastosowanie drzew decyzyjnych w klasyfikacji i regresji1
T-A-4Reguły asocjacyjne oraz techniki ewaluacji modelu1
5

Treści programowe - wykłady

KODTreść programowaGodziny
T-W-1Wprowadzenie w problematykę data mining, przegląd programów do eksploracji danych Metody redukcji wymiaru danych, wstępna obrobka danych, poznawanie zbioru danych, badanie relacji1
T-W-2Zadania eksploracyjne - opis, estymacja, predykcja, klasyfikacja, grupowanie i odkrywanie regul1
T-W-3Modele regresji wielorakiej i regresji logistycznej,1
T-W-4Sztuczne sieci neuronowe, rodzaje zastosowania, budowa i algorytmy uczące1
T-W-5Inne modele zgłebiania danych - Naiwny klasyfikator Bayesa, metoda MARS1
5

Formy aktywności - ćwiczenia audytoryjne

KODForma aktywnościGodziny
A-A-1Przygotowanie do zajęć5
A-A-2Samodzielne studiowanie tematyki ćwiczeń audytoryjnych22
A-A-3Przygotowanie do zaliczenia16
A-A-4Zaliczenie pisemne2
45
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta

Formy aktywności - wykłady

KODForma aktywnościGodziny
A-W-1udzial studentów w wykładach5
A-W-2Samodzielne pogłebianie wiedzy dotyczącej omawianego zagadnienia25
A-W-3Przygotowanie do pisemnego zaliczenia15
45
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaBL_2A_BLM-S-O4.4_W01umiejętność wykorzystania zaawansowanych metod statystycznych do wnikliwej analizy złożonych danych biologicznych
Odniesienie do efektów kształcenia dla kierunku studiówBL_2A_W05posiada zaawansowaną wiedzę na temat możliwości wykorzystania metod obliczeniowych i informatycznych do modelowania zjawisk i procesów zachodzących na wszystkich poziomach hierarchicznej organizacji biologicznej
Odniesienie do efektów zdefiniowanych dla obszaru kształceniaP2A_W01rozumie złożone zjawiska i procesy przyrodnicze
P2A_W03ma pogłębioną wiedzę z zakresu tych nauk ścisłych, z którymi związany jest studiowany kierunek studiów (w szczególności biofizyka, biochemia, biomatematyka, geochemia, biogeochemia, geofizyka)
P2A_W06ma wiedzę w zakresie statystyki na poziomie prognozowania (modelowania) przebiegu zjawisk i procesów przyrodniczych oraz ma znajomość specjalistycznych narzędzi informatycznych
Cel przedmiotuC-1Zapoznanie studentów z różnymi metodami zgłębiania danych w analizach biologicznych
Treści programoweT-W-2Zadania eksploracyjne - opis, estymacja, predykcja, klasyfikacja, grupowanie i odkrywanie regul
T-W-3Modele regresji wielorakiej i regresji logistycznej,
T-W-4Sztuczne sieci neuronowe, rodzaje zastosowania, budowa i algorytmy uczące
T-W-5Inne modele zgłebiania danych - Naiwny klasyfikator Bayesa, metoda MARS
T-W-1Wprowadzenie w problematykę data mining, przegląd programów do eksploracji danych Metody redukcji wymiaru danych, wstępna obrobka danych, poznawanie zbioru danych, badanie relacji
Metody nauczaniaM-2Prezentacje multimedialne przy wykorzystaniu komputera i projektora
M-3pokaz oraz symulacja działania programów prezentujących poszczególne metody
M-1wykład inforamcyjny prezentujący poszczególne zagadnienia
Sposób ocenyS-1Ocena podsumowująca: sprawdzian zaliczeniowy z prowadzonych wykładów i ćwiczeń
Kryteria ocenyOcenaKryterium oceny
2,0
3,0Student potrafi opisać stosowane na zajęciach metody data mining
3,5
4,0
4,5
5,0
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaBL_2A_BLM-S-O4.4_U01Potrafi wykorzystać poznane metody do pogłębionej analizy populacji biologicznej
Odniesienie do efektów kształcenia dla kierunku studiówBL_2A_U07ma pogłębioną wiedzę bioinformatyczną i posiada umiejętność jej stosowania w pracy biologa, posługuje się metodami statystyki matematycznej w analizie danych doświadczalnych i obserwacji biologicznych;
BL_2A_U15student posiada umiejętność prawidłowego zastosowania specjalistycznej terminologii, a w pracy badawczej zastosować poznane metody, potrafi także przygotować projekt własnych badań naukowych prawidłowo dobierając piśmiennictwo;
Odniesienie do efektów zdefiniowanych dla obszaru kształceniaP2A_U02biegle wykorzystuje literaturę naukową z zakresu dziedzin nauki i dyscyplin naukowych, właściwych dla studiowanego kierunku studiów, w języku polskim; czyta ze zrozumieniem skomplikowane teksty naukowe w języku angielskim
P2A_U03wykazuje umiejętność krytycznej analizy i selekcji informacji, zwłaszcza ze źródeł elektronicznych
P2A_U05stosuje metody statystyczne oraz techniki i narzędzia informatyczne do opisu zjawisk i analizy danych o charakterze specjalistycznym
P2A_U06zbiera i interpretuje dane empiryczne oraz na tej podstawie formułuje odpowiednie wnioski
P2A_U07wykazuje umiejętność formułowania uzasadnionych sądów na podstawie danych pochodzących z różnych źródeł
P2A_U09wykazuje umiejętność napisania pracy badawczej w języku polskim oraz krótkiego doniesienia naukowego w języku obcym na podstawie własnych badań naukowych
P2A_U10posiada umiejętność wystąpień ustnych w języku polskim i języku obcym dotyczących, zagadnień szczegółowych z zakresu dziedzin nauki i dyscyplin naukowych, właściwych dla studiowanego kierunku studiów
Cel przedmiotuC-1Zapoznanie studentów z różnymi metodami zgłębiania danych w analizach biologicznych
Treści programoweT-A-2Wykorzystanie analizy dyskryminacji w zagadnieniach klasyfikacyjnych
T-A-3Zastosowanie drzew decyzyjnych w klasyfikacji i regresji
T-A-1Przygotowywanie dużych zbiorów danych w oparciu o konkretne przykłady, czyszczenie, integracja, selekcja, transformowanie danych
T-A-4Reguły asocjacyjne oraz techniki ewaluacji modelu
Metody nauczaniaM-2Prezentacje multimedialne przy wykorzystaniu komputera i projektora
M-3pokaz oraz symulacja działania programów prezentujących poszczególne metody
M-1wykład inforamcyjny prezentujący poszczególne zagadnienia
Sposób ocenyS-1Ocena podsumowująca: sprawdzian zaliczeniowy z prowadzonych wykładów i ćwiczeń
Kryteria ocenyOcenaKryterium oceny
2,0
3,0Student potrafi w oparciu o program komputerowy przeprowadzić analizę danych za pomoca wybranej metody data mining
3,5
4,0
4,5
5,0
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaBL_2A_BLM-S-O4.4_K01jest zorientowany w możliwościach wydobywania ukrytej wiedzy z danych ze zdolnością do wykorzystania podejścia naukoego
Odniesienie do efektów kształcenia dla kierunku studiówBL_2A_K01wykazuje zrozumienie i przekonanie o poznawalności procesów i zjawisk biologicznych zachodzących w świecie żywych organizmów; w interpretowaniu procesów i zjawisk biologicznych wykorzystuje podejście naukowe
Odniesienie do efektów zdefiniowanych dla obszaru kształceniaP2A_K04prawidłowo identyfikuje i rozstrzyga dylematy związane z wykonywaniem zawodu
P2A_K07systematycznie aktualizuje wiedzę przyrodniczą i zna jej praktyczne zastosowania
Cel przedmiotuC-1Zapoznanie studentów z różnymi metodami zgłębiania danych w analizach biologicznych
Treści programoweT-W-1Wprowadzenie w problematykę data mining, przegląd programów do eksploracji danych Metody redukcji wymiaru danych, wstępna obrobka danych, poznawanie zbioru danych, badanie relacji
T-W-5Inne modele zgłebiania danych - Naiwny klasyfikator Bayesa, metoda MARS
T-A-3Zastosowanie drzew decyzyjnych w klasyfikacji i regresji
T-W-2Zadania eksploracyjne - opis, estymacja, predykcja, klasyfikacja, grupowanie i odkrywanie regul
T-W-3Modele regresji wielorakiej i regresji logistycznej,
T-W-4Sztuczne sieci neuronowe, rodzaje zastosowania, budowa i algorytmy uczące
T-A-1Przygotowywanie dużych zbiorów danych w oparciu o konkretne przykłady, czyszczenie, integracja, selekcja, transformowanie danych
T-A-4Reguły asocjacyjne oraz techniki ewaluacji modelu
T-A-2Wykorzystanie analizy dyskryminacji w zagadnieniach klasyfikacyjnych
Metody nauczaniaM-2Prezentacje multimedialne przy wykorzystaniu komputera i projektora
M-3pokaz oraz symulacja działania programów prezentujących poszczególne metody
M-1wykład inforamcyjny prezentujący poszczególne zagadnienia
Sposób ocenyS-1Ocena podsumowująca: sprawdzian zaliczeniowy z prowadzonych wykładów i ćwiczeń