Zachodniopomorski Uniwersytet Technologiczny w Szczecinie

Wydział Biotechnologii i Hodowli Zwierząt - Bioinformatyka (S1)

Sylabus przedmiotu Wykorzystanie metod data mining w analizach biologicznych:

Informacje podstawowe

Kierunek studiów Bioinformatyka
Forma studiów studia stacjonarne Poziom pierwszego stopnia
Tytuł zawodowy absolwenta inżynier
Obszary studiów nauk przyrodniczych, nauk technicznych, studiów inżynierskich
Profil ogólnoakademicki
Moduł
Przedmiot Wykorzystanie metod data mining w analizach biologicznych
Specjalność przedmiot wspólny
Jednostka prowadząca Katedra Nauk o Zwierzętach Przeżuwających
Nauczyciel odpowiedzialny Wilhelm Grzesiak <Wilhelm.Grzesiak@zut.edu.pl>
Inni nauczyciele Daniel Zaborski <Daniel.Zaborski@zut.edu.pl>
ECTS (planowane) 3,0 ECTS (formy) 3,0
Forma zaliczenia zaliczenie Język polski
Blok obieralny 8 Grupa obieralna 3

Formy dydaktyczne

Forma dydaktycznaKODSemestrGodzinyECTSWagaZaliczenie
laboratoriaL4 15 1,50,41zaliczenie
wykładyW4 15 1,50,59zaliczenie

Wymagania wstępne

KODWymaganie wstępne
W-1Podstawy statystyki i metod stosowanych w statystyce

Cele przedmiotu

KODCel modułu/przedmiotu
C-1Zapoznanie studentów z różnymi metodami zgłębiania danych w analizach biologicznych

Treści programowe z podziałem na formy zajęć

KODTreść programowaGodziny
laboratoria
T-L-1Wstępna obróbka danych do analizy. Wykorzystanie metod regresji w eksploracji danych biologicznych. Regresja logistyczna i log-liniowa2
T-L-2Zastosowanie analizy dyskryminacji w zadaniach klasyfikacyjnych2
T-L-3Drzewa decyzyjne (CART, CHAID, drzewa ze wzmacnianiem, losowy las)2
T-L-4Sztuczne sieci neuronowe i ich praktyczne zastosowania w analizie danych biologicznych2
T-L-5Metoda MARS jako narzędzie w analizach biologicznych2
T-L-6Analiza skupień (algorytmy grupowania hierarchicznego i algorytm k-średnich)2
T-L-7Algorytm k-najbliższych sąsiadów. Naiwny klasyfikator Bayesa1
T-L-8Zaliczenie praktyczne2
15
wykłady
T-W-1Wprowadzenie w problematykę data mining, przegląd programów do eksploracji danych2
T-W-2Metody redukcji wymiaru danych, wstępna obróbka danych, poznawanie zbioru danych, badanie relacji2
T-W-3Zadania eksploracyjne - opis, estymacja, predykcja, klasyfikacja, grupowanie i odkrywanie reguł1
T-W-4Modele regresji wielorakiej i regresji logistycznej4
T-W-5Sztuczne sieci neuronowe, rodzaje zastosowania, budowa i algorytmy uczące4
T-W-6Inne modele zgłębiania danych - naiwny klasyfikator Bayesa, metoda MARS2
15

Obciążenie pracą studenta - formy aktywności

KODForma aktywnościGodziny
laboratoria
A-L-1uczestnictwo w zajęciach15
A-L-2Przygotowanie teoretyczne do zajęć15
A-L-3Przygotowanie do zaliczenia15
45
wykłady
A-W-1udzial studentów w wykładach15
A-W-2Samodzielne pogłebianie wiedzy dotyczącej omawianego zagadnienia15
A-W-3Przygotowanie do pisemnego zaliczenia15
45

Metody nauczania / narzędzia dydaktyczne

KODMetoda nauczania / narzędzie dydaktyczne
M-1wykład informacyjny prezentujący poszczególne zagadnienia
M-2Prezentacje multimedialne przy wykorzystaniu komputera i projektora
M-3Ćwiczenia laboratoryjne z wykorzystaniem komputera

Sposoby oceny

KODSposób oceny
S-1Ocena podsumowująca: Zaliczenie pisemne wykładów
S-2Ocena podsumowująca: Zaliczenie praktyczne ćwiczeń

Zamierzone efekty kształcenia - wiedza

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaOdniesienie do efektów kształcenia prowadzących do uzyskania tytułu zawodowego inżynieraCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
BI_1A_BI-S-O5.1_W01
Student wymienia poznane na zajęciach programy do analiz data mining, charakteryzuje etapy wstępnej obróbki danych, opisuje zadania eksploracji danych oraz objaśnia zasady działania wybranych metod data mining
BI_1A_W13, BI_1A_W17P1A_W02, P1A_W04, P1A_W05, P1A_W06, P1A_W07, T1A_W02, T1A_W03, T1A_W04, T1A_W06, T1A_W07, T1A_W08InzA_W01, InzA_W03, InzA_W05C-1T-W-1, T-W-2, T-W-3, T-W-4, T-W-5, T-W-6M-1, M-2S-1
BI_1A_BI-S-O5.1_W02
Student opisuje możliwości wykorzystania metod data mining w analizach danych biologicznych na przykładach
BI_1A_W13, BI_1A_W17P1A_W02, P1A_W04, P1A_W05, P1A_W06, P1A_W07, T1A_W02, T1A_W03, T1A_W04, T1A_W06, T1A_W07, T1A_W08InzA_W01, InzA_W03, InzA_W05

Zamierzone efekty kształcenia - umiejętności

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaOdniesienie do efektów kształcenia prowadzących do uzyskania tytułu zawodowego inżynieraCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
BI_1A_BI-S-O5.1_U01
Student wykorzystuje poznane metody do pogłębionej analizy populacji biologicznej
BI_1A_U13T1A_U03, T1A_U04, T1A_U08, T1A_U10InzA_U05, InzA_U06C-1T-L-1, T-L-2, T-L-3, T-L-4, T-L-5, T-L-6, T-L-7M-1, M-2, M-3S-2

Zamierzone efekty kształcenia - inne kompetencje społeczne i personalne

Zamierzone efekty kształceniaOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaOdniesienie do efektów kształcenia prowadzących do uzyskania tytułu zawodowego inżynieraCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
BI_1A_BI-S-O5.1_K01
jest zorientowany w możliwościach wydobywania ukrytej wiedzy z danych ze zdolnością do wykorzystania podejścia naukowego
BI_1A_K02P1A_K01, P1A_K04C-1M-1, M-2, M-3S-1

Kryterium oceny - wiedza

Efekt kształceniaOcenaKryterium oceny
BI_1A_BI-S-O5.1_W01
Student wymienia poznane na zajęciach programy do analiz data mining, charakteryzuje etapy wstępnej obróbki danych, opisuje zadania eksploracji danych oraz objaśnia zasady działania wybranych metod data mining
2,0nie potrafi opisać stosowane na zajęciach metody data mining
3,0potrafi opisać stosowane na zajęciach metody data mining
3,5potrafi dobrze opisać stosowane na zajęciach metody data mining
4,0potrafi dobrze opisać stosowane na zajęciach metody data mining i objaśnić zasady dzialania
4,5potrafi dobrze opisać stosowane na zajęciach metody data mining,m oprzedstawić sposób przygotowania danych, objaśnić zasady dzialania
5,0potrafi bardzo dobrze opisać stosowane na zajęciach metody data mining, oprzedstawić sposób przygotowania danych, objaśnić zasady dzialania
BI_1A_BI-S-O5.1_W02
Student opisuje możliwości wykorzystania metod data mining w analizach danych biologicznych na przykładach
2,0nie potrafi wykonać przykladowego zadania z wybraną metoda data mining
3,0potrafi wykonać przykladowego zadania z wybraną metoda data mining
3,5potrafi wykonać przykladowego zadania z wybraną metoda data mining i przedstawić jakośc modelu oraz prognoz
4,0potrafi wykonać przykladowe zadania z dowolną metodą data mining i przedstawić jakość modelu oraz uzyskanej prognozy
4,5potrafi bardzo dobrze wykonać przykladowe zadania z dowolną metodą data mining i przedstawić jakość modelu oraz uzyskanej prognozy
5,0potrafi bardzo dobrze wykonać przykladowe zadania z dowolną metodą data mining i przedstawić jakość modelu oraz uzyskanej prognozy oraz porowanać zastosowane modele

Literatura podstawowa

  1. Stanisz A., Przystępny kurs statystyki. t III Analizy wielowymiarowe., StatSoft, Kraków, 2005
  2. Gatnar E., Podejście wielomodelowe w zagadnieniach dyskryminacji i regresji, PWN, Warszawa, 2008

Literatura dodatkowa

  1. Hastie T., Tibshirani R., Friedman J., The elements of Statistical Learning, Data mining Inference and Prediction, Springer, 2001

Treści programowe - laboratoria

KODTreść programowaGodziny
T-L-1Wstępna obróbka danych do analizy. Wykorzystanie metod regresji w eksploracji danych biologicznych. Regresja logistyczna i log-liniowa2
T-L-2Zastosowanie analizy dyskryminacji w zadaniach klasyfikacyjnych2
T-L-3Drzewa decyzyjne (CART, CHAID, drzewa ze wzmacnianiem, losowy las)2
T-L-4Sztuczne sieci neuronowe i ich praktyczne zastosowania w analizie danych biologicznych2
T-L-5Metoda MARS jako narzędzie w analizach biologicznych2
T-L-6Analiza skupień (algorytmy grupowania hierarchicznego i algorytm k-średnich)2
T-L-7Algorytm k-najbliższych sąsiadów. Naiwny klasyfikator Bayesa1
T-L-8Zaliczenie praktyczne2
15

Treści programowe - wykłady

KODTreść programowaGodziny
T-W-1Wprowadzenie w problematykę data mining, przegląd programów do eksploracji danych2
T-W-2Metody redukcji wymiaru danych, wstępna obróbka danych, poznawanie zbioru danych, badanie relacji2
T-W-3Zadania eksploracyjne - opis, estymacja, predykcja, klasyfikacja, grupowanie i odkrywanie reguł1
T-W-4Modele regresji wielorakiej i regresji logistycznej4
T-W-5Sztuczne sieci neuronowe, rodzaje zastosowania, budowa i algorytmy uczące4
T-W-6Inne modele zgłębiania danych - naiwny klasyfikator Bayesa, metoda MARS2
15

Formy aktywności - laboratoria

KODForma aktywnościGodziny
A-L-1uczestnictwo w zajęciach15
A-L-2Przygotowanie teoretyczne do zajęć15
A-L-3Przygotowanie do zaliczenia15
45
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta

Formy aktywności - wykłady

KODForma aktywnościGodziny
A-W-1udzial studentów w wykładach15
A-W-2Samodzielne pogłebianie wiedzy dotyczącej omawianego zagadnienia15
A-W-3Przygotowanie do pisemnego zaliczenia15
45
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaBI_1A_BI-S-O5.1_W01Student wymienia poznane na zajęciach programy do analiz data mining, charakteryzuje etapy wstępnej obróbki danych, opisuje zadania eksploracji danych oraz objaśnia zasady działania wybranych metod data mining
Odniesienie do efektów kształcenia dla kierunku studiówBI_1A_W13ma podstawową wiedzę dotyczącą metod sztucznej inteligencji i uczenia maszynowego
BI_1A_W17posiada wiedzę o narzędziach matematycznych i informatycznych, wykorzystywanych w analizach biologicznych i bioinformatycznych
Odniesienie do efektów zdefiniowanych dla obszaru kształceniaP1A_W02w interpretacji zjawisk i procesów przyrodniczych opiera się na podstawach empirycznych, rozumiejąc w pełni znaczenie metod matematycznych i statystycznych
P1A_W04ma wiedzę w zakresie najważniejszych problemów z zakresu dziedzin nauki i dyscyplin naukowych, właściwych dla studiowanego kierunku studiów oraz zna ich powiązania z innymi dyscyplinami przyrodniczymi
P1A_W05ma wiedzę w zakresie podstawowych kategorii pojęciowych i terminologii przyrodniczej oraz ma znajomość rozwoju dziedzin nauki i dyscyplin naukowych, właściwych dla studiowanego kierunku studiów i stosowanych w nich metod badawczych
P1A_W06ma wiedzę w zakresie statystyki i informatyki na poziomie pozwalającym na opisywanie i interpretowanie zjawisk przyrodniczych
P1A_W07ma wiedzę w zakresie podstawowych technik i narzędzi badawczych stosowanych w zakresie dziedzin nauki i dyscyplin naukowych, właściwych dla studiowanego kierunku studiów
T1A_W02ma podstawową wiedzę w zakresie kierunków studiów powiązanych ze studiowanym kierunkiem studiów
T1A_W03ma uporządkowaną, podbudowaną teoretycznie wiedzę ogólną obejmującą kluczowe zagadnienia z zakresu studiowanego kierunku studiów
T1A_W04ma szczegółową wiedzę związaną z wybranymi zagadnieniami z zakresu studiowanego kierunku studiów
T1A_W06ma podstawową wiedzę o cyklu życia urządzeń, obiektów i systemów technicznych
T1A_W07zna podstawowe metody, techniki, narzędzia i materiały stosowane przy rozwiązywaniu prostych zadań inżynierskich z zakresu studiowanego kierunku studiów
T1A_W08ma podstawową wiedzę niezbędną do rozumienia społecznych, ekonomicznych, prawnych i innych pozatechnicznych uwarunkowań działalności inżynierskiej
Odniesienie do efektów kształcenia prowadzących do uzyskania tytułu zawodowego inżynieraInzA_W01ma podstawową wiedzę o cyklu życia urządzeń, obiektów i systemów technicznych
InzA_W03ma podstawową wiedzę niezbędną do rozumienia społecznych, ekonomicznych, prawnych i innych uwarunkowań działalności inżynierskiej
InzA_W05zna typowe technologie inżynierskie w zakresie studiowanego kierunku studiów
Cel przedmiotuC-1Zapoznanie studentów z różnymi metodami zgłębiania danych w analizach biologicznych
Treści programoweT-W-1Wprowadzenie w problematykę data mining, przegląd programów do eksploracji danych
T-W-2Metody redukcji wymiaru danych, wstępna obróbka danych, poznawanie zbioru danych, badanie relacji
T-W-3Zadania eksploracyjne - opis, estymacja, predykcja, klasyfikacja, grupowanie i odkrywanie reguł
T-W-4Modele regresji wielorakiej i regresji logistycznej
T-W-5Sztuczne sieci neuronowe, rodzaje zastosowania, budowa i algorytmy uczące
T-W-6Inne modele zgłębiania danych - naiwny klasyfikator Bayesa, metoda MARS
Metody nauczaniaM-1wykład informacyjny prezentujący poszczególne zagadnienia
M-2Prezentacje multimedialne przy wykorzystaniu komputera i projektora
Sposób ocenyS-1Ocena podsumowująca: Zaliczenie pisemne wykładów
Kryteria ocenyOcenaKryterium oceny
2,0nie potrafi opisać stosowane na zajęciach metody data mining
3,0potrafi opisać stosowane na zajęciach metody data mining
3,5potrafi dobrze opisać stosowane na zajęciach metody data mining
4,0potrafi dobrze opisać stosowane na zajęciach metody data mining i objaśnić zasady dzialania
4,5potrafi dobrze opisać stosowane na zajęciach metody data mining,m oprzedstawić sposób przygotowania danych, objaśnić zasady dzialania
5,0potrafi bardzo dobrze opisać stosowane na zajęciach metody data mining, oprzedstawić sposób przygotowania danych, objaśnić zasady dzialania
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaBI_1A_BI-S-O5.1_W02Student opisuje możliwości wykorzystania metod data mining w analizach danych biologicznych na przykładach
Odniesienie do efektów kształcenia dla kierunku studiówBI_1A_W13ma podstawową wiedzę dotyczącą metod sztucznej inteligencji i uczenia maszynowego
BI_1A_W17posiada wiedzę o narzędziach matematycznych i informatycznych, wykorzystywanych w analizach biologicznych i bioinformatycznych
Odniesienie do efektów zdefiniowanych dla obszaru kształceniaP1A_W02w interpretacji zjawisk i procesów przyrodniczych opiera się na podstawach empirycznych, rozumiejąc w pełni znaczenie metod matematycznych i statystycznych
P1A_W04ma wiedzę w zakresie najważniejszych problemów z zakresu dziedzin nauki i dyscyplin naukowych, właściwych dla studiowanego kierunku studiów oraz zna ich powiązania z innymi dyscyplinami przyrodniczymi
P1A_W05ma wiedzę w zakresie podstawowych kategorii pojęciowych i terminologii przyrodniczej oraz ma znajomość rozwoju dziedzin nauki i dyscyplin naukowych, właściwych dla studiowanego kierunku studiów i stosowanych w nich metod badawczych
P1A_W06ma wiedzę w zakresie statystyki i informatyki na poziomie pozwalającym na opisywanie i interpretowanie zjawisk przyrodniczych
P1A_W07ma wiedzę w zakresie podstawowych technik i narzędzi badawczych stosowanych w zakresie dziedzin nauki i dyscyplin naukowych, właściwych dla studiowanego kierunku studiów
T1A_W02ma podstawową wiedzę w zakresie kierunków studiów powiązanych ze studiowanym kierunkiem studiów
T1A_W03ma uporządkowaną, podbudowaną teoretycznie wiedzę ogólną obejmującą kluczowe zagadnienia z zakresu studiowanego kierunku studiów
T1A_W04ma szczegółową wiedzę związaną z wybranymi zagadnieniami z zakresu studiowanego kierunku studiów
T1A_W06ma podstawową wiedzę o cyklu życia urządzeń, obiektów i systemów technicznych
T1A_W07zna podstawowe metody, techniki, narzędzia i materiały stosowane przy rozwiązywaniu prostych zadań inżynierskich z zakresu studiowanego kierunku studiów
T1A_W08ma podstawową wiedzę niezbędną do rozumienia społecznych, ekonomicznych, prawnych i innych pozatechnicznych uwarunkowań działalności inżynierskiej
Odniesienie do efektów kształcenia prowadzących do uzyskania tytułu zawodowego inżynieraInzA_W01ma podstawową wiedzę o cyklu życia urządzeń, obiektów i systemów technicznych
InzA_W03ma podstawową wiedzę niezbędną do rozumienia społecznych, ekonomicznych, prawnych i innych uwarunkowań działalności inżynierskiej
InzA_W05zna typowe technologie inżynierskie w zakresie studiowanego kierunku studiów
Kryteria ocenyOcenaKryterium oceny
2,0nie potrafi wykonać przykladowego zadania z wybraną metoda data mining
3,0potrafi wykonać przykladowego zadania z wybraną metoda data mining
3,5potrafi wykonać przykladowego zadania z wybraną metoda data mining i przedstawić jakośc modelu oraz prognoz
4,0potrafi wykonać przykladowe zadania z dowolną metodą data mining i przedstawić jakość modelu oraz uzyskanej prognozy
4,5potrafi bardzo dobrze wykonać przykladowe zadania z dowolną metodą data mining i przedstawić jakość modelu oraz uzyskanej prognozy
5,0potrafi bardzo dobrze wykonać przykladowe zadania z dowolną metodą data mining i przedstawić jakość modelu oraz uzyskanej prognozy oraz porowanać zastosowane modele
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaBI_1A_BI-S-O5.1_U01Student wykorzystuje poznane metody do pogłębionej analizy populacji biologicznej
Odniesienie do efektów kształcenia dla kierunku studiówBI_1A_U13rozwiązuje proste problemy techniczne i biologiczne wykorzystując wiedzę o sztucznej inteligencji i uczeniu maszynowym
Odniesienie do efektów zdefiniowanych dla obszaru kształceniaT1A_U03potrafi przygotować w języku polskim i języku obcym, uznawanym za podstawowy dla dziedzin nauki i dyscyplin naukowych właściwych dla studiowanego kierunku studiów, dobrze udokumentowane opracowanie problemów z zakresu studiowanego kierunku studiów
T1A_U04potrafi przygotować i przedstawić w języku polskim i języku obcym prezentację ustną, dotyczącą szczegółowych zagadnień z zakresu studiowanego kierunku studiów
T1A_U08potrafi planować i przeprowadzać eksperymenty, w tym pomiary i symulacje komputerowe, interpretować uzyskane wyniki i wyciągać wnioski
T1A_U10potrafi - przy formułowaniu i rozwiązywaniu zadań inżynierskich - dostrzegać ich aspekty systemowe i pozatechniczne
Odniesienie do efektów kształcenia prowadzących do uzyskania tytułu zawodowego inżynieraInzA_U05potrafi dokonać krytycznej analizy sposobu funkcjonowania i ocenić - zwłaszcza w powiązaniu ze studiowanym kierunkiem studiów - istniejące rozwiązania techniczne, w szczególności urządzenia, obiekty, systemy, procesy, usługi
InzA_U06potrafi dokonać identyfikacji i sformułować specyfikację prostych zadań inżynierskich o charakterze praktycznym, charakterystycznych dla studiowanego kierunku studiów
Cel przedmiotuC-1Zapoznanie studentów z różnymi metodami zgłębiania danych w analizach biologicznych
Treści programoweT-L-1Wstępna obróbka danych do analizy. Wykorzystanie metod regresji w eksploracji danych biologicznych. Regresja logistyczna i log-liniowa
T-L-2Zastosowanie analizy dyskryminacji w zadaniach klasyfikacyjnych
T-L-3Drzewa decyzyjne (CART, CHAID, drzewa ze wzmacnianiem, losowy las)
T-L-4Sztuczne sieci neuronowe i ich praktyczne zastosowania w analizie danych biologicznych
T-L-5Metoda MARS jako narzędzie w analizach biologicznych
T-L-6Analiza skupień (algorytmy grupowania hierarchicznego i algorytm k-średnich)
T-L-7Algorytm k-najbliższych sąsiadów. Naiwny klasyfikator Bayesa
Metody nauczaniaM-1wykład informacyjny prezentujący poszczególne zagadnienia
M-2Prezentacje multimedialne przy wykorzystaniu komputera i projektora
M-3Ćwiczenia laboratoryjne z wykorzystaniem komputera
Sposób ocenyS-2Ocena podsumowująca: Zaliczenie praktyczne ćwiczeń
PoleKODZnaczenie kodu
Zamierzone efekty kształceniaBI_1A_BI-S-O5.1_K01jest zorientowany w możliwościach wydobywania ukrytej wiedzy z danych ze zdolnością do wykorzystania podejścia naukowego
Odniesienie do efektów kształcenia dla kierunku studiówBI_1A_K02wykazuje zrozumienie podstawowych zjawisk i procesów biologicznych, a przy ich interpretacji opiera się na podstawach empirycznych dostrzegając rolę metod matematycznych i statystycznych
Odniesienie do efektów zdefiniowanych dla obszaru kształceniaP1A_K01rozumie potrzebę uczenia się przez całe życie
P1A_K04prawidłowo identyfikuje i rozstrzyga dylematy związane z wykonywaniem zawodu
Cel przedmiotuC-1Zapoznanie studentów z różnymi metodami zgłębiania danych w analizach biologicznych
Metody nauczaniaM-1wykład informacyjny prezentujący poszczególne zagadnienia
M-2Prezentacje multimedialne przy wykorzystaniu komputera i projektora
M-3Ćwiczenia laboratoryjne z wykorzystaniem komputera
Sposób ocenyS-1Ocena podsumowująca: Zaliczenie pisemne wykładów