Wydział Informatyki - Informatyka (S2)
specjalność: grafika komputerowa i systemy multimedialne
Sylabus przedmiotu Eksploracja baz tekstowych - Przedmiot obieralny II:
Informacje podstawowe
Kierunek studiów | Informatyka | ||
---|---|---|---|
Forma studiów | studia stacjonarne | Poziom | drugiego stopnia |
Tytuł zawodowy absolwenta | magister | ||
Obszary studiów | nauki techniczne | ||
Profil | ogólnoakademicki | ||
Moduł | — | ||
Przedmiot | Eksploracja baz tekstowych - Przedmiot obieralny II | ||
Specjalność | internet w zarządzaniu | ||
Jednostka prowadząca | Katedra Inżynierii Systemów Informacyjnych | ||
Nauczyciel odpowiedzialny | Jarosław Wątróbski <Jaroslaw.Watrobski@zut.edu.pl> | ||
Inni nauczyciele | |||
ECTS (planowane) | 4,0 | ECTS (formy) | 4,0 |
Forma zaliczenia | zaliczenie | Język | polski |
Blok obieralny | 6 | Grupa obieralna | 1 |
Formy dydaktyczne
Wymagania wstępne
KOD | Wymaganie wstępne |
---|---|
W-1 | Znajomość podstawowych zagadnień z zakresu baz danych |
W-2 | Znajomość zagadnień odkrywania wiedzy z baz danych |
Cele przedmiotu
KOD | Cel modułu/przedmiotu |
---|---|
C-1 | Ukształtowanie umiejętności w zakresie odkrywania wiedzy z teksotowych baz danych dla potrzeb wspomagania decyzji z użyciem technik eksploracji danych i tekstu. Ukształtowanie umiejętności w zakresie stosowania technik odkrywania wiedzy w środowisku Internet |
Treści programowe z podziałem na formy zajęć
KOD | Treść programowa | Godziny |
---|---|---|
laboratoria | ||
T-L-1 | Ustalenie zasad zaliczenia labolatoriów. Przedstawienie oprogramowania. | 2 |
T-L-2 | Zadania wyszukiwania w oparciu o słowa kluczowe w przykladowych tekstowych bazach danych | 2 |
T-L-3 | Zadania wyszukiwania w oparciu o reprezentację wektorową: wyszukiwanie z wykorzystaniem macierzy TFM i odległości kosinusowej w przykladowych tekstowych bazach danych | 6 |
T-L-4 | Wykorzystanie metod Data Mining w przykąldowych tekstowych bazach danych (klasyfikacja oraz grupowanie dokumentów tekstowych, kategoryzacja dokumentów tekstowych, ranking ważności dokumentów, analiza zależności pomiędzy dokumentami, analiza skupień, klasyfikacja bezwzorcowa, grupowanie dokumentów, klasyfikacja dokumentów za pomocą metody k-średnich, wykorzystanie hierarchicznych metod grupowania w klasyfikacji dokumentów tekstowych, zastosowanie sieci neuronowych w klasyfikacji dokumentów. | 8 |
T-L-5 | Przykladowe zadania eksploracji tesktu i wyszukiwania dokumentów z wykorzystaniem ukrytego indeksowania semantycznego, rozkładu SVD macierzy względem wartości szczególnych. Zagadnienia kompresji danych oraz plików odwróconych. | 6 |
T-L-6 | Przykladowe zadania eksploracji sieci Web (Web content mining), eksploracji połączeń sieci Web (Web linkage mining) oraz eksploracji korzystania z sieci Web (Web usage mining). Przykładowe odkrywanie wzorcow dostępu do stron i wzorcow ścieżek nawigacyjnych. | 6 |
30 | ||
wykłady | ||
T-W-1 | Podstawowe definicje. Wprowadzenie do problematyki eksploracji tekstu i baz tekstowych. Systemy Information Retrival oraz miary ocen wyszukiwania | 4 |
T-W-2 | Zadania eksploracji tesktowych baz teskowych i dokumentów tekstowych (wyszukiwanie dokumentów tekstowych w oparciu o zapytania i dokumenty, klasyfikacja oraz grupowanie dokumentów tekstowych, kategoryzacja dokumentów tekstowych, ranking ważności dokumentów, analiza zależności pomiędzy dokumentami). Numeryczna reprezentacja tekstów (reprezentacja oparta na wektorach liczebności słów , określanie podobieństwa pomiędzy dokumentami tekstowymi oraz pomiędzy słowami, metody redukcji wymiaru), analiza skupień (klasyfikacja bezwzorcowa, grupowanie) dokumentów, klasyfikacja dokumentów za pomocą metody k-średnich, wykorzystanie hierarchicznych metod grupowania w klasyfikacji dokumentów tekstowych, zastosowanie sieci neuronowych w klasyfikacji dokumentów. Klasyfikacja wzorcowa dokumentów (neuronowe metody klasyfikacji , klasyfikacja bayerowska, wykorzystanie drzew klasyfikacyjnych w analizie dokumentów tekstowych). Metody pozyskiwania wiedzy z dokumentów tekstowych. Zagadnienie automatycznego generowania streszczeń. Wyszukiwanie informacji w tekstowych bazach danych. | 6 |
T-W-3 | Reprezentacja tekstu i zapytań: podejście oparte o zbiór słów kluczowych.Problem synonimów i polisemii. Problemy zapytań i dokumentów. | 2 |
T-W-4 | Wyszukiwanie w oparciu o reprezentację wektorową, macierz TFM, miary odleglości oraz odległość kosinusowa. Reprezentacja zapytań i dokumantow. Wagi. | 6 |
T-W-5 | Eksploracja tesktu i wyszukiwanie dokumentów (Ukryte indeksowanie semantyczne, rozkład SVD macierzy względem wartości szczególnych, kompresja danych, pliki odwrócone). Problemy eksploracji tekstu. | 4 |
T-W-6 | Zadania eksploracji tekstu (asocjacje, klasyfikacja dokumentów, ekstrakcja cech, grupowanie i kategoryzacja) | 4 |
T-W-7 | Eksploracja sieci Web (Web content mining), eksploracja połączeń sieci Web (Web linkage mining), eksploracja korzystania z sieci Web (Web usage mining). Przyklady zastosowan metod eksploracji. Algorytm Page Rank. Odkrywanie wzorcow dostępu do stron. Odkrywanie wzorcow ścieżek nawigacyjnych. | 4 |
30 |
Obciążenie pracą studenta - formy aktywności
KOD | Forma aktywności | Godziny |
---|---|---|
laboratoria | ||
A-L-1 | udział w laboratoriach | 30 |
A-L-2 | Uczestnictwo w konsultacjach i zaliczeniu formy zajęć | 2 |
A-L-3 | przygotowanie się do laboratoriów i sporządzenie sprawozdań | 15 |
47 | ||
wykłady | ||
A-W-1 | udział w wykładach | 30 |
A-W-2 | przygotowanie do zaliczenia | 36 |
A-W-3 | Uczestnictwo w konsultacjach i zaliczeniu formy zajęć | 2 |
68 |
Metody nauczania / narzędzia dydaktyczne
KOD | Metoda nauczania / narzędzie dydaktyczne |
---|---|
M-1 | Wykład z prezentacjami i przykładami |
M-2 | Ćwiczenia laboratyjne i realizacja zadań praktycznych |
Sposoby oceny
KOD | Sposób oceny |
---|---|
S-1 | Ocena podsumowująca: Wykład: ocena podsumowująca - Zaliczenie pisemne z pytaniami praktycznymi, pytaniami w formie wyboru i opisu - łącznie 5 pytań; |
S-2 | Ocena podsumowująca: Laboratorium : Ogólna ocena na podstawie sprawozdań i obecności |
Zamierzone efekty kształcenia - wiedza
Zamierzone efekty kształcenia | Odniesienie do efektów kształcenia dla kierunku studiów | Odniesienie do efektów zdefiniowanych dla obszaru kształcenia | Cel przedmiotu | Treści programowe | Metody nauczania | Sposób oceny |
---|---|---|---|---|---|---|
I_2A_D15/O4/2-2_W01 Posiada wiedzę w zakresie metod esploracji danych w tesktowych bazach i środowisku Internet | I_2A_W08 | — | C-1 | T-W-1, T-W-3, T-W-2, T-L-1, T-L-2 | M-1 | S-1 |
Zamierzone efekty kształcenia - umiejętności
Zamierzone efekty kształcenia | Odniesienie do efektów kształcenia dla kierunku studiów | Odniesienie do efektów zdefiniowanych dla obszaru kształcenia | Cel przedmiotu | Treści programowe | Metody nauczania | Sposób oceny |
---|---|---|---|---|---|---|
I_2A_D15/O4/2-2_U01 W wyniku przeprowadzonych zajęć student umie analizować i rozwiązywac problemy w zakresie odkrywania wiedzy z tesktowych baz danych oraz w środowisku Internet. Student umie samodzielnie formułować odpowiednią postać zadań eksploracji danych oraz dobierać odpowiednie metody ich rozwiązania. | I_2A_U04, I_2A_U09, I_2A_U10 | — | C-1 | T-L-2, T-L-3, T-L-6, T-L-5, T-L-4 | M-1 | S-1 |
Kryterium oceny - wiedza
Efekt kształcenia | Ocena | Kryterium oceny |
---|---|---|
I_2A_D15/O4/2-2_W01 Posiada wiedzę w zakresie metod esploracji danych w tesktowych bazach i środowisku Internet | 2,0 | Student nie opanował podstawowej wiedzy w zakresie eksploracji baz tekstowych |
3,0 | Student zna podstawowe zadania analizy baz tekstowych, umie je rozwiązywać w prostych sytuacjach praktycznych w zadowalającym stopniu | |
3,5 | Student zna podstawowe zadania analizy danych, umie je rozwiązywać w prostych sytuacjach praktycznych | |
4,0 | Student zna podstawowe zadania analizy danych, umie je rozwiązywać w sytuacjach praktycznych | |
4,5 | Student zna zadania analizy baz tesktowych, umie je rozwiazywać w w sytuacjach praktycznych, samodzielnie umie właściwie rozpoznać rodzaj zadania | |
5,0 | Student zna zadania analizy baz tesktowych, umie je rozwiazywać w w sytuacjach praktycznych, samodzielnie umie właściwie rozpoznać rodzaj zadania i dobrać odpowiednią metodę. |
Kryterium oceny - umiejętności
Efekt kształcenia | Ocena | Kryterium oceny |
---|---|---|
I_2A_D15/O4/2-2_U01 W wyniku przeprowadzonych zajęć student umie analizować i rozwiązywac problemy w zakresie odkrywania wiedzy z tesktowych baz danych oraz w środowisku Internet. Student umie samodzielnie formułować odpowiednią postać zadań eksploracji danych oraz dobierać odpowiednie metody ich rozwiązania. | 2,0 | Student nie posiada umiejętności eksploracji baz tekstowych |
3,0 | Student zna podstawowe zagadnienia esploracji baz tesktowych, umie rozwiązać podstawowe zadania eksploracji tesktu w stopniu zadowalającym | |
3,5 | Student zna podstawowe zagadnienia esploracji baz tesktowych, umie rozwiązać podstawowe zadania eksploracji tesktu | |
4,0 | Student zna zagadnienia i metody esploracji baz tesktowych, umie rozwiązać zadania eksploracji baz tesktowych | |
4,5 | Student zna zagadnienia i metody esploracji baz tesktowych, umie formułować i rozwiązać zadania eksploracji baz tesktowych | |
5,0 | Student zna zagadnienia i metody esploracji baz tesktowych, umie formułować i rozwiązać zadania eksploracji baz tesktowych, umie dobrać wlaściwą metodę do rozważanego problemu |
Literatura podstawowa
- Larose D.T., Odkrywanie wiedzy z danych, Wydawnictwo naukowe PWN, Warszawa, 2006
- Hand D., Mannila H., Smyth P, Eksploracja danych, WNT, Warszawa, 2005
Literatura dodatkowa
- Cichorz P., Systemy uczące się, WNT, Warszawa, 2000
- KlosgenW., Żytkow J.M., Handbook of Data Mining and Knowledge discovery, Oxford University Press, Oxford, 2002