Zachodniopomorski Uniwersytet Technologiczny w Szczecinie

Wydział Informatyki - Informatyka (S1)

Sylabus przedmiotu Introduction to Natural Language Processing:

Informacje podstawowe

Kierunek studiów Informatyka
Forma studiów studia stacjonarne Poziom pierwszego stopnia
Tytuł zawodowy absolwenta inżynier
Obszary studiów charakterystyki PRK, kompetencje inżynierskie PRK
Profil ogólnoakademicki
Moduł
Przedmiot Introduction to Natural Language Processing
Specjalność przedmiot wspólny
Jednostka prowadząca Katedra Metod Sztucznej Inteligencji i Matematyki Stosowanej
Nauczyciel odpowiedzialny Joanna Kołodziejczyk <Joanna.Kolodziejczyk@zut.edu.pl>
Inni nauczyciele
ECTS (planowane) 4,0 ECTS (formy) 4,0
Forma zaliczenia zaliczenie Język polski
Blok obieralny 6 Grupa obieralna 5

Formy dydaktyczne

Forma dydaktycznaKODSemestrGodzinyECTSWagaZaliczenie
wykładyW6 30 2,00,50zaliczenie
laboratoriaL6 30 2,00,50zaliczenie

Wymagania wstępne

KODWymaganie wstępne
W-1The course does not require any previous knowledge. Python familiarity will be useful.

Cele przedmiotu

KODCel modułu/przedmiotu
C-1To understand the methods used to solve practical problems of NLP, in particular, information retrieval summarization, machine translation
C-2To apply the existing NLP libraries, determine the advantages and disadvantages of different systems, evaluate and compare the results

Treści programowe z podziałem na formy zajęć

KODTreść programowaGodziny
laboratoria
T-L-1Environment preparing - Python Installation and refreshment.3
T-L-2Introduction to SpaCy including basic operation, loading language models and tokenization.3
T-L-3Text Processing Basics including: sentence segmentation, part-of-speech tagging, lemmatization and word frequencies and text preprocessing techniques.4
T-L-4Named Entity Recognition including: understanding and using named entities.3
T-L-5Dependency Parsing including: understanding and visualizing dependency tree.3
T-L-6Word Vectors and Text Similarity including SpaCy's word vectors and calculating text similarity.4
T-L-7Advanced NLP Concepts including topic modelling, sentiment analysis, customizing SpaCy pipeline.5
T-L-8Building a Small NLP Project.5
30
wykłady
T-W-1Text processing: regular expressions, tokenization, sentesces segmentation; n-gram language models6
T-W-2Tagging, Parsing4
T-W-3Naïve bayes and logistics regression – text calssification5
T-W-4Lexical semantics, words as vectors,4
T-W-5Artificial neural networks4
T-W-6Hidden Markov Models3
T-W-7Recursive neural network4
30

Obciążenie pracą studenta - formy aktywności

KODForma aktywnościGodziny
laboratoria
A-L-1Class attendance30
A-L-2Homeworks20
50
wykłady
A-W-1Lecture attendance30
A-W-2Reading literature on the subject18
A-W-3Consultation2
50

Metody nauczania / narzędzia dydaktyczne

KODMetoda nauczania / narzędzie dydaktyczne
M-1Lectures presentation
M-2Discussion
M-3Developing software in Python

Sposoby oceny

KODSposób oceny
S-1Ocena podsumowująca: Testing of knowledge through a multiple choice test
S-2Ocena formująca: Continuous assessment
S-3Ocena formująca: Project work

Zamierzone efekty uczenia się - wiedza

Zamierzone efekty uczenia sięOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaOdniesienie do efektów uczenia się prowadzących do uzyskania tytułu zawodowego inżynieraCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
Itest_1A_C25.10_W01
Student understand the basics of natural language processing (NLP). Has a knowladge on language modeling, text classification, summarization, and machine translation.
I_1A_W05C-1T-W-1, T-W-2, T-W-3, T-W-4, T-W-5, T-W-6, T-W-7M-1, M-2S-1

Zamierzone efekty uczenia się - umiejętności

Zamierzone efekty uczenia sięOdniesienie do efektów kształcenia dla kierunku studiówOdniesienie do efektów zdefiniowanych dla obszaru kształceniaOdniesienie do efektów uczenia się prowadzących do uzyskania tytułu zawodowego inżynieraCel przedmiotuTreści programoweMetody nauczaniaSposób oceny
Itest_1A_C25.10_U01
Students will learn how to use existing NLP libraries and software packages but also the mathematical models underlying computational linguistics.
I_1A_U06C-2T-L-1M-3S-2, S-3

Kryterium oceny - wiedza

Efekt uczenia sięOcenaKryterium oceny
Itest_1A_C25.10_W01
Student understand the basics of natural language processing (NLP). Has a knowladge on language modeling, text classification, summarization, and machine translation.
2,0
3,0Studen understand basic definitions and algorithms in NLP
3,5
4,0
4,5
5,0

Kryterium oceny - umiejętności

Efekt uczenia sięOcenaKryterium oceny
Itest_1A_C25.10_U01
Students will learn how to use existing NLP libraries and software packages but also the mathematical models underlying computational linguistics.
2,0
3,0Performance of tasks and projects at a sufficient level
3,5
4,0
4,5
5,0

Literatura podstawowa

  1. Jurafsky, D., Martin, J., Speech and language processing: An introduction to speech recognition, computational linguistics and natural language processing, Prentice Hall, 2008
  2. Bird, S., Klein, E., Loper, E, Natural language processing with Python, O'Reilly Media, Inc., 2009

Treści programowe - laboratoria

KODTreść programowaGodziny
T-L-1Environment preparing - Python Installation and refreshment.3
T-L-2Introduction to SpaCy including basic operation, loading language models and tokenization.3
T-L-3Text Processing Basics including: sentence segmentation, part-of-speech tagging, lemmatization and word frequencies and text preprocessing techniques.4
T-L-4Named Entity Recognition including: understanding and using named entities.3
T-L-5Dependency Parsing including: understanding and visualizing dependency tree.3
T-L-6Word Vectors and Text Similarity including SpaCy's word vectors and calculating text similarity.4
T-L-7Advanced NLP Concepts including topic modelling, sentiment analysis, customizing SpaCy pipeline.5
T-L-8Building a Small NLP Project.5
30

Treści programowe - wykłady

KODTreść programowaGodziny
T-W-1Text processing: regular expressions, tokenization, sentesces segmentation; n-gram language models6
T-W-2Tagging, Parsing4
T-W-3Naïve bayes and logistics regression – text calssification5
T-W-4Lexical semantics, words as vectors,4
T-W-5Artificial neural networks4
T-W-6Hidden Markov Models3
T-W-7Recursive neural network4
30

Formy aktywności - laboratoria

KODForma aktywnościGodziny
A-L-1Class attendance30
A-L-2Homeworks20
50
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta

Formy aktywności - wykłady

KODForma aktywnościGodziny
A-W-1Lecture attendance30
A-W-2Reading literature on the subject18
A-W-3Consultation2
50
(*) 1 punkt ECTS, odpowiada około 30 godzinom aktywności studenta
PoleKODZnaczenie kodu
Zamierzone efekty uczenia sięItest_1A_C25.10_W01Student understand the basics of natural language processing (NLP). Has a knowladge on language modeling, text classification, summarization, and machine translation.
Odniesienie do efektów kształcenia dla kierunku studiówI_1A_W05Ma wiedzę o nowoczesnych metodach projektowania, analizowania, wytwarzania, testowania oprogramowania oraz rozwiązywania wybranych zadań inżynierskich obejmujących w szczególności narzędzia wspomagające wytwarzanie oprogramowania na różnych etapach powstawania, eksploatacji i rozwoju systemów informatycznych.
Cel przedmiotuC-1To understand the methods used to solve practical problems of NLP, in particular, information retrieval summarization, machine translation
Treści programoweT-W-1Text processing: regular expressions, tokenization, sentesces segmentation; n-gram language models
T-W-2Tagging, Parsing
T-W-3Naïve bayes and logistics regression – text calssification
T-W-4Lexical semantics, words as vectors,
T-W-5Artificial neural networks
T-W-6Hidden Markov Models
T-W-7Recursive neural network
Metody nauczaniaM-1Lectures presentation
M-2Discussion
Sposób ocenyS-1Ocena podsumowująca: Testing of knowledge through a multiple choice test
Kryteria ocenyOcenaKryterium oceny
2,0
3,0Studen understand basic definitions and algorithms in NLP
3,5
4,0
4,5
5,0
PoleKODZnaczenie kodu
Zamierzone efekty uczenia sięItest_1A_C25.10_U01Students will learn how to use existing NLP libraries and software packages but also the mathematical models underlying computational linguistics.
Odniesienie do efektów kształcenia dla kierunku studiówI_1A_U06Potrafi pozyskiwać, przesyłać, przetwarzać dane, podsumowywać wyniki eksperymentów empirycznych, dokonywać interpretacji uzyskanych wyników i formułować wynikające z nich wnioski.
Cel przedmiotuC-2To apply the existing NLP libraries, determine the advantages and disadvantages of different systems, evaluate and compare the results
Treści programoweT-L-1Environment preparing - Python Installation and refreshment.
Metody nauczaniaM-3Developing software in Python
Sposób ocenyS-2Ocena formująca: Continuous assessment
S-3Ocena formująca: Project work
Kryteria ocenyOcenaKryterium oceny
2,0
3,0Performance of tasks and projects at a sufficient level
3,5
4,0
4,5
5,0