УЧЕБНА ПРОГРАМА
по дисциплината
УВОД В КОМПЮТЪРНАТА ЛИНГВИСТИКА
специалност БФ, МП „КОМПЮТЪРНА ЛИНГВИСТИКА. ИНТЕРНЕТ ТЕХНОЛОГИИ В ХУМАНИТАРИСТИКАТА”
Образователно-квалификационна степен МАГИСТЪР
Вид обучение: РЕДОВНО
Извадка от учебния план
Наименование на дисциплината
|
Хорариум |
ECTS- кредити |
Форма на заключителен контрол |
|||
Лекции |
Семинарни упражнения |
Практически упражнения |
Хоспитиране |
|||
Увод в компютърната лингвистика
|
30 |
|
|
|
3 |
изпит |
Анотация
Курсът запознава студентите с езиковата многозначност, с приложението на електронните корпуси, с регулярни езици и регулярни граматики, както и с приложението на регулярните изрази, с различни нива на предварителна обработка на текста.
Форми и методи на оценяване:изпит
Лекционен курс
Тема № |
Наименование на темата |
Хорариум |
1 |
Предмет на компютърната лингвистика и нейното приложение. |
1 ч. |
2. |
Езикова многозначност. |
1 ч. |
3. |
Електронни корпуси – приложение
|
2 ч. |
4. |
Регулярни езици и регулярни граматики.
|
2 ч. |
5. |
Приложение на регулярните изрази.
|
1 ч. |
6. |
Фразово-структурни граматики.
|
1 ч. |
7. |
Контекстно-свободни и контекстно-зависими граматики. |
1 ч. |
8. |
Формални граматики – йерархия на Чомски.
|
1 ч. |
9. |
Предварителна обработка на текста – токънизация.
|
3 ч. |
10. |
Основни модели за представяне на информацията във флективни речници.
|
3 ч. |
11. |
Приложение на крайните автомати.
|
2 ч. |
12. |
Лексикални класове. Отстраняване на граматична многозначност.
|
3 ч. |
13. |
Видове тагери – базирани на статистически модели и лингвистични правила.
|
3 ч. |
14. |
Други нива на предварителна обработка на текста – лематизация, парсиране, автоматично отстраняване на семантична многозначност.
|
3 ч. |
15. |
Лексикално-семантични мрежи. WordNet. |
3 ч. |
Съставили програмата: проф. д-р Светла Коева
Литература:
1. Jurafsky and Martin, SPEECH and LANGUAGE PROCESSING: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, Second Edition, McGraw Hill, 2008.
2. Roland Hausser, Foundations of Computational Linguistics: Man-Machine Communication in Natural Language, Friedrich-Alexander-Universitat Erlangen-Nfirnberg, Berlin: Springer, 1999.
3. Edward Stabler, Notes on Computational Linguistics, UCLA, 2003.
4. Christopher D. Manning, Prabhakar Raghavan & Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press, 2008.
5. Ivo Ipsic (edt.) Speech and Language Technologies, InTech, Published: June 21, 2011 under CC BY-NC-SA 3.0 license, in subject Numerical Analysis and Scientific Computing DOI: 10.5772/938
6. Коева, Св. Езикови ресурси и компютърни програми с приложение в лингвистичните изследвания, в: Приложение на информационните технологии в работата на филолога и при изграждането на езикови ресурси, Архимед, София, 54-75, 2009. ISBN 987-954-779-106-0
Учебната програма е приета с решение на катедрен съвет протокол N 8/08.07.2011 год.