УЧЕБНА ПРОГРАМА
по дисциплината
УВОД В КОМПЮТЪРНАТА ЛИНГВИСТИКА
специалност БФ, МП „КОМПЮТЪРНА ЛИНГВИСТИКА. ИНТЕРНЕТ ТЕХНОЛОГИИ В ХУМАНИТАРИСТИКАТА”
Образователно-квалификационна степен МАГИСТЪР
Вид обучение: РЕДОВНО
Извадка от учебния план
| 
 Наименование на дисциплината 
  | 
 Хорариум  | 
 
 ECTS- кредити  | 
 
 Форма на заключителен контрол  | 
|||
| 
 Лекции  | 
 Семинарни упражнения  | 
 Практически упражнения  | 
 Хоспитиране  | 
|||
| 
 
 
 Увод в компютърната лингвистика 
  | 
 30  | 
 
  | 
 
  | 
 
  | 
 3  | 
 изпит  | 
Анотация
Курсът запознава студентите с езиковата многозначност, с приложението на електронните корпуси, с регулярни езици и регулярни граматики, както и с приложението на регулярните изрази, с различни нива на предварителна обработка на текста.
Форми и методи на оценяване:изпит
Лекционен курс
| 
 Тема №  | 
 Наименование на темата  | 
 Хорариум  | 
| 
 1  | 
 Предмет на компютърната лингвистика и нейното приложение.  | 
 1 ч.  | 
| 
 2.  | 
Езикова многозначност. | 
 1 ч.  | 
| 
 3.  | 
Електронни корпуси – приложение
 
  | 
 2 ч.  | 
| 
 4.  | 
Регулярни езици и регулярни граматики.
 
  | 
 2 ч.  | 
| 
 5.  | 
Приложение на регулярните изрази.
 
  | 
 1 ч.  | 
| 
 6.  | 
Фразово-структурни граматики.
 
  | 
 1 ч.  | 
| 
 7.  | 
 Контекстно-свободни и контекстно-зависими граматики.  | 
 1 ч.  | 
| 
 8.  | 
Формални граматики – йерархия на Чомски.
 
  | 
 1 ч.  | 
| 
 9.  | 
Предварителна обработка на текста – токънизация.
 
  | 
 3 ч.  | 
| 
 10.  | 
Основни модели за представяне на информацията във флективни речници.
 
  | 
 3 ч.  | 
| 
 11.  | 
Приложение на крайните автомати.
 
  | 
 2 ч.  | 
| 
 12.  | 
Лексикални класове. Отстраняване на граматична многозначност.
 
  | 
 3 ч.  | 
| 
 13.  | 
Видове тагери – базирани на статистически модели и лингвистични правила.
 
  | 
 3 ч.  | 
| 
 14.  | 
Други нива на предварителна обработка на текста – лематизация, парсиране, автоматично отстраняване на семантична многозначност.
 
  | 
 3 ч.  | 
| 
 15.  | 
 Лексикално-семантични мрежи. WordNet.  | 
 3 ч.  | 
Съставили програмата: проф. д-р Светла Коева
Литература:
1. Jurafsky and Martin, SPEECH and LANGUAGE PROCESSING: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition, Second Edition, McGraw Hill, 2008.
2. Roland Hausser, Foundations of Computational Linguistics: Man-Machine Communication in Natural Language, Friedrich-Alexander-Universitat Erlangen-Nfirnberg, Berlin: Springer, 1999.
3. Edward Stabler, Notes on Computational Linguistics, UCLA, 2003.
4. Christopher D. Manning, Prabhakar Raghavan & Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press, 2008.
5. Ivo Ipsic (edt.) Speech and Language Technologies, InTech, Published: June 21, 2011 under CC BY-NC-SA 3.0 license, in subject Numerical Analysis and Scientific Computing DOI: 10.5772/938
6. Коева, Св. Езикови ресурси и компютърни програми с приложение в лингвистичните изследвания, в: Приложение на информационните технологии в работата на филолога и при изграждането на езикови ресурси, Архимед, София, 54-75, 2009. ISBN 987-954-779-106-0
Учебната програма е приета с решение на катедрен съвет протокол N 8/08.07.2011 год.
