Корпусна лингвистика

Корпусна лингвистика

Образователно-квалификационна степен: магистър

Вид обучение: редовно

Хорариум ECTS- кредити  Крайна оценка
Лекции Семинарни упражнения Практически упражнения Хоспитиране
15 5 10 3 изпит

 

Анотация

Курсът има за цел да въведе студентите в интердисциплинарното научно направление „Корпусна лингвистика”, предлагащо нова методология за провеждане на лингвистични изследвания, базирани на големи по обем текстови масиви. Основните задачи на курса са:

  • да запознае студентите с основните понятия, методи и технологии, използвани в корпусната лингвистика;
  • да даде основни знания за историята на корпусната лингвистика и съвременното състояние на това научно направление;
  • да представи основните програмни средства, интерфейси и технологии за създаване и обработка на корпуси и за търсене в корпуси;
  • да изгради у студентите умения и навици за работа с информационните ресурси на корпусната лингвистика;
  • да формира у студентите навици за изследователска работа върху различни езикови явления с използване на методите и технологиите на корпусната лингвистика;
  • да запознае студентите със съществуващите корпуси на българския език (преди всичко – Българския национален корпус) и да изгради у тях умения за работа с тях.

 

Форми и методи на оценяване:

 

Оценяват се както теоретичните знания на студентите, така и практическите им умения за работа с различни корпуси и по-специално с Българския национален корпус. По време на практическите и семинарните занятия студентите извършват под ръководството на преподавателя лингвистични наблюдения и изследвания с използване на корпусни методи и изготвят презентации за прилаганите методи, технологии, за етапите на анализа и постигнатите резултати, които се представят като курсови работи и получават текуща оценка.

Курсът завършва с изпит, по време на който студентите представят и заключителна курсова работа по избран теоретичен или практически проблем, свързан с корпусните изследвания. Крайната оценка се оформя, като се вземат предвид текущите оценки и оценката от изпита.

 

Лекционен курс

Тема № Наименование на темата Хорариум
1 Въведение в корпусната лингвистика. Основни понятия. 1
2. Основни характеристики електронните корпуси 1
3. Типология на електронните корпуси 1
4. История на корпусната лингвистика. Направления, предхождащи появата на корпусната лингвистика. Начален етап в развитието на корпусната лингвистика 1
5. Съвременно състояние на корпусната лингвистика. Web като корпус 1
6. Създаване и проектиране на корпуси – основни етапи, методи и технологии 2
7. Корпусни метаданни. Лингвистична обработка на корпуси. Равнища на обработка. 3
8. Приложение на корпусите в лингвистичните изследвания. Методи за корпусни изследвания (корпусно базирани, корпусно изведени методи) 2
9. Системи за търсене в корпуси. Език на заявките. Регулярни изрази 2
10. Български национален корпус. Други корпуси за българския език 1

Семинарни упражнения

Тема № Наименование на темата Хорариум
1. Основни типове корпуси за различни езици. Национални корпуси. Паралелни корпуси. Специални корпуси 3
2. Анотация на корпуси 1
3. Език на заявките за търсене в корпуси 1
4. Корпуси на българския език 1

Практически упражнения

Тема № Наименование на темата Хорариум
1. Работа със системи за търсене в корпуси – система на БНК, Bonito, Xaira, Sketch Engine и др. 4
2. Работа с конкордансери и други програми за извличане на информация от корпуси  – WordSmith Tools, AntConc, MonoConc, Concordancer, Searchinform и др. 2
3. Провеждане на лингвистични наблюдения и изследвания с използване на корпуси за българския и други езици 3
4. Използване на Web като корпус 1

Съставили програмата: доц. д-р Диана Благоева, доц. д-р Сия Колковска

 

Литература

  • Благоева, Д., С. Колковска. Корпусният подход в българската лексикография – практика и перспективи. // Съвременни методи и подходи в лексикографската практика. Сборник студии и статии. София, Авангард Прима, 2011, с. 7-45. ISBN 978-954-323-923-8
  • Коева, Св., Д. Благоева, С. Колковска. Проектът Български национален корпус – резултати и перспективи. Български език 58, 2011, кн. 3, с. 34-53. ISSN 0005-4283
  • Koeva Sv., D. Blagoeva and S. Kolkovska. Bulgarian National Corpus Project. – In: N. Calzolari, K. Choukri, B. Maegaard, J. Mariani, J. Odjik, S. Piperidis, M. Rosner, D. Tapias (eds.). Proceedings of the Seventh conference on International Language Resources and Evaluation (LREC’10). Valletta, European Language Resources Association (ELRA), 2010, pp. 3678-3684. ISBN 2-9517408-6-7 http://www.lrec-conf.org/proceedings/lrec2010/index.html
  • Коева, Св., Д. Благоева, С. Колковска. Българският електронен езиков корпус и негови приложения. // Наука, 2010, кн. 5, с. 64-69. ISSN 0861 3362
  • Коева, Св., Д. Благоева, С. Колковска. Българският национален корпус – състояние и перспективи. – В: Лексикографията в европейското културно пространство. Велико Търново, „Знак’94”, 2010, с. 289-300. ISBN 978-954-8305-10-5
  • Blagoeva, D. Electronic Corpora and Bulgarian New-Word Lexicography. // Études Cognitives. Vol. 9. Warszawa, SOW, 2009, pp. 143-150. ISSN 1641-9758
  • Благоева, Д., С. Колковска, В. Сумрова. LexyScan – софтуерно средство за работа с електронен корпус за лексикографски цели. // Bulharská a slovenská lexikografia v zjednotenej Európe. Bratislava, Slavistycký ústav Jána Stanislava SAV, ИБЕ „Проф. Л. Андрейчин” при БАН. Велико Търново, ИК „Знак’94”, 2009, с. 233-243. ISBN 978-80-969992-4-8
  • Благоева, Д. Проблеми на изграждането на електронен корпус за лексикографски цели. // Lexikografie v kontextu informační společnosti. Praha, UJČ, 2008, 169-179. ISBN 978-80-86496-41-2.
  • http://ibl.bas.bg/sites/default/files/Publication1.pdf
  • Благоева, Д., С. Колковска. Електронен корпус за целите на „Речник на българския език” – състояние и перспективи. // Лексикографията и лексикологията в съвременния свят. Велико Търново, 2007, Знак’94, стр. 277-286. ISBN 978-954-8709-76-7
  • http://ibl.bas.bg/sites/default/files/Publication2.pdf
  • Баранов, А. Н. Корпусная лингвистика. // Баранов, А. Н. Введение в прикладную лингвистику. М., 2001, с. 112-137.
  • Захаров, В. П., С. Ю. Богданова. Корпусная лингвистика (учебник для студентов гуманитарных вузов). Иркутск, ИГЛУ, 2011. 160 с.
  • Зубов, А. В., И. И. Зубова. Информационные технологии в лингвистике. Учебное пособие. Москва, Академия, 2004. 208 с.
  • Перцов, Н. В. О роли корпусов в лингвистических исследованиях. // Труды международной конференции „Корпусная лингвистика – 2006”. Санкт-Петербург, Изд. Санкт-Петербургского университета, Изд. РХГА, 2006, с. 318-331.

  • BNC: The BNC Users Reference Guide, 2000. http://www.natcorp.ox.ac.uk/World/HTML/.
  • Český Národní Korpus – Úvod a Příručka Uživatele / Kocek J., Kopřivová M., Kučera K. (eds.). Praha, 2000.
  • Kennedy, G. An Introduction to Corpus Linguistics. London, 1998.
  • Kilgarriff, A., G. Grefenstette. Web as Corpus. 2003. http://www.kilgarriff.co.uk/Publications/2003-KilgGrefenstette-WACIntro.pdf
  • Leech, G. Corpus Annotation Schemes. // Literary and Linguistics Computing. 1993. Vol. 8. N 4, 275-281.
  • Lüdeling. A, M. Kytö (eds.). Corpus Linguistics. An International Handbook. Volumes 1-2. Berlin & New York: Walter de Gruyter, 2008.
  • McEnery A., Wilson A. Corpus Linguistics. Edinburgh, Edinburgh University Press, 2001.
  • Meyer, Ch. F. English Corpus Linguistics: An Introduction. Cambridge: Cambridge University Press, 2002. XVI + 168 pp.
  • Sinclair J. Corpus, Concordance, Collocation, Oxford University Press, 1991.
  • Sinclair J. Preliminary Recommendations on Text Typology. EAGLES Do-cument EAG-TCWG-TTYP/P, 1996 // http://www.ilc.cnr.it/EAGLES96/ texttyp/texttyp.html
  • Svartvik, J. (ed.). Directions in Corpus Linguistics, Berlin. 1992.

 

Учебната програма е приета с решение на катедрен съвет протокол N 8/08.07.2011 год.