Вести «Калмыкия»: выпуск 18.09.2015
Калмыцкий институт гуманитарных исследований вот уже несколько лет разрабатывает проект Национального корпуса калмыцкого языка. Его создание стало возможным благодаря финансовой поддержке Российского гуманитарного научного фонда, а также программы фундаментальных исследований РАН. Работа над созданием национального корпуса калмыцкого языка была начата ещё в 2010 году.
Суть его заключается в том, чтобы создать информационно-справочную систему, в которой будет собрано письменное и устное наследие калмыцкого этноса. С появлением такого ресурса исследователи впервые получат возможность работать с большими объемами текстового материала без необходимости тратить время на поиски в архивах. В него вошли чуть более 7 тысяч произведений калмыцкой художественной литературы, включая стихотворения и прозаические тексты, начиная с 50-х и заканчивая 80-ми годами прошлого столетия. А также калмыцкий фольклор и архив газеты «Хальмг унн» за последние 10 лет.
На сегодняшний день работа над основным корпусом завершена. Ученые приступили ко второму этапу — к разработке подкорпусов. Так, например, ведется работа над созданием морфемного подкорпуса, с помощью которого можно провести морфемный анализ любого слова. Также на стадии разработки ещё один подкорпус — старокалмыцкий. На сегодняшний день объем национального корпуса составляет около 10 млн словоупотреблений. Несмотря на то, что электронный ресурс находится в испытательном режиме, уже сегодня любой желающий может свободно пользоваться его данными, зайдя на сайт kalmcorpora.ru. В дальнейших планах ученых КИГИРАН — оцифровать номера журнала “Теегин герл”, начиная с 56-го года и довести объем словообразований до 20 млн-ов.