Исследователи в Северной Осетии проанализировали структуру осетинских текстов для создания цифровых сервисов
Специалисты лингвистического проекта Ossetic.ru представили результаты масштабного исследования частотности алфавитных единиц в осетинском языке. Работа, приуроченная к Дню осетинского языка и литературы, станет основой для разработки новых ИТ-продуктов.
«Проведен анализ больших массивов осетинских текстов. Полученные результаты помогают лучше понять структуру языка и создают базу для прикладных решений: удобного ввода текста, систем автоподсказок, поиска, а также технологий распознавания текста и других цифровых инструментов», — отметили исследователи.
Одной из ключевых особенностей работы стало сопоставление данных современного цифрового корпуса, собранного на платформе ossetic.ru, с массивным фондом печатных изданий на осетинском языке. Такое сравнение позволяет ученым сохранять баланс между классической литературной традицией и современными нормами употребления языка при создании программного обеспечения.
Проект реализуется при участии экспертного сообщества и волонтеров. Ознакомиться с полными результатами исследования можно на официальном ресурсе проекта.
Ранее сообщалось, что в республике также ведется работа над созданием цифрового корпуса из 1 млн параллельных предложений для интеграции осетинского языка в системы искусственного интеллекта.







































