Девятиклассница из Владикавказа выбрала OCRсистему для оцифровки осетинских книг и дообучения нейросетей
Девятиклассница из Владикавказа Милана Плиева сравнила существующие OCRсистемы в поисках наиболее подходящей для распознавания осетинских текстов и намерена дообучить выбранную модель для подготовки качественных данных для нейросетей, сообщили в ITкубе.
Исследование ученицы ITкуба принесло ей победу в секции «Большие данные, искусственный интеллект и безопасность» регионального этапа всероссийского конкурса «Большие вызовы», уточнили в телеграмканале «Проекты. Северная Осетия». Милана отметила, что планирует автоматизировать процесс оценки результатов системы.
На осетинском языке мало цифровых ресурсов: большинство материалов представлены в виде сканов и фотографий, непригодных для обучения моделей. По словам авторов проекта, работа школьницы поможет эффективно оцифровывать книги и архивы и создать базу данных для обучения нейросетей, переводчиков и других цифровых сервисов на осетинском языке.









































