Чукотский язык готовят к интеграции в «Яндекс.Переводчик»
Первый этап перевода чукотского языка в цифру проходил в прошлом году.
29 января 2026Фото: Shutterstock
Команда Чукотского арктического научного центра собрала и обработала 100 тысяч словоформ. Сейчас предстоит повторный процесс проверки и редактирования. Вторым этапом проекта станет внесение готовых данных на специальный сайт «Национальный корпус чукотского языка». После этого все пары «оригинал – русский перевод» станут доступны в «Яндекс.Переводчике», сообщает ИА «Чукотка».
Первый этап перевода чукотского языка в цифру проходил в прошлом году. В проекте были заняты двое сотрудников Чукотского арктического научного центра с помощниками – знатоками чукотского языка. Среди них Борис Ыттыгыргын, Григорий Ранаврольтын, Вера Грачёва, Антонина Кергитваль. Они проверили достоверность каждой пары «оригинал – русский перевод». Набор словоформ вели еще несколько привлеченных активистов, среди которых Виктория Вылко, Галина Пенелькут, Михаил Голбцев, Александра Пенелькут и ведущая новостей на чукотском языке на «Радио Пурга» Анна Гыргольгыргына. При этом шла непрерывная консультация с другими знатоками языка из сёл Чукотки.«Нам сказали ещё в конце 2024 года, что мы можем встать в очередь в «Яндекс.Переводчик», когда соберём 300 000 словоформ. Но малочисленные народы очень сильно попросили Агентство по делам национальностей снизить этот ценз до 100 000. Это позволило и чукотскому языку подобраться к заветной цели», – рассказал директор Чукотского арктического научного центра Денис Литовка. Для проекта по интеграции чукотского языка в «Яндекс.Переводчик» при поддержке Сбера был приобретен специализированный книжный сканер. Такое оборудование позволяет быстро и качественно оцифровывать старые издания на чукотском языке, включая книги, газеты и брошюры.
С помощью новой оргтехники перевели в цифровой формат более 30 книг, изданных в период с 1940 по 1980-е годы ХХ века. Эти материалы стали основой для создания языкового корпуса чукотского языка. Кроме того, своевременную финансовую поддержку оказал окружной департамент образования и науки. Благодаря этому удалось достичь поставленной цели – собрать первые 100 000 словоформ.
«В дальнейшем, когда первые данные будут переданы в сервис «Яндекс. Переводчик», начнется работа по формированию второй сотни тысяч словоформ, и так далее. Будет, конечно, и аудиосервис. То есть, вы говорите по-русски – Яндекс переводит на чукотский и, наоборот, с чукотского на русский, или на другой язык, на английский, сразу же, автоматически. Наши сотрудницы уже начинают работать с аудио», – отметил Денис Литовка. Параллельно с работой над Яндекс-переводчиком, продолжится и наполнение сайта «Национальный корпус чукотского языка». На нем будет доступна вся литература в оцифрованном формате и аудио материалы.
К концу 2025 года в Яндекс-переводчике было представлено 18 языков народов России. В течение последующих трех лет планируется добавить еще 20. К этой работе подключились 19 регионов, которые отобрали 34 языка, находящиеся под угрозой исчезновения. Среди них — вепсский, мансийский, ненецкий, хантыйский и чукотский языки.
Изображения: Shutterstock