Многие казахстанские интернет-пользователи уже привыкли к тому, что через бесплатную систему перевода Google Translate можно перевести на русский язык и понять смысл небольшого текста или отрывка, публикации на неизвестном пользователю иностранном языке. Большинство из них — преподаватели, исследователи, студенты и журналисты. Вопрос о том, как превратить эту систему в полезное средство и для казахоязычных пользователей, обсуждается уже несколько лет.
Преподаватель университета из Алматы Адам Гроуд и студентка Айнель Мусина — волонтеры, которые активно занимаются google-переводом. Если раньше они занимались поиском перевода тысяч слов, словосочетаний и коротких текстов, то теперь перешли на следующий уровень перевода - они дают оценку качеству переведенных слов.
— Это очень легко. Вам дают определенное слово или словосочетание. Вы отмечаете всего лишь одну отметку и даете оценку качеству перевода этого слова, — говорит Айнель Мусина репортеру Азаттыка, демонстрируя свою работу на мониторе.
Работа по внедрению казахского языка в мировую бесплатную систему перевода Google Translate началась несколько лет назад. С прошлого года компания Google проводит тестирование по внедрению казахского языка в сервис. Для того чтобы включить определенный язык в систему перевода, компания не сотрудничает лишь с одной конкретной организацией, она принимает переводы от всех добровольцев, изъявивших желание улучшить качество переводов. Затем при помощи экспертов-добровольцев отбирает самые лучшие образцы переводов.
По данным местного фонда WikiBilim — одного из координаторов работ по тестированию в Казахстане, на сегодняшний день, благодаря помощи добровольцев, переведены тысячи слов, словосочетаний и коротких текстов.
Фонд, который раньше нуждался в рядовых добровольцах, теперь испытывает потребность в экспертах-профессионалах, которые могли бы проверить качество перевода.
По словам представителей фонда WikiBilim, у рядовых добровольцев может не хватить компетенции для оценки качества google-переводов на казахском языке. Поэтому фонд нашел спонсоров и нанял профессиональных специалистов, которые глубоко освоили английский и казахский языки. Финансовые возможности ограничены, поэтому представители фонда говорят, что желают видеть среди добровольцев экспертов-профессионалов.
— Чем больше экспертов будет привлечено, тем быстрее в системе Google-переводчик появится казахский язык. Для создания алгоритма, понимающего казахский язык, в большом количестве нужны переводы. Ранее эксперты благодаря оценкам «хорошо» или «плохо», поставленным за качество переводов, отсортировали и вывели из системы некачественные образцы переводов, оставив хорошие примеры в качестве основных образцов для использования, затем сформировали пошаговый алгоритм, — говорит председатель попечительского совета общественного фонда WikiBilim Рауан Кенжеханулы.
По его словам, в настоящее время добровольцы фонда выполнили все переводческие работы, которые запросила компания Google. Однако в компании до сих пор не сообщили, когда именно казахский язык включат в систему перевода.
— Сейчас, как говорят в Google, проводится работа по последнему тестированию, которая позволит посмотреть качество перевода. В ближайшее время должны запустить. Мы также ждем с нетерпением, — говорит Рауан Кенжеханулы.
В Казахстане также есть независимые добровольцы, которые вносят свой вклад в этот проект и делятся своим опытом. Алматинский блогер Марат Шакен — один из них. Он недавно сообщил в социальной сети, что взялся за организацию бесплатных тренинг-уроков для лиц, участвующих в проекте по включению казахского языка в систему Google Translate. Сейчас он занимается регистрацией желающих участвовать в тренинге. В беседе с репортером Азаттыка он сообщил, что в конце недели компания Google начнет лекции по системе перевода. По его словам, заявки пока поступили лишь от 82 человек, пожелавших принять участие в проекте. Регистрация продлится до 6 октября.
Бесплатный сервис перевода компании Google сегодня может обеспечить автоматический перекрестный перевод текстов, написанных на более чем 60 языках. Из тюркских языков в эту систему пока включены лишь турецкий и азербайджанский.