С.Бадрал: Мы стремимся создать робота с искусственным интеллектом
Новости МонголииВ век информационных технологий мировые разработчики программного обеспечения активно работают над созданием совершенного искусственного интеллекта. В зарубежных странах ученые уже успешно опробовали роботов в сфере услуг и даже такси с искусственным интеллектом. Монголы не должны отставать в этой области.
22-го сентября компания «Чимэгэ системс» (Chimege Systems) представила технологию «Чимэгэ бичээч», которая использует искусственный интеллект для преобразования человеческой речи в текст и текста в речь с помощью любого цифрового устройства и даже Интернета. «Чимэгэ системс» - это стартап-компания, основанная для разработки решений искусственного интеллекта (ИИ) на монгольском языке. Слово «чимэгэ» в транслитерации старомонгольской письменности означает чимээ, что по-русски означает звук/шум. Целью является разработка и внедрение приложений искусственного интеллекта для поддержки взаимодействия человека и компьютера.
Основанная в 2019 году, компания «Чимэгэ системс» разработала свои приложения «Чимэгэ
бичээч» (Chimege Writer), «Чимэгэ уншигч» (Chimege Reader) и «Чимэгэ гар» (Chimege Keyboard), а также «Тунгаамал толь», словарь монгольской
письменности, который ищет слова по голосу. В будущем компания намерена широко использовать эту систему
для создания робота с искусственным интеллектом. Как создавалась эта
виртуальная разработка? Каковы ее преимущества? Как технология обрабатывает
аудиоинформацию на
монгольском языке? С какими трудностями пришлось столкнуться разработчикам при
создании этой технологии? Какова будет роль робота, которого разработчики
планируют создать в будущем? Ответы на эти и другие вопросы дал основатель
компании «Болорсофт» по разработке программного обеспечения,
исполнительный директор компании «Чимэгэ системс» С.Бадрал в интервью
корреспонденту ИА МОНЦАМЭ.
-В настоящее время
технология «Чимэгэ бичээч» (Chimege Writer) привлекает большое
внимание. Ваши предыдущие системы «Болор дуран»
и «Болор толь» были очень успешными, не так ли?
-Создав компанию «Болорсофт» в августе 2008
года, в конце декабря была запущена программа проверки орфографии монгольского
языка «Болор толь». Официально эта система стала публичной с января 2009 года.
Вот почему «Болор толь» стала нашей первой разработкой. Затем система «Болор дуран»
или корректор слов и орфографии, была создана в 2011 году и запущена в
2012 году. За этим последовало создание системы «Эдугэ», которая анализирует
информацию в Интернете. В течение почти двух лет я работал над включением
монгольской письменности в Юникод (Unicod). В конце концов,
политика вмешалась в эту работу, поэтому я решил оставить этот вопрос и начал
разрабатывать технологию «Чимэгэ системс».
-Помимо преобразования
монгольской речи в текст, появилась базовая технология преобразования текста в
речь. Какие устройства в будущем, в эпоху развития информационных технологий,
на ваш взгляд, могут быть внедрены?
-Прежде чем говорить о «Чимэгэ системс», сначала я хотел бы
сказать о создании компании «Чимэгэ системс» для того, чтобы заняться новой разработкой
отдельно от компании «Болорсофт» . Здесь следует отметить, что компания «Болорсофт» в целом
проводит исследования и разрабатывает морфологию и лексику монгольского языка,
используя искусственный интеллект для распознавания текста. Мы решили развивать
«Чимэгэ» или систему, связанную с
голосом в двух направлениях, т.е. преобразование текста в речь и речи в текст.
Это делается для того, чтобы разработать монгольскую Siri, объединить её с
технологией понимания языка и создать монгольского робота. Как вы сказали, «Чимэгэ системс» - это базовая технология.
Электронные устройства сейчас приближаются к той стадии, на которой они могут
говорить.
Siri - персональный голосовой помощник с искусственным интеллектом, присутствующий на всех современных аппаратах Apple. Эта программа, способна успешно распознавать речь людей, давать голосовые ответы и выполнять озвученные команды.
Согласно исследованиям, к 2025 году 50% всех электронных
устройств в мире будут способны распознавать человеческие голоса. Это означает,
что наша технология может быть интегрирована со всеми электронными
устройствами. 22 сентября мы запустили на рынок продукт под названием «Чимэгэ бичээч»
(Chimege Writer). С момента
своего запуска технологию приобрели и начали использовать 30-40 организаций.
Например, наш разговор с вами сейчас
может быть преобразован в текст, и мы можем проверить его позже. Эта
система уже начала использоваться для записи протоколов. Для начала мы
подписали контракт на то, чтобы киоски «Гэрэгэ системс» (Gereg Systems) могли
говорить. Следующим шагом является обеспечение того, чтобы люди могли
разговаривать с говорящими киосками, когда они получают его услуги. «Чимэгэ бичээч»
также может быть использована для недавно запущенной системы государственных услуг «E-Mongolia». Проще говоря, вы сможете общаться с приложением
E-Mongolia. Речь идет о подключении системы распознавания голоса к приложению «E-Mongolia», чтобы обеспечить равные возможности для людей с ограниченными возможностями.
-Технология,
которая распознает и говорит по-монгольски, необходима для киосков в то время,
когда государственные услуги становятся все более электронными. Возможно ли
внедрить технологию распознавания голоса в наши повседневные операционные
системы, такие как Microsoft, Apple IOS и Android?
-Мы разрабатываем ту же технологию, что и вышеперечисленные
компании. Если эти крупные компании хотят интегрировать наши технологии, то
возражений нет. Но здесь другие компании могут поставить вопрос о конкуренции,
и обстоятельства могут сложиться не так, как нам бы хотелось. Этого никто не
знает. Так или иначе, мы разрабатываем приложение для использования технологии
на мобильных телефонах. В будущем мы намерены сделать монгольскую Siri.
-Монгольский язык уже введен в систему распознавания
голоса Google. Что особенного в системе распознавания голоса, которую
разрабатывает ваша компания, в отличие от системы Google?
-Что касается
нашей системы, то она с самого начала опиралась на монгольском языке.
Уровень обработки монгольского языка составляет 97 процентов, достигая того же уровня обработки английского языка в Google.
Точность
обработки данных Google в монгольском
языке составляет менее 80 процентов. Стало быть, есть большая разница между 80%
и 97%. Легко начать что-то и отказаться, но развивать его до тех пор, пока не
станет ежедневным потреблением человека, –
трудная задача. Наша «Чимэгэ» на 97 процентов свободно распознает монгольский и английский языки. В
общем, монгольский язык мы довели до того же уровня английского в Google.
Главное отличие заключается в том, что Google, крупная компания, разрабатывает
одновременно много языков, в том числе и монгольский. Для того чтобы наша
система работала в полном объеме, нам важно максимально решать самые сложные
задачи нашего родного языка.
-Каковы были лингвистические трудности при
разработке системы распознавания монгольского языка и преобразования его в
текст?
-Люди очень интересуются этим вопросом. Монгольский язык относится к алтайской языковой группе. В прошлом для языков этой группы практически не проводилась обширная компьютерная обработка. Есть исследования, проведенные со стороны лингвистики, но исследования по компьютерной обработке делались очень редко. Во-вторых, наш язык имеет гармонию гласных и сложную слоговую структуру, и одно слово может меняться в несколько раз. Один только глагол меняется около 1900 раз , а существительное - более 800 раз. Более того, глаголы могут стать существительными.
Для английского
языка достаточно собрать слова и обработать их, но создать базу данных
монгольского языка очень сложно. В-третьих, грамматика кириллицы, которую мы
используем, нестабильна. Благодаря тому, что мы
одновременно развивали монгольскую письменность, нам удалось преодолеть эту
трудность и распознать слово по его корню в монгольской письменности.
-Есть
ли другие компании, кроме Google, которые разрабатывают технологию
распознавания монгольского языка?
-Компания для
монгольского языка нет. Попытка была предпринята компанией Google. Наша система распознает 97% английского
языка. На самом деле в мире существует более 10 компаний, разрабатывающих эту
технологию. Основными игроками в этой области являются Microsoft, Facebook,
Google, Amaozon, IBM, Apple, Tesla, Baidu.
-В
тестовой части «Чимэгэ системс» был монголо-английский разговорный
переводчик. Возможно ли в будущем ввести другие языки?
-На эту модель мы
пробовали английский и немецкий языки. В обоих случаях голос распознается на 97
процентов. Поэтому в дальнейшем мы будем продолжать включать в систему и другие
иностранные языки.
-В
любом языке есть свои диалекты. Справилась ли с этой задачей «Чимэгэ системс»?
-Я думаю, что
благодаря серьезному обновлению, которое мы планируем сделать в ближайшее
время, наша система будет еще более усовершенствована с этой точки зрения. На
данный момент уровень точности расшифровки речи составляет 97 процентов, а три процента – это ошибки. В основном это связано с диалектом.
-Система
преобразования речи в текст очень полезна для журналистов и людей, которые
ведут протоколы встреч. Вы сказали, что в настоящее время её покупают и
используют более 30 организаций. Какие организации используют его больше всего?
-Сегодня наша система широко используется в
юридическом секторе, и клиника «Интермед» приступила к тестированию нашего продукта. Мы также
заключили устное соглашение с компанией «Гэрэгэ системс» об автоматизации
электронных киосков. Наш продукт открыт для использования в сфере образования и
журналистики. В настоящее время наиболее активными пользователями являются
представители юридического сектора.
-Вы
говорили ранее, что планируете создать монгольского робота. Какова роль этого
робота и когда он будет готов?
-Это будет
нелегко, потому что мы разрабатываем технологию, которая заменит искусственный
интеллект. Думаю, что на его создание уйдет 1-2 года. Я ещё не знаю, какими
навыками и способностями будет обладать робот. Для начала мы планируем создать
робота, который сможет разговаривать с людьми. Фактически, роботы начинают
брать на себя механизированные рабочие места за рубежом, такие как виртуальные
операторы и регистраторы (администраторы).
Поэтому мы стремимся иметь такого же виртуального администратора на ресепшн,
который говорит по-монгольски. Я думаю, что новый продукт будет представлен
публике в ближайшее время.
Беседовал С.Мунхбаатар
Фото Т.Чимгээ