音声自動文字変換システム「チメゲ」開発者バドラル社長:AI搭載の国産ロボット開発を目指す

教育
gombosuren0625@gmail.com
2020-11-04 10:50:34

 近年のデジタル時代、世界各企業は完全な人工知能(AI)を目指して日々開発を進めている。AI技術は海外では、タクシーなどのサービス業で活用を試みている。モンゴル勢もこの競争に遅れているわけではない。チメゲ・システムズ社は9月22日、AIを活用した音声技術「チメゲ・ビチェーチ」を発表したばかりだ。具体的に、音声認識技術とはどのようなものかを、ボロルソフト社創業者、チメゲ・システムズのサンリグ・バドラル社長に聞いた。

 ――「チメゲ・ビチェーチ」は 世間から大きな注目を浴びています。ボロル・ソフト社が開発したスペル修正プログラム「ボロル・ ドラン」や「ボロル・トリ(辞書)」も成功しましたね。

 ボロルソフト社は2008年に創 設。同年12月、「ボロル・トリ」プログラムが開発され、翌年1月に公表された。これに続き、スペル修正のボロル・ドランは2011年に開発。2012年に発売された。その後、オンライン式情報分析プログラム「エデゥゲ」が開発。モンゴル文字ユ ニコード開発は2017~18年の2年間で手掛けたが、結局のところ、政治関与があったため開発は挫折。そしてチメゲ・システム開発に着手した。

 ――AIを活用したモンゴル語の 音声認識システムの「チメゲ」 に話の焦点を移したいです。今後、チメゲ・システムをどの場面において活用できるとお考えでしょうか

 チメゲ・システムは、ボロルソフトと全く異なる法人チメ グ・システムズ社が開発。ボロルソフトはモンゴル語文字形態分析に係るAI技術開発で行われるが、一方、チメゲは音声認識 に特化しており、アイホンでいうとモンゴル版シリである。音 声認識システムに「言語理解」 を加えて、モンゴル産ロボット 開発を手掛けたい。チメゲ・シ ステムはあくまで基礎技術に過ぎない。人間同様に機械も音声対話をできる時代へ進む。2025年ごろから、世界中の電気機械器具のおよそ50%は音声対応が可能になるという。だから、チメゲ・システムとほかの電気機械の融合可能性が十分考えられる。チメゲ・ビチェーチは9月22 日に発表されてから、既に30社~40社が購入した。このインタビューもそのまま文字変換も可能ですよ。会議などの議事録に活用できる。ゲレグ・システムズ社が手掛ける各種証明書自動交付機「キオスク」に導入するために向けた業務提携に関する事業契約が締結された。今後、 キオスク機は音声対話できるようになるわけだ。このほど、発表されたEモンゴリアでも導入可 能だ。障がい者への配慮を考えて音声認識システムの導入について、Eモンゴリア開発チームと協議中です。

 ――Eモンゴリアの音声認識導入とは重要です、今後、マイクロソフト、アップルIOS、アンドロイドといったオぺレーティン グシステムへの導入はいかがでしょうか。

 弊社も上述した企業らと同じ く、オペレーティングシステム開発をしている。無論、向こうから技術統合といった話を持ち掛けられたら大歓迎する。競争相手だからどうだろう。でも、 うちはモンゴル版シリ開発を目指す。

 ――グーグル社の開発した音声自動文字変換システムには、 モンゴル語が既に追加されました。グーグル開発システムとチメゲ・システムの違いとは?

 わが社のシステムはモンゴル語を基礎に開発。だから、音声 認識度はほぼ97%に達した。一 方、グーグルの場合は、モンゴル語音声認識は80%も満たない状況だ。音声認識度からする と、大きな違いがあるわけだ。 でも、我が社はモンゴル語だけに特化しており、グーグルは様々な言語対応の音声認識システムを開発している。

 ――モンゴル語の音声自動文字変換システム開発の難点とは何でしょうか。

 その点はよく聞かれている。 モンゴル語はアルタイ諸語に属し、そもそもアルタイ系言語を対象の技術開発が乏しかった。2点目はモンゴル語の形態だ。 モンゴル語の動詞は約1900回、 名詞は800回も変換する。動詞から名詞へ、名詞から動詞へ変換 といった難題もあった。3点目はキリル文字の文法問題もあった。元々、モンゴル語の縦文字に係る技術に携わっていたことを活かした。

 ――御社とグーグル以外のモンゴル語の認識システム開発に着手している企業はあるのでしょうか。

 モンゴル語に限って言うと我が社とグーグル以外はない。グーグルは開発を試行したのみ。 チメゲの英語認識度はほぼ97% 。マイクロソフト、フェイスブック、グーグル、アマゾン、アイ・ビー・エム、アップル、テ スラ、バイドゥといった10社のみは、音声認識技術開発分野で大きく活躍している。

 ――チメゲ・システムのテス ト閲覧には、モンゴル語と英語 の自動通訳機能がありました。 今後、他の言語も追加されてい くのでしょうか。

 自動通訳機能を英語とドイツ語を限定にテストした。音声認識の正確度は両方が97%だった。今後は、他の言語を追加していく考えだ。

 ――モンゴル語の方言にどう対応しているのでしょうか。

 これから大きなプログラム修正が行われる。先ほど、認識正確度は97%だと申し上げたが、つまり3%は間違いているわけだ。この3%はほぼ方言を原因とした。

 ――チメゲ・ビチェーチ音声自動文字変換システムにはモンゴル縦文字が加わるのでしょうか。

 符号化文字集合や文字符号化方式などを定めた文字コードの業界規格ユニコードを巡る問題は解決されないと一歩も進めないだろう。ボロルソフトによる先行開発の文字コードが実用化されていない。

 ――10月6日、ユニコードに関する国際会議がウランバートル市にて開かれました。これについてどう思いますか。

 私は会議へ参加していない。昨年4月、ウランバートル市で、ユニコード委員会が初めて会議を開いた。我々は、モンゴル縦文字について国際規格化をウランバートル市で決める歴史的な一ページを切り開くためにユニコード委員会の会議組織に向けて2017年から取り組んだ。我々は2019年以降、政治の影響があったから同事業を断念した。

 ――ボロルソフトはモンゴル縦文字ユニコード化事業を続けるのでしょうか。

 我々は2018年、モンゴル縦文字の音素表記を熱心に取り組んだ。その勢いだったら、遅くても今年度に実用されていただろう。事業が再開となると、開発期間は2年も必要とされる。でも、我々はユニコード委員会から脱退しており、ユニコードが最も良い方向で解決してほしいと願っている。

 ――音声自動文字変換システム「チメゲ」は常に議事録に関わっている方々に必要不可欠な存在となるかと思いますが、先ほどおっしゃった購入した事業者とは。

 今、主に法律事務所が購入。常に議事録に関わっているからだ。また、インターメド国際病院はシステム導入を試行中。教育やマスメディアでも活用を十分に見込める。

 ――以前、バドラル社長はある講演で、学校の試験などで音声認識システム活用の可能性について言及していました。これについて教えてください。

 それは結構前の話だ。学校テストについて、個人的に否定的な立場だ。学力・能力などの状態や度合いを試すに、知識をどれほど習得したかの度合いを確認する必要がある。当たり外れのテストだけで評価するには問題がある。だから、成績評価の自動化を進めるべきだ。

 ――確認させてほしいのは、先ほどの話からすると、AIは正確と不正確を認識分けするというわけですか。

 その通り。受験者はどれほど正確に答えたかをAIが判断するというわけだ。

 ――先ほど、国産ロボット開発について話がありました。ロボットの役目と開発期間について教えてください。

 AI技術開発だから、そう簡単に完了しない。今後、1,2年がかかるだろう。それでも機能と能力について今言うには早すぎるよ。(笑)

 ―― ありがとうございました。最新技術の話ができてよかったです。