С.Бадрал: Хиймэл оюун ухаант робот бүтээхийг зорьж байна

МОНГОЛЫН МЭДЭЭ | БОЛОВСРОЛ
munkhbaatar@montsame.gov.mn
2020-10-15 15:47:27
@s_munkhbaatar

Улаанбаатар /МОНЦАМЭ/.


Мэдээллийн технологийн эрин зуунд дэлхийн программ хөгжүүлэгч компаниуд төгс хиймэл оюун ухаан бүтээхээр идэвхийлэн ажиллаж байна. Гадаад улс орнуудад хиймэл оюун ухаант үйлчлэгч, такси хүртэл зохион бүтээгээд амжилттай туршив. Монголчууд ч энэ хөгжлөөс хоцрох учиргүй. “Чимэгэ системс” ХХК өнгөрсөн сарын 22-нд хиймэл оюун ухааны тусламжтай хүний яриаг бичвэр, бичвэрийг яриа болгох чадвартай “Чимэгэ бичээч” технологийг танилцууллаа. Цаашид энэхүү системийг өргөн хүрээнд ашиглаж хиймэл оюун ухаант робот бүтээхээр зорьж байна. Энэ талаар программ хөгжүүлэгч “Болорсофт” ХХК-ийг үүсгэн байгуулагч, “Чимэгэ системс” ХХК-ийн гүйцэтгэх захирал С.Бадралтай ярилцлаа.


-“Чимэгэ бичээч” технологи олны сонирхлыг их татаж байна. Урьд нь танай гаргаж байсан “Болор дуран”, “Болор толь” систем маш амжилттай явж ирсэн шүү дээ?


-“Болорсофт” компанийг 2008 оны наймдугаар сард байгуулж, мөн оны 12 дугаар сарын сүүлээр “Болор толь”-ийг гаргасан. Тэгээд албан ёсоор 2009 оны нэгдүгээр сараас олон нийтийн хүртээл болгож байв. Тэгэхээр анхны бүтээл бол “Болор толь” юм.

Тэгээд “Болор дуран” буюу үг, үсгийн алдаа засагчийг 2011 онд бүтээж 2012 онд зах зээлд гаргаж байлаа. Үүний дараа интернэтэд байгаа мэдээлэлд дүн шинжилгээ хийдэг “Эдүгэ” системийг бүтээсэн. Дараа нь монгол бичгийг юникодод оруулах асуудлаар 2017-2018 онд буюу бараг хоёр жил ажилласан. Сүүлдээ улс төр холилдоод байхаар нь орхиод “Чимэгэ систем”-ээ хөгжүүлж эхэлсэн.


-Одоогоор монгол яриаг бичвэр болгохын зэрэгцээ бичвэрийг яриа болгох суурь технологи бий боллоо. Яриаг бичвэр болгох гэхээс илүүтэй монгол хэл таньдаг хиймэл оюун ухаан бүтээсэн гэдэг талаас нь ярилцмаар байна. Цаашид мэдээллийн технологийн хувьслын эрин үед үүнийг ямар төхөөрөмжид нэвтрүүлэх боломжтой гэж үзэж байна вэ?


-“Чимэгэ систем”-ийг ярихын өмнө хэлэхэд, “Болорсофт” компаниас тусгаарлаж “Чимэгэ системс” компани байгуулсан. “Болорсофт” нь монгол хэлний морфологи, үг зүйгээр хиймэл оюун ухаан ашиглаж бичвэрийг ойлгох хэмжээнд судалгаа хөгжүүлэлтээ хийгээд явж байна. Харин “Чимэгэ” буюу дуу хоолойтой холбоотой системээ салгаад бичвэрийг яриа, яриаг бичвэрт буулгах “монгол сири”-г хөгжүүлж байгаа юм. Үүнийг хэл яриа ойлгох технологид холбож монгол робот бүтээхээр зорьж байна. Таны хэлсэнчлэн “Чимэгэ систем” бол суурь технологи. Ярьдаггүй хүн гэж байхгүйтэй адил технологийн хөгжлөө дагаад электрон төхөөрөмжүүд ярьдаг шат руу алхаж байна.

Ерөнхийдөө 2025 он гэхэд дэлхийн бүх электрон төхөөрөмжийн 50 хувь нь дуу хоолой таньж ярилцах боломжтой болно гэсэн судалгаа байна.

Эндээс юу харагдаж байна вэ гэхээр, манай технологи бүх электрон төхөөрөмжтэй интеграц хийж холбогдон ажиллах боломжтой гэсэн үг.

Одоогоор, бид “Чимэгэ бичээч” гэдэг бүтээгдэхүүнээ зах зээлд өнгөрсөн сарын 22-нд гаргасан. Нээлтээ хийснээс хойш 30-40 байгууллага худалдан аваад ашиглаж эхэлсэн байна. Одоо та бид хоёрын ярьж буй ярилцлагыг шууд бичвэрт буулгах боломжтой. Магадгүй хоёулаа дараа нь үүнийг шалгаж үзэж болох юм. Энэ системийг протокол буулгахад ашиглаад эхэлсэн. Эхний ээлжинд “Гэрэгэ системс”-ийн Киоск төхөөрөмжийг ярьдаг болгохоор гэрээ контрактаа байгуулчихлаа. Дараагийн шатанд хүн очоод лавлах үйлчилгээ авахдаа ярилцдаг болгохыг зорино.

Саяхан нээлтээ хийсэн төрийн цахим үйлчилгээ бүхий “E-Mongolia” систем мөн холбогдох боломжтой. Гар утсан дээр шивэх төвөгтэй байдаг шүү дээ. Тиймээс “E-Mongolia” аппликейшнтэйгээ ярилцах боломжтой болно гэсэн үг. Бид хөгжлийн бэрхшээлтэй иргэдэд тэгш боломж олгох үүднээс “E-Mongolia аппликейшнтэй яриа таних системийг холбох асуудлыг ярьж байгаа. Мэдээж Монгол Улс өөрийн хэлээ технологийн хурдтай  хөл нийлүүлэн хөгжүүлж яваа нь ололт.


-Төрийн үйлчилгээ цахимжиж байгаа энэ үед киоск төхөөрөмж зэрэгт монгол хэл таньж ярилцдаг технологийн шийдэл чухал. Цаашдаа бидний өдөр тутамдаа хэрэглэдэг Microsoft, Apple IOS, Android зэрэг үйлдлийн системд яриа таних технологио нэвтрүүлэх боломжтой юу?


-Манайх дээрх компаниудтай ижилхэн л ижил төрлийн технологи хөгжүүлж байгаа компани. Тэдгээр том компаниуд манай технологитой интеграц хийе гэвэл татгалзах зүйлгүй. Магадгүй, нөгөө компаниуд өрсөлдөгч учраас эсэргээр ажиллаж болно. Үүнийг хэн ч мэдэхгүй шүү дээ. Ямартай ч бид гар утсан дээр технологио ашиглах аппликейшнийг өөрсдөө хийж байгаа. Цаашдаа “монгол сири”-г хийнэ гээд зорьж байна.


-“Google”-ийн хөгжүүлж буй дуу хоолой таньж бичвэр болгодог системд монгол хэл хэдийн нэвтэрсэн. Танай компанийн бүтээн хөгжүүлж байгаа энэхүү дуу хоолой таних систем нь түүнээс юугаараа онцлог вэ?


-Манай системийн хувьд, анхнаасаа монгол хэлэнд суурилж хэлний асуудлыг шийдсэн.

Монгол хэл боловсруулах түвшин нь 97 хувь буюу “Google”-ийн англи хэл боловсруулах түвшинтэй ижил хэмжээнд хүрчихсэн.

Google-ийн монгол хэлний нарийвчлал 80 хувьд ч хүрэхгүй байгаа. Тэгэхээр 80-97-ын хооронд маш их зөрүү байгаа биз. Ямар нэг зүйлийг зүглүүлээд хаях амархан. Хүний хэрэглээнд нэвтэртэл хөгжүүлнэ гэдэг амар зүйл биш. Манай “Чимэгэ”-гийн хувьд монгол болон англи хэлийг 97 хувьтай таньдаг. Ерөнхийдөө “Google англи хэлийг хөгжүүлсэн шиг түвшинд монгол хэлийг аваачсан. Гол ялгаа бол “Google” том компани, монгол гэлтгүй маш олон хэлийг зэрэг хөгжүүлж байна. Харин бидний хувьд аль болох өөрийн хэлнийхээ төвөгтэй байгаа асуудлыг шийдэхийг чухалчилж байгаа юм.


-Монгол хэлийг таньж бичвэрт буулгах систем хөгжүүлэхэд хэл зүйн талын хүндрэл нь юу байсан бэ?


-Яг энэ асуудлыг хүмүүс ихээхэн сонирхдог. Монгол хэл бол Алтайн язгуурын хэлний бүлэгт багтдаг. Энэ бүлгийн хэлүүдэд урьд нь компьютерын цахим боловсруулалт хийж байсан том ажил байхгүй, судалгаа багатай юм. Хэлзүйн талаасаа судалгаа байдаг ч компьютерын боловсруулалт талдаа судалгаа тун ховор. Хоёрдугаарт, манай хэл залгамал бүтэцтэй, нэг үг асар олон хувирдаг. Нэг үйл үг гэхэд л 1900 орчим, нэр үг 800 гаруй хувирч байна. Цаашлаад үйл үг нь нэр үг болоод хувирчихдаг. Жишээлбэл, “яв” гэсэн үг “явдал” болоод нэр үг болчихно. Энэ маягаар цаашаа 800 хувирна гэсэн үг. Үг зүйн задаргааны хувьд асар их төвөгтэй байдал үүсгэж байгаа юм.

Англи хэл бол үгсээ цуглуулаад л боловсруулчихна шүү дээ. Гэтэл манай хэл сан үүсгэн цуглуулаад хийхэд маш их асуудалтай. Гуравдугаарт, кирил бичгийн дүрэм тогтворгүй байгаа асуудал бий. Гэхдээ бид монгол бичгийг давхар хөгжүүлж явсан учир тэр хүндрэлийг сууриар нь буюу монгол бичгийн үгийн язгуураар тогтоож хүндрэлийг давсан.


-Эрдэмтэд үг зүйн асуудлыг монгол бичгээс хөөн шийддэг шүү дээ...

-Тийм. Зарим маргаантай бичиглэл дээр монгол бичгээ барьж байгаа гэсэн үг. Эрдэмтэд ч хоорондоо маргаанаа тайлахдаа монгол бичиг дээр хэрхэн бичиж буйгаар нь ялгадаг. Ер нь “Чимэгэ” гэлтгүй, “Болор дуран”, “Болор Спилчекер” зэрэг систем үг зүйн алдаа шалгахдаа дээрх зарчмыг баримталдаг.


-Google”-ээс өөр монгол хэлээр яриа таних технологи хөгжүүлж байгаа компани бий юу?


-Монгол хэлээр бол өөр байхгүй. “Google” оролдлого хийсэн. Манайх англи хэлийг 97 хувьтай таньж байгаа. Ер нь энэ төрлийн технологийн ард дэлхийн 10 гаруй компани л бий. Microsoft, Facebook, Google, Amaozon, IBM, Apple, Tesla, Baidu зэрэг дэлхийн цөөн том тоглогч байгаа.


-“Чимэгэ системс”-ийн туршилтын хэсэгт монгол-англи яриа хөрвүүлэгч байсан. Цаашид өөр хэл нэвтрүүлэх боломжтой юу?


-Энэхүү загварыг англи, герман хэл дээр сургаж үзсэн. Аль алинд нь дуу хоолойг 97 хувьтай таньж байгаа.  Тэгэхээр цаашдаа өөр бусад хэл рүү хөгжүүлээд явна даа.


-Монгол хэлэнд олон үндэстний аялга бий. Тэдгээрийг хэрхэн таниулж байна вэ?


-Одоо бид удахгүй нэг том шинэчлэл хийснээр илүү сайжрах байх. Одоо бол 97 хувийн нарийвчлалтай, 3 хувь нь алдаатай байна гээд байна шүү дээ. Үүний ихэнх тохиолдол нь аялгатай холбоотой. Гэхдээ 80 настай баяд эмээг ярихад ойлгох хэмжээнд байгаа юм.


-Цаашид “Чимэгэ бичээч” дээр монгол бичгээр хөрвүүлэгч оруулах боломж байгаа юу. Бас л эхлээд монгол бичгийн юникодын асуудлыг шийдэх шаардлагатай юу?


-Ер нь кодчлол тогтоогүй байхад бид монгол бичгээр юу ч гаргаад нэмэргүй. Тиймээс кодчиллоо эхлээд тогтоох хэрэгтэй. Тэгвэл манайд хийчихсэн бэлэн систем нь байгаа. “Болорсофт” компани бүгдийг нь давхар хөгжүүлж ирсэн. Болор дуран буюу үг үсгийн алдаа шалгадаг программ монгол бичиг дээр ижилхэн ажиллана. Үсгийг янз янзаар кодлоод байгаа тул түүнийг бид нэвтрүүлж чадахгүй хүлээгээд байна. “Чимэгэ” системийн хувьд ч ижилхэн. Жишээлбэл, Аав гээд хэлэхэд л Абу гээд монгол бичгээр бичдэг хэмжээнд боловсруулсан байгаа гэсэн үг.

Манай кирил дээр гаргасан бүх систем монгол бичгээр давхар ажиллах боломжтой.


-Сая 10 дугаар сарын 6-нд Юникодын асуудлаар олон улсын хурал Улаанбаатар хотноо боллоо. Та монгол бичгийн юникодын асуудлаар идэвхтэй ажиллаж байсан хүний хувьд энэ хурлын үр дүнг юу гэж үзэж байгаа вэ?


-Би тэр хуралд суугаагүй. Ноднин дөрөвдүгээр сард Улаанбаатарт анх удаа Юникодын комисс хуралдсан. Тэр хурлыг зохион байгуулах бүх нөхцөлийг бүрдүүлэхээр 2017 оноос хойш ажилласан. Бидний амбиц бол монгол бичгээ олон улсын стандартад оруулах асуудлыг Улаанбаатар хотноо шийдвэрлэж нийтэд хэрэглэх боломжтой болгох түүхэн үйл явдлыг бичих гэж зорьсон. Гэтэл 2019 онд болсон уг хурал нь улстөржиж бүх төрийн байгууллага нь бидний эсрэг санал өгсөн. Энэ удаагийн хурлаар уйгур бичгийг кодлохоор болсон гэж дуулсан. Гурван жилийн өмнө энэ асуудал яригдаж байсан. Энэ жил ямартай ч кодын мужид оруулж батлахаар болсон юм шиг байна билээ.


-“Болорсофт” компани монгол бичгийг авиа зүйн зарчмаар кодлох чиглэлээр хөгжүүлж байсан байх аа. Чухам яагаад та бүхний ажил саатсан юм бэ?


-Нэг хэсэг нь дүрсээр кодлох байр суурьтай байсан. Тэр нь титэм, шүд, шилбэ, гэдсийг холбоно гэсэн үг. Ингэж кодлож болно. Гэхдээ энэ нь хэлний симатикийг алдагдуулна.


-Монгол бичгийг дүрсээр кодолбол шивэхэд маш их ажиллагаатай болно, тийм үү?


-Мэдээж шивэхэд ажиллагаатай. Нэг үсэг бичихийн тулд олон товчлуур дээр дарна гэсэн үг. Бидний бариад байгаа санал нь авиагаар нь кодлох.

Одоо ч монгол бичгийг авиагаар нь кодолсон байгаа. Гэхдээ хамгийн гол алдаа нь, эр эм үгийн “Г”, “Х” байсан. Үүнийг фонт нь үгээ эр эмийг нь таних хэрэгтэй болж байгаа юм. Үүнийг бичиж байгаа хүн нь ойлгож эр, эм үгийнхээ үсгийг тавих ёстой болохоос систем юм уу, фонт нь түүнийг автоматаар солих нь буруу байсан. Ийм ганцхан алдаанаас болж тэр чигээр нь дүрс рүү оруулъя гэж дайрч байгаа нь харамсалтай.

Хэдий дүрс рүү орж болох ч маргааш нь дахиад техникийн асуудал ургана. Учир нь эрэмбэлж чадахгүй. Шүд шилбээр нь ангилчихвал “А” болон “Э” үсэг холилдоно. Цаашлаад “У” болон “О” үсэг холилдоно. Тэгэхээр миний яриад байгаа мөнөөх утга учир нь алдагдаад түүнээсээ хөөгөөд технологийн хүндрэлүүд гарч эхэлнэ. Зүгээр бичгийн машины хэмжээнд шивэх гэж байгаа бол болно. Жаахан алдааг нь засаад л болчих гээд байхад наадах чинь огт болохгүй, дүрс рүү оруулна гээд байгаа нь эмгэнэлтэй асуудал.


-Монгол бичгийг авиа зүйгээр нь юникодод оруулахад нэлээд ахицтай ажилласан. Дээр дурдсан алдааг засахад хэдий хугацаа орох вэ. Ер нь “Болорсофт” энэ төслөө цаашид үргэлжлүүлэх үү?


-Бид анх 2018 онд юникодод авиа зүйгээр кодлоно гэж улайрч явсан. Хэрвээ тэр үед нь оруулчихсан бол 2020 онд бүх систем дээр нэвтэрчихсэн, асуудал шийдэгдсэн байх байлаа. Одоо бол наад зах нь дахиад хоёр жил зарцуулна.

Би энэ стандартчиллын комиссын гишүүнчлэлээс албан ёсоор татгалзаад, ажлын багаас гарчихсан. Ийшээ орох сонирхолгүй байгаа. Гэхдээ зөв зүйтэй талаас нь шийдэгдээсэй гэж чих тавьдаг. Тэртээ тэргүй техникийн хувьд бүгдийг шийдчихлээ гээд байхад авахгүй хаяж байхад бид юу ярих вэ дээ.   


-Чимэгэ яриа буулгагч нь сэтгүүлч, хурлын тэмдэглэл хөтөлдөг хүмүүст ихээхэн хэрэгтэй. Одоогоор 30 гаруй байгууллага худалдан аваад хэрэглэж байна гэж та хэллээ. Ямар байгууллагууд түлхүү ашиглаж байна вэ?


-Өнөөдрийн байдлаар, хамгийн эхэнд хуулийн салбарынхан байна. Хууль дүрмийнхээ дагуу бүх зүйлээ протоколтой байлгах ёстой гэдэг утгаараа. Интермэд эмнэлэгт ашиглах гээд туршилтын шатандаа явж байна. Мөн “Гэрэгэ системс”-тэй хамтран электрон киоск төхөөрөмжийг автоматжуулахаар аман гэрээ байгуулчихсан. Боловсролын салбар, сэтгүүл зүйн салбарт хэрэглэх боломж нь нээлттэй. Одоогоор хамгийн идэвхтэй ашиглаж байгаа нь хуулийн салбарынхан байна даа.


-Таны нэгэн илтгэлдээ, хиймэл оюун ухаан ашигласнаар дуу хоолойгоор шалгалт өгдөг системийн тухай ярьж байсан. Энэ талаар дэлгэрэнгүй тайлбарлана уу?


-Энэ тухай олон жилийн өмнө ярьж байсан. Миний хувьд боловсролын системд тест, шаблон бөглөдөг нь маш их хор уршиг авчирдаг гэж боддог. Хүний мэдлэгийг уншуулж, яриулж байж шалгана шүү дээ. Түүнээс биш “онгоц буудаж” байгаа юм шиг байж болохгүй. Хэрвээ шалгалтын материалыг багш нь засахад төвөгтэй байгаа бол одоо ч тодорхой хэмжээнд автоматжуулах боломжтой.


-Тухайн хүний хариултыг хиймэл оюун ухаан сонсоод зөв, бурууг нь ялгадаг системийн тухай хэлэх гээд байна уу?

-Тийм. Тухайн хүн хэдэн хувь зөв ярив гэдгийг тооцоолох боломжтой.


-Та дээр хэлэхдээ, монгол робот бүтээхээр төлөвлөж байгаа гэсэн. Энэ нь ямар үүрэгтэй робот байх вэ. Хэзээ дуусгана гэж тооцож байна вэ?

-Хиймэл оюун ухааныг орлох технологи бүтээж байгаа болохоор тийм ч амар дуусахгүй. Эхний ээлжинд 1-2 жилийн дотор бүтээх байх. Тэр нь ямар чадвартай байхыг хэлж мэдэхгүй байна.

Эхлээд хүнтэй ярилцах хэмжээний робот байхаар төлөвлөж байгаа. Ер нь гадаадад виртуал оператор, ресепшин зэрэг механикжсан ажлын байрыг робот эзэлж эхлээд байна шүү дээ. Тиймээс бид үүнтэй адил монгол хэлтэй виртуал ресепшн хийхээр зорьж байгаа.

Удахгүй олон нийтэд танилцуулах байх аа.

Related news