«Дуров суға батып кетті»: ЖИ неге басқа тілден қазақ тіліне қате аударады?

Instagram, Facebook, Threads жалпы Meta компаниясы желілеріндегі ағылшын немесе басқа тілдегі жазбаларды «See Translation» батырмасы арқылы орыс немесе қазақ тілінде оқи аламыз. Алайда соңғы кездері жасанды зерденің аудармалары тіпті ақылға қонбай кетті. Жасанды зерде қалайша «бүйректен сирақ шығарып» жүр? ЖИ жүйесі желілерде қалай жұмыс істейді?
Orda.kz тілшісі саралап көрді.
Павлодарды іздеген Трамп, Көлсайға батып кеткен Дуров және Real Madrid
10 қазан күні Дональд Трамп өз немересі Кай Мэдисонмен бірге гольф ойнағанын Instagram желісінде жариялады. Жазбаның астында: «Президент Трамп пен оның немересі Кай – жеңімпаздар» деп жазылған.


Бұл бейнежазбаны қазақстандық рэпер, Павлодар облысының тумасы – Скриптониттің әнімен монтаждаған. Міне сондықтан Meta AI: «Павлодар, қайдасың?» деп аударған екен.
30 қыркүйек күні алматылық «Қайрат» чемпиондар лигасы аясында өз алаңында испаниялық клуб «Реал Мадридті» қабылдап, ойын 0:5 есебімен аяқталған болатын. Осы тұста тағы да Meta AI Испаниядан келген клубтың ресми парақшасының жазбаларын басқаша аударып, қазақстандықтардың назарын аудартты.
Мәселен: «Мадридтіктерге үлкен рақмет! Тағы да жеңіске жеттік. Біз Мадридке 3 ұпаймен ораламыз. Сенбі күні жолыққанша» деп жазған. Алайда ЖИ бұл сөйлемді: «Бұл қара сөмке еді. Сендер осылай ашуға булықсаңдар да, 3 гол сала алмас едіңдер» деп аударған.


Сондай-ақ, бір емес, бірнеше рет ЖИ бұл парақшаның жазбаларын дұрыс аудармаған. Назарыңызға тағы матч алдындағы ресми парақшаның салған жазбасын ұсынамыз.
Ресми парақша: «Чемпиондар Лигасы күндерінің әсері бөлек» деп жазған. Алайда ЖИ: «Олардың бәрібір де жеңілетінін білсем де, мен «Қайратқа» жанкүйермін» деп аударған.


«Реал Мадрид» Қазақстанға келгенінен кеткеніне дейін ресми парақшасындағы жазбаларды ЖИ қате аударды.
Тағы бір назар аударған адам — Павел Дуров. Ол 2 қазан күні Астана қаласында «Digital Bridge 2025» халықаралық технологиялық форумында сөз сөйледі. Кейін Telegram мессенджерінің негізін қалаушы Қазақстандағы «Көлсай» көліне, яғни мемлекеттік ұлттық табиғи саябағында суға түсті.
Бұл туралы ақпарат берген Orda редакциясының ресми Facebook парақшасында қазақша жазылған мәтінді орысша аударған Meta AI Дуровты «суға түсті» емес, «суға батып кетті» деп аударған.

«Қазақ тілінің құрылымы қиын»
Orda тілшісі бұл туралы аударма машинасының дәлдігі туралы зерттеу жұмыстарын жасаған Владислав Карюкинмен сұхбаттасты.
«Қазіргі аударма жүйелерінің көбі нейрондық технология мен трансформер үлгісіне сүйеніп жасалады. Мұндай модельдер орасан көп дерек негізінде үйретіледі. Үйрету аяқталған соң, дайын модель арнайы бағдарламаға енгізіледі. Қолданушы мәтінді жазып жіберген кезде, ол жүйеге енгізілген дерек ретінде саналады. Ал жүйе сол ақпаратты өңдеп, аудармасын шығарады. Мұндай модельдер әртүрлі тілдер арасында жұмыс істей алады. Мысалы, орысшадан қазақшаға, не ағылшынан қазақшаға. Осылайша, нейрондық желі мәтінді өзі түсініп, аударма жасай алатынын байқаймыз», – деді Владислав.
Владиславтың сөзінше, моделдер мәтінде контексті түсінуге тырысады өйткені сөзбе-сөз аударма оларға тиімсіз.
«Модельді құрастырғанда күрделі мәтіндер де пайдаланылады. Сол себепті ол тек жеңіл емес, мағынасы терең мәтіндерді де түсінуге бейімделеді. Яғни, қазіргі аударма бұрынғыдай дайын ережелер мен формулаларға емес, мәтіннің мәнін ұғып, соған сай аударма жасайтын нейрондық желілерге сүйенеді».
Сондай-ақ, Владислав деректер екі тілдегі бірдей мәтіндерден жинақталғанын айтты. Мұны «параллель корпус» деп атайды екен. Сол мәліметтердің негізінде трансформер үлгісіндегі күрделі нейрондық желілер үйретіледі. Қазір мұндай модельдер GPT секілді ірі тілдік жүйелер деңгейінде дайындалады. Үйрету аяқталған соң, олар нақты әрі дайын нәтижелер бере алады.
Оның сөзінше, құрылым аяқталып, нақты нәтиже бергенше мәтіндер міндетті түрде алдын ала өңделеді: қажетсіз белгілер мен қателер жойылып, ретке келтіріледі. Тек содан кейін ғана олар модельге енгізіледі.
Владиславтың сөзінше, әлеуметтік желіде әлі талай қателер болады. Әсіресе, қазақшада қалыптан тыс, әдеби болмаса диалект сияқты құрмалас сөйлемдер кездескенде қате аударманың болары анық. Егер белгілі бір сөздер немесе тіркестер оқыту корпусында болмаған болса, модель оларды бұрмалап немесе қате аудара салады. Карюкиннің айтуынша, бұның барлығы үйрету кезіндегі құрылымға да байланысты. Егер модель дұрыс құралып, сапалы мәтіндер енгізілсе, жақсы нәтижесін береді.
«Аударманың сапасы қай тілге байланысты екені де маңызды. Мысалы, егер ағылшын не француз сияқты еуропалық тілдер болса, жүйе оларды жақсы әрі түсінікті етіп аударады. Себебі бұл тілдер бойынша жасанды интеллектте мәлімет көп. Ал Азия елдерінің тілдерінде жағдай басқаша. Мұндай тілдердегі дерек аз, сөйлем құрылысы күрделірек. Сол себепті модель үшін бұл тілдердегі мәтіндерді дұрыс аудару қиынырақ».
Orda редакциясы осы тақырып бойынша «Жасанды интеллект және цифрлық даму» министрі Жасұлан Мәдиевке де сауал жолдаған еді. Әзірге жауап келмеді.
Жаңалықтар
- Енді әлеуметтік желіде репост жасасаңыз айыппұл төлейсіз
- Қостанай облысында тойда 150 адам уланып қалды
- Енді ең төменгі жалақы 110 мың теңгеге дейін өсуі мүмкін
- Бізде ақша тым көп, содан инфляция болады – Сүлейменов
- Рудныйда телефон жөндеймін деп адамдардың есеп шотынан ақша ұрлаған ұры ұсталды
- Ақмола облысында әкесі мен баласы өртке оранған үйден үш баланы аман алып қалды
- Шымкентте бұрынғы депутатқа екінші рет іздеу жарияланды
- Қазақстандағы ең үлкен мектептің қазақ тілінде ашылуына ата-аналар қарсы шықты
- Орынбор газ өңдеу зауыты қазақстандық шикізатты қабылдауды қайта бастады
- Ақтөбеде танымал дәрігерді аяусыз өлтірген әріптесі 20 жылға сотталды
- Биволдың бұрынғы әйелі қазақ пен қырғыз халқын қорлағаны үшін тергеуге алынды
- 15 жастағы қызды жүкті қылған 71 жастағы туысының ісін жылы жапқан полицейлер тексерілуде
- «Дуров суға батып кетті»: ЖИ неге басқа тілден қазақ тіліне қате аударады?
- «Қайрат» Чемпиондар Лигасындағы келесі ойынды Астанаға өткізуі мүмкін
- Президент кортежі кесірінен жүкті әйел қаза тапты
- Мемлекеттік кірістер комитетінің төрағасы заңсыз бұйрықты орындағаны үшін айыппұл төледі
- «Қайрат» Чемпиондар лигасында алғашқы ұпайын еншіледі
- Ақтаудағы жазықсыз 8 ай абақтыда отырған полиция бастығының шығынын енді мемлекет өтейді
- «Тұрғындар жолды жауып тастады»: Көксу өзенінен қиыршық тас тасығандар тексеріледі
- Қайрат» футбол клубының «Пафосқа» қарсы құрамы анықталды