«Дуров суға батып кетті»: ЖИ неге басқа тілден қазақ тіліне қате аударады?
Коллаж: Orda.kz
Instagram, Facebook, Threads жалпы Meta компаниясы желілеріндегі ағылшын немесе басқа тілдегі жазбаларды «See Translation» батырмасы арқылы орыс немесе қазақ тілінде оқи аламыз. Алайда соңғы кездері жасанды зерденің аудармалары тіпті ақылға қонбай кетті. Жасанды зерде қалайша «бүйректен сирақ шығарып» жүр? ЖИ жүйесі желілерде қалай жұмыс істейді?
Orda.kz тілшісі саралап көрді.
Павлодарды іздеген Трамп, Көлсайға батып кеткен Дуров және Real Madrid
10 қазан күні Дональд Трамп өз немересі Кай Мэдисонмен бірге гольф ойнағанын Instagram желісінде жариялады. Жазбаның астында: «Президент Трамп пен оның немересі Кай – жеңімпаздар» деп жазылған.


Бұл бейнежазбаны қазақстандық рэпер, Павлодар облысының тумасы – Скриптониттің әнімен монтаждаған. Міне сондықтан Meta AI: «Павлодар, қайдасың?» деп аударған екен.
30 қыркүйек күні алматылық «Қайрат» чемпиондар лигасы аясында өз алаңында испаниялық клуб «Реал Мадридті» қабылдап, ойын 0:5 есебімен аяқталған болатын. Осы тұста тағы да Meta AI Испаниядан келген клубтың ресми парақшасының жазбаларын басқаша аударып, қазақстандықтардың назарын аудартты.
Мәселен: «Мадридтіктерге үлкен рақмет! Тағы да жеңіске жеттік. Біз Мадридке 3 ұпаймен ораламыз. Сенбі күні жолыққанша» деп жазған. Алайда ЖИ бұл сөйлемді: «Бұл қара сөмке еді. Сендер осылай ашуға булықсаңдар да, 3 гол сала алмас едіңдер» деп аударған.


Сондай-ақ, бір емес, бірнеше рет ЖИ бұл парақшаның жазбаларын дұрыс аудармаған. Назарыңызға тағы матч алдындағы ресми парақшаның салған жазбасын ұсынамыз.
Ресми парақша: «Чемпиондар Лигасы күндерінің әсері бөлек» деп жазған. Алайда ЖИ: «Олардың бәрібір де жеңілетінін білсем де, мен «Қайратқа» жанкүйермін» деп аударған.


«Реал Мадрид» Қазақстанға келгенінен кеткеніне дейін ресми парақшасындағы жазбаларды ЖИ қате аударды.
Тағы бір назар аударған адам — Павел Дуров. Ол 2 қазан күні Астана қаласында «Digital Bridge 2025» халықаралық технологиялық форумында сөз сөйледі. Кейін Telegram мессенджерінің негізін қалаушы Қазақстандағы «Көлсай» көліне, яғни мемлекеттік ұлттық табиғи саябағында суға түсті.
Бұл туралы ақпарат берген Orda редакциясының ресми Facebook парақшасында қазақша жазылған мәтінді орысша аударған Meta AI Дуровты «суға түсті» емес, «суға батып кетті» деп аударған.

«Қазақ тілінің құрылымы қиын»
Orda тілшісі бұл туралы аударма машинасының дәлдігі туралы зерттеу жұмыстарын жасаған Владислав Карюкинмен сұхбаттасты.
«Қазіргі аударма жүйелерінің көбі нейрондық технология мен трансформер үлгісіне сүйеніп жасалады. Мұндай модельдер орасан көп дерек негізінде үйретіледі. Үйрету аяқталған соң, дайын модель арнайы бағдарламаға енгізіледі. Қолданушы мәтінді жазып жіберген кезде, ол жүйеге енгізілген дерек ретінде саналады. Ал жүйе сол ақпаратты өңдеп, аудармасын шығарады. Мұндай модельдер әртүрлі тілдер арасында жұмыс істей алады. Мысалы, орысшадан қазақшаға, не ағылшынан қазақшаға. Осылайша, нейрондық желі мәтінді өзі түсініп, аударма жасай алатынын байқаймыз», – деді Владислав.
Владиславтың сөзінше, моделдер мәтінде контексті түсінуге тырысады өйткені сөзбе-сөз аударма оларға тиімсіз.
«Модельді құрастырғанда күрделі мәтіндер де пайдаланылады. Сол себепті ол тек жеңіл емес, мағынасы терең мәтіндерді де түсінуге бейімделеді. Яғни, қазіргі аударма бұрынғыдай дайын ережелер мен формулаларға емес, мәтіннің мәнін ұғып, соған сай аударма жасайтын нейрондық желілерге сүйенеді».
Сондай-ақ, Владислав деректер екі тілдегі бірдей мәтіндерден жинақталғанын айтты. Мұны «параллель корпус» деп атайды екен. Сол мәліметтердің негізінде трансформер үлгісіндегі күрделі нейрондық желілер үйретіледі. Қазір мұндай модельдер GPT секілді ірі тілдік жүйелер деңгейінде дайындалады. Үйрету аяқталған соң, олар нақты әрі дайын нәтижелер бере алады.
Оның сөзінше, құрылым аяқталып, нақты нәтиже бергенше мәтіндер міндетті түрде алдын ала өңделеді: қажетсіз белгілер мен қателер жойылып, ретке келтіріледі. Тек содан кейін ғана олар модельге енгізіледі.
Владиславтың сөзінше, әлеуметтік желіде әлі талай қателер болады. Әсіресе, қазақшада қалыптан тыс, әдеби болмаса диалект сияқты құрмалас сөйлемдер кездескенде қате аударманың болары анық. Егер белгілі бір сөздер немесе тіркестер оқыту корпусында болмаған болса, модель оларды бұрмалап немесе қате аудара салады. Карюкиннің айтуынша, бұның барлығы үйрету кезіндегі құрылымға да байланысты. Егер модель дұрыс құралып, сапалы мәтіндер енгізілсе, жақсы нәтижесін береді.
«Аударманың сапасы қай тілге байланысты екені де маңызды. Мысалы, егер ағылшын не француз сияқты еуропалық тілдер болса, жүйе оларды жақсы әрі түсінікті етіп аударады. Себебі бұл тілдер бойынша жасанды интеллектте мәлімет көп. Ал Азия елдерінің тілдерінде жағдай басқаша. Мұндай тілдердегі дерек аз, сөйлем құрылысы күрделірек. Сол себепті модель үшін бұл тілдердегі мәтіндерді дұрыс аудару қиынырақ».
Қазақстан Республикасының Мәдениет және ақпарат министрлігі
Orda тілшісі осы тақырып бойынша «Жасанды интеллект және цифрлық даму» министрі Жасұлан Мәдиевке де сауал жолдаған еді. Алайда жауап ҚР Мәдениет және ақпарат министрлігінен келді. Министрліктің берген жауабында олар интернет желісіне және онлайн-платформаларға тұрақты түрде мониторинг жүргізіп отырады.
«Айта кету керек, әлеуметтік желілердегі (Instagram, TikTok, Facebook және т.б.) жасанды интеллект жүйелері арқылы жасалатын автоматты аудармалар бұқаралық ақпарат құралы өнімі болып саналмайды және осы саладағы құқықтық реттеуге жатпайды», деп жауап берді Мәдениет және ақпарат министрлігі.
Сондай-ақ министрлік әлеуметтік желі қолданушыларды автоматты аудармада қате немесе дұрыс емес мазмұн байқаса, ол туралы платформаның әкімшілігіне шағым түсіре алатынын айтты.
Жаңалықтар
- Еліміз балаларға медициналық көмек көрсетудің гибридті моделін енгізеді
- 200 тоннадан астам зақымданған астық елге кіргізілмей, экспорттаушы елге қайтарылды
- Прокуратура Алматы облысында 800-ден астам құқықбұзушылықты анықтады
- Bloomberg — Қазақстан өңірдегі цифрландыру көшбасшысы
- Жаңа Конституцияның қабылдануына орай кімдер қылмыстық және әкімшілік амнистияға ілігуі мүмкін?
- Еліміздегі ҰБТ-дан шекті балл жинаған талапкерлер күмән туғызды
- Жалған жұмыс арқылы әлеуметтік төлем алғандарға қатысты 38 қылмыстық іс қозғалды
- АҚШ Эбола вирусын жұқтырған науқастарын Африкаға орналастырмақшы, Кения соты қарсы шықты
- Қарағанды облысында өртенген үй мен шаруашылық құрылысынан 8 газ баллоны шығарылды
- Тоқаев: Озық технологиялар еуразиялық интеграцияның қуатты катализаторына айналуы керек
- Жангелдиндегі отбасы өлімі: Туыстары бірнеше ай бойы марқұмдармен хат жазысқан
- «Есімімді кірлетуге жол бермеймін»: Михаил Шайдоров жалақы дауына қатысты мәлімдеме жасады
- Қазақстан халықаралық деңгейде «+7» телефон коды бойынша тең құқықты мәртебесін бекітті
- Атырау облысында жол апатынан төрт адам қаза тапты
- Қазақстан Ресейдің қазақтар көп тұратын өңірлеріне мектеп салады
- Тағы бір «Палау орталығы» өртенді, бұл жолғысы Астанада
- Дубайда өмір бойына сотталған қазақстандыққа қатысты тың дерек шықты
- Сот процесінде Сұлтан Сәрсемалиевтің ата-анасының сөзі тыңдалды
- Қай маман иелерінің жалақысы 2,5 есеге дейін өсіп, үкіметтен қолдау көреді?
- Атырауда жасөспірім қатысқан оқиға бойынша төрт адам жауапқа тартылды