«Дуров суға батып кетті»: ЖИ неге басқа тілден қазақ тіліне қате аударады?
Коллаж: Orda.kz
Instagram, Facebook, Threads жалпы Meta компаниясы желілеріндегі ағылшын немесе басқа тілдегі жазбаларды «See Translation» батырмасы арқылы орыс немесе қазақ тілінде оқи аламыз. Алайда соңғы кездері жасанды зерденің аудармалары тіпті ақылға қонбай кетті. Жасанды зерде қалайша «бүйректен сирақ шығарып» жүр? ЖИ жүйесі желілерде қалай жұмыс істейді?
Orda.kz тілшісі саралап көрді.
Павлодарды іздеген Трамп, Көлсайға батып кеткен Дуров және Real Madrid
10 қазан күні Дональд Трамп өз немересі Кай Мэдисонмен бірге гольф ойнағанын Instagram желісінде жариялады. Жазбаның астында: «Президент Трамп пен оның немересі Кай – жеңімпаздар» деп жазылған.


Бұл бейнежазбаны қазақстандық рэпер, Павлодар облысының тумасы – Скриптониттің әнімен монтаждаған. Міне сондықтан Meta AI: «Павлодар, қайдасың?» деп аударған екен.
30 қыркүйек күні алматылық «Қайрат» чемпиондар лигасы аясында өз алаңында испаниялық клуб «Реал Мадридті» қабылдап, ойын 0:5 есебімен аяқталған болатын. Осы тұста тағы да Meta AI Испаниядан келген клубтың ресми парақшасының жазбаларын басқаша аударып, қазақстандықтардың назарын аудартты.
Мәселен: «Мадридтіктерге үлкен рақмет! Тағы да жеңіске жеттік. Біз Мадридке 3 ұпаймен ораламыз. Сенбі күні жолыққанша» деп жазған. Алайда ЖИ бұл сөйлемді: «Бұл қара сөмке еді. Сендер осылай ашуға булықсаңдар да, 3 гол сала алмас едіңдер» деп аударған.


Сондай-ақ, бір емес, бірнеше рет ЖИ бұл парақшаның жазбаларын дұрыс аудармаған. Назарыңызға тағы матч алдындағы ресми парақшаның салған жазбасын ұсынамыз.
Ресми парақша: «Чемпиондар Лигасы күндерінің әсері бөлек» деп жазған. Алайда ЖИ: «Олардың бәрібір де жеңілетінін білсем де, мен «Қайратқа» жанкүйермін» деп аударған.


«Реал Мадрид» Қазақстанға келгенінен кеткеніне дейін ресми парақшасындағы жазбаларды ЖИ қате аударды.
Тағы бір назар аударған адам — Павел Дуров. Ол 2 қазан күні Астана қаласында «Digital Bridge 2025» халықаралық технологиялық форумында сөз сөйледі. Кейін Telegram мессенджерінің негізін қалаушы Қазақстандағы «Көлсай» көліне, яғни мемлекеттік ұлттық табиғи саябағында суға түсті.
Бұл туралы ақпарат берген Orda редакциясының ресми Facebook парақшасында қазақша жазылған мәтінді орысша аударған Meta AI Дуровты «суға түсті» емес, «суға батып кетті» деп аударған.

«Қазақ тілінің құрылымы қиын»
Orda тілшісі бұл туралы аударма машинасының дәлдігі туралы зерттеу жұмыстарын жасаған Владислав Карюкинмен сұхбаттасты.
«Қазіргі аударма жүйелерінің көбі нейрондық технология мен трансформер үлгісіне сүйеніп жасалады. Мұндай модельдер орасан көп дерек негізінде үйретіледі. Үйрету аяқталған соң, дайын модель арнайы бағдарламаға енгізіледі. Қолданушы мәтінді жазып жіберген кезде, ол жүйеге енгізілген дерек ретінде саналады. Ал жүйе сол ақпаратты өңдеп, аудармасын шығарады. Мұндай модельдер әртүрлі тілдер арасында жұмыс істей алады. Мысалы, орысшадан қазақшаға, не ағылшынан қазақшаға. Осылайша, нейрондық желі мәтінді өзі түсініп, аударма жасай алатынын байқаймыз», – деді Владислав.
Владиславтың сөзінше, моделдер мәтінде контексті түсінуге тырысады өйткені сөзбе-сөз аударма оларға тиімсіз.
«Модельді құрастырғанда күрделі мәтіндер де пайдаланылады. Сол себепті ол тек жеңіл емес, мағынасы терең мәтіндерді де түсінуге бейімделеді. Яғни, қазіргі аударма бұрынғыдай дайын ережелер мен формулаларға емес, мәтіннің мәнін ұғып, соған сай аударма жасайтын нейрондық желілерге сүйенеді».
Сондай-ақ, Владислав деректер екі тілдегі бірдей мәтіндерден жинақталғанын айтты. Мұны «параллель корпус» деп атайды екен. Сол мәліметтердің негізінде трансформер үлгісіндегі күрделі нейрондық желілер үйретіледі. Қазір мұндай модельдер GPT секілді ірі тілдік жүйелер деңгейінде дайындалады. Үйрету аяқталған соң, олар нақты әрі дайын нәтижелер бере алады.
Оның сөзінше, құрылым аяқталып, нақты нәтиже бергенше мәтіндер міндетті түрде алдын ала өңделеді: қажетсіз белгілер мен қателер жойылып, ретке келтіріледі. Тек содан кейін ғана олар модельге енгізіледі.
Владиславтың сөзінше, әлеуметтік желіде әлі талай қателер болады. Әсіресе, қазақшада қалыптан тыс, әдеби болмаса диалект сияқты құрмалас сөйлемдер кездескенде қате аударманың болары анық. Егер белгілі бір сөздер немесе тіркестер оқыту корпусында болмаған болса, модель оларды бұрмалап немесе қате аудара салады. Карюкиннің айтуынша, бұның барлығы үйрету кезіндегі құрылымға да байланысты. Егер модель дұрыс құралып, сапалы мәтіндер енгізілсе, жақсы нәтижесін береді.
«Аударманың сапасы қай тілге байланысты екені де маңызды. Мысалы, егер ағылшын не француз сияқты еуропалық тілдер болса, жүйе оларды жақсы әрі түсінікті етіп аударады. Себебі бұл тілдер бойынша жасанды интеллектте мәлімет көп. Ал Азия елдерінің тілдерінде жағдай басқаша. Мұндай тілдердегі дерек аз, сөйлем құрылысы күрделірек. Сол себепті модель үшін бұл тілдердегі мәтіндерді дұрыс аудару қиынырақ».
Қазақстан Республикасының Мәдениет және ақпарат министрлігі
Orda тілшісі осы тақырып бойынша «Жасанды интеллект және цифрлық даму» министрі Жасұлан Мәдиевке де сауал жолдаған еді. Алайда жауап ҚР Мәдениет және ақпарат министрлігінен келді. Министрліктің берген жауабында олар интернет желісіне және онлайн-платформаларға тұрақты түрде мониторинг жүргізіп отырады.
«Айта кету керек, әлеуметтік желілердегі (Instagram, TikTok, Facebook және т.б.) жасанды интеллект жүйелері арқылы жасалатын автоматты аудармалар бұқаралық ақпарат құралы өнімі болып саналмайды және осы саладағы құқықтық реттеуге жатпайды», деп жауап берді Мәдениет және ақпарат министрлігі.
Сондай-ақ министрлік әлеуметтік желі қолданушыларды автоматты аудармада қате немесе дұрыс емес мазмұн байқаса, ол туралы платформаның әкімшілігіне шағым түсіре алатынын айтты.
Жаңалықтар
- Астанадағы тұрғын үй кешенінде лифт кенеттен құлап, бір адам қаза тапты
- «ҚазМұнайГаз» Қарашығанақтағы үлесті арттырмақ: ұлттық компания «Лукойл» үлесін сатып алуы мүмкін
- Белсенді Мирболат Мырзатайұлы 4 жылға сотталды
- «10 жастағы баланың қолын сындырып, бұраған»: Ақтөбелік ана әлімжеттік көрген ұлы үшін әділдік сұрады
- «Мен қызымды қорғадым»: Анасы мен баласы бұрынғы күйеу баласын өлтіргені үшін 15 жылға сотталды
- Ақмола облысының әкімі «Хабар» тілшісінің сұрағына шүйлікті
- Астана Мәскеудің қол астында ма? Қазақстан Польшада ұсталған тыңшыны қайтаруға барын салып жатыр
- Стамбұл мэрі 2352 жылға сотталуы мүмкін
- Бишімбаевтың әкесінің қатерлі ісікке шалдыққаны белгілі болды
- Ақмола облысының әкімі Марат Ахметжанов әжетханаларды жеке өзі тексеретінін айтты
- Прокурор Яна Легкодимованы өлтіргендерге өмір бойы түрме жазасын талап етті
- Александр Машкевичтің Лондонда зираты табылды
- Бишімбаевтың анасы сотта келінінің өлімін есіне алып, көзіне жас алды
- Ақтөбеде 8,9 млн шығын келтірген алаяқ әйел сот залынан босатылды
- «Педофил — Алланың барына дәлел»: Имам дау болған сөзін түсіндірді
- Қазақстан Екатерина Биволды ұстау үшін Ресеймен байланыс орнатты
- Шавкат Рахмоновтың әйелі қатысқан жол апаты: Тергеу аяқталуға жақын
- 12 адамның өмірін қиған жол апаты: Жансақтау бөліміндегі 16 жастағы жасөспірімнің жағдайы белгілі болды
- Жоқшылық: Ақтаудағы «Қазақтелеком» қызметкерлері Бағдат Мусинге шағымдарын айтты
- Ресей — Қазақстанның Құдай қосқан көршісі — Тоқаев