Google Çeviri'de Güney Aşağı Franken dili dahil 110 yeni dil

dunyadan

Aktif Üye
Google daha fazla dili otomatik olarak çevirebilir. Google Translate çeviri hizmetinin sayısı, başlangıçta kaynak diller için olmak üzere neredeyse ikiye katlanarak 133'ten 243'e çıkacak. Veri şirketi bunu perşembe günü duyurdu. Spektrum, Kantonca veya Pencapça (Shahmukhi yazısının bir versiyonu) gibi çok sayıda konuşmacının bulunduğu dillerden, güney Brezilya'da kullanılan Güney Düşük Franken veya Riograndenser Hunsrückisch gibi daha az yaygın lehçelere kadar uzanır.


Reklamcılık



Google çalışanı Isaac Caswell şirket blogunda “Artık desteklenen dillerin yelpazesini genişletmek için yapay zekayı kullanıyoruz” diye yazıyor. “Geniş Dil Modelimiz PaLM2 sayesinde bugüne kadarki en büyük genişletmemiz olan Google Çeviri'ye 110 yeni dil sunuyoruz.” Daha geçen yıl, Google Çeviri kelime dağarcığını 33 dil genişleterek toplam sayıyı 131'e ve yazılı Çincenin geleneksel ve basitleştirilmiş versiyonlarına getirdi. Bu sefer Kantonca ayrı olarak ekleniyor. Caswell, bunun öğrenilmesinin özellikle zor olduğunu belirtiyor, “çünkü yazılı Kantonca çoğu zaman Mandarin Çincesi ile örtüşüyor.” Bu, Kantonca metinleri otomatik olarak bulmayı ve bunları Büyük Dil Modeline (LLM) dahil etmeyi zorlaştırır.

Yüzyıllardır Almanya ve Avusturya'da konuşulan Romanes, Avrupa'da çok sayıda lehçede yayılmış olması nedeniyle programcılar için bir zorluk da yarattı. Sonuç, bu şekilde konuşulmayan bir karışım üreten bir LLM'dir: Güney Vlax'a dayanır, ancak Kuzey kolunun ve Balkan kollarının unsurlarını da içerir.

Yeni dillerin dörtte biri Afrika kökenlidir. Artık tüm Lusofos'un yalnızca bir azınlığı tarafından konuşulan ayrı bir Portekizce çeşidi var: Portekiz'de yaygın olan dil versiyonu. Ayrıca Jamaika, Mauritius, Papua Yeni Gine ve Seyşeller gibi çeşitli kreol dilleri de içerir. Politik olarak patlayıcı yeni gelenler arasında Tibetçe, Osetçe ve Kırım Tatarlarının dili yer alır. Google, yeni desteklenen dillerin bir listesini yayınladı.

GUI Mücadelesi


Yeni teklifler henüz kullanıcı arayüzlerinde seçilemiyor. Bu, çevirilerin dışında yeni diller mümkün, ancak henüz değil içinde yeni diller. Çevrimdışı çeviri paketleri de uygulamada henüz mevcut değil. Google'ın bu kadar çok dil için arayüzü nasıl tasarlayacağı henüz bilinmiyor. Şirket kendisine bir gün 1.000 dili otomatik olarak birbirine çevirme hedefi koydu. Bu, yaklaşık yedi dilden birini destekleyeceği anlamına gelir.

Her ne kadar diller sürekli olarak yok olsa da, hala 7.000'den fazla dil var. Bir dil ile bir lehçe arasındaki kesin ayrım zordur ve çoğu zaman (siyasi olarak) tartışmalıdır. Almanya'da Yidiş, Kuzey Frizce, Roman, Saterland dili, Sorb dili ve Güney Jutland dili özellikle yok olma tehlikesiyle karşı karşıyadır.

Halüsinasyonlar: Çiğneyelim mi?


Google, Faroese'nin uzun süredir devam eden Google Çeviri tarafından desteklenme talebini nihayet yerine getirdiğini açıkladı. Ancak dil tanıma pratikte henüz düzgün çalışmıyor. Google Çeviri şu anda Faroe dilindeki “Mær gongst væl, takk, og tygum?” cümlesini yanlış yorumluyor. (“İyiyim, teşekkür ederim, ya sen?”) İzlandaca olarak. Sonuç şu Dadaist yanlış çeviridir: “Lütfen inleyip çiğnememize izin mi vereyim?”.

Google Translate'e yanlış kaynak dilini yanlışlıkla veya yanlışlıkla söylediğinizde garip şeyler olur. Google, AI'sına “Hiçbir şey anlamıyorum” hata mesajı gibi boşluklar bırakacak kadar cesur olmayı henüz öğretmedi. “Mær gongst væl, takk, og tygum?” “Almanca”dan İngilizceye çevrilecekse, çıktı şu olur: “Sayıyoruz, değil mi ve merak ediyoruz?” Tersine, yanlışlıkla İngilizce girerseniz, sistem şu Alman sürprizini halüsinasyona uğratır: “Siz, babanız ve oğlunuz ne olacak?”




(ds)