istanbul-ticaret-gazetesi
istanbul-ticaret-gazetesi

Yapay zeka öğrenmesinde dil dayatması

Mevcut yapay zekâ sistemleri, büyük oranda ana akım Amerikan İngilizcesiyle eğitiliyor. Bu durum, farklı bölgelerden gelen dilsel çeşitliliği dışlayan ve eşitsizlikleri pekiştiren sonuçlar doğuruyor.

Giriş: 08.05.2025 - 09:29
Güncelleme: 08.05.2025 - 09:29
Yapay zeka öğrenmesinde dil dayatması

Yapay zeka sistemlerinin eğitiminde kullanılan verilerin yaklaşık yüzde 90'ı İngilizce'den oluşuyor. Ancak bu İngilizce, küresel çeşitliliği değil, ağırlıklı olarak ana akım Amerikan İngilizcesini temsil ediyor. Dünya genelinde 1,5 milyar kişinin konuştuğu bu dilin bölgesel ve kültürel birçok çeşidi varken, yapay zekâ teknolojileri daha dar bir İngilizce anlayışına dayandırılıyor.


DİLİN TEKELLEŞMESİ RİSKİ

Bu durum, tesadüfi değil. Amerikan İngilizcesi, dijital altyapıdan teknoloji şirketlerinin kurumsal tercihleri ve veri kümelerine kadar birçok alanda hâkimiyet kurmuş durumda. Özellikle Silikon Vadisi merkezli şirketler, geliştirdikleri ürün ve sistemlerde çoğunlukla bu dil normlarını benimsiyor. Otomatik düzeltme sistemlerinden AI yazma asistanlarına kadar kullanılan araçların temelinde de bu veri hakimiyeti yatıyor. Sonuç olarak, yapay zekâ tarafından üretilen içerikler çeşitliliği dışlayan, azınlık aksanlarını göz ardı eden, dilsel ve kültürel önyargıları yeniden üreten bir çizgiye kayıyor.


HOMOJEN AKSANLAR ELEŞTİRİSİ

Son dönemde yapılan araştırmalar, bu homojenleşmenin kullanıcı deneyimlerini olumsuz etkilediğini gösteriyor. Ana akım dışındaki İngilizce konuşurlar, özellikle ses klonlama ve konuşma üretimi gibi alanlarda yapay zekânın aksan çeşitliliğini yeterince yansıtamadığını belirtiyor. Katılımcıların bir kısmı, mevcut seslerde baskın Amerikan aksanının öne çıktığını, sistemlerin başka kültür ve bölgeleri dışladığını vurguluyor. Bu bağlamda, yapay zekâ teknolojilerinin "başka insanlar düşünülerek" geliştirildiği yönünde eleştiriler dikkat çekiyor.

Yapay zeka öğrenmesinde dil dayatması


ALGORİTMİK AYRIMCILIĞIN İZLERİ

Yapay zekâ sistemleri, yalnızca dili anlamakla kalmıyor, aynı zamanda karar alma süreçlerini de etkiliyor. Otomatik düzeltme, sesten metne dönüştürme ve iş başvurularında kullanılan özgeçmiş tarayıcıları gibi araçlar çoğunlukla Amerikan İngilizcesi verisiyle eğitildiği için, bu normların dışında kalan yapılar sistem tarafından "yanlış" veya "eksik" kabul edilebiliyor. Örneğin, Hint İngilizcesi ile yazılmış bir başvurunun sistem tarafından reddedilmesi ya da Avustralya yerlilerine ait sözlü tarihlerin ses tanıma tarafından eksik aktarılması, önemli bilgi ve kültürel kayıplara yol açabiliyor.


ÇEŞİTLİLİĞE SAYGILI YAKLAŞIM

Yapay zekâ geliştirme süreçlerinde "tek doğru İngilizce" anlayışından uzaklaşılması gerektiği vurgulanıyor. İngilizce, farklı kültür ve coğrafyalarda çeşitli biçimlerde konuşuluyor. Hint İngilizcesinde "prepone" gibi özgün sözcükler bulunurken, Singapur İngilizcesi olan "Singlish", Malayca, Tamilce ve Hokkienceden sözdizimsel öğeler taşıyor. Aborijin İngilizcesi de kendine özgü yapısı ve kurallarıyla diğer İngilizce çeşitleri kadar geçerli bir dilsel yapı sunuyor.


Dilbilimciler ve uzmanlar, yapay zekâ teknolojilerinin bu çeşitliliği yansıtan şekilde geliştirilmesini savunuyor. Bu, yalnızca veri temsiliyle değil, aynı zamanda disiplinler arası iş birliğiyle mümkün olabilecek bir dönüşüm olarak görülüyor. Dilsel adaletin sağlanması, toplum liderlerinin, dilbilimcilerin, teknoloji uzmanlarının ve eğitimcilerin birlikte hareket etmesiyle gerçekleşebilir. Yapay zekâ, dili düzeltmek yerine, farklı konuşurları anlamaya çalışan bir sistem haline getirilmelidir.


DİLİN SAHİBİ KİM?

İngilizce, tarih boyunca emperyalizmin bir aracı olarak kullanıldıysa da, aynı zamanda direnişin, yaratıcılığın ve kültürel aidiyetin de dili olmuştur. Her toplum, İngilizceyi kendi koşullarına göre yeniden şekillendirmiştir. Ancak yapay zekâ sistemleri bu zenginliğe değil, hâkim olan forma odaklanıyor. Bu da, pratikte tek dilliliğe yakın bir yapay zekâ ekosistemi ortaya çıkarıyor.


Uzmanlar, dilsel çeşitliliği belgeleyen ve saygı gösteren sistemlerin inşa edilmesinin şart olduğunu vurguluyor. Ancak bu, her türlü dil biçiminin dijitalleştirilmesi gerektiği anlamına gelmiyor. Daha çok, sistemlerin hangi İngilizceyi modellediğini sorgulamak, dışarıda bırakılanların kimler olduğunu anlamak gerekiyor. Çünkü teknoloji sadece konuşulan dili değil, temsil edilen toplulukları da şekillendiriyor.