Kriter > Dosya > Dosya / Toplum |

Büyük Dil Modellerinin Küreselliği Sorgulanmalıdır


Halihazırda küresel çapta yaygın olarak kullanılan belli başlı yapay zekâ ve özellikle büyük dil modellerinin zaman zaman sorgulara verdikleri yanıtların, farklı kültürel ve dilsel bağlamlarda çeşitli sorunlara neden olduğu görülüyor. Örneğin, Türkiye'ye özel bir soru setiyle GPT'nin karşısına çıktığınızda size ABD'deki olayları örnekleyerek anlatabiliyor. Dolayısıyla, ABD kültürü haricindeki diğer kültürlere özgü nüanslar ve anlamlar göz ardı edilebiliyor.

Büyük Dil Modellerinin Küreselliği Sorgulanmalıdır

Yapay zekâ ve özellikle büyük dil modelleri (LLM), günümüzde birçok alanda devrim yapmış ve özellikle son 2 yıldır küresel ölçekte etkili olmuştur. Bu modeller; dil işleme, çeviri, bilgi arama ve daha birçok alanda insan hayatını kolaylaştıran çözümler sunuyor. Ancak, bu teknolojilerin ardındaki kültürel ve etik boyutların yeterince sorgulanmadığı da bir gerçek. LLM'lerin geliştirildiği ve eğitildiği çevrelerin, modellerin çıktıları üzerinde büyük etkisi var. Tıpkı bir insanın doğduğu ve büyüdüğü çevreden etkilendiği gibi, bu modeller de eğitildikleri verilerin kültürel izlerini taşır. Bu makalede, LLM'lerin küresel etkilerini incelerken, bu modellerin geliştirilme süreçlerinde karşılaşılan kültürel ve etik zorluklara odaklanacağız.

 

Batı Kültürü Temelli Oluşan Dil

LLM'ler, geniş veri kümeleri üzerinde eğitilen ve dil anlama, üretme gibi yeteneklere sahip olan yapay zekâ modelleridir. API adını verdiğimiz programlama ara yüzleri veya grafik tabanlı ara yüzler sayesinde umumi kullanıma açılmaktadır. Bu modeller, genellikle Batı ülkelerinde, özellikle de Amerika Birleşik Devletleri ve Avrupa'da geliştirilmektedir. Çin'in geliştirdiği bazı modeller de bulunmaktadır fakat bunların sayısı henüz kısıtlıdır. O nedenle bu modellerin eğitiminde kullanılan veri setleri, büyük ölçüde Batı kültürünü ve medeniyetini yansıtmaktadır. Örneğin, İngilizce metinler ve Batı kültürüne ait içerikler, LLM'lerin eğitiminde yaygın olarak kullanılmaktadır. O nedenle bu modellerin çıktılarının belirli bir kültürel bakış açısını yansıtması doğal karşılanabilir.

Halihazırda LLM'lerin küresel çapta yaygın olarak kullanıldığı bilinmektedir. Belli başlı LLM'lerin zaman zaman sorgulara (prompt) verdikleri yanıtların, farklı kültürel ve dilsel bağlamlarda çeşitli sorunlara neden olabildiği görülmektedir. Örneğin, Türkiye'ye özel bir soru setiyle GPT'nin karşısına çıktığınızda size ABD'deki olayları örnekleyerek anlatabilmektedir. Dolayısıyla, ABD kültürü haricindeki diğer kültürlere özgü nüanslar ve anlamlar göz ardı edilebilmektedir. Dünyaca ünlü Harvard Üniversitesinde yapılan bilimsel bir çalışma bunu doğrulamaktadır. Çalışmaya göre, OpenAI'ın büyük dil modeli olan GPT'nin cevaplarının insan cevaplarıyla benzerliği, o kültür ABD kültüründen uzaklaştıkça azalmaktadır. Diğer bir deyişle, ABD'nin kültürüne yakın olan kültürlerde GPT, insana çok benzer cevaplar vermekteyken, ABD'nin kültürüne çok uzak olan Ortadoğu veya Afrika ülkelerinde GPT ile insan arasındaki makas daha da açılmaktadır. O zaman halihazırda bildiğimiz LLM'lerin küresel bir perspektif sunma yeteneği kısıtlı diyebiliriz.

Bu gibi durumlarda akla ilk gelen çözümlerden birisi fine-tuning (ince-ayar) sürecidir. Özetle, bu süreçte bir büyük dil modeli seçilerek amaca, kültüre veya disipline yönelik olarak çok kısıtlı bir eğitim sürecinden geçirilir. Yani, bu süreç sayesinde LLM'yi belirli bir görev veya dil için optimize edebiliyoruz. Elbette bu süreç, modellerin belirli kültürel ve dilsel bağlamlara uyum sağlamasına yardımcı olabilir. Fakat unutulmamalıdır ki, ince-ayar süreci her zaman yeterli olamıyor. Bir insanın doğup büyüdüğü çevrenin etkilerinden tamamen kurtulması ve bambaşka bir diyara giderek sonradan bir şeyler öğrenip ayak uydurmaya gayret etmesi nasıl zorsa, bir LLM'nin de eğitildiği orijinal veri setlerinin etkilerinden tamamen arınması çok zordur. Bu durum, modellerin çıktılarında belirli kültürel ön yargıların devam etmesine yol açıyor. Daha iyi anlaşılması için şöyle bir örnek daha verebiliriz. Lisans, yüksek lisans ve doktora öğrenimini sosyoloji alanında yapmış ve bu alana hakim bir personelinizi, finans birimi için işe aldığınızı varsayalım. Bu kişinin, pozisyonunun gerektirdiği bilgi birikimine ulaşması ve size faydalı olabilmesi çok zordur. Uzun yıllar tekrar yetiştirilmesi ve eğitim alması gerekebilir. Dolayısıyla, aradığımız şey ince-ayardan çok daha fazlası olmalıdır.

Meseleye farklı bir açıdan da yaklaşabiliriz. Devlet büyüklerimizin son zamanlarda yapay zekâ bağlamındaki riskleri gündeme getirdiğini, hatta "çağımızın dijital atom bombası" olarak nitelediklerini görüyor ve duyuyoruz. Aynı şekilde, bunun sadece sektörleri dönüştürecek bir teknoloji değil, aynı zamanda ülkemiz için bir milli güvenlik meselesi olduğunu da görmekteyiz. Zira Mayıs’ta Milli Güvenlik Kurulu'nca (MGK) yayınlanan bildiride, yapay zekâda kaydedilen ilerlemenin büyük fırsatlar sunduğuna ama yeni tehditler doğurabileceğine de dikkat çekiliyor. Yapay zekâyı bu kadar kritik yapan şey nedir, diye sorduğumuzda, pek çok farklı disiplinden pek çok görüş ve düşünceyle karşılaşabiliriz. Fakat özellikle devleti ilgilendiren kısmı, veri mahremiyeti ekseninde bu modellerin kamu kurum ve kuruluşları başta olmak üzere Türkiye Cumhuriyeti sınırları içinde kullanımının verebileceği zararların büyüklüğüdür. LLM'lerin eğitildiği veri setlerindeki kültürel ön yargılar, modellerin çıktılarında da kendini gösterebilir. Örneğin, bir modelin cinsiyet, ırk veya din gibi konularda tarafsız yanıtlar vermesi beklenirken, eğitim verilerindeki ön yargılar nedeniyle bu mümkün olmayabiliyor. Bu durumda LLM'lerin adil ve evrensel bir araç olarak kullanılması da zorlaşıyor. Kamu kurum ve kuruluşları bir yana, halka açık yaygın kullanımda bile, tıpkı derin sahte (deepfake) gibi geri dönülmesi zor problemlere neden olma potansiyeli görülüyor. Çünkü modellerin çıktılarındaki ön yargılar, halüsinasyon ve dezenformasyona eğilim, kullanıcıların yanıltıcı veya taraflı bilgilerle karşılaşmasına neden olabiliyor.

Diğer yandan, LLM'lerin küresel kullanımında karşılaşılan bir diğer zorluk, verinin adil toplanmaması ve temsil kabiliyetinin sınırlı olması. Bu noktada dil ve kültür farklılıkları önemli bir yer tutuyor. Örneğin, bilindik küresel dil modellerinde Arapça veya çok daha az konuşulan Afrika dilleri gibi dillerde yeterince veri bulunmadığından, bu dillerdeki kullanıcılar LLM'lerden yeterli performans alamıyor. Ayrıca, kültürel referanslar ve deyimler gibi dilin incelikleri, modellerin çıktılarında doğru bir şekilde yansıtılamıyor. Bu dil modellerinin Türkçe deyim ve atasözleri konusundaki sınırlı başarı düzeyi ve Türk dilindeki bazı nüansları anlayamaması da bunun bir göstergesi. Tabiri caizse "el evinde büyümüş" böyle bir modeli alıp evinizde, kuruluşunuzda kullanmak da riskleri artırıyor.

HAVELSAN
Türk mühendisleri son dönemde tüm dünyada adından söz ettiren doğal dil işleme alanındaki yapay zekâ modellerine milli bir çözüm geliştirdi. Savunma sanayisinde yazılım tabanlı çözümleriyle dikkati çeken HAVELSAN, yapay zekâ çalışmaları kapsamında "milli GPT" ürününe imza attı. (Utku Uçrak / AA, 16 Ocak 2024)

 

Kendi Dil Modelini Geliştirmek

O zaman çözüm nedir? Bu konuda birçok çözüm önermek mümkün. Kullanmamak da bir seçenek, fakat bu durum yapay zekâ devriminden kopmak manasına geliyor ki buna hiçbir devlet yönetiminin gönüllü olacağını düşünmüyorum. Dolayısıyla kullanmayalım demek bir çözüm gibi görünmüyor. Öte yandan, dünya üzerindeki kültür ve dillerin eşit veri kümeleri ile temsil edildiği LLM eğitim süreçleri akla gelebilir, ancak o zaman da bir dil modeli geliştirmenin süresi ve maliyeti devasa seviyelere ulaşacaktır. Tam da bu noktada, Türkiye'nin ikinci yüzyılına damgasını vuracak olan Milli Teknoloji Hamlesi ve yerli teknoloji geliştirme çabalarının bu konuda ne kadar önemli olduğunu görmek gerekiyor.

Türkiye Cumhuriyeti olarak, milli güvenlik endişelerimizi göz önünde bulundurup kendi büyük dil modellerimizi geliştirmemiz, hem stratejik bir gereklilik hem de ülkemizin teknolojik bağımsızlığı açısından kritik bir öneme sahiptir. Bu bağlamda, yabancı LLM'leri kullanarak ince-ayar yapmak yalnızca geçici bir çözüm sunacak ve uzun vadede sürdürülebilir bir fayda sağlamayacaktır. Kendi verimizle kendi dil modellerimizi geliştirmek, ülkemizin kültürel değerlerini ve dil özelliklerini tam anlamıyla yansıtan yapay zekâ modelleri oluşturmak demektir. Böylece bu modeller sadece teknolojik bağımsızlığımızı sağlamakla kalmaz, aynı zamanda kültürel mirasımızı koruma ve gelecek nesillere aktarma açısından da büyük bir önem taşır. Bu modelleri geliştirmek eğitim sistemimizde de büyük bir dönüşüm sağlayacaktır. Gençlerimiz, kendi kültürel bağlamlarında eğitilmiş yapay zekâ sistemleriyle daha doğru ve etkili bir şekilde öğrenim görebilecektir. Türkiye Yüzyılı Maarif Modelinin konuşulduğu ve uygulanmaya başlandığı bir zaman dilimindeyiz. Tam bu çabalara destek olabilecek bir konudan bahsediyoruz. Kendi modellerimiz hem dil öğreniminde hem de diğer akademik alanlarda daha kaliteli bir eğitim sunulmasını sağlayacak. Örneğin, tarih derslerinde yerli büyük dil modelleri kullanılarak öğrencilerimize kendi tarihimizin doğru ve tarafsız bir şekilde aktarılması daha mümkün bir hale gelecektir. Kendi tarihimizi başkaları değil biz yazacak durumda olacağız. Aynı şekilde, dil ve edebiyat derslerinde Türk dilinin incelikleri ve zenginlikleri öğrencilerimize daha iyi bir şekilde öğretilebilecektir.

Farklı bir açıdan bakarsak, bu tür modellerin ekonomik kalkınma ve teknoloji alanında da büyük fırsatlar sunduğunu görmek gerekmektedir. Yerli yapay zekâ teknolojileri, ülkemizin yazılım ve teknoloji ihracatını artırarak ekonomimize katkıda bulunacaktır. Ayrıca, yerli dil modelleri geliştiren firmalar ve araştırma kuruluşları, uluslararası arenada rekabet gücünü artırarak Türkiye'nin teknoloji alanında söz sahibi olmasını sağlayacaktır. Tüm bu faydaya, yabancı bir dil modelinin ince-ayarıyla ulaşamayız. Bu modellerin geliştirilme aşaması bile genç girişimcilerimiz için yeni deneyim ve fırsatları beraberinde getirecek son derece faydalı bir süreçtir. Hem doğrudan hem de dolaylı yoldan ülkemizin inovasyon ekosistemini güçlendirici bir etkisinden bahsediyoruz.

Kendi büyük dil modellerimizi geliştirmeyi tercih etmenin bir milli güvenlik meselesi olduğundan bahsetmiştik. Bu iddiayı biraz daha ete kemiğe büründürmek gerekir. Örneğin, yabancı dil modellerinin, özellikle de çevrimiçi modellerin kullanımı, verimizin yabancı şirketlerin ve dolaylı olarak devletlerin eline geçmesi riskini doğurabilecektir. Tahmin edildiği üzere bu durum, kritik bilgilerin ve devlet sırlarının sızdırılması gibi ciddi güvenlik açıklarına yol açabilir. Sosyal medyada her gün saatlerini geçiren bireylerden dolayı sosyal medya platformlarının ve firmalarının elde ettikleri verinin boyutunun ne kadar büyük olduğunu ve bu veri ile nasıl bizi bizden daha iyi tanıdıklarını anlamak çok zor değil. Yeni küresel çatışma ve savaşların zemininin teknoloji olduğu düşünülürse, verinizi cömertçe farklı ülkelerin hizmetine vererek ne kadar büyük risk aldığınızı rahatlıkla görebilirsiniz. Milli dil modelleri sayesinde, yurt içinde üretilen verinin güvenliğinin de büyük ölçüde sağlanması, stratejik bilgi ve belgelerin korunması mümkün olacaktır. Yarın pişman olmaktansa bugün önlem almak her zaman daha etkili bir çözümdür.

Son olarak, yerli büyük dil modellerinin geliştirilmesi ile uluslararası arenada Türkiye'nin itibarı artırılacaktır. Kendi yapay zekâ teknolojilerini geliştiren bir ülke olarak, uluslararası iş birliklerinde daha güçlü bir konumda olacak, hem teknoloji alanında hem de diplomatik ilişkilerde daha fazla söz sahibi olarak ülkemizin küresel etkisini artırabileceğiz. Kendi teknolojisini üreten ve bu alanda liderlik eden bir Türkiye, özellikle gelişmekte olan ülkeler için de örnek teşkil edecektir.

 


Etiketler »  

Veri politikasındaki amaçlarla sınırlı ve mevzuata uygun şekilde çerez konumlandırmaktayız. Detaylar için "veri politikamızı" inceleyebilirsiniz. Daha fazlası