ChatGPT neden gerçek bir yapay zeka değil?

aG7wKmetsyYapay Zeka2 saatler önce1 Okunma

Yapay zeka yüzyıllardır bir hayal olmuştu ama hesaplama gücü ve data tahlilinde kaydedilen devasa ilerleme sebebiyle daha yeni “viral” oldu. ChatGPT üzere geniş lisan modelleri (LLM’ler) aslında çok ileri bir otomatik tamamlama formu. Bu kadar etkileyici olmalarının sebebiyse eğitim verisinin internetin tamamından oluşması. LLM’ler gerçek yapay genel zeka formülündeki içeriklerden biri olabilir fakat formülün tamamı olmadıkları kesin; ayrıyeten öteki birtakım bileşenlerin ne olduğunu muhtemelen şimdi bilmiyoruz.

ChatGPT sayesinde hepimiz, nihayet yapay zekayı deneyim edebiliyoruz. Bütün gereksiniminiz bir internet tarayıcısı. Sonrasında gezegendeki en ileri yapay zeka sistemiyle direkt konuşabiliyorsunuz; 70 yıllık uğraşın parlak başarısıyla. Ayrıyeten gerçek yapay zeka üzere görünüyor; yani hepimizin sinemalarda gördüğü yapay zeka üzere. Pekala bu durum, gerçek yapay zekanın formülünü nihayet bulduğumuz manasına geliyor mu? Yapay zeka için yolun sonu artık görünüyor mu?

Simgesel yapay zeka için bir formül

Bilgisayarlar talimatları takip eden makinelerdir. Onlara verdiğimiz programlar, ince ayrıntılı talimatlardan fazlası değildir; bilgisayarın sadık formda takip ettiği formüllerdir. İnternet tarayıcınız, eposta istemciniz ve söz işlemcinizin hepsi, bu inanılmaz derecede ayrıntılı talimat listesinden ibarettir. Bu yüzden şayet “gerçek yapay zeka” mümkün olsaydı (insanlar kadar kabiliyetli bilgisayarların olması hayali), o vakit o da bu türlü bir formül ile tıpkı kapıya çıkardı. Yapay zekayı gerçeğe dönüştürmek için tüm yapmamız gereken şey gerçek formülü bulmak. Pekala bu türlü bir formül nasıl görünürdü? Ayrıyeten ChatGPT, GPT-4 ve BARD’la (doğru isim vermek gerekirse, geniş lisan modelleri [LLM’ler]) ilgili son zamanlardaki heyecan göz önüne alındığında, nihayet gerçek yapay zekanın formülünü bulduk mu?

Yaklaşık 40 yıldır yapay zeka yapma teşebbüslerine taraf veren temel görüş, şuurlu zihni modellemeyi kapsıyordu; yani şuurlu varlığımızı meydana getiren fikirler ve muhakeme süreçlerini. Bu yaklaşıma sembolik yapay zeka ismi veriliyordu zira kanılarımız ve muhakememiz, simgelerden oluşan (harfler, sözler ve noktalama işaretleri) lisanları kapsıyor üzere görünüyordu. Sembolik yapay zeka, bu sembolik tabirleri yakalayan formülleri bulmaya çalışmanın yanısıra bu simgeleri manipüle ederek muhakeme ve karar vermeyi tekrarlamayı ihtiva ediyordu.

Simgesel yapay zeka bir ölçü muvaffakiyet elde etmiş lakin beşerler için kıymetsiz görünen devasa büyüklükteki bir vazife aralığında göz alıcı bir başarısızlığa uğramıştı. Bir insan hızını tanımak üzere kolay bir vazife bile sembolik yapay zekanın ötesindeydi. Bunun sebebi, yüzleri tanımanın algılama gerektiren bir iş olması. Algılama gördüğümüz, duyduğumuz ve hissettiğimiz şeyi manaya sorunu. Çoğumuz algılamayı büyük oranda çantada keklik görüyoruz; hakkında pek düşünmüyoruz ve elbet onu zekayla ilişkilendirmiyoruz. Ama sembolik yapay zeka, algılama gerektiren sorunları çözmeye çalışmada yanlış bir yoldu.

Sinirsel ağlar geliyor

Yapay zeka için alternatif bir formül de zihni modellemek yerine beyinde gördüğümüz yapıları modellemeyi içeriyor. Sonuçta insan beyinleri, günümüzde insan zekasını meydana getirebildiğini bildiğimiz tek varlıklar. Bir beyne mikroskop altında bakarsanız, nöron ismi verilen ve uçsuz bucaksız ağlarda birbirine bağlanan devasa ölçüde hudut hücresi görürsünüz. Her bir nöron, kendi ağ irtibatlarındaki örüntüleri arıyor. Nöron bir örüntüyü tanıdığında komşularına sinyaller gönderiyor. Bu komşular da karşılığında örüntü arıyor, bir örüntü gördüklerinde kendi denkleriyle bağlantı kuruyorlar ve bu bu türlü devam ediyor.

Mantıklı bir biçimde açıklayamıyoruz lakin bu devasa nöron ağları bir biçimde öğrenebiliyor ve nihayetinde akıllı davranışlar meydana getiriyor. Nöral ağlar alanı, esasen 1940’lı yıllarda doğmuş ve kelam konusu nöron ağlarının elektriksel devrelerle taklit edilebileceği fikrinden ilham almıştı. Günümüzdeki nöral ağlar, elektrik devrelerinden çok yazılımlarda gerçeğe dönüştürülüyor ve açık konuşmak gerekirse nöral ağ araştırmacıları aslında beyni modellemeye çalışmıyor. Ancak kullandıkları yazılım yapıları (çok kolay hesaplama aygıtlarından oluşan çok geniş ağlar), ilhamını beyinlerde ve hudut sistemlerinde gördüğümüz sinirsel yapılardan alıyor.

Çeşitli vakitlerde revaçta olup çeşitli vakitlerde gözden düşen (özellikle de 1960’ların sonu ve 1980’lerin ortalarında) sinirsel ağlar üzerinde 1940’lı yıllardan bu yana devamlı olarak çalışılıyor ve bu ağlar sıklıkla sembolik yapay ile rekabet halinde olarak görülüyor. Ama sinirsel ağların kararlı biçimde çalışmaya başlaması geçtiğimiz on yıl içinde oldu. Geride bıraktığımız on yılda yapay zekayla ilgili gördüğümüz tüm bu cümbüş aslında sinirsel ağların bir dizi yapay zeka sorununda süratli ilerleme göstermeye başlamasından kaynaklanıyor.

Sinirsel ağların bu yüzyılda kalkışa geçmesi ise ne yazık ki sıradan sebeplere dayanıyor. Elbette yeni sinirsel ağ yapıları ve onları yapılandıran algoritmalar üzere bilimsel ilerlemeler oldu. Ancak gerçekte, günümüzdeki sinirsel ağların arkasındaki ana fikirler 1980’ler kadar eski vakitlerde biliniyordu. Bu yüzyılın getirdiği şey ise bol ölçüde data ve bol ölçüde hesaplama gücü oldu. Sinirsel bir ağı eğitmek için ikisi de gerekiyor ve ikisi de bu yüzyılda bolluğa ulaştı.

Geçtiğimiz vakitlerde haberlere çıkan yapay zeka sistemlerinin hepsinde sinirsel ağlar kullanılıyor. Örneğin Londra merkezli yapay zeka şirketi DeepMind’ın geliştirdiği ve Mart 2016’da dünya şampiyonu bir oyuncuyu yenen birinci Go yazılımı olan meşhur AlphaGo’da, her biri 12 sinirsel katmana sahip iki sinirsel ağ kullanılıyor. Bu ağları eğitecek bilgiler, internet üzerinden oynanan evvelki Go oyunlarından ve ayrıyeten yazılımın kendi kendine oynadığı oyunlardan geliyor; yani yazılımın kendi karşı oynadığı oyunlardan. Son yıllarda manşetlere çıkan yapay zeka sistemleri de (Microsoft takviyeli yapay zeka firması OpenAI’ın ChatGPT ve GPT-4’ünün yanısıra Google’ın BARD’ı) sinirsel ağlar kullanıyor. Son gelişmeleri farklı kılan şey ise yalnızca büyüklükleri. Bu modellerle ilgili her şey akıllara sakinlik veren ölçeklerde.

Devasa güç, devasa veri

OpenAI’ın 2020 yazında duyurduğu GPT-3 sistemini düşünün. ChatGPT’nin altında yatan teknoloji bu. Kelam konusu teknolojide çığır açan bir dönüm noktasının sinyalini veren LLM de buydu. GPT-3’ü meydana getiren bu sinirsel ağlar devasa boyutta. Hudut ağlarıyla ilgili çalışma yürüten beşerler, bir ağın büyüklüğünü belirtirken onun “parametre” sayısından bahsederler. Bu bağlamda bir “parametre”, ya tekli bir nöron ya da nöronlar ortasındaki bir ilişki olan bir ağ bileşenidir. GPT-3’ün toplamda 175 milyar parametresi varken, GPT-4’ün 1 trilyon parametresi olduğu söyleniyor. Karşılaştırma yaparsak, bir insan beyninde toplamda 100 milyar nöron üzere bir sayı bulunuyor ve bunlar 1.000 trilyon kadar fazla sinaptik irtibatla bağlı. Mevcut LLM’ler devasa olsa da insan beyninin ölçeğinden hâlâ uzaktalar.

GPT’yi eğitmek için kullanılan bilgi 575 gigabayt metinden oluşuyor. Tahminen bunun kulağa fazla gelmediğini düşünüyorsunuzdur; sonuçta bunu sıradan bir bilgisayarda depolayabilirsiniz. Ancak bunlar görüntü, fotoğraf yahut müzik değil, yalnızca yazılı sıradan metinler. Üstelik 575 gigabaytlık yazılı sıradan metin, hayal edilemeyecek kadar büyük bir ölçü; bir insanın hayatı boyunca okuyabileceğinden çok lakin çok daha fazlası. Tüm bu metinleri nereden almışlar pekala? Dünya Çapında Web’i indirmişler. Hepsini. Her internet sayfasındaki her ilişki takip edilmiş, metin çıkarılmış ve sonrasında süreç tekrarlanarak, web üzerindeki her bir metin modülü elde edilene kadar her irtibat sistematik olarak takip edilmiş. İngilizce Vikipedi, toplam eğitim verisinin yalnızca %3’ünü meydana getiriyormuş.

Peki ya tüm bu metni işleyecek ve bu devasa ağları eğitecek bilgisayar? Bilgisayar uzmanları tekli bir aritmetik hesaplamayı kastederken “yüzer nokta işlemi” yahut “FLOP” terimini kullanıyor; yani bir FLOP, tek bir ekleme, çıkarma, çarpma yahut bölme hareketi manasına geliyor. GPT-3’ü eğitmek için 3^1023 FLOP gerekmiş. Bizim naçizane insan tecrübelerimiz, bizi bu kadar büyük sayıları anlamak için donatmıyor. Şu biçimde tabir edelim: Şayet GPT-3’ü 2023 yılında yapılan sıradan bir masaüstü bilgisayarda eğitmeye çalışsaydınız, o kadar FLOP’u yürütebilmek için 10.000 yıl üzere bir mühlet devamlı olarak çalışması gerekirdi.

Tabii ki OpenAI GPT-3’ü masaüstü bilgisayarda eğitmedi. Binlerce özel yapay zeka işlemcisi içeren ve aylar boyunca durmadan çalışan çok değerli süperbilgisayarlar kullandılar. Üstelik bu hesaplama ölçüsü ucuz da değil. GPT-3’ü eğitmek için gereken bilgisayar mühleti, özgür piyasada milyonlarca dolar fiyat. Öteki her şeyden başka olarak bu durum, bir avuç büyük teknoloji firması ve ulus devletler haricinde ChatGPT üzere sistemleri inşa etmeye çok az tertibin parasının yeteceği manasına geliyor.

LLM çatısı altında

Akıllara dingin veren bütün bu ölçeklerine karşın, LLM’ler aslında çok kolay bir şey yapıyor. Akıllı telefonunuzu açtığınızı ve eşinize “ne zaman” sözleriyle bir metin iletisi yazmaya başladığınızı düşünün. Telefonunuz sizin için o metni tamamlayacak şeyler önerir. Örneğin “eve geliyorsun” yahut “yemek yiyoruz” üzere şeyler önerebilir. Bunları önerir zira telefonunuz bunların, “ne zaman”dan sonra belirmesi en mümkün sözler olduğunu kestirim ediyordur. Telefonunuz bu kestirimi göndermiş olduğunuz bütün metin iletilerine dayanarak yapar ve bu bildirilere nazaran onların, “ne zaman”ın en beklenen tamamlayıcıları olduğunu öğrenmiştir. LLM’ler de tıpkı şeyi yapıyor lakin gördüğümüz üzere bunu devasa ölçüde daha büyük bir ölçekte yapıyorlar. Bu eğitim dataları yalnızca sizin metin iletileriniz değil, dünyada dijital formatta bulunan bütün metinler. Bu ölçek ne getiriyor? Oldukça kayda paha bir şey; ve beklenmeyen bir şey.

ChatGPT yahut BARD’ı kullandığımız vakit farkına vardığımız birinci şey, çok doğal metin üretmede son derece âlâ oldukları. Bu şaşırtan bir şey değil; bana yapmak için tasarlanmışlar ve aslında o 575 gigabayt metnin bütün sıkıntısı de bu. Ama beklenmedik şey, LLM’lerin şimdi anlamadığımız formlarda öteki kabiliyetler de kazanması: Üzerinde eğitildikleri muazzam metin külliyatı içerisinde, bir halde dolaylı olarak anlaşılması gereken kabiliyetler.

Örneğin ChatGPT’den bir metin kesimini özetlemesini isteyebiliyoruz ve genelde övgüye paha bir iş çıkarıyor. Birtakım metinlerdeki kıymetli noktaları çıkarmasını yahut metin modüllerini karşılaştırmasını isteyebiliyoruz ve bu vazifelerde de hayli uygun görünüyor. Yapay zeka alanında çalışanlar GPT-3 2020 yılında yayımlandığında LLM’lerin gücü karşısında alarma geçse de; dünyanın geri kalanı yalnızca ChatGPT Kasım 2022’de yayımlandığında durumun farkına vardı. Birkaç ay içerisinde yüz milyonlarca kullanıcı çekti. Yapay zeka on yıldır sık sık gündeme geliyordu ancak ChatGPT yayınlandığında basında ve toplumsal medyada oluşan heyecan eşi gibisi görülmemiş cinstendi: Yapay zeka viral oldu.

Yapay zeka çağı

Bu noktada söyleyip rahatlamam gereken bir şey var. ChatGPT sayesinde nihayet yapay zeka çağına ulaştık. Her gün yüz milyonlarca insan, gezegendeki en karmaşık yapay zeka ile etkileşime giriyor. Bunun için 70 yıllık bilimsel emek, sayısız meslek, milyarlarca ancak milyarlarca dolar yatırım, yüz binlerce bilimsel makale ve aylar boyunca en yüksek süratte çalışan yapay zeka süperbilgisayarları gerekmişti. Dünyanın nihayet ulaştığı yapay ise… istem tamamlama oldu.

Şu an trilyon dolarlık firmaların geleceği tehlikede. Kaderleri… istem tamamlamaya bağlı. Tam da cep telefonunuzun yaptığı şeye. Bu alanda 30 yıldan uzun müddet çalışan bir yapay zeka araştırmacısı olarak, durumu çok kırıcı bulduğumu söylemem lazım. Aslında rezil bir durum. Sonunda en büyük primi yapacak yapay zeka versiyonunun bu olacağını kim varsayım edebilirdi ki?

Yapay zekada ne vakit süratli bir ilerleme periyodu görsek, birisi sonunda bu işin bittiğini söylüyor; yani artık gerçek yapay zekaya giden yolda olduğumuzu. LLM’lerin başarısına bakıldığında, artık de emsal argümanların öne sürülmesi şaşırtan değil. Hasebiyle biraz durup bununla ilgili düşünelim. Şayet yapay zekada muvaffakiyet gösterirsek, o vakit makinelerin bir insanın yapabildiği her şeyi yapması gerekir.

İnsan zekasının iki ana kısmını düşünün: Birinde salt zihinsel kabiliyetler varken, oburu fizikî kabiliyetleri içeriyor. Örneğin zihinsel kabiliyetler ortasında mantıksal ve soyut muhakeme yapmak, sağduyu muhakemesi (yere düşen bir yumurtanın kırılacağını anlamak yahut Kansas’ı yiyemeyeceğimi anlamak gibi), sayısal ve matematiksel muhakeme, sorun çözme ve planlama, doğal lisan sürece, mantıklı bir zihin durumu, bir faaliyet, hatırlama hissiyatı ve empati duyma yeteneği. Fizikî kabiliyetler ortasında duyusal manaya (yani beş duyumuzdan gelen girdileri yorumlama), hareketlilik, istikamet bulma, el mahareti ve hareketleri, el-göz eşgüdümü ve içalgı yer alıyor.

Bunun, kapsamlı bir insan kabiliyeti listesinden uzakta olduğunun altını çiziyorum. Ancak günün birinde gerçek yapay zekamız olursa (bizim kadar uzman yapay zeka), o vakit elbette tüm bu kabiliyetlere sahip olur.

LLM’ler gerçek yapay zeka değil

Söylenecek en açık şey, LLM’lerin bu fizikî kabiliyetlerin hiçbirine uygun bir teknoloji olmadığı. LLM’ler gerçek dünyada hiç bulunmuyor ve robotik yapay zekanın teşkil ettiği zahmetlerin, LLM’lerin ele alması için tasarlandığı şeylerle hiç lakin hiç alakası yok. Ayrıyeten robotik yapay zekadaki ilerleme, LLM’lerdeki ilerlemeden çok daha düşük olmuştu. Tahminen şaşırtan gelebilir lakin robotların el mahareti üzere kabiliyetlerinin çözülmesine daha çok var. Dahası, LLM’ler bu zahmetler için tahlile götüren hiçbir yol sergilemiyor.

Elbette bir yapay zeka sisteminin salt bir yazılım zekası olduğunu düşünebilirsiniz, o halde LLM’ler üstte listelenen zihinsel kabiliyetlerle kıyaslandığında nasıl biçimleniyor? Bunlar ortasında LLM’lerin yalnızca doğal lisan işlemede sahiden değerli bir ilerleme kaydettiği argüman edilebilir; yani sıradan insan lisanlarında tesirli halde bağlantı kurabilmede. Burada şaşırtan bir şey yok; bunun için tasarlanmışlardı.

Fakat insan gibisi irtibatta sergiledikleri göz kamaştırıcı yeterlilik, tahminen de öteki şeylerde gerçekte olduklarından çok daha ehil olduklarına inanmamıza yol açıyor. Bir ölçü yapay mantıksal muhakeme ve sorun çözme gerçekleştirebiliyorlar ancak bunlar şu anda yüzeysel. Tahminen de doğal lisan işlemenin ötesinde bir şey yapabiliyor olduklarına şaşırmalıyız. Öteki bir şey yapmak için tasarlanmamışlardı, bu yüzden başka şeyler bir bonus; ayrıyeten fazladan rastgele bir kabiliyet, sistemin eğitildiği metinde dolaylı yoldan anlaşılan bir şey olmalı.

Bu sebepler ve daha fazlası münasebetiyle, LLM teknolojisinin tek başına “gerçek yapay zekaya” giden bir güzergâh sunması bana mümkün görünmüyor. Dünyamızda gerçek manada mevcut değiller ve bunun farkında da değiller. Bir LLM’yi konuşma ortasında bırakırsanız ve bir haftalığına tatile giderseniz, sizin nerede olduğunuzu merak etmeyecektir. Vaktin geçişinin farkında değildir ve aslında hiçbir şeyin farkında değildir. Siz bir istem yazana kadar, sözün tam manasıyla hiçbir şey yapmayan ve sonrasında yalnızca o isteme bir karşılık hesaplayan, bu noktada da tekrar hiçbir şey yapmamaya geri dönen bir bilgisayar programıdır. Dünyaya dair ansiklopedik bilgileri eğitildikleri noktada kalmıştır. Ondan sonrasına dair bir şey bilmezler.

Ayrıca LLM’ler asla rastgele bir şey deneyim etmemiştir. Yalnızca hayal edilemeyecek ölçülerde metin sindirmiş programlardır. LLM’ler sarhoş olmanın hissini tanım etmede kusursuz bir iş çıkarabilir lakin bunun sebebi, sarhoş olmanın bir sürü tarifini okumuş olmalarıdır. Bunu kendi kendilerine yaşamamışlardır ve yaşayamazlar. Onlara verdiğiniz isteme karşı en âlâ cevabı oluşturmaktan diğer hiçbir maksatları yoktur.

Bu durum etkileyici olmadıkları (ki öyleler) ya da kullanışlı olamayacakları (öyleler) manasına gelmez. Ben aslında sahiden teknolojide bir dönüm noktasında olduğumuza inanıyorum. Lakin bu gerçek muvaffakiyetleri “gerçek yapay zeka” ile karıştırmayalım. LLM’ler gerçek yapay zekanın formülündeki bir bileşen olabilir lakin katiyen formülün bütünü değiller; ve ben başka birtakım bileşenlerin ne olduğunu şimdi bilmediğimizden kuşkulanıyorum.

0 Oylar: 0 Oylar, 0 Oylar (0 Puanlar)

Bir cevap bırakın

Önceki Yazı

Sonraki Yazı

Son yorumlar

Görüntülenecek bir yorum yok.
Size güncel haberleri gösterelim
  • Facebook38.5K
  • X Network32.1K
  • Instagram18.9K

En güncel yapay zeka haberlerini size bildirim olarak gönderelim.

E-posta yoluyla haber bülteni almayı kabul ediyorum. Daha fazla bilgi için, lütfen Gizlilik Politikamızı inceleyin

Kategoriler

REKLAM

Sonraki Yazı Yükleniyor...
Follow
Kenar çubuğu Ara Trendler
Popüler Haberler
Yükleniyor

Oturum açma 3 saniye...

Kayıt 3 saniye...