Google'ın TurboQuant Duyurusu: Donanım İhtiyacını Kısmen Etkileyecek
BILIM TEKNOLOJI

Google'ın TurboQuant Duyurusu: Donanım İhtiyacını Kısmen Etkileyecek

Dr. Özdemir, Google'ın TurboQuant uygulamasının RAM ihtiyacını azaltacağı beklentilerine dair önemli açıklamalarda bulundu.

1 kez görüntülendi
Google'ın yapay zeka alanında devrim niteliğinde bir gelişme olarak tanıttığı TurboQuant uygulaması sonrasında RAM üreten firmaların hisselerinde yaşanan büyük düşüş, dünya genelinde tartışmalara yol açmaya devam ediyor. Bu algoritmanın, büyük yapay zeka modellerinin bellek kullanımını 6 kat azaltması bekleniyor ve bunun sonucunda devasa sistemlerin daha yüksek performansla çalışacağı öngörülüyor. AA muhabirine açıklamada bulunan SETA araştırmacısı ve ETAI Direktörü Dr. Gloria Shkurti Özdemir, Google'ın TurboQuant ile ilgili ortaya çıkan spekülasyonların önemli bir kısmının teknik detayların tam olarak anlaşılmamasından kaynaklandığını belirtti. Özdemir, Cloudflare CEO'su Matthew Prince gibi etkili isimlerin bu durumu "Google'ın DeepSeek anı" olarak tanımlamasının da abartılı kıyaslamalar arasında yer aldığını vurguladı. TurboQuant'ın donanım ihtiyaçlarını ortadan kaldıran bir teknoloji olmadığını, aksine büyük dil modellerinde çıkarım aşamasında oluşan KV önbelleğini optimize eden bir vektör kuantizasyon algoritması olduğunu ifade eden Özdemir, "Bu algoritma modelin tamamını değil, yalnızca bağlam bilgisini geçici olarak depolayan önbelleği hedef alıyor. Bellek gereksinimlerini 6 kat azaltan bir teknolojinin maliyetleri de aynı oranda düşüreceği düşüncesi temelsizdir; çünkü bellek, veri merkezinin sadece bir bileşenidir. Kuantizasyon teknikleri, modellerin daha düşük bit hassasiyetiyle çalışmasını sağlayarak çıkarım maliyetlerini düşürür ve bellek kullanımını optimize eder. Bu yaklaşım yeni olmasa da, Google burada süreci daha etkili hale getirmeyi amaçlıyor." şeklinde konuştu. Gloria Shkurti Özdemir, piyasadaki sert tepkilerin, özellikle RAM üreticilerinin hisselerindeki düşüşün bu noktada abartılı ve kısa vadeli bir yorum olarak değerlendirilebileceğini belirtti. Özdemir, "Zira bu tür teknolojiler 'daha az donanım ihtiyacı' anlamına gelmez. Daha doğru bir ifadeyle, 'aynı donanımla daha fazla iş yapılabilmesi' anlamına gelir. Bu da uzun vadede genellikle talebi azaltmak yerine artırır." dedi. Özdemir, yapay zeka piyasalarının yüksek beklentiler ve anlatımlar üzerinden hareket eden, son derece hassas bir yapıya sahip olduğunu belirterek, "DeepSeek’in model duyurusunda olduğu gibi, TurboQuant ile benzer bir durum yaşanıyor. Piyasa, teknik gelişmeleri 'mevcut iş modellerini veya donanım talebini nasıl etkiler?' sorusu üzerinden değerlendiriyor. Bu, yarı iletken ve bellek gibi sektörlerde orantısız fiyat hareketlerine yol açabiliyor. Yapay zeka alanında sürekli bir ilerleme var; ancak piyasanın beklentisi genellikle büyük ve paradigmaları değiştiren sıçramalar yönünde. Bu nedenle bu tür duyurular, gerçek etkilerinden bağımsız olarak, 'büyük kırılma olabilir' algısını tetikleyerek kısa vadeli dalgalanmalara neden oluyor." şeklinde ifade etti. Dünyada uzun süredir devam eden RAM krizi ile ilgili bilgiler veren Özdemir, krizin tek bir nedene indirgenemeyecek kadar çok katmanlı bir durum olduğunu vurguladı. Bunun en temel nedenlerinden birinin yapay zeka uygulamaları ve özellikle büyük dil modellerinin hızlı yaygınlaşması nedeniyle bellek talebinde yaşanan keskin artış olduğunu belirtti. "Bu sistemler yalnızca işlem gücü değil, aynı zamanda yüksek bant genişliğine sahip bellek gerektiriyor ve bu durum mevcut üretim kapasitesi üzerinde ciddi bir baskı oluşturuyor." diye ekledi. Yarı iletken üretiminin son derece maliyetli ve esnekliği sınırlı bir alan olduğuna işaret eden Özdemir, yeni üretim tesislerinin devreye alınmasının yıllar aldığını ifade etti. Talep hızla artarken arzın aynı hızda genişleyemediğini belirten Özdemir, jeopolitik gerilimler ve tedarik zinciri kısıtlarının bu tabloyu daha kırılgan hale getirdiğini aktardı. Veri merkezleri ve yapay zeka sektörünün en çok etkilenen alanlar arasında olduğunu söyleyen Özdemir, tüketici elektroniği ve otomotiv gibi sektörlerin de artan maliyetler ve arz baskısı nedeniyle doğrudan ya da dolaylı olarak etkilendiğini belirtti. Özdemir, burada daha derin bir yapısal meseleye de değinmek gerektiğini vurguladı. Moore Yasası'nın, yani transistör yoğunluğunun düzenli olarak artması, fiziksel sınırlara yaklaşmakta ve yavaşladığı giderek daha geniş bir kesim tarafından kabul edilmektedir. Öte yandan, yapay zeka tarafında hem hesaplama hem de bellek ihtiyacı çok daha hızlı bir şekilde artmaktadır. Bu da donanım tarafındaki ilerleme ile talep artışı arasında bir uyumsuzluk yaratarak RAM krizini geçici bir arz sorununun ötesine taşıyarak daha yapısal bir gerilime dönüştürmektedir. Özdemir, krizle ilgili kısa vadede dalgalanmaların süreceğini belirtirken, orta ve uzun vadede üretim kapasitesindeki artışlar, daha verimli model tasarımları ve yeni bellek teknolojilerinin devreye girmesiyle daha dengeli bir yapının oluşacağını belirtti. "Bununla birlikte verimlilik artışlarının genellikle talebi azaltmak yerine artırdığı düşünüldüğünde, bu krizin tamamen ortadan kalkmasından ziyade daha yüksek bir talep seviyesinde yeniden şekillenmesi daha olası görünüyor." dedi.