Yapay Zeka

Google Yapay Zeka İşlemcisi

Google Yapay Zeka İşlemcisi

Kısaca AI olarak adlandırılan yapay zeka uzun zamandır günlük yaşamımızın bir parçası. Sadece akıllı telefonlarda sisli asistan olarak dile geldiklerinde ya da otomatik yüz taraması yaptıklarında orada olduklarını fark ediyoruz. Fakat Google aramaları bile  yapay zekanın bir alt kolu olan öğrenme yetisi olmadan çalışamamakta. RankBrain adlı bir teknoloji iki yılı aşkın süredir arama sonuçlarının düzenlenmesi için zaten kullanılıyor. Google’da yapılan günlük aramaların yaklaşık %15i tamamen yeni, yani daha önce hiçbir kullanıcı tarafından yapılmamış aramalar. RankBrain algoritması bilinmeyen aramalardaki örnek teşkil edebilecek benzerlikleri bulma konusunda yardımcı olmakta. Son olarak arama makinesi bu benzerlikleri işleyerek, şimdiye kadar oluşturulmamış arama sonuçlarını uygun şekilde sıralamakta. Google kendi bilişim merkezinde özel olarak geliştirdiği işlemci olan Tensor Processing Units (TPU’ları) bu işlem için kullanıyor.

İnsan Üstü Zeka (Yapay Zeka)

Yapay Zeka TPU

İlk olarak 2016 yılında Google tarafından resmi olarak duyurulan TPU’lar adlarını ev içi kütüphane yazılımı TensorFlow’dan almakta. TPU’ların asıl görevi kuruldukları açık kaynaklı kütüphanelerin AI algoritmalarını hızlandırmaktır.  TPU’lar ilk olarak Go-oyuncularını mağlup eden bir AI olan, AlphaGO için donanım platformu olarak kullanıldı. Santrancın aksine profesyonel seviyede geliştirilen Go-yazılımı yıllar boyunca yenilmeme ünvanını korumayı başarmıştır. Daha sonra geliştirilen AlphaGo Zero ilk olarak kurallar yardımıyla oyunu kendi kendine öğrendi. Üç günde profesyonel seviyeye gelen yazılım üç hafta sonra selefi AlphaGo’nın seviyesine erişmişti bile. AlphaGo bu seviyeye milyonlarca profesyonel tarafından eğitilerek ulaşmıştı. Daha sonra anlaşıldı ki: İlk AI öğrenimi insan hareketleriyle kısıtlandırılmış.

AlphaGo Zero’nun ise yenilmez ünvanını ele geçirmesi sade altı hafta aldı. Google’ın AI’ı donanım bileşenleri göze çarpmayan TPU’larda çalışmakta. Sunucuya takılan kartlar olarak yüklenmekteler.  Bu kartlar verileri PCI Express ile iletirken, içlerinde bellek olarak DDR3 RAM kullanmaktalar. Google her dört TPU’yu birleştirerek, yüzlercesini SATA ile tek bir ünite birbirine bağlamakta.

Neronsal Ağlar İçin Hızlandırma

Yapay Zeka Neronsal Ağlar

Normal CPU’larla karşılaştırılırsa, TPU’lar yapay nöronsal ağların uygulanması konusunda uzmanlaşmakta. Bunlar, insan beynini sinir hücreleri (nöronlar) ve bunların bağlantıları (sinapslar) ile taklit eden birbiriyle bağlantılı matematiksel fonksiyonlardan ve parametrelerden oluşur. Beynimize benzer şekilde, bir nöronal ağın uygun girdilerine ihtiyacı vardır. Örneğin bunlara yeni bir dil, görüntü ya da Go kurallarını öğretebilirsiniz.

Yapay nöronsal ağ, nöron katmanlarından oluşur. Her bir nöron, önceki tabakadaki bağlantılı nöronların çıktı değerlerinin bir toplamını kullanır. Doğru tartma, makine öğreniminin başarısının anahtarıdır – ancak bunu bulmak için ilk olarak birçok küçük operasyonun arka planda hesaplanması gerekmekte. Bu bağlamda grafik işlemcilerinin kullanılması en iyi seçenek. Arama sonuçlarını düzenlemek ve hareketleri tahmin etmek için neronsal ağın, süzülen nokta hesaplarını yüksek isabetine artık ihtiyacı bulunmamakta. Bu işlem birçok çarpım ve tüm sayıların eklenimini gerektirmekte. Google, çekirdeğinde TPU ile (sağdaki resme göz atın) 256 x 256 üniteli matris ‘den oluşan bir bilgisayar ünitesi. Sekiz Bit’lik tüm sayılarla çalışıyor, saniyede 92 milyar operasyon işlem yapabilme kapasitesine sahip ve arama verilerini arama belleğinde depoluyor. Blok diagramı gösteriyor ki matris, çip üzerinde dörtte birlik bir alanı kaplamakta. Geri kalan bileşenler ise devamlı olarak yeni verilerle işlem gücü sağlamaktan sorumlu. TPU’lar kendileri komut üretmezler. Bunlar PCI Express ile bağlı ikinci bir bağlı sunucudan (host) gelmekte. Bitiş sonuçları da bu yoldan geri aktarılmak. Giriş-çıkış bellek modülü, hesaplamalar için gerekli olan nöronal ağın tartımlarını doğrudan bilgisayar birimine iletir. Uygulamalarda çok az değişim yaşandığı için DDR3-RAM bağlantısı şu aşamada yeterli gelmekte. Ara sonuçlar, 24 MB büyüklüğünde bir önbellekte toplanır ve her zaman bir döngü içinde, bilgi işlem birimine pompalanır.

 

CPU’dan 45 Kat Hızlı

TPU’nun CISC komut seti (Complex Instruction Set Computer) bi düzine karmaşık komutlu işleyebilmekte. Gerekli operasyonuların tamamlanması için sadece beş komut gerekmekte – bunlar komutu okuma, matris çarpımlarının uygulanımı ya da aktivasyon özelliklerinin hesaplanmasından oluşmakta. AI hesaplamalarını optimize ederek TPU’lar CPU’lardan 45, GPU’lardan da 17 kat daha hızlı hale gelmekte. Aynı zamanda daha güç tasarruflu şekilde çalışmaktalar (sağdaki resme göz atın). Ön planda Google bulunmakta: Dahası TPU’nun performansı basit müdahalelerle de arttırılabilmekte. Sadece GDDR-RAM kullanarak bile işlem gücünü beş katına çıkartabilirsiniz.