Yazılım

Google’ın Yapay Zekası, İnsan Sesi Çıkarabilecek

Teknoloji devi Google, son yıllarda gittikçe gelişen yapay zeka ile ilgili oldukça başarılı işler çıkarmaya devam ediyor. 2016 yılında DeepMind şirketi, insan sesini taklit edebilen yapay zeka yazılımı WaweNet ile ilgili ilk paylaşımını yapmıştı.WaweNet artık Google sesli asistan sistemini kullanacak.

WaweNet ile ilgili ilk detaylar 2016 senesinde paylaşılmıştı. DeepMing firması tarafından geliştirilen ve sinir ağına sahip yapay zeka yazılımı, insan sesine en yakın tonda konuşma yapabiliyor. İlgi çeken bu yazılım artık Google Asistan’la beraber olacak.

Sesli asistan uygulamalarının konuşma esnasında duraklamalarına ve tonlarının robotik oluşuna artık alıştık derken, hollywood senaryolarını bile geride bırakacak bir sistem yapıldı. Bahse konu sistemler robotik ses tonlamasına sahip olup, Text-to-Speech olarak bilinen sistemlerdi.

Fakat DeepMing firmasının geliştirdiği WaveNet, sinir ağı yapısı sayesinde dalga formları üreterek asistanın sesinin insan sesi benzeri çıkmasını sağlıyor. Ses desteği sistemi öğrenebilen bir beyin mantığı ile çalıştığı için, eğitim aşamasında çok farklı gerçek insan sesi kullanıldı. Yapılan bu çalışmalar sonucunda yapay zeka yazılımı, insan sesiyle birebir aynı tonda ve duraksamadan akıcı bir şekilde konuşabiliyor.

Yüksek bilgi-işlem gücü gerektiren yazılım örneğin, 0.02 saniyelik insan sesiyle konuşma gerçekleştirebilmesi için 1 saniye işlem yapması gerek. Buda WaweNetin en önemli dezevantajı olarak görünüyordu. Ancak 1 senedir süreyi kısaltmak için gece gündüz çalışan mühendisler, Yazılımı ilk durumuna göre 1000 kat daha hızlı ve yalnızca 1 saniyede 20 saniye insan sesi çıkarabilecek duruma getirmeyi başardılar.

Bu inanılmaz başarının ardından Google firmasının dikkatini çeken yazılım, Amerikan İngilizcesi ve Japonca aksanları kullanabilmesi için güncellenmeye başlandı. İlk olarak bu 2 dil, insan sesi çıkaran Google Asistan uygulaması için kullanılacak. Sonrasında farklı dil ve aksanlar için çalışmalar devam edecek.