Microsoft’un Yeni Yapay Zeka Modeli Korkunç Seviyelere Ulaştı

Microsoft’un yeni nöral kodlayıcı dil modeli Vall-E’nin son iterasyonu, doğallık, konuşma sağlamlığı ve konuşmacı benzerliği açısından önceki çabaları aşmış durumda. Popüler iki ölçüte insan denkliği sağlayan ilk model olan Vall-E 2, görünüşe göre insan sesine çok yakın bir doğallıkta ve canlılıkta konuşma üretebiliyor. Ancak Microsoft, bu teknolojiyi genel halkın erişimine açma gibi bir planının olmadığını belirtti.

Microsoft'un yeni nöral kodlayıcı

Microsoft’un yeni nöral kodlayıcı dil modeli Vall-E’nin son iterasyonu, doğallık, konuşma sağlamlığı ve konuşmacı benzerliği açısından önceki çabaları aşmış durumda. Popüler iki ölçüte insan denkliği sağlayan ilk model olan Vall-E 2, görünüşe göre insan sesine çok yakın bir doğallıkta ve canlılıkta konuşma üretebiliyor. Ancak Microsoft, bu teknolojiyi genel halkın erişimine açma gibi bir planının olmadığını belirtti.

Vall-E’nin temelini oluşturan bu yeni yapay zeka ses aracı, performansı büyük ölçüde artıran iki önemli gelişmeyi entegre ediyor. Gruplanmış kod modelleme, kod dizilerini daha iyi organize etmeyi sağlıyor ve bu da çözüm hızını artırarak uzun dizilerle ilişkili zorlukları aşmaya yardımcı oluyor.

Tekrarlama farkındalığı örnekleme ise orijinal nükleus örnekleme sürecini yeniden düşünerek, kod çözme sırasında simge tekrarlamasını arıyor. Bu sürecin, çözümlemeyi stabilize etmeye ve orijinal Vall-E’de mevcut olan sonsuz döngü sorununu önlemeye yardımcı olduğunu Microsoft belirtti.

Microsoft, Vall-E 2’yi LibriSpeech ve VCTK veri setleri kullanarak test etti ve her ikisini de başarıyla geçti. Redmond’un iddiasına göre, yapay zeka aracı insan denkliği elde ettiğinde, Vall-E 2 doğallık, benzerlik ve sağlamlık konularında gerçek örneklemelerden daha iyi performans gösteriyor. Yani bu araç, insan konuşmacıdan neredeyse ayırt edilemeyen doğal konuşma üretebiliyor.

Microsoft, Vall-E 2’nin sadece bir araştırma projesi olduğunu ve bu teknolojiyi tüketici ürününe dahil etme veya genel halka sunma gibi bir planlarının olmadığını belirtti. Redmond ayrıca, belirli bir kişiyi taklit etme veya ses tanımlama sistemini sahtecilik yapma gibi kötüye kullanım potansiyeline sahip olduğunu vurguladı.

Bununla birlikte, şirket eğitim, çeviri, erişilebilirlik, gazetecilik, kendi yazılmış içerik ve sohbet botları gibi alanlarda uygulama potansiyeli olduğuna inanıyor.

Kaynak:https://www.techspot.com/news/103761-microsoft-ai-speech-generator-achieves-human-parity-but.html