Ana içeriğe geç

Gemini 3.5 Live Translate ile gerçek zamanlı çeviri dönemi

Google, yüksek kaliteli sesli çeviriler sağlayan yeni Gemini 3.5 Live Translate yapay zeka modelini kullanıma sunduğunu duyurdu. 70’ten fazla dili destek veren yeni model, konuşmaları doğal biçimde ve gerçek zamanlı olarak çeviriyor.

Gemini 3.5 Live Translate ile gerçek zamanlı çeviri dönemi
Cnbc-e
16

Google Gemini 3.5 Live Translate'i duyurdu. Bu ses modeli 70’ten fazla dilde neredeyse gerçek zamanlı konuşmadan konuşmaya çeviri sunuyor. Model dilleri otomatik olarak algılıyor. Konuşmacıların tonlamasını, hızını ve ses perdesini koruyarak çevrilmiş konuşma üretiyor.

Konuşmacıların bitirmesini beklemeden yanıt veriyor. Oturum boyunca konuşmacının birkaç saniye gerisinde kalıyor.

Model konuşmayı akış halindeyken işliyor. Manuel yapılandırma olmadan çok dilli girdileri yönetiyor. Google, modelin gürültü dayanıklılığının yüksek sesli ve öngörülemeyen ortamlarda çalışmasına olanak tanıdığını belirtti.

Geniş kullanım alanı ve API desteği

Model Google ürünlerinde kullanıma sunuluyor. Geliştiriciler için Gemini Live API ve Google AI Studio üzerinden genel önizleme başlıyor.

Kurumsal kullanıcılar için Google Meet'te bu ay özel önizleme başlayacak. Android ve iOS'ta Google Translate üzerinden de erişilebilecek.

Agora, Fishjam, LiveKit, Pipecat ve Vision Agents gibi geliştirici platformları teknolojiyi entegre ediyor. Böylece sesli çeviri uygulamaları mümkün olacak.

Google Meet konuşma çevirisi için 3.5 Live Translate'i kullanacak. Önceki beş dil sınırına kıyasla 70'ten fazla dil sunuyor. Tek bir toplantıda 2.000'den fazla dil kombinasyonunda konuşmalar mümkün olacak.

Dil bariyerini ortadan kaldırma konusunda oldukça iyi görünen model, çevirileri istenirse Android telefonların ahizesi üzerinden de aktarabiliyor. "Listening mode" sayesinde artık gerçek zamanlı sesli çevirler için kulaklık zorunluluğu bulunmuyor.

Kaynağa Git

İlgili Haberler