Google Gemini 3.5 Live Translate'i duyurdu. Bu ses modeli 70’ten fazla dilde neredeyse gerçek zamanlı konuşmadan konuşmaya çeviri sunuyor. Model dilleri otomatik olarak algılıyor. Konuşmacıların tonlamasını, hızını ve ses perdesini koruyarak çevrilmiş konuşma üretiyor.
Konuşmacıların bitirmesini beklemeden yanıt veriyor. Oturum boyunca konuşmacının birkaç saniye gerisinde kalıyor.
For over 20 years, we've dedicated ourselves to removing language barriers so people can learn, speak and connect more deeply than ever before.
— Google (@Google) June 9, 2026
Today, we’re taking our next step with the release of Gemini 3.5 Live Translate — our latest audio model for live, speech-to-speech… https://t.co/wu2h6WnO1i pic.twitter.com/qnsMs4BUCf
Model konuşmayı akış halindeyken işliyor. Manuel yapılandırma olmadan çok dilli girdileri yönetiyor. Google, modelin gürültü dayanıklılığının yüksek sesli ve öngörülemeyen ortamlarda çalışmasına olanak tanıdığını belirtti.
Geniş kullanım alanı ve API desteği
Model Google ürünlerinde kullanıma sunuluyor. Geliştiriciler için Gemini Live API ve Google AI Studio üzerinden genel önizleme başlıyor.
Kurumsal kullanıcılar için Google Meet'te bu ay özel önizleme başlayacak. Android ve iOS'ta Google Translate üzerinden de erişilebilecek.
Agora, Fishjam, LiveKit, Pipecat ve Vision Agents gibi geliştirici platformları teknolojiyi entegre ediyor. Böylece sesli çeviri uygulamaları mümkün olacak.
Google Meet konuşma çevirisi için 3.5 Live Translate'i kullanacak. Önceki beş dil sınırına kıyasla 70'ten fazla dil sunuyor. Tek bir toplantıda 2.000'den fazla dil kombinasyonunda konuşmalar mümkün olacak.
Dil bariyerini ortadan kaldırma konusunda oldukça iyi görünen model, çevirileri istenirse Android telefonların ahizesi üzerinden de aktarabiliyor. "Listening mode" sayesinde artık gerçek zamanlı sesli çevirler için kulaklık zorunluluğu bulunmuyor.