Alibaba, gerçek dünyada görev yapacak robotlar için geliştirdiği ilk bedensel yapay zekâ model ailesi olan Qwen-Robot'u tanıttı. Şirketin Tongyi Lab araştırma ekibi tarafından geliştirilen bu yeni model ailesi, büyük dil modellerini robotların fiziksel hareketleriyle birleştirmeyi amaçlıyor. Alibaba Cloud'un belirli kurumsal müşterileriyle pilot test sürecine giren Qwen-Robot, robotların çevrelerini algılamasına, karar vermesine ve fiziksel dünyada görev gerçekleştirmesine yardımcı olacak üç farklı modelden oluşuyor.
Bugüne kadar geliştirilen büyük dil modelleri, metin ve görüntüleri anlamada önemli ilerleme kaydetmiş olsa da bu sistemlerin fiziksel dünyada görev yerine getirmesi çok daha karmaşık bir problem olarak görülüyor. Örneğin bir yapay zekâ modeli "Mutfağa git, kırmızı kupayı bul ve rafa koy" komutunu anlayabiliyor. Ancak bu görevi yerine getirebilmek için yalnızca dili anlaması yetmiyor; bulunduğu ortamı analiz etmesi, hedef nesneyi tespit etmesi, hareketlerini planlaması ve fiziksel olarak nesneyi kavrayabilmesi gerekiyor. İşte robotik alanındaki en büyük zorluklardan biri de bu dijital anlayış ile fiziksel hareket arasındaki boşluğu kapatmak.
Alibaba'ya göre bu sorunun çözülmesini zorlaştıran en önemli etkenlerden biri de robot eğitim verilerinin internet verilerinden çok farklı olması. Robot kolları, araçlar, sensörler ve kameralar tarafından üretilen veriler farklı formatlarda geliyor ve bu verilerin toplanması son derece maliyetli oluyor. Üstelik tüm bu verileri tek bir sistemde bir araya getirmek çoğu zaman performansı artırmak yerine yeni sorunlara yol açabiliyor.
Alibaba, Dijital Asistanları Robotlarla Fiziksel Dünyaya Taşımak İstiyor
Alibaba bu sorunu çözmek için Qwen-Robot çatısı altında üç ayrı model geliştirdi. Bunlardan ilki olan Qwen-RobotNav, hareket ve navigasyona odaklanıyor. Bu model robotların komutları takip etmesini, belirli hedeflere ulaşmasını, nesneleri takip etmesini ve otonom sürüş benzeri görevleri yerine getirmesini sağlıyor. İkinci model olan Qwen-RobotManip ise fiziksel etkileşim tarafını üstleniyor. Robotların nesneleri kavramasına, taşımasına ve manipüle etmesine yardımcı olan bu sistem, farklı robot platformlarından toplanan geniş bir veri setiyle eğitildi. Üçüncü model olan Qwen-RobotWorld ise bir tür "dünya modeli" olarak görev yapıyor. Bu model çevrede meydana gelebilecek değişimleri tahmin ederek robotların eylemlerinin olası sonuçlarını önceden değerlendirmesine yardımcı oluyor.
Alibaba'ya göre bu üç model birlikte çalıştığında robotlar yalnızca verilen komutları anlamakla kalmıyor, aynı zamanda çevrelerinde bulunan nesnelerle etkileşime girebiliyor, karmaşık ortamlarda hareket edebiliyor ve gerçek zamanlı kararlar alabiliyor. Şirketin uzun vadeli hedefi, dijital asistan mantığını fiziksel dünyaya taşıyabilecek genel amaçlı robot sistemleri geliştirmek.
Alibaba tarafından paylaşılan demolar da bu hedefin ilk örneklerini gözler önüne seriyor. Şirket, Qwen-RobotNav modelini Unitree'nin dört ayaklı Go2 robotu üzerinde test etti. NVIDIA'nın Jetson Thor donanımıyla çalışan ve yalnızca düşük çözünürlüklü tek bir kameraya sahip olan robot, daha önce hiç görmediği bir daire içerisinde sözlü komutları takip ederek odalar arasında başarıyla hareket edebildi. Üstelik bunu önceden hazırlanmış bir haritaya ihtiyaç duymadan gerçekleştirdi.
Alibaba, yeni model ailesiyle birlikte Qwen-RobotClaw adını verdiği bir robot ajan sistemini de tanıttı. Bu sistem, Qwen modellerinin fiziksel dünyadaki araçlar gibi hareket ederek çeşitli görevleri yerine getirmesine olanak tanıyor. Şirketin gösterdiği örneklerden birinde yapay zekâ destekli ajan, bir tuvalet arıyor, hizmet dışı olduğunu belirten tabelayı tespit ediyor ve ardından alternatif bir güzergâh oluşturarak başka bir tuvalete yöneliyor. Alibaba ayrıca geliştiricilerin bu sistemleri test edebilmesi için Chat2Robot isimli platformu da açık kaynak olarak yayınladı.
Qwen-Robot model ailesi, büyük dil modelleri konusunda Batılı rakipleriyle kıyasıya bir rekabete giren Çinli şirketlerin, sadece insansı robot üretiminde değil, bu robotlara hayat verecek bedensel yapay zekâ konusunda da yarışın içinde olacağını gösteriyor.