
Alibaba Cloud, çok modlu yapay zeka modeli Qwen3.5-Omni ile sınırları zorluyor. Metin, resim, ses ve videoyu aynı anda işleyebilen bu devasa model, «Audio-Visual Vibe Coding» yeteneğiyle dikkat çekiyor. Model, ekran kaydınızı izleyip sesli komutlarınızı duyarak, herhangi bir metin girişi olmadan çalışan kodlar üretebiliyor.
Ses anlama konusunda Gemini 3.1 Pro’yu geride bırakan Qwen3.5-Omni, 113 dil ve lehçeyi destekliyor. 256 bin tokenlik bağlam penceresi sayesinde tek bir sorguda 10 saatlik ses verisini analiz edebiliyor. Bu teknoloji, yapay zekanın sadece bir araç değil, gerçek bir asistan olma yolundaki en büyük adımıdır.
Bu materyal, Alibaba Cloud’un Hybrid-Attention MoE mimarisi ışığında «Amul Info» teknoloji servisi tarafından hazırlanmıştır.
Keywords