Videodan Kod Yazma: Alibaba Ekranı «Gören» Qwen3.5-Omni Yapay Zekasını Tanıttı

Alibaba Cloud, çok modlu yapay zeka modeli Qwen3.5-Omni ile sınırları zorluyor. Metin, resim, ses ve videoyu aynı anda işleyebilen bu devasa model, «Audio-Visual Vibe Coding» yeteneğiyle dikkat çekiyor. Model, ekran kaydınızı izleyip sesli komutlarınızı duyarak, herhangi bir metin girişi olmadan çalışan kodlar üretebiliyor.

Ses anlama konusunda Gemini 3.1 Pro’yu geride bırakan Qwen3.5-Omni, 113 dil ve lehçeyi destekliyor. 256 bin tokenlik bağlam penceresi sayesinde tek bir sorguda 10 saatlik ses verisini analiz edebiliyor. Bu teknoloji, yapay zekanın sadece bir araç değil, gerçek bir asistan olma yolundaki en büyük adımıdır.

Bu materyal, Alibaba Cloud’un Hybrid-Attention MoE mimarisi ışığında «Amul Info» teknoloji servisi tarafından hazırlanmıştır.

Popüler Haberler

Videodan Kod Yazma: Alibaba Ekranı «Gören» Qwen3.5-Omni Yapay Zekasını Tanıttı

Popüler Haberler

Benzer Haberler

15 Saniyede Yıldız Olun: Suno v5.5 Artık Sizin Sesinizle Şarkı Söylüyor

Beklenmedik İttifak: OpenAI, Codex’i Rakibi Anthropic’in Claude Code Aracına Entegre Etti

Teknoloji Atılımı: Qwen3.6 Plus Preview, OpenRouter’da Ücretsiz Yayınlandı

Illustrator’da Devrim: Adobe Project Turntable 2D Çizimleri Yapay Zeka ile 3D’ye Dönüştürüyor