Печать
Просмотров: 907
Alibaba представила линейку малых ИИ-моделей Qwen3.5.

иcтoчник : www.kv.by

Alibaba Qwen представила новую линейку моделей, отличающуюся компактными размерами и высокой скоростью выдачи качественных ответов, заметно опережая ведущие американские аналоги. В младшем сегменте линейки доступны модели Qwen3.5-0.8B и Qwen3.5-2B, которые характеризуют как ´миниатюрные´ и ´быстрые´; они созданы для разработки прототипов и быстрого разворачивания на мобильных устройствах с приоритетом энергоэффективности.

Мультимодальная версия Qwen3.5-4B рассчитана на создание лёгких агентов и изначально поддерживает контекстное окно размером 262 144 токена. В рассуждающей конфигурации Qwen3.5-9B демонстрируются возможности, сопоставимые с американским конкурентом - открытым GPT-OSS-120B: при этом размер самой модели меньше примерно в 13,5 раза, а ее языковые знания и логическое мышление соответствуют уровню аспирантуры.

Весовой набор открыт - доступен под лицензией Apache 2.0, что позволяет корпоративное и коммерческое использование, включая дополнительное обучение при необходимости. При создании малых моделей серии Qwen3.5 компания отошла от классических архитектур Transformer, внедрив гибридную схему: сочетание нейросетей Gated Delta Networks и разреженной смеси экспертов (Mixture-of-Experts - MoE).

Этот подход помогает решить проблему ограниченной памяти у компактных моделей, при этом Gated Delta Networks обеспечивает большую пропускную способность и меньшую задержку в ответах. Все модели изначально мультимодальны. В отличие от прежних поколений, где генераторы изображений ´прикреплялись´ к текстовым моделям, Qwen3.5 обучались на мультимодальных токенах. В результате версии 4B и 9B могут распознавать элементы пользовательского интерфейса и считать объекты на видео.