иcтoчник: www.kv.by
Alibaba Cloud объявила о публичном доступе к своей новой флагманской модели логического рассуждения Qwen3-Max-Thinking. По результатам 19 бенчмарков модель демонстрирует производительность на уровне ведущих аналогов, таких как GPT-5.2-Thinking, Claude-Opus-4.5 и Gemini 3 Pro.
В официальном блоге компании отмечается, что Qwen3-Max-Thinking достигла улучшений по фактической точности, сложному логическому рассуждению, следованию инструкциям, учету пользовательских предпочтений и агентским возможностям. Эти результаты достигнуты за счёт увеличения параметров модели и использования значительных вычислительных ресурсов для обучения с подкреплением (reinforcement learning, RL). Ключевыми нововведениями стали адаптивные инструменты и стратегия масштабирования тестов.
В отличие от прежнего подхода, когда пользователь вручную выбирал инструменты, Qwen3-Max-Thinking теперь автономно задействует встроенные возможности поиска, памяти и интерпретатора кода прямо в диалоге. Разработчики утверждают, что инструменты поиска и памяти снижают ´галлюцинации´, дают доступ к актуальной информации и позволяют формировать более персонализированные ответы, а интерпретатор кода позволяет выполнить фрагменты кода для решения сложных задач.
Такой подход повысил точность на ряде специализированных тестов (GPQA, HLE, LiveCodeBench v6, IMO-AnswerBench) при сохранении прежнего объёма вычислений. По словам компании, технология с адаптивными инструментами уже доступна в Qwen Chat. Также открыт доступ к API через сервис Alibaba Cloud Model Studio: необходимо зарегистрировать аккаунт в Alibaba Cloud, воспользоваться Model Studio и создать в консоли разработчика API-ключ. API Qwen совместим с протоколом OpenAI API, что упрощает интеграцию стандартными методами, а также обеспечена поддержка Anthropic API, позволяющая бесшовно работать с Claude Code.