Французский ИИ-стартап Mistral AI представил семейство моделей Mistral 3.

иcтoчник: www.kv.by

Французский стартап Mistral AI представил семейство моделей Mistral 3 со открытыми весами (open-weight), сделав уверенную заявку на лидерство в сегменте общедоступного ИИ и подчеркнув преимущества для корпораций по сравнению с решениями крупных игроков.

Семейство состоит из 10 моделей: крупная MoE-модель с открытыми весами - Mistral Large 3 - с мультимодальными и многоязычными возможностями. Это самая мощная на сегодня модель компании, обученная на 41 млрд активных и 675 млрд общих параметров. В линейке также присутствуют девять меньших моделей, рассчитанных на автономную работу и полную настройку, включая три высокоплотные версии с 4 млрд, 8 млрд и 3 млрд параметров.

Модели Mistral обещают лучшее соотношение производительности и стоимости в своем сегменте. При этом Mistral Large 3 входит в число передовых открытых решений, оптимизированных под тонко настроенные инструкции. По заявлению компании, все модели выпускаются по лицензии Apache 2.0.

Открытый исходный код в разных сжатых форматах, по словам разработчиков, расширяет возможности сообщества и упрощает применение ИИ через распределённый интеллект. Как сообщает TechCrunch, Mistral - стартап двухлетней давности, основанный бывшими сотрудниками DeepMind и Meta.

Компания смогла привлечь около 2,7 млрд долларов инвестиций и оценивается в примерно 13,7 млрд долларов, что заметно меньше капитала и оценок конкурентов: OpenAI (примерно 57 млрд долларов привлечений, оценка около 500 млрд) и Anthropic (около 45 млрд привлечений, оценка около 350 млрд). Mistral утверждает, что в корпоративной практике ´больше не всегда значит лучше´.

По словам Гийома Лампле, соучредителя и главного научного сотрудника, многие клиенты хотят начать с крупной закрытой модели - но потом понимают, что развёртывание обходится дорого и медленно, и обращаются к настройке меньших моделей под конкретные задачи. По его мнению, подавляющее большинство реальных сценариев корпоративного использования ИИ возможно реализовать с помощью небольших моделей с тонкой настройкой. При этом он отмечает: по сравнению с эталонными моделями открытые решения могут уступать на старте, но выигрыш достигается именно за счёт адаптации и доработки меньших моделей