иcтoчник: www.kv.by
Arcee, лаборатория из Сан-Франциско, выпустила Trinity-Large-Thinking - текстово-обоснованную модель с 399 миллиардами параметров. Распространяется она под лицензией Apache 2.0, что позволяет её свободно использовать и модифицировать как независимым разработчикам, так и крупным компаниям. Trinity-Large-Thinking задуманa как открытая альтернатива проприетарным моделям, которые доминируют на рынке.
Публикация вышла на волне растущих опасений компаний по поводу использования китайских архитектур в критической инфраструктуре. Arcee предлагает разработчикам инструмент, который можно держать под самостоятельным контролем. Arcee - небольшая команда из 30 человек, выделяющаяся подходом ´инженерия через ограничения´.
В 2026 году компания вложила 20 миллионов долларов, почти половину своего бюджета, в 33-дневный цикл обучения Trinity-Large. Для этого был задействован кластер из 2048 GPU NVIDIA B300 Blackwell, что позволило добиться высокой скорости обучения.
Модель имеет архитектуру Mixture-of-Experts, где из 400 миллиардов параметров активны всего 1,56% (примерно 13 миллиардов) для каждого токена, что обеспечивает высокую скорость и эффективность.
В целях стабильности Arcee внедрила механизм SMEBU (Soft-clamped Momentum Expert Bias Updates), который равномерно распределяет нагрузку между экспертами. Обучение Trinity-Large включало 20 триллионов токенов, половина которых - синтетические данные, созданные переработкой текстов. Такой подход помогает модели лучше понимать концепции и знания, а не просто запоминать текст.
Ключевым обновлением Trinity-Large-Thinking стала фаза мышления перед генерацией ответа. Это повысило способность модели к выполнению сложных многошаговых задач и обеспечило стабильность в долгосрочных сценариях.
На тесте PinchBench модель набрала 91.9 балла, близко к лидеру рынка Claude Opus 4.6 (93.3). Лицензия Apache 2.0 выделяет Trinity-Large-Thinking среди конкурентов, предоставляя предприятиям возможность полного контроля над моделью. Arcee также выпустила Trinity-Large-TrueBase - контрольную точку с 10 триллионами токенов, которая позволяет полностью адаптировать модель под свои нужды. Trinity-Large-Thinking уже получила положительные отзывы сообщества.
На платформе OpenRouter модель стала самой популярной в США, обработав за день более 80 миллиардов токенов. При цене $0.90 за миллион токенов Trinity значительно дешевле конкурентов, таких как Claude Opus 4.6 ($25 за миллион токенов). Arcee планирует использовать наработки Trinity-Large для обновления своих компактных моделей Mini и Nano, сделав их доступными для широкого круга пользователей