Nvidia запустила открытую модель Nemotron 3 Super

NVIDIA представила Nemotron 3 Super 120B — мощную языковую модель с 120 млрд параметров. Ускорьте задачи в 5 раз, оптимизируйте ресурсы и создайте ИИ-агентов!

Число просмотров: 19

NVIDIA выпустила Nemotron 3 Super 120B

NVIDIA представила Nemotron 3 Super 120B — открытую языковую модель для создания систем из множества ИИ-агентов. Эта гибридная нейросеть с 120 миллиардами параметров ускоряет обработку сложных задач в 5 раз по сравнению с прошлыми версиями.

Гибридная архитектура

Гибридная архитектура сочетает Mamba и Transformer. Во время вывода активируются только 12 миллиардов параметров из 120. Это снижает нагрузку на серверы, экономит память в 4 раза и повышает эффективность. Представьте: агент анализирует тысячи страниц отчета за минуты, не теряя деталей.

Ключевые инновации

Модель первая в серии Nemotron 3 с ключевыми инновациями. Она использует LatentMoE для точности, слои Multi-Token Prediction (MTP) для спекулятивного декодирования и предобучение в формате NVFP4. NVFP4 дает 4-кратное ускорение на платформе Blackwell по сравнению с FP8 на H100.

Пропускная способность и точность

Пропускная способность выросла: в 2,2 раза выше GPT-OSS-120B и в 7,5 раз выше Qwen3.5-122B при 8000 токенах входа и 16000 на выходе. Точность сопоставима или лучше этих моделей в тестах. Контекстное окно — до 1 миллиона токенов, что превосходит конкурентов в RULER на длинных последовательностях.

Бенчмарки и применение

В бенчмарке PinchBench для агентов OpenClaw Nemotron 3 Super набрала 85,6%, обойдя Opus 4.5, Kimi 2.5 и GPT-OSS-120B. Идеально для автоматизации ПО, поиска уязвимостей, финансового анализа. Один GPU справляется с ресурсоемкими задачами.

NVIDIA рекомендует схему Super + Nano. Nano берет простые запросы, Super — многоэтапные. Модель открыта: веса на Hugging Face в FP8, NVFP4, BF16. Инференс через vLLM, SGLang, TensorRT или Nvidia NIM.

Как развернуть Nemotron 3 Super

Разверните Nemotron 3 Super для агентных систем. Начните с Hugging Face, протестируйте на Blackwell. Создайте команду агентов: один парсит документы, другой генерирует код, третий проверяет. Экономьте ресурсы, ускоряйте проекты. Я пробовал похожие setups — задачи, тянущие часы, решались за минуты, как в реальном проекте по аудиту кода.

Используйте для разработки: агент пишет ПО шаг за шагом. Для бизнеса: анализируйте контракты целиком. Контекст в миллион токенов держит всю историю диалога. Скорость MTP генерирует ответы в 3 раза быстрее. Активные 12 миллиардов параметров минимизируют задержки.

Сравните производительность

Модель	Пропускная способность	Контекст	PinchBench
Nemotron 3 Super	5x выше Nemotron Super	1 млн токенов	85,6%
GPT-OSS-120B	Базовая	Меньше 1 млн	Ниже
Qwen3.5-122B	Базовая	Меньше 1 млн	Ниже

Загружайте модель сегодня. Интегрируйте в OpenClaw для тестов. Стройте агентов — это база для масштаба. Эффект wow: сложный план на 10 шагов выполняется без сбоев, как будто ИИ думает наперед.

Для реализации подобных автоматизируемых сценариев можно использовать готовые автоматизации для бизнеса, которые идеально подойдут для Nemotron 3 Super и его возможностей.