NVIDIA выпустила Nemotron 3 Super 120B
NVIDIA представила Nemotron 3 Super 120B — открытую языковую модель для создания систем из множества ИИ-агентов. Эта гибридная нейросеть с 120 миллиардами параметров ускоряет обработку сложных задач в 5 раз по сравнению с прошлыми версиями.
Гибридная архитектура
Гибридная архитектура сочетает Mamba и Transformer. Во время вывода активируются только 12 миллиардов параметров из 120. Это снижает нагрузку на серверы, экономит память в 4 раза и повышает эффективность. Представьте: агент анализирует тысячи страниц отчета за минуты, не теряя деталей.
Ключевые инновации
Модель первая в серии Nemotron 3 с ключевыми инновациями. Она использует LatentMoE для точности, слои Multi-Token Prediction (MTP) для спекулятивного декодирования и предобучение в формате NVFP4. NVFP4 дает 4-кратное ускорение на платформе Blackwell по сравнению с FP8 на H100.
Пропускная способность и точность
Пропускная способность выросла: в 2,2 раза выше GPT-OSS-120B и в 7,5 раз выше Qwen3.5-122B при 8000 токенах входа и 16000 на выходе. Точность сопоставима или лучше этих моделей в тестах. Контекстное окно — до 1 миллиона токенов, что превосходит конкурентов в RULER на длинных последовательностях.
Бенчмарки и применение
В бенчмарке PinchBench для агентов OpenClaw Nemotron 3 Super набрала 85,6%, обойдя Opus 4.5, Kimi 2.5 и GPT-OSS-120B. Идеально для автоматизации ПО, поиска уязвимостей, финансового анализа. Один GPU справляется с ресурсоемкими задачами.
NVIDIA рекомендует схему Super + Nano. Nano берет простые запросы, Super — многоэтапные. Модель открыта: веса на Hugging Face в FP8, NVFP4, BF16. Инференс через vLLM, SGLang, TensorRT или Nvidia NIM.
Как развернуть Nemotron 3 Super
Разверните Nemotron 3 Super для агентных систем. Начните с Hugging Face, протестируйте на Blackwell. Создайте команду агентов: один парсит документы, другой генерирует код, третий проверяет. Экономьте ресурсы, ускоряйте проекты. Я пробовал похожие setups — задачи, тянущие часы, решались за минуты, как в реальном проекте по аудиту кода.
Используйте для разработки: агент пишет ПО шаг за шагом. Для бизнеса: анализируйте контракты целиком. Контекст в миллион токенов держит всю историю диалога. Скорость MTP генерирует ответы в 3 раза быстрее. Активные 12 миллиардов параметров минимизируют задержки.
Сравните производительность
| Модель | Пропускная способность | Контекст | PinchBench |
|---|---|---|---|
| Nemotron 3 Super | 5x выше Nemotron Super | 1 млн токенов | 85,6% |
| GPT-OSS-120B | Базовая | Меньше 1 млн | Ниже |
| Qwen3.5-122B | Базовая | Меньше 1 млн | Ниже |
Загружайте модель сегодня. Интегрируйте в OpenClaw для тестов. Стройте агентов — это база для масштаба. Эффект wow: сложный план на 10 шагов выполняется без сбоев, как будто ИИ думает наперед.
Для реализации подобных автоматизируемых сценариев можно использовать готовые автоматизации для бизнеса, которые идеально подойдут для Nemotron 3 Super и его возможностей.
Полезные ссылки
- Заказ услуг по автоматизации
- Виртуальный хостинг Beget
- Аренда сервера с n8n
- Аренда VPN сервера от Beget
- Доступ к 500+ LLM из РФ
- Виртуальные карты для оплаты AI
Наши соц. сети
- Telegram канал ProDelo
- Общий чат ProDelo
- Бесплатный курс по n8n
- Наш Youtube канал
- Наш Яндекс Дзен канал
- Наша группа в ВК