ГлавнаяМодели › DeepSeek V3
Флагманская модель

DeepSeek V3

671 млрд параметров в архитектуре Mixture-of-Experts. Превосходит GPT-4o и Claude 3.5 Sonnet в большинстве тестов при значительно меньшей стоимости обучения.

DeepSeek V3

Ключевые характеристики

671B
Параметров (MoE)
37B
Активных параметров на токен
128K
Контекст (токены)
14.8T
Токенов обучения

Что умеет DeepSeek V3

Универсальная модель для широкого спектра задач — от кода до аналитики.

🖥️

Программирование

Написание, отладка и объяснение кода на 50+ языках. Особенно силён в Python, JavaScript, C++ и SQL.

📝

Длинные тексты

Обрабатывает до 128 000 токенов. Может анализировать целые книги, кодовые базы или юридические документы.

🌐

Многоязычность

Отлично понимает русский, английский, китайский и другие языки. Переводит с сохранением смысла и стиля.

Скорость

Высокоскоростная генерация благодаря архитектуре MoE — на токен активируется только 37B из 671B параметров.

🔍

Анализ данных

Интерпретирует структурированные данные, строит выводы, объясняет статистику.

💬

Диалоговость

Поддерживает длинные многоходовые диалоги с сохранением контекста разговора.

DeepSeek V3 в бенчмарках

БенчмаркDeepSeek V3GPT-4oClaude 3.5 Sonnet
MATH-50090.2%76.6%78.3%
HumanEval (Код)82.6%90.2%92.0%
MMLU88.5%88.7%88.3%
GPQA Diamond59.1%53.6%65.0%
LiveCodeBench40.5%32.9%38.9%

Попробуйте DeepSeek V3

Бесплатно, без регистрации. Откройте чат прямо сейчас.