Первая открытая модель с цепочкой мышления, сопоставимая с o1 от OpenAI. Думает вслух перед ответом, побеждает в математике и научных задачах.

R1 не даёт ответ сразу. Сначала она строит цепочку рассуждений — точно как опытный специалист думает над задачей.
R1 разбирает условия, определяет тип задачи и выбирает стратегию решения. Этот процесс виден пользователю.
Модель проверяет промежуточные шаги, замечает ошибки и корректирует курс прямо в процессе мышления.
| Бенчмарк | DeepSeek R1 | OpenAI o1 | GPT-4o |
|---|---|---|---|
| MATH-500 | 97.3% | 96.4% | 76.6% |
| AIME 2024 | 79.8% | 74.3% | 9.3% |
| Codeforces | 96.3% | 96.6% | 62.8% |
| GPQA Diamond | 71.5% | 75.7% | 53.6% |
| MMLU | 90.8% | 91.8% | 88.7% |
Олимпиадные задачи, высшая математика, статистика — с пошаговым решением и проверкой.
Решает задачи уровня Codeforces, LeetCode Hard. Объясняет оптимальные алгоритмы.
Разбирает научные статьи, выдвигает гипотезы, предлагает методологию.
Анализирует сложные правовые тексты, находит противоречия, строит аргументацию.
Проектирует системы, оценивает архитектурные решения, предупреждает о подводных камнях.
Объясняет сложные концепции поэтапно, подбирает задачи нарастающей сложности.