DeepSeek AI是什么?了解这款席卷加密货币交易的国产大模型

robot
Генерация тезисов в процессе

在近期的 криптовалютных торговых экспериментах один из китайских AI-моделей под названием DeepSeek произвел впечатление: за всего 9 дней он увеличил начальный капитал с 10 000 долларов до 22 500 долларов, достигнув поразительной доходности в 125 %.

Этот результат даже превзошел модель Qwen 3 Max от Alibaba, сделав DeepSeek звездой в области AI-торговли.

![] ( https://img-cdn.gateio.im/social/moments- 9 a 31 a 6 ba 141 a 21 f 30 fa 89056 a 4556 d 45)

Происхождение и развитие DeepSeek

DeepSeek (глубокий поиск) — китайская компания в области искусственного интеллекта, основанная в Ханчжоу в 2023 году при инвестициях известного гиганта по управлению количественными активами High-Flyer.

Компания занимается разработкой передовых моделей больших языковых моделей и связанных технологий, выпустила несколько моделей, включая DeepSeek LLM, DeepSeek Coder, DeepSeekMath и DeepSeek-VL.

20 января 2025 года DeepSeek официально выпустила модель DeepSeek-R 1, которая показывает результаты, сопоставимые с OpenAI O 1 в задачах математики, кода и естественного языкового вывода. А последняя версия DeepSeek-V 3.2 привлекла широкое внимание, снизив стоимость AI-выводов до 1/6 — 1/7 от V 3.1, а также ускорив обработку длинных контекстов в 2–3 раза.

Семейство моделей DeepSeek и технологическая эволюция

Инновации в архитектуре моделей

Технологическая архитектура DeepSeek сочетает вариации Transformer и динамический механизм внимания, реализуя баланс между семантическим пониманием и генерацией через многоуровневое объединение признаков.

Ключевые преимущества включают:

  • Динамический разреженный механизм внимания: за счет введения управляющих элементов динамически распределяет веса внимания, сохраняя возможность обработки длинных текстов и снижая вычислительную сложность. Обработка документа объемом 100 000 токенов уменьшает вычислительные затраты на 42 % по сравнению со стандартным Transformer.
  • Гибридная система экспертов: использует маршрутизацию через 16 экспертных модулей, активируя только 2–3 эксперта на токен, что увеличивает емкость модели и одновременно контролирует расходы на вывод.
  • Поэтапная стратегия обучения: включает предварительное обучение, тонкую настройку по инструкциям и обучение с подкреплением на основе обратной связи человека. В сценах генерации кода точность увеличилась до 89,7 % за счет синтезированных данных.

Отличные показатели

В тесте MMLU модель DeepSeek-72B набрала 81,3 балла в области математики, физики и STEM, превзойдя GPT-4 с 79,8.

В задаче автодополнения кода Pass@1 достигла 68,2 %, что на 12 пунктов выше Codex.

Производительность DeepSeek в криптовалютных и финансовых рынках

Выдающиеся результаты в криптовалютных торгах

В рамках проекта Alpha Arena, запущенного Nof 1, DeepSeek с Chat V 3.1 продемонстрировала выдающие торговые способности.

Конкурс предполагал, что шесть AI-моделей с начальным капиталом по 10 000 долларов торгуют Bitcoin, Ether, Dogecoin и другими цифровыми активами, чтобы добиться максимальной доходности при одинаковых рыночных условиях.

По состоянию на 28 октября DeepSeek достигла доходности в 125 %, значительно опередив конкурентов.

В то время как GPT-5 от OpenAI потерял почти 60 % капитала и снизился до примерно 4000 долларов, Gemini 2.5 Pro от Google DeepMind потерял 57 %.

На платформе прогнозов Polymarket вероятность победы DeepSeek оценивается в 61 %, что значительно выше 29 % у Alibaba.

Успехи на американском фондовом рынке

Кроме криптовалют, DeepSeek показывает отличные результаты и в торговле акциями США.

В рамках открытого эксперимента “AI-Trader” под руководством Гонконгского университета, DeepSeek за месяц тестирования достигла годовой доходности 10,61 %, в то время как индекс Nasdaq 100, отслеживающий технологические акции, принес всего 2,13 %.

Это означает, что доходность DeepSeek почти в пять раз превышает бенчмарк.

Преимущества API DeepSeek и стратегия открытого исходного кода

Значительное падение цен

29 сентября 2025 года DeepSeek выпустила модель DeepSeek-V 3.2-Exp и объявила о значительном падении цен на API.

При новой ценовой политике, при попадании токенов в кеш, цена составляет 0,2 юаня за миллион токенов; при промахе — 2 юаня за миллион токенов; за вывод — 3 юаня за миллион токенов, что более чем на 50 % ниже предыдущих цен.

Новая модель DeepSeek-V 3.2 снизила стоимость AI-выводов до 1/6 — 1/7 от V 3.1, а цены API составляют 0,28 / 0,028 / 0,42 доллара за миллион input/cached/output токенов соответственно.

Стратегия открытого исходного кода и локализация

DeepSeek использует лицензию MIT, оптимизирована для Huawei и китайских чипов, что способствует развертыванию в локальных вычислительных средах Китая.

Эта стратегия открытого исходного кода позволяет разработчикам бесплатно и приватно развертывать модели DeepSeek, расширяя возможности для корпоративных приложений.

Перспективы развития

С развитием технологий AI-торговли можно с уверенностью сказать, что такие отечественные большие модели, как DeepSeek, в будущем будут играть все более важную роль на рынке криптовалют и в более широких финансовых сферах.

Для трейдеров криптовалют важно следить за развитием DeepSeek, чтобы не только быть в курсе передовых технологий AI, но и использовать потенциальные инвестиционные возможности будущего финансового рынка.

BTC-4.49%
DOGE-6.75%
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить