DeepSeek: Всё, что нужно знать о приложении чат-бота на основе ИИ

DeepSeek стал вирусным явлением

Китайская исследовательская лаборатория DeepSeek привлекла всеобщее внимание на этой неделе, когда её приложение-чатбот поднялось на вершину чартов App Store и Google Play. Модели AI DeepSeek, разработанные с использованием эффективных вычислительных методов, заставили аналитиков Уолл-Стрит и технологов задуматься, сможет ли США сохранить лидерство в гонке AI и будет ли спрос на AI-чипы устойчивым.

История DeepSeek

DeepSeek поддерживается High-Flyer Capital Management, китайским количественным хедж-фондом, использующим AI для информирования своих торговых решений.

  • Основатель: Лянь Вэньфэн, соучредитель High-Flyer с 2015 года.
  • Запуск: High-Flyer запустил DeepSeek как исследовательскую лабораторию в 2023 году.
  • Данные: DeepSeek создал свои собственные кластерные центры данных для подготовки моделей.

Компания столкнулась с американскими экспортными запретами на оборудование, и для подготовок моделей использовала менее мощные чипы Nvidia H800.

Модели DeepSeek

В ноябре 2023 года DeepSeek представил свои первые модели: DeepSeek Coder, DeepSeek LLM и DeepSeek Chat. Однако именно в следующем году, когда стартап выпустил модели DeepSeek-V2, AI-индустрия начала обращать на него внимание.

  • DeepSeek-V2: Общепurpose системы для анализа текста и изображений.
  • Цены: Намного ниже сопоставимых моделей на тот момент.
  • Конкуренция: Соперники, такие как ByteDance и Alibaba, снизили цены на свои модели.

В декабре 2024 года был запущен DeepSeek V3, который стал еще более популярным.

Техническое превосходство

DeepSeek V3 превосходит как открытые, так и закрытые модели, такие как Llama от Meta и GPT-4 от OpenAI.

Модель R1

Модель R1, выпущенная в январе 2025 года, эффективнее проверяет свои ответы, избегая распространенных ошибок.

  • Преимущества: Более надежна в физике, науке и математике.
  • Недостатки: Ограничена в ответах на определенные темы, как, например, события на площади Тяньаньмэнь.

Модель и подход

Модель DeepSeek остается загадкой. Компания предлагает свои услуги и продукты по ценам ниже рыночных и даже предоставляет некоторые услуги бесплатно, не принимая инвестиции, несмотря на интерес со стороны венчурных капиталистов.

  • Эффективность: Прорывы в эффективности поддерживают низкие цены.
  • Использование: Модели не являются открытым кодом, но доступны под разрешительными лицензиями.
  • Деривативы: Разработчики создали более 500 производных моделей R1 с 2,5 миллионами загрузок.

Влияние на индустрию

Успех DeepSeek вызвал значительные волнения в индустрии AI, включая падение акций Nvidia на 18%. Microsoft объявила, что DeepSeek доступен через Azure AI Foundry, а OpenAI выразила обеспокоенность по поводу государственного контроля над DeepSeek.

Запреты и ограничения

  • Некоторые компании, страны, включая Южную Корею, и даже штат Нью-Йорк запретили использование DeepSeek на государственном уровне.

Будущее DeepSeek

Перспективы DeepSeek остаются неопределёнными. Улучшение моделей — это неизбежность, но правительство США, похоже, начинает проявлять опасения по поводу иностранного влияния.

Эта история была изначально опубликована 28 января 2025 года и будет регулярно обновляться.

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь

Основатель более 10 стартапов в области ИТ и ИИ. Серийный предприниматель. Профессиональный управленец.