DeepSeek стал вирусным явлением
Китайская исследовательская лаборатория DeepSeek привлекла всеобщее внимание на этой неделе, когда её приложение-чатбот поднялось на вершину чартов App Store и Google Play. Модели AI DeepSeek, разработанные с использованием эффективных вычислительных методов, заставили аналитиков Уолл-Стрит и технологов задуматься, сможет ли США сохранить лидерство в гонке AI и будет ли спрос на AI-чипы устойчивым.
История DeepSeek
DeepSeek поддерживается High-Flyer Capital Management, китайским количественным хедж-фондом, использующим AI для информирования своих торговых решений.
- Основатель: Лянь Вэньфэн, соучредитель High-Flyer с 2015 года.
- Запуск: High-Flyer запустил DeepSeek как исследовательскую лабораторию в 2023 году.
- Данные: DeepSeek создал свои собственные кластерные центры данных для подготовки моделей.
Компания столкнулась с американскими экспортными запретами на оборудование, и для подготовок моделей использовала менее мощные чипы Nvidia H800.
Модели DeepSeek
В ноябре 2023 года DeepSeek представил свои первые модели: DeepSeek Coder, DeepSeek LLM и DeepSeek Chat. Однако именно в следующем году, когда стартап выпустил модели DeepSeek-V2, AI-индустрия начала обращать на него внимание.
- DeepSeek-V2: Общепurpose системы для анализа текста и изображений.
- Цены: Намного ниже сопоставимых моделей на тот момент.
- Конкуренция: Соперники, такие как ByteDance и Alibaba, снизили цены на свои модели.
В декабре 2024 года был запущен DeepSeek V3, который стал еще более популярным.
Техническое превосходство
DeepSeek V3 превосходит как открытые, так и закрытые модели, такие как Llama от Meta и GPT-4 от OpenAI.
Модель R1
Модель R1, выпущенная в январе 2025 года, эффективнее проверяет свои ответы, избегая распространенных ошибок.
- Преимущества: Более надежна в физике, науке и математике.
- Недостатки: Ограничена в ответах на определенные темы, как, например, события на площади Тяньаньмэнь.
Модель и подход
Модель DeepSeek остается загадкой. Компания предлагает свои услуги и продукты по ценам ниже рыночных и даже предоставляет некоторые услуги бесплатно, не принимая инвестиции, несмотря на интерес со стороны венчурных капиталистов.
- Эффективность: Прорывы в эффективности поддерживают низкие цены.
- Использование: Модели не являются открытым кодом, но доступны под разрешительными лицензиями.
- Деривативы: Разработчики создали более 500 производных моделей R1 с 2,5 миллионами загрузок.
Влияние на индустрию
Успех DeepSeek вызвал значительные волнения в индустрии AI, включая падение акций Nvidia на 18%. Microsoft объявила, что DeepSeek доступен через Azure AI Foundry, а OpenAI выразила обеспокоенность по поводу государственного контроля над DeepSeek.
Запреты и ограничения
- Некоторые компании, страны, включая Южную Корею, и даже штат Нью-Йорк запретили использование DeepSeek на государственном уровне.
Будущее DeepSeek
Перспективы DeepSeek остаются неопределёнными. Улучшение моделей — это неизбежность, но правительство США, похоже, начинает проявлять опасения по поводу иностранного влияния.
Эта история была изначально опубликована 28 января 2025 года и будет регулярно обновляться.