Выберите язык

Выберите язык

Китайский стартап DeepSeek анонсировал дистиллированную версию своей передовой модели искусственного интеллекта R1, которая может работать на одной видеокарте вместо дюжины GPU, необходимых для полной версии.

deepseek.jpg

Китайская компания DeepSeek совершила важный прорыв в области искусственного интеллекта, представив компактную версию своей модели R1 с возможностями рассуждения. Новая модель DeepSeek-R1-0528-Qwen3-8B создана методом дистилляции и требует значительно меньше вычислительных ресурсов по сравнению с полноразмерной версией.

Технические характеристики и преимущества

Дистиллированная версия основана на модели Qwen3-8B от компании Alibaba, выпущенной в мае 2025 года. Несмотря на компактный размер, новая модель демонстрирует впечатляющие результаты в тестированиях, превосходя Google Gemini 2.5 Flash в математическом бенчмарке AIME 2025 и практически сравниваясь с Microsoft Phi 4 Plus в тесте HMMT.

Требования к оборудованию

Одним из главных достоинств DeepSeek-R1-0528-Qwen3-8B является минимальные требования к аппаратному обеспечению. По данным облачной платформы NodeShift, для работы модели достаточно одного GPU с 40-80 ГБ оперативной памяти, например Nvidia H100. Для сравнения, полная версия R1 требует около двенадцати GPU с 80 ГБ памяти каждый.

Процесс обучения и лицензирование

В процессе создания компактной модели разработчики использовали текст, сгенерированный полноразмерной версией R1, для тонкой настройки базовой модели Qwen3-8B. Модель распространяется под разрешительной лицензией MIT, что позволяет её свободное коммерческое использование.

Практическое применение

DeepSeek-R1-0528-Qwen3-8B подходит как для академических исследований, так и для промышленной разработки, ориентированной на модели малого масштаба. Несколько приложений, включая LM Studio, уже интегрировали эту модель через API, делая её доступной для широкого круга разработчиков.

Официальный сайт DeepSeek: https://www.deepseek.com/

В случае каких-либо проблем напишите нам, мы поможем быстро и качественно!