DeepSeek-R1 发布,性能对标 OpenAI o1 正式版
发布时间:2025-01-211月20日,来自杭州的深度求索(DeepSeek)发布 DeepSeek-R1模型,并同步开源模型权重。
DeepSeek-R1 遵循 MIT License,允许用户通过蒸馏技术借助 R1 训练其他模型。
DeepSeek-R1上线API,对用户开放思维链输出,通过设置 `model='deepseek-reasoner'` 即可调用。
DeepSeek 官网与 App 即日起同步更新上线。
性能对齐OpenAI-o1正式版
DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。
蒸馏小模型超越 OpenAI o1-mini
DeepSeek在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时,通过 DeepSeek-R1 的输出,蒸馏了 6 个小模型开源给社区,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini 的效果。
HuggingFace链接:https://huggingface.co/deepseek-ai
开放的许可证和用户协议
DeepSeek已将 DeepSeek-R1 训练技术全部公开,在发布并开源 R1 的同时,协议授权层面作如下调整:
模型开源 License 统一使用 MIT。此次开源仓库(包括模型权重)统一采用标准化、宽松的 MIT License,完全开源,不限制商用,无需申请。
产品协议明确可“模型蒸馏”。已更新线上产品的用户协议,明确允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。
App与网页端
登录DeepSeek官网或官方App,打开“深度思考”模式,即可调用最新版 DeepSeek-R1 完成各类推理任务。
API 及定价
DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元。
论文链接:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf
API调用指南: https://api-docs.deepseek.com/zh-cn/guides/reasoning_model
来源链接:https://mp.weixin.qq.com/s/atKyfC5l-BaStje8-F3FGQ
来源:DeepSeek