cjzdaily

Open-R1: DeepSeek-R1大模型开源复现计划

概述：HuggingFace 发布的完全开放的项目，旨在分三步(知识蒸馏、强化学习、多阶段训练)复现 DeepSeek-R1 的完整训练流程，让更多人能理解和使用这套技术方案

项目分三个主要步骤：
· 步骤 1: 通过从 DeepSeek-R1 中提取高质量的推理语料，复现 R1-Distill