cjzdaily
09:25 · Jan 26, 2025 · Sun
https://x.com/shao__meng/status/1883155733203877940?s=12
X (formerly Twitter)
meng shao (@shao__meng) on X
Open-R1: DeepSeek-R1大模型开源复现计划
概述:HuggingFace 发布的完全开放的项目,旨在分三步(知识蒸馏、强化学习、多阶段训练)复现 DeepSeek-R1 的完整训练流程,让更多人能理解和使用这套技术方案
项目分三个主要步骤:
· 步骤 1: 通过从 DeepSeek-R1 中提取高质量的推理语料,复现 R1-Distill
Home
Powered by
BroadcastChannel
&
Sepia