cjzdaily
02:11 · Oct 20, 2024 · Sun
https://x.com/tonyzhu1984/status/1847632709675602316?s=12&t=Kai8A164X7FNQtl0psU7PQ
X (formerly Twitter)
Tony出海号 (@tonyzhu1984) on X
Meta 刚刚低调发布了一个最小且快速的 LLM大模型训练和推理框架库Meta Lingua。 目的是让更多人来训练 llama。可以 24 小时训练出一个 llama 7B,MMLU达到 48%。在许多下游任务上获得了非常强大的性能,并且与DCLM 基线 1.0的性能相匹配。
国内大模型要笑醒,训练一个国产大模型只需要 10
Home
Powered by
BroadcastChannel
&
Sepia