cjzdaily
08:00 · Sep 16, 2024 · Mon
https://x.com/dotey/status/1835395891483554105?s=52&t=Kai8A164X7FNQtl0psU7PQ
X (formerly Twitter)
宝玉 (@dotey) on X
去年 Jim Fan 对于 Q* 的预测,现在结合刚发布的 o1 来看基本上都是准确的!
Jim 将 Q* 和 AlphaGo 做了类比,猜测 Q* 可能类似于 AlphaGo,是通过与自己之前的版本进行对弈,自我对弈不断进步,甚至于架构都是类似的。
AlphaGo 的架构核心有四个组件:
1. 策略神经网络(Policy
Home
Powered by
BroadcastChannel
&
Sepia