cjzdaily
17:55 · Jan 13, 2025 · Mon
https://x.com/op7418/status/1878635303155720510?s=12
X (formerly Twitter)
歸藏(guizang.ai) (@op7418) on X
Moondream 是一个 非常强大而且小巧的视觉模型
0.5B INT4 版本甚至只有 400M,
支持结构化 OCR 输出、图片描述、物体检测和位置标注
最近更是更新了 视线检测,给一段视频就可以看到视频中每个人的视线
这个很适合用来恶搞和意图检测
Home
Powered by
BroadcastChannel
&
Sepia