cjzdaily
07:29 · Aug 31, 2024 · Sat
https://x.com/dotey/status/1826848241951858840?s=12&t=Kai8A164X7FNQtl0psU7PQ
X (formerly Twitter)
宝玉 (@dotey) on X
最近有个朋友跟我讨论技术问题,他在用个第三方的OCR的服务,用来提取发票上的文字为结构化数据。但收费较高,想自己实现一套,试了开源的PaddleOCR,识别可以,但是无法转成结构化的数据。
我建议他试试多模态的LLM,比如Gemini 1.5 Flash,用来做 OCR 效果非常好,可以在 Prompt
Home
Powered by
BroadcastChannel
&
Sepia