专栏名称: 宝玉xp
前微软Asp.Net最有价值专家 互联网科技博主 我是宝玉。
今天看啥  ›  专栏  ›  宝玉xp

之前有一篇文章《处理数百万份 PDF,以及为何 Gemini 2-20250209031030

宝玉xp  · 微博  · AI  · 2025-02-09 03:10
    

文章预览

2025-02-09 03:10 本条微博链接 之前有一篇文章《处理数百万份 PDF,以及为何 Gemini 2.0 能改变一切 [译]》讲借助多模态的语言模型例如 Gemini 2.0 就可以低成本进行复杂 PDF 的解析。 今天又看到一篇《为什么用多模态语言模型对 PDF 做 OCR 表现并没有那么好?》,讲实际上面对现实场景,还是有很多细节上的问题,以及安全上的风险,比如说语言模型会因为图像分割时的问题导致识别错误,或者因为语言模型的特点,“自作聪明 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览