专栏名称: 论智
专注于人工智能新技术、新应用
今天看啥  ›  专栏  ›  论智

Dropbox用机器学习,从海量图片中对文本进行检索

论智  · 公众号  ·  · 2018-10-12 18:29

文章预览

来源:Dropbox 编译:Bing Dropbox是Dropbox公司的在线存储服务,通过云计算实现互联网上的文件同步,用户可以存储并共享文件和文件夹。最近,研究人员在一次产品更新后,在用户的工作流中加入了人工智能模块,并加入了 光学字符识别(OCR) 技术。用户从这些变化中最明显的感受就是, 他们可以在图像或PDF文件中直接搜索英文文本。 从图像中(包括PDF)自动识别文本是一项前景广阔的技术。在Dropbox中,用户总共存储了超过200亿个图像和PDF文件,其中10%—20%是文本照片,例如收据和白色背景的图像,这些都是目前图像中文本识别的新对象。另外还有25%的PDF文件是扫描版文本,同样可以用作自动文本识别。 从计算机视觉的角度来看,虽然对人类来说,看真实的文件和 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览