专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
今天看啥  ›  专栏  ›  量子位

微软开源Markdown工具爆了:支持Office文档,可接多模态LLM直出报告

量子位  · 公众号  · AI  · 2025-01-20 13:04
    

文章预览

奇月 发自 凹非寺 量子位 | 公众号 QbitAI 微软官方开源了一款文件格式转换工具—— MarkItDown ! 它不仅可以将常见的Office文档(Word、PowerPoint、 Excel )、PDF、图像、音频等转换为对大模型更友好的 Markdown 格式。 而且还支持集成像GPT-4o这样的 多模态LLM ,可以直接对图片、音频文件进行更高级的处理,比如快速输出商业报告。 以后开发者们上传训练数据、微调LLM应用都更方便了。 发布仅两个月,它的GitHub收藏数就超过了 3万 。 具体来说,它支持的文件格式包括: PDF PowerPoint Word Excel 图像(含OCR和EXIF元数据) 音频(含EXIF元数据和转录) HTML 其他基于文本的格式(CSV, JSON, XML) 压缩包 使用方式上,MarkItDown提供了 命令行、Python API 以及 Docker 三种形式。 热心网友Aark Kodur还制作了 在线版 的网页应用,点开网址就能直接试用。 可接多模态LLM直接生成报告 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览