专栏名称: 鸭哥聊Java
回复关键字:666 ,领取免费简历模板,Java面试题,Java编程视频等。本号内容涵盖Java源码,JVM源码,Dubbo源码,Spring源码,Spring Cloud微服务架构,分布式高并发架构技术,MySQL性能调优等。
今天看啥  ›  专栏  ›  鸭哥聊Java

SpringBoot + Apache tika 轻松实现各种文档内容解析

鸭哥聊Java  · 公众号  ·  · 2024-06-24 14:00
作者:不可食用盐链接:https://juejin.cn/post/7252159509848899640Apache tika是Apache开源的一个文档解析工具。Apache Tika可以解析和提取一千多种不同的文件类型(如PPT、XLS和PDF)的内容和格式,并且Apache Tika提供了多种使用方式,既可以使用图形化操作页面(tika-app),又可以独立部署(tika-server)通过接口调用,还可以引入到项目中使用。本文演示在spring boot 中引入tika的方式解析文档。如下:引入依赖在spring boot 项目中引入如下依赖:dependencyManagement> dependencies> dependency> groupId>org.apache.tikagroupId> artifactId>tika-bomartifactId> version>2.8.0version> type>pomtype> scope>importscope> dependency> dependencies> dependencyManagement> dependency> groupId>org.apache.tikagroupId> artifactId>tika-coreartifactId> dependency> dependency> groupId>org.apache.tikagroupId> artifactId>ti ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照