文章预览
如何使用 Java 读取 Excel、"doc"、"docx"、"pdf" 和 "txt" 文件。 在 Java 开发中,我们经常需要读取不同类型的文件,包括 Excel 表格文件、"doc" 和 "docx" 文档文件、PDF 文件以及纯文本文件。 其中最常用的是 Apache POI 库。Apache POI 是一个流行的 Java 库,提供了许多 API 来读取和写入 Microsoft Office 文档,包括 Excel、Word和 PowerPoint 等。 本文将介绍如何使用 Java 读取这些不同类型的文件。(本文的方法可供参考,还有其它方法读者自行查阅。) 1.举个栗子 以下是本人在开发过程中,读取"doc"、"docx"、"pdf" 和 "txt" 文件的代码例子,后面将详细解释。 txt文件读取不多说,用流读取。 import org.apache.pdfbox.pdmodel.PDDocument; import org.apache.pdfbox.text.PDFTextStripper; import org.apache.poi.hwpf.extractor.WordExtractor; import org.apache.poi.xwpf.extractor.XWPFWordExtractor; import org.apache.poi.xwpf.usermodel.XWPFD
………………………………