java 读取ppt文件_java使用poi读取ppt文件和poi读取excel、word示例

Apache的POI项目可以用来处理MS Office文档,codeplex上还有一个它的.net版本。POI项目可创建和维护操作各种基于OOXML和OLE2文件格式的Java API。大多数MS Office都是OLE2格式的。POI通HSMF子项目来支持Outlook,通过HDGF子项目来支持Visio,通过HPBF子项目来支持Publisher。

使用POI抽取Word简单示例:

要引入poi-3.7.jat和poi-scratchpad-3.7.ajr这两个包。

package msoffice;

import java.io.File;

import java.io.FileInputStream;

import java.io.IOException;

import java.io.InputStream;

import org.apache.poi.hwpf.HWPFDocument;

import org.apache.poi.hwpf.extractor.WordExtractor;

import org.apache.poi.hwpf.usermodel.CharacterRun;

import org.apache.poi.hwpf.usermodel.Paragraph;

import org.apache.poi.hwpf.usermodel.Range;

import org.apache.poi.hwpf.usermodel.Section;

public class Word {

// 直接抽取全部内容

public static String readDoc1(InputStream is) throws IOException {

WordExtractor extractor = new WordExtractor(is);

return extractor.getText();

}

//分章节Section、段落Paragraph、字符串CharacterRun抽取

public static void readDoc2(InputStream is) throws IOException {

HWPFDocument doc=new HWPFDocument(is);

Range r=doc.getRange();

for(int x=0;x

Section s=r.getSection(x);

for(int y=0;y

Paragraph p=s.getParagraph(y);

for(int z=0;z

CharacterRun run=p.getCharacterRun(z);

String text=run.text();

System.out.print(text);

}

}

}

}

public static void main(String[] args) {

File file = new File("/home/orisun/1.doc");

try {

FileInputStream fin = new FileInputStream(file);

String cont = readDoc1(fin);

System.out.println(cont);

fin.close();

fin = new FileInputStream(file);

readDoc2(fin);

fin.close();

} catch (IOException e) {

e.printStackTrace();

}

}

}

POI抽取PPT示例:

package msoffice;

import java.io.File;

import java.io.FileInputStream;

import java.io.IOException;

import java.io.InputStream;

import org.apache.poi.hslf.HSLFSlideShow;

import org.apache.poi.hslf.extractor.PowerPointExtractor;

import org.apache.poi.hslf.model.Slide;

import org.apache.poi.hslf.model.TextRun;

import org.apache.poi.hslf.usermodel.SlideShow;

public class PPT {

//直接抽取幻灯片的全部内容

public static String readDoc1(InputStream is) throws IOException{

PowerPointExtractor extractor=new PowerPointExtractor(is);

return extractor.getText();

}

//一张幻灯片一张幻灯片地读取

public static void readDoc2(InputStream is) throws IOException{

SlideShow ss=new SlideShow(new HSLFSlideShow(is));

Slide[] slides=ss.getSlides();

for(int i=0;i

//读取一张幻灯片的标题

String title=slides[i].getTitle();

System.out.println("标题:"+title);

//读取一张幻灯片的内容(包括标题)

TextRun[] runs=slides[i].getTextRuns();

for(int j=0;j

System.out.println(runs[j].getText());

}

}

}

public static void main(String[] args){

File file = new File("/home/orisun/2.ppt");

try{

FileInputStream fin=new FileInputStream(file);

String cont=readDoc1(fin);

System.out.println(cont);

fin.close();

fin=new FileInputStream(file);

readDoc2(fin);

fin.close();

}catch(IOException e){

e.printStackTrace();

}

}

}

Excel文件由多个Workbook组成,一个Workbook由多个Sheet组成。

POI抽取Excel简单示例:

package msoffice;

import java.io.File;

import java.io.FileInputStream;

import java.io.IOException;

import java.io.InputStream;

import java.util.Iterator;

import org.apache.poi.hssf.usermodel.HSSFCell;

import org.apache.poi.hssf.usermodel.HSSFRow;

import org.apache.poi.hssf.usermodel.HSSFSheet;

import org.apache.poi.hssf.usermodel.HSSFWorkbook;

import org.apache.poi.hssf.extractor.ExcelExtractor;

import org.apache.poi.poifs.filesystem.POIFSFileSystem;

import org.apache.poi.ss.usermodel.Row;

public class Excel {

//直接读取Excel的全部内容

public static String readDoc1(InputStream is)throws IOException{

HSSFWorkbook wb=new HSSFWorkbook(new POIFSFileSystem(is));

ExcelExtractor extractor=new ExcelExtractor(wb);

extractor.setFormulasNotResults(false);

extractor.setIncludeSheetNames(true);

return extractor.getText();

}

//读取时细化到Sheet、行甚至单元格

public static double getAvg(InputStream is)throws IOException{

HSSFWorkbook wb=new HSSFWorkbook(new POIFSFileSystem(is));

//获取第一张sheet

HSSFSheet sheet=wb.getSheetAt(0);

double molecule=0.0;

double denominator=0.0;

//按行遍历sheet

Iterator riter=sheet.rowIterator();

while(riter.hasNext()){

HSSFRow row=(HSSFRow)riter.next();

HSSFCell cell1=row.getCell(4);

HSSFCell cell2=row.getCell(4);

if(cell1.getCellType()!=HSSFCell.CELL_TYPE_NUMERIC){

System.err.println("数字类型错误!");

System.exit(-2);

}

if(cell2.getCellType()!=HSSFCell.CELL_TYPE_NUMERIC){

System.err.println("数字类型错误!");

System.exit(-2);

}

denominator+=Double.parseDouble(cell2.toString().trim());

molecule+=Double.parseDouble(cell2.toString().trim())*Float.parseFloat(cell1.toString().trim());

}

return molecule/denominator;

}

public static void main(String[] args){

File file = new File("/home/orisun/3.xls");

try{

FileInputStream fin=new FileInputStream(file);

String cont=readDoc1(fin);

System.out.println(cont);

fin.close();

fin=new FileInputStream(file);

System.out.println("加权平均分"+getAvg(fin));

fin.close();

}catch(IOException e){

e.printStackTrace();

}

}

}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/366233.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vue lang_新疆人的“lang”是“浪”吗?

小编:“老王,天气这么热,过几天我们几个人约上要到巩乃斯lang起呢也享受一下避暑生活么,你去不去?“老王:”这个礼拜六礼拜天都有事呢礼拜六我乌什塔拉的姨娘家出嫁丫头呢礼拜天五号渠的阿哥家给娃娃娶媳妇…

js将canvas保存成图片并下载

<canvas id"canvas" width"400" height"400"></canvas> <div><button id"save">保存</button> </div>var arr [{locations:[[0,0],[200,200],[0,400]],color:"red"},{locations:[[0,0…

如果Java快死了,那么它肯定看起来非常健康

Java快要死了的奇怪但流行的断言只能在没有证据的情况下提出&#xff0c;而不是因为它。 在酷孩子闲逛的论坛&#xff08;Hacker News&#xff0c;Reddit等&#xff09;中反复出现的偏见与Java语言背道而驰。 人们常常反复感叹 Java冗长而流行。 虽然我接受第一个描述符&#…

java 图片去除黑边_根据 Map 上的变量绘制彩色和形状的点时,保持符号的黑色边框(geom_point)...

我的问题与this thread有些相关&#xff0c;但我想为每个符号实际上都有黑色边框&#xff0c;因为我有符号重叠的实例&#xff0c;我认为有边框会有所帮助 . 但是&#xff0c;我的颜色和形状基于geom_point中美学内部的变量&#xff0c;因此使用shape 21和color NA的解决方案…

使用GreenDao 添加字段,删除表,新增表操作

GreenDao 给我个人感觉 比一般的ORM框架要好很多&#xff0c;虽然说上手和其他的比起来&#xff0c;较复杂&#xff0c;但是如果使用熟练以后&#xff0c;你会爱上这个框架的 用这些ORM 框架给我的感觉都是&#xff0c;当升级时&#xff0c;都需要进行数据库所有表的删除&#…

linux下log日志乱码_如何用 Linux 技巧大大提高工作效率?

作者 | 守望先生责编 | 屠敏前言Linux中的一些小技巧可以大大提高你的工作效率&#xff0c;本文就细数那些提高效率或者简单却有效的Linux技巧。命令编辑及光标移动这里有很多快捷键可以帮我们修正自己的命令。接下来使用光标二字代替光标的位置。删除从开头到光标处的命令文本…

安卓java桌面图标程序_android如何定制默认桌面上应用程序和shortcut图标 | 学步园...

可以在res/xml/default_workspace.xml文件中增加或删除tag标记块如果想删除默认browser图标&#xff1a;launcher:packageName"com.android.browser"launcher:className"com.android.browser.BrowserActivity"launcher:screen"2"launcher:x"…

Go语言基础之15--文件基本操作

一、文件读写 1.1 os.File os.File封装所有文件相关操作&#xff0c; 是一个自定义的struct。 a. 打开一个文件进行读操作&#xff1a; os.Open(name string) (*File, error) Open是以读的方式打开文件&#xff08;底层调用的是Openfile函数&#xff09;。 b. 关闭一个文件&…

Event flow

考虑这么个例子&#xff1a; <div><button id"btn">Click Me!</button> </div> 哪怕一个web开发的初学者都会知道&#xff0c;当我们鼠标在button上点击时&#xff0c;会在button上触发一个click事件。但是&#xff1a; button是div的一个子…

使用vux组件库常见报错($t)处理

错误一&#xff1a; [Vue warn]: Property or method "$t" is not defined on the instance but referenced during render. Make sure that this property is reactive, either in the data option, or for class-based components, by initializing the property.…

UIBOT调试时步入的快捷键_远程调试 bug ,快速定位问题

情况是这样的&#xff0c;现在的产品出现了一个 bug ,需要及时排查快速解决&#xff0c;你是怎么样解决的呢&#xff1f;解决&#xff1a;登陆服务器&#xff0c;查看日志&#xff0c;看一下哪里有问题&#xff0c;然后本地运行程序进行debug ,解决后&#xff0c;在重新打包部署…

Spring面向方面的编程

介绍 在理想的面向对象系统中&#xff0c;我们希望将每个对象设计为执行一项特定任务。 但是&#xff0c;除了执行其主要任务外&#xff0c;对象还执行被动任务&#xff0c;例如日志记录&#xff0c;事务&#xff0c;安全性&#xff0c;缓存等。这些被动活动是必需的&#xff0…

vim ctags java源码_如何使用vim的插件Ctags查看Linux源码

一.ubuntu下安装Linux内核源码(1).查看自己的内核版本(2).查看源内的内核源码类表(3).下载源码(4).进入/usr/src(5).解压下载的文件到用户主二.安装vim插件Ctags和使用插件的介绍Ctags工具是用来遍历源代码文件生成tags文件&#xff0c;这些tags文件能被编辑器或其它工具用来快…

MySql - GROUP BY 和 HAVING关键字

本文主要针对GROUP BY 和 HAVING两个关键字进行分析 使用测试表如下&#xff1a; 测试前&#xff0c;只知道GROUP BY 这个关键字的作用是根据一个字段进行分组&#xff0c;去重。HAVING对分组设置条件。 具体分组规则&#xff0c;设置条件不清楚。 测试开始 首先 单独使用GROUP…

javascript引擎工作原理

1. 什么是JavaScript解析引擎&#xff1f; 简单地说&#xff0c;JavaScript解析引擎就是能够“读懂”JavaScript代码&#xff0c;并准确地给出代码运行结果的一段程序。比方说&#xff0c;当你写了 var a 1 1; 这样一段代码&#xff0c;JavaScript引擎做的事情就是看懂&#…

浏览器缓存原理以及本地存储

作为一名前端工作人员&#xff0c;前端的缓存知识是必须掌握的&#xff0c;因为一个网站打开网页的速度直接关系到用户体验&#xff0c;用户粘度&#xff0c;而提高网页的打开速度有很多方面需要优化&#xff0c;其中比较重要的一点就是利用好缓存&#xff0c;缓存文件可以重复…

linux shell 宏定义_linux内核修炼之系统调用

fork()这个系统调用是有两个返回值的&#xff0c;在子进程中的返回值是0&#xff0c;在父进程中的返回值是PID&#xff0c;如下图 fork一次 返回两次关于0x80中断和特权级检查在mian函数的sched_init()函数中调用宏&#xff1a;set_system_gate(0x80,&system_call);将0x80号…

使用JPA和Hibernate有效删除数据

您可能会遇到必须对关系数据库中存储的大量数据集执行批量删除的情况。 如果您将JPA与Hibernate一起用作基础OR映射器&#xff0c;则可以尝试通过以下方式调用EntityManager的remove&#xff08;&#xff09;方法&#xff1a; public void removeById(long id) {RootEntity ro…

java21个知识点重点_java21个知识点重点

http://blog.csdn.net/jerroluo/article/details/520025851. JVM相关(包括了各个版本的特性)对于刚刚接触Java的人来说&#xff0c;JVM相关的知识不一定需要理解很深&#xff0c;对此里面的概念有一些简单的了解即可。不过对于一个有着3年以上Java经验的资深开发者来说&#xf…

Django模型中字段属性choice使用

今天设计models时&#xff0c;用到了choice这个属性&#xff0c;用来限制用户做出选择的范围。比如说性别的选择&#xff08;男或女&#xff09;。 class User&#xff08;AbstractUser&#xff09;&#xff1a;。。。sex models.CharField(verbose_name性别,max_length5,choi…