java中operationBox_Java使用PDFBox开发包实现对PDF文档内容编辑与保存

pdfbox开发包下载地址:http://pdfbox.apache.org/

程序实现了PDF文档的创建,读入,与修改PDF内容并保存。

可能有个前提,PDF文档不是加密的,如果加密怎么办,我没研究过!

源代码如下:

package com.gloomyfish.ups.pdf.reader;

import java.io.File;

import java.io.IOException;

import java.io.OutputStream;

import java.util.List;

import org.apache.pdfbox.cos.COSArray;

import org.apache.pdfbox.cos.COSString;

import org.apache.pdfbox.exceptions.COSVisitorException;

import org.apache.pdfbox.pdfparser.PDFStreamParser;

import org.apache.pdfbox.pdfwriter.ContentStreamWriter;

import org.apache.pdfbox.pdmodel.PDDocument;

import org.apache.pdfbox.pdmodel.PDPage;

import org.apache.pdfbox.pdmodel.common.PDStream;

import org.apache.pdfbox.pdmodel.edit.PDPageContentStream;

import org.apache.pdfbox.pdmodel.font.PDFont;

import org.apache.pdfbox.pdmodel.font.PDType1Font;

import org.apache.pdfbox.util.PDFOperator;

import org.apache.pdfbox.util.PDFTextStripper;

/**

* http://pdfbox.apache.org/

*

* @author fish

*

*/

public class PDFReader {

public PDFReader()

{

createHelloPDF();

readPDF();

editPDF();

}

public void createHelloPDF() {

PDDocument doc = null;

PDPage page = null;

try {

doc = new PDDocument();

page = new PDPage();

doc.addPage(page);

PDFont font = PDType1Font.HELVETICA_BOLD;

PDPageContentStream content = new PDPageContentStream(doc, page);

content.beginText();

content.setFont(font, 12);

content.moveTextPositionByAmount(100, 700);

content.drawString("Hello");

content.endText();

content.close();

doc.save("D:\\gloomyfish\\pdfwithText.pdf");

doc.close();

} catch (Exception e) {

System.out.println(e);

}

}

public void readPDF()

{

PDDocument helloDocument;

try {

helloDocument = PDDocument.load(new File(

"D:\\gloomyfish\\pdfwithText.pdf"));

PDFTextStripper textStripper = new PDFTextStripper();

System.out.println(textStripper.getText(helloDocument));

helloDocument.close();

} catch (IOException e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

}

public void editPDF() {

try {

// pdfwithText

PDDocument helloDocument = PDDocument.load(new File("D:\\gloomyfish\\pdfwithText.pdf"));

// PDDocument helloDocument = PDDocument.load(new File("D:\\gloomyfish\\hello.pdf"));

// int pageCount = helloDocument.getNumberOfPages();

PDPage firstPage = (PDPage)helloDocument.getDocumentCatalog().getAllPages().get(0);

// PDPageContentStream content = new PDPageContentStream(helloDocument, firstPage);

PDStream contents = firstPage.getContents();

PDFStreamParser parser = new PDFStreamParser(contents.getStream());

parser.parse();

List tokens = parser.getTokens();

for (int j = 0; j < tokens.size(); j++)

{

Object next = tokens.get(j);

if (next instanceof PDFOperator)

{

PDFOperator op = (PDFOperator) next;

// Tj and TJ are the two operators that display strings in a PDF

if (op.getOperation().equals("Tj"))

{

// Tj takes one operator and that is the string

// to display so lets update that operator

COSString previous = (COSString) tokens.get(j - 1);

String string = previous.getString();

string = string.replaceFirst("Hello", "Hello World, fish");

//Word you want to change. Currently this code changes word "Solr" to "Solr123"

previous.reset();

previous.append(string.getBytes("ISO-8859-1"));

}

else if (op.getOperation().equals("TJ"))

{

COSArray previous = (COSArray) tokens.get(j - 1);

for (int k = 0; k < previous.size(); k++)

{

Object arrElement = previous.getObject(k);

if (arrElement instanceof COSString)

{

COSString cosString = (COSString) arrElement;

String string = cosString.getString();

string = string.replaceFirst("Hello", "Hello World, fish");

// Currently this code changes word "Solr" to "Solr123"

cosString.reset();

cosString.append(string.getBytes("ISO-8859-1"));

}

}

}

}

}

// now that the tokens are updated we will replace the page content stream.

PDStream updatedStream = new PDStream(helloDocument);

OutputStream out = updatedStream.createOutputStream();

ContentStreamWriter tokenWriter = new ContentStreamWriter(out);

tokenWriter.writeTokens(tokens);

firstPage.setContents(updatedStream);

helloDocument.save("D:\\gloomyfish\\helloworld.pdf"); //Output file name

helloDocument.close();

//PDFTextStripper textStripper = new PDFTextStripper();

//System.out.println(textStripper.getText(helloDocument));

//helloDocument.close();

} catch (IOException e) {

// TODO Auto-generated catch block

e.printStackTrace();

} catch (COSVisitorException e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

}

public static void main(String[] args) {

new PDFReader();

}

}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/530298.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java访问权限最高_java 访问权限

Java语言中的访问权限修饰符有4种&#xff0c;但是仅有3个关键字&#xff0c;因为不写访问权限&#xff0c;在Java中被称为默认权限&#xff0c;或同包权限&#xff0c;本文中以(default)代替。下面按照权限从小到大的顺序对4中访问权限分别介绍。class我个人&#xff0c;我有很…

java中 queryparam_java – 何时使用@QueryParam和@PathParam

我不是问这里已经问过的问题&#xff1a;What is the difference between PathParam and QueryParam这是一个“最佳实践”或常规问题。什么时候使用PathParam和QueryParam。我可以想到的是&#xff0c;决定可能使用两者来区分信息模式。让我在下面说明我的LTPO – 不完美的观察…

java中fork函数_java中的forkjoin框架的使用

fork join框架是java 7中引入框架&#xff0c;这个框架的引入主要是为了提升并行计算的能力。fork join主要有两个步骤&#xff0c;第一就是fork&#xff0c;将一个大任务分成很多个小任务&#xff0c;第二就是join&#xff0c;将第一个任务的结果join起来&#xff0c;生成最后…

Java h264起始码_h.264 – 使用H264视频的起始码

有两种H.264流格式,有时也称为>附件B(在原始H.264流中找到)> AVCC(在像MP4这样的容器中找到)H.264流由NAL(包装单位)组成(1)附件B&#xff1a;在每个NAL单元的字节[x00] [x00] [x00] [x01]之前有4字节的起始码.[start code]--[NAL]--[start code]--[NAL] etc(2)AVCC&…

java中已定义类型car_Java 8 习惯用语(8):Java 知道您的类型

Java™8是第一个支持类型推断的 Java 版本&#xff0c;而且它仅对 lambda 表达式支持此功能。在 lambda表达式中使用类型推断具有强大的作用&#xff0c;它将帮助您做好准备以应对未来的 Java版本&#xff0c;在今后的版本中还会将类型推断用于变量等更多可能。这里的诀窍在于恰…

ATM柜员机JAVA课程设计_ATM柜员机学年论文设计(Java课程设计)

内容简介&#xff1a;ATM柜员机学年论文设计(Java课程设计)&#xff0c;共23页&#xff0c;4599字&#xff0c;附源程序。一&#xff0e; 程序介绍3二&#xff0e; 开发环境搭建31. MyEclipse 5.5.1 GA安装32. MyEclipse Designer 图形设计插件安装33. MySQL数据库安装4三&…

mysql 结果集什么意思_结果集中的mysql“和”逻辑

假设我有一个类似以下的数据集&#xff1a;table fooid | employeeType | employeeID-------------------------1 | Developer | 12 | Developer | 23 | Developer | 34 | Manager | 15 | Manager | 46 | Manager | 57 | CEO | 18 | CEO | 6我想运行一个查询,该查询将返回所有e…

opencv java 去干扰_java - OpenCV Java修补图像格式要求 - 堆栈内存溢出

一直试图让修复工作在Android上进行&#xff0c;int height (int) viewMat.size().height;int width (int) viewMat.size().width;Mat maskMat new Mat();maskMat.create(viewMat.size(), CvType.CV_8U);maskMat.setTo(bColor);Point r1 new Point(width/2-width/10, heigh…

java中 set集合_第8篇 Java中的集合(Set)

Java 集合的 Set 接口Set类型与List类型的区别Set&#xff1a; 无序、不可重复List&#xff1a; 有序、可重复1、HashSetHashSet的存储结构&#xff1a;HashMap特点&#xff1a;HashSet通过比较存放的哈希码(hashCode)来确定对象存放的位置当两个对象的哈希值相等时&#xff0c…

android mysql实现登录注册_android简单登陆和注册功能实现+SQLite数据库学习

android简单登陆和注册功能实现SQLite数据库学习发布时间&#xff1a;2018-07-04 17:23,浏览次数&#xff1a;1027, 标签&#xff1a;androidSQLite这里我只是建立了一个用简单的存储用户名和密码的表单MyDBHelper.java<>public class MyDBHelper extends SQLiteOpenHelp…

java web 来源页_Java:Java Web--分页效果

先来看一看分页的实现原理万能公式.jpg项目目录.PNG首先,新建Java Web项目一. 梳理业务逻辑重定向到URL(跳转到StudentViewAction页面)//index.jsp页面1.从页面接收可变的值2.接收值有问题时,初始化为13.如果没有问题,把String类型接收值强转成Integer4.实例DAO方法,调用findSt…

java 浏览器 安全_安全策略-IE浏览器防黑十大秘籍

1.管理好Cookie在IE6.0中&#xff0c;打开“工具”→“Internet选项”→“隐私”对话框&#xff0c;这里设定了“阻止所有Cookie”、“高”、“中高”、“中”、“低”、“接受所有Cookie”六个级别&#xff0c;你只要拖动滑块就可以方便地进行设定&#xff0c;而点击下方的“编…

什么是java中的枚举法_enum枚举javajava,enum枚举使用详解+,总结

enum 的全称为 enumeration&#xff0c; 是 JDK 1.5 中引入的新特性&#xff0c;存放在 java.lang 包中。下面是我在使用 enum 过程中的一些经验和总结。原始的接口定义常量语法(定义)创建枚举类型要使用 enum 关键字&#xff0c;隐含了所创建的类型都是 java.lang.Enum 类的子…

java 审计 漏洞函数_Java Web代码审计流程与漏洞函数

常见框架与组合常见框架Struts2SpringMVCSpring Boot框架执行流程View层&#xff1a;视图层Controller层&#xff1a;表现层Service层&#xff1a;业务层Dom层&#xff1a;持久层常见组合SpringStruts2HibernateSpringSpringMVCMybatisSpring BootMybatis代码审计方法根据业务功…

java前期_【JAVA】前期环境配置

一、java的环境配置及在eclipse中如何安装JRE或JDK环境eclipse下载地址&#xff1a;JDK下载地址&#xff1a;1)安装JDK或JRE注&#xff1a;JDK使用与开发者运用&#xff0c;其中包含了开发环境和运行环境。而JRE只包含了java的运行环境。2)配置设置执行路径UNiX&#xff1a;在C…

php截取指定字符串之后,php截取字符串(截取指定字符串之间的字符串)

一、PHP截取两个指定字符后边的字符$a "123abc#456";$b (strpos($a,""));$c (strpos($a,"#"));echo substr($a,$b1,$c-1);二、常用截取字符串技巧。//构造字符串$str "ABCDEFGHIJKLMNOPQRSTUVWXYZ";echo "原字符串&#xff1a;…

php 日志按天截取,Laravel 日志管理:按日期切割日志

日志存储Laravel 默认的错误文件记录在一个文件里&#xff0c;随着时间的推移&#xff0c;此文件将会变得巨大&#xff0c;不方便查阅。我们可以通过修改 config/app.php 配置文件中的 log 选项来配置 Laravel 使用的存储机制。如果你希望每天产生日志都存放在不同的文件中&…

php xcache 方法,php xcache 解密

NO.2 /index.php?actionmd5webcrack 很强大,需要登陆论坛才能解密,点击右上角的“register”进行注册,都是一些简单的单词,应该能看懂吧?...() A.PHP B.JSP D.Ajax 4.配置 ...假设$aarray(‘x’,’y’);,则$aarray_pad...xcache 15 四个模块 Admin Common Member Article 用户…

ecshop category.php?id=4,categoryall.php

//by 琅琊源码 QQ:27392236define(IN_ECS, true);require dirname(__FILE__) . /includes/init.php;if ((DEBUG_MODE & 2) ! 2) {$smarty->caching true;}require ROOT_PATH . /includes/lib_area.php;$area_info get_area_info($province_id);$area_id $area_info[r…

php 获取key的位置,PHP获取当前所在目录位置的方法

本文实例讲述了PHP获取当前所在目录位置的方法。分享给大家供大家参考。具体分析如下&#xff1a;如果要获取脚本文件的目录&#xff0c;要应用函数getcwd()来实现。函数声明如下&#xff1a;string getcwd ( void ) ;成功执行后返回当前目录字符串&#xff0c;失败返回FALSE。…