Java读取HTML传人文件,java读取html文件并获取body中所有的标签及内容的案例.pdf

java读读取取html文文件件,并并获获取取body中中所所有有的的标标签签及及内内容容的的案案例例

这里的获取的是html文件中body 中的所有标签以及内容

package com.lmt.service.file;

import java.io.BufferedReader;

import java.io.File;

import java.io.FileInputStream;

import java.io.InputStreamReader;

import java.io.Reader;

import org.springframework.stereotype.Component;

import com.lmt.config.UrlConstants;

Component

public class ParseFile {

/**

* 解析html文件

* param file

* return

*/

public String readHtml(File file){

String body = "";

try {

FileInputStream iStream = new FileInputStream(file);

Reader reader = new InputStreamReader(iStream);

BufferedReader htmlReader = new BufferedReader(reader);

String line;

boolean found = false;

while (!found && (line = htmlReader.readLine()) != null) {

if (line.toLowerCase().indexOf("

的前面可能存在空格

found = true;

}

}

found = false;

while (!found && (line = htmlReader.readLine()) != null) {

if (line.toLowerCase().indexOf("

found = true;

} else {

// 果存在图片,则将相对路径转换为绝对路径

String lowerCaseLine = line.toLowerCase();

if (lowerCaseLine.contains("src")) {

//这里是定义图片的访问路径

String directory = "D:/test";

// 果路径名不以反斜杠结尾,则手动添加反斜杠

/*if (!directory.endsWith("\\")) {

directory = directory + "\\";

}*/

// line = line.substring(0, lowerCaseLine.indexOf("src") + 5) + directory +

line.substring(lowerCaseLine.indexOf("src") + 5);

/*String filename = extractFilename(line);

line = line.substri

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/538111.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

插件translator_Zotero Jasminum 插件的更新记录

Jasminum 插件发布后 林知:简单的Zotero CNKI 中文插件​zhuanlan.zhihu.com受到一些同学的关注,同时也收到许多反馈。我写这个插件的初衷就是想让大家在Zotero上能更方便的使用知网,尤其是人文社科相关专业的同学,他们尤其依赖中…

Tomcat的三个端口

8005 <Server port"8005" shutdown"SHUTDOWN"> 关闭tomcat通信接口 8009 <Connector port"8009" protocol"AJP/1.3" redirectPort"8443"/> 与其他http服务器通信接口&#xff0c;用于http服务器集合 8080…

计算机一级考试word题主要,2017年计算机一级考试word题及答案

1 / 7 2017 年计算机一级考试 及答案 计算机还是人们的学习工具和生活工具。借助家用计算机、个人计算机、计算机网、数据库系统和各种终端设备&#xff0c;那么 2017 年计算机一级考试 及答案有哪一些 ?下面是 才小编收集整理的 2017 年计算机一级考试 及答案&#xff0c;欢迎…

ubuntu18.04 用xhell连接失败

ifconfig命令有用之后&#xff0c;又发现xhell连接不上ubuntu18.04版本的虚拟机&#xff0c;原因是ubuntu18.04默认没有安装ssh服务。 使用以下命令安装 sudo apt-get install openssh-server 安装完成后,启动ssh服务 sudo /etc/init.d/ssh start 查看ssh进程&#xff0c;若出现…

extjs中元数据_json – 如何配置ExtJS 4 Store(代理和阅读器)来读取元数据

我的问题是除了totalRecords之外如何获取元数据,在我的例子中它是版本,代码,searchquery(请查看json).{"result": {"version":"1","code":"200","searchquery": "false","totalRecords": &qu…

伍德里奇计量经济学第五版第四章计算机操作,伍德里奇计量经济学第四章

伍德里奇计量经济学第四章2016年10⽉25⽇ 星期⼆ 下午10:21 Page 1User: ⺩建英name: log: /Users/wangjianying/Desktop/Chapter 4 Computer exercise.smcllog type: smclopened on: 25 Oct 2016, 22:20:411. do "/var/folders/qt/0wzmrhfd3rb93j2h5hhtcwqr0000gn/T//SD1…

2018百度之星程序设计大赛 - 资格赛 1002 子串查询

子串查询 Accepts: 1262 Submissions: 5335 Time Limit: 3500/3000 MS (Java/Others) Memory Limit: 262144/262144 K (Java/Others) Problem Description 度度熊的字符串课堂开始了&#xff01;要以像度度熊一样的天才为目标&#xff0c;努力奋斗哦&#xff01; 为了检验你是否…

mysql sleep详解_MySQL中sleep函数的特殊现象示例详解

前言MySQL中的系统函数sleep&#xff0c;实际应用的场景不多&#xff0c;一般用来做实验测试&#xff0c;昨天在测试的时候&#xff0c;意外发现sleep函数的一个特殊现象。如果在查询语句中使用sleep函数&#xff0c;那么休眠的时间跟返回的记录有关。如下测试所示&#xff1a;…

使用maven构建dubbo服务的可执行jar包

maven 项目结构 <build><!-- 使用dubbo推荐的方法&#xff0c;打包成jar&#xff0c;调用main方法启动 --><finalName>admin-service-user</finalName><resources><resource><targetPath>${project.build.directory}/classes</ta…

计算机网络安全应具备的功能,2016计算机专业知识:网络系统安全体系具备功能攻击方法...

【导读】为了帮助广大考生更好的备考&#xff0c;中公事业单位考试网提供2016年计算机专业知识《网络系统安全体系具备功能攻击方法》学习&#xff0c;为考生定制计算机基础知识复习计划。一、网络系统安全体系具备功能1.访问控制;2.检查安全漏洞;3.攻击监控;4.加密通讯;5.认证…

Linux的标准I/O和管道

标准输入输出与管道 1、标准输入和输出程序&#xff1a;指令数据指令&#xff1a;计算、加减乘除数据&#xff1a;输入数据、输出数据2、在Linux中每一个打开的文件都会分配一个当前进程中唯一的文件描述符&#xff0c;用来标识文件的状态fd:file descripor3、Linux提供给程序…

页面url带参数_微信小程序云开发教程微信小程序的JS高级页面间数据传递

同学们大家好&#xff0c;我是小伊同学&#xff0c;上一节课我们讲解了全局数据的读写方法&#xff0c;那么在页面间同样需要数据交互&#xff0c;今天我们就来学习这部分内容。在微信小程序中&#xff0c;我们常常需要将数据在页面之间进行传递&#xff0c;比如用户的身份信息…

软件测试员对英语,软件测试工程师英语面试题

以下是软件测试工程师部分英语面试中的参考回答&#xff0c;仅提参考&#xff1a;Interview English&#xff1a;一&#xff0c;Why are you interested in working for our company?1。Because your company has a good sales record.2。Because your operations are global,…

OpenGL——二维几何变换

平移、旋转、缩放的实现 #include<iostream> #include <math.h> #include<Windows.h> #include <GL/glut.h>using namespace std;GLsizei winWidth 600, winHeight 600;GLfloat xwcMin 0.0, xwcMax 225.0; GLfloat ywcMin 0.0, ywcMax 225.0;cla…

在Eclipse 中打开当前文件夹

原文连接&#xff1a;https://www.cnblogs.com/panie2015/p/5985053.html ------------------------------------------------------------------------ 最近试过好多次&#xff0c;安装插件来 在Eclipse 中打开当前文件所在文件夹&#xff0c;结果总是不甚如意。 烦躁了&…

清华大学计算机系主任应明生,清华大学计算机科学与技术系导师简介:应明生...

对考生而言&#xff0c;充分了解高校、专业以及师资情况是一项最基础、最关键的工作。以下是中公考研小编为大家整理的“清华大学计算机科学与技术系导师简介&#xff1a;应明生”的相关信息&#xff0c;希望对同学们有所帮助。姓名&#xff1a;应明生职称&#xff1a;教授邮件…

在VS2013平台下如何快速解决c++代码内存泄漏问题

在学习FPS3000人脸关键点定位算法时&#xff0c;发现github上的源码&#xff0c;存在大量的内存泄漏问题&#xff0c;在训练的时发现内存一直在增长&#xff0c;测试的时候也存在内存无法彻底释放的问题。 一直以为是存放模型参数vector<class>结构的问题&#xff0c; 采…

python请简述构造函数和析构函数的作用_python – 构造函数和析构函数如何工作?...

我正在尝试理解这段代码&#xff1a;class Person:Represents a person population 0def __init__(self,name)://some statements and population 1def __del__(self)://some statements and population - 1def sayHi(self):grettings from personprint Hi My name is %s % s…

服务器应用日志清理,Linux下Tomcat日志定期清理

服务器上的tomcat的catalina.out文件越来越大&#xff0c;查看起来很不方便&#xff0c;以前每次都是想起来的时候手工清理一下(cat /dev/null > catalina.out)&#xff0c;后来发现了logratate这个工具&#xff0c;Ubuntu下的mysql,nginx好像也是用的这个工具还定期整理log…

dubbo简易监控中心安装

dubbo简易监控中心也是dubbo服务应用。 为什么叫“简易”&#xff1f;这是阿里巴巴定义的&#xff0c;意思是功能不多但够用&#xff0c;可以自己扩展。 1、下载dubbo源码&#xff0c;要与使用的dubbo版本一致。 https://github.com/alibaba/dubbo/releases 2、maven instal…