java爬取小说

使用Java爬取网站:http://www.shicimingju.com的小说内容

代码详解
1.在本地创建存储位置
2.编写正则表达式
3.循环获取内容
4.把内容存入文件夹中
5.判断成功或失败

效果演示
在这里插入图片描述
代码展示

package text;import java.io.BufferedReader;import java.io.BufferedWriter;import java.io.File;import java.io.FileOutputStream;import java.io.InputStreamReader;import java.io.OutputStreamWriter;import java.net.URL;import java.util.regex.Matcher;import java.util.regex.Pattern;public class text {public static void main(String[] args) {//创建文件存放内容File file = new File("D:\\Text\\text.txt");//正则表达式String regex_content = "<p.*?>(.*?)</p>";String regex_title = "<title>(.*?)</title>";Pattern p_content = Pattern.compile(regex_content);Pattern p_title = Pattern.compile(regex_title);Matcher m_content;Matcher m_title;//循环获取内容for (int i = 1; i <= 120; i++) {System.out.println("第" + i + "章开始下载。。。");try {URL url = new URL("http://www.shicimingju.com/book/sanguoyanyi/" + i+ ".html");BufferedReader reader = new BufferedReader(new InputStreamReader(url.openStream(), "utf8"));String str = null;BufferedWriter writer = new BufferedWriter(new OutputStreamWriter(new FileOutputStream(file, true)));while ((str = reader.readLine()) != null) {m_title = p_title.matcher(str.toString());m_content = p_content.matcher(str.toString());boolean isEx = m_title.find();if (isEx) {String title = m_title.group();title = title.replace("<title>", "").replace("</title>", "");System.out.println(title);writer.write("第" + i + "章:" + title + "\n");}while (m_content.find()) {String content = m_content.group();content = content.replace("<p>", "").replace("</p>", "").replace("&nbsp;", "").replace("?", "");//存内容writer.write(content + "\n");}}System.out.println("第" + i + "章下载完成.........");writer.write("\n\n");writer.close();reader.close();} catch (Exception e) {System.out.println("很遗憾,本次下载失败!!!");e.printStackTrace();}}}}

了解更多关注我哟!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/565441.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

智能家居(3)智能交互的竞品分析

智能家居系统与产品的交互方式&#xff0c;早已从物理按键、遥控操作发展为以触摸面板手机APP作为主要的交互方式&#xff0c;并已经实现了语音交互、生物识别等新技术的导入&#xff0c;未来可能会流行基于视觉的交互方式、基于机器学习的无感交互方式。融合这些交互方式的多模…

java爬取单张图片

我们经常需要在网页上获取一些图片&#xff0c;有的图片我们是可以直接下载使用&#xff0c;有的图片需要我们登陆账号甚至付费下载&#xff0c;所以在此我写了一个使用Java爬取任意网页单张图片的爬虫。 代码解析 1.图片的网络位置 2.进行访问和下载 3.建立本地存储位置 效果…

LaTex实战笔记 3-宏包与控制命令

1. LaTeX 命令的基本架构 LaTex 排版系统对于格式控制、公式编辑比 Word 更加灵活、准确。 Tex 环境中&#xff0c;字符、图片等各种文档内容都装在不同的盒子&#xff08;box&#xff09;容器内。这些盒子根据 Tex/Latex 的默认规则和控制命令组合为更大的盒子。字符组合为单…

【OpenCV 例程200篇】201. 图像的颜色空间转换

OpenCV 例程200篇 总目录 201. 图像的颜色空间转换 202. 查表快速替换&#xff08;cv.LUT&#xff09; 203. 伪彩色图像处理 204. 图像的色彩风格滤镜 205. 调节色彩平衡/饱和度/明度 文章目录【youcans 的 OpenCV 例程200篇】201. 图像的颜色空间转换图像的色彩空间基础图像的…

CSDN 搜索工具使用体验与对比分析

搜索工具是 C 站的核心产品&#xff0c;也是广大计算机学习读者的最爱。基于 CSDN 的程序设计与基于 Baidu 的程序设计并肩&#xff0c;成为计算机学习者的最爱。 本文对几种常用的计算机行业相关搜索工具进行对比分析。 本次对比分析只针对各网站的 PC 端网页版。 文章目录0…

【OpenCV 例程200篇】202. 查表快速替换(cv.LUT)

OpenCV 例程200篇 总目录 201. 图像的颜色空间转换 202. 查表快速替换&#xff08;cv.LUT&#xff09; 203. 伪彩色图像处理 204. 图像的色彩风格滤镜 205. 调节色彩平衡/饱和度/明度 文章目录【youcans 的 OpenCV 例程200篇】202. 查表快速替换&#xff08;cv.LUT&#xff09;…

LaTex实战笔记 4-字体格式

LaTeX 中的字体有 5 种属性&#xff1a; 字体编码&#xff1a;正文字体编码&#xff0c;数学字体编码字体族&#xff1a;罗马字体&#xff0c;无衬线字体&#xff0c;打字机字体&#xff08;等宽字体&#xff09;等字体系列&#xff1a;粗细&#xff0c;宽度字体形状&#xff…

PHP在哪里执行_php文件放在哪运行

下载一个WampServer (集成环境)安装后&#xff0c;把要运行的放到安装目录下的www(我安装在D盘&#xff1a;D:\wamp\wamp\www)&#xff0c;然后本机访问localhost/text.php(text.php是你要运行的php文件)。WampServer(推荐学习&#xff1a;PHP编程从入门到精通)WampServer是一款…

LaTex实战笔记 5-段落格式

2.1 换行和分段 通常 LATEX 会自动换行&#xff0c;也可以用\\ 或\newline 命令来强制换行。 开始一个段落&#xff0c;可以通过插入一个空行&#xff0c;也可以使用 \par 命令来强制分段。 连续两个换行符就是一个空行&#xff0c;可以将文字分段。但连续多个换行符&#xff…

【OpenCV 例程200篇】203. 伪彩色图像处理

OpenCV 例程200篇 总目录 201. 图像的颜色空间转换 202. 查表快速替换&#xff08;cv.LUT&#xff09; 203. 伪彩色图像处理 204. 图像的色彩风格滤镜 205. 调节色彩平衡/饱和度/明度 文章目录【youcans 的 OpenCV 例程200篇】203. 伪彩色图像处理什么是伪彩色图像&#xff1f;…

php post 丢失,php post大量数据时发现数据丢失问题解决方法,post数据丢失_PHP教程...

php post大量数据时发现数据丢失问题解决方法&#xff0c;post数据丢失解决办法&#xff1a;在php.ini中将max_input_vars调大改为5000就可以了原因追查&#xff1a;from的enctype”multipart/form-data”php版本5.6.6问题&#xff1a;部分POST数据接收不到追源代码发现是php中…

Jquery鼠标点击出现文字

点击鼠标左键出现文字效果。 原理解说 1.首先确定你是不是点的鼠标左键&#xff1b; 2.文字效果要出现在你鼠标点击的地方&#xff1b; 3.点击后文字出现一个由下往上的显示效果&#xff1b; 4.点击完成后固定时间内还得消失 效果演示 代码演示 <!DOCTYPE html> <h…

【OpenCV 例程200篇】204. 图像的色彩风格滤镜

OpenCV 例程200篇 总目录 201. 图像的颜色空间转换 202. 查表快速替换&#xff08;cv.LUT&#xff09; 203. 伪彩色图像处理 204. 图像的色彩风格滤镜 205. 调节色彩平衡/饱和度/明度 文章目录【youcans 的 OpenCV 例程200篇】204. 图像的色彩风格滤镜4. 图像的色彩风格滤镜4.1…

php文件夹重命名,PHP重命名和移动目录

PHP重命名目录使用PHP的rename()函数可以重命名目录。如果rename()函数执行成功&#xff0c;则返回true&#xff0c;否则返回false。复制代码PHP重命名目录示例-www.baike369.com$state rename(folder,folder2); // 将folder文件夹重命名为folder2文件夹if($state){echo 重命名…

【OpenCV 例程200篇】205. 调节色彩平衡/饱和度/明度

OpenCV 例程200篇 总目录 201. 图像的颜色空间转换 202. 查表快速替换&#xff08;cv.LUT&#xff09; 203. 伪彩色图像处理 204. 图像的色彩风格滤镜 205. 调节色彩平衡/饱和度/明度 文章目录【youcans 的 OpenCV 例程200篇】205. 调节色彩平衡/饱和度/明度4.3 自己调节色彩平…

自定义U盘图标

现在几乎人手一个U盘&#xff0c;作为很隐私的东西&#xff0c;U盘的使用场景却非常复杂&#xff0c;经常需要插入各种各样的设备… 那么如何让自己的U盘与众不同&#xff0c;在插入后给人留下深刻的印象呢&#xff1f; 今天就教给大家如何DIY自己的U盘图标。 1. 下载ico图标…

C站 APP 搜索工具使用体验与对比

文章目录0. 对比的 APP1. APP 首页布局2. 搜索页面的设计3. 关键词输入的过程4. 搜索结果的页面5. 搜索内容的展现6. 搜索结果的内容质量6.1 搜索内容质量评分6.2 对搜索内容评价的分析7. 小结0. 对比的 APP 垂直行业 APP&#xff1a;CSDN&#xff0c;稀土掘金&#xff0c;极客…

【OpenCV 例程200篇】206. Photoshop 色阶调整算法

OpenCV 例程200篇 总目录 201. 图像的颜色空间转换 202. 查表快速替换&#xff08;cv.LUT&#xff09; 203. 伪彩色图像处理 204. 图像的色彩风格滤镜 205. 调节色彩平衡/饱和度/明度 206. Photoshop 色阶调整算法 【youcans 的 OpenCV 例程200篇】206. Photoshop 色阶调整算法…

【OpenCV 例程200篇】207. Photoshop 色阶自动调整算法

OpenCV 例程200篇 总目录 201. 图像的颜色空间转换 202. 查表快速替换&#xff08;cv.LUT&#xff09; 203. 伪彩色图像处理 204. 图像的色彩风格滤镜 205. 调节色彩平衡/饱和度/明度 206. Photoshop 色阶调整算法 207. Photoshop 色阶自动调整算法 【youcans 的 OpenCV 例程20…

【OpenCV 例程200篇】208. Photoshop 对比度自动调整算法

OpenCV 例程200篇 总目录 【youcans 的 OpenCV 例程200篇】208. Photoshop 对比度自动调整算法 对比度是指图像中明暗区域最亮的白和最暗的黑之间不同亮度层级的测量&#xff0c;差异范围越大代表对比越大。 当对比率达到 120:1 就可以容易地显示生动、丰富的色彩&#xff0c;…