java高效写文件_java如何高效读写10G以上大文件

有一份10G以上大文本文件,需要替换里面的一些文本信息(每一行都有),如何高效读并替换掉生成新的文件

先分割成多个文件

多个线程操作多个文件,避免两个线程操作同一个文件

按行读文件并按行写入新的文件

合并所有文件

1,4用linux命令就可以了~

File file = new File(filepath);

BufferedInputStream fis = new BufferedInputStream(new FileInputStream(file));

BufferedReader reader = new BufferedReader(new InputStreamReader(fis,”utf-8″),510241024);

String line = “”;

while((line = reader.readLine()) != null){

//进行替换操作和其他业务

}

为了提高性能,你可能需要 mapped IO,具体可以参考:

为何要在Java中使用内存映射文件(Memory Mapped File)或者MappedByteBuffer

java大文件读写操作,java nio 之MappedByteBuffer,高效文件/内存映射

java.io和java.nio性能简单对比

如果是简单文本的替换,用linux的sed命令就行了。

如果是比较复杂的文本替换,看下面:

http://stackoverflow.com/ques…

http://www.baeldung.com/java-…

用spark分析、

lines=sc.textFile(“your_file”);

filterlines=lines.filter(your_filter_function)

filterlines.xxx()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/566638.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java md2_GitHub - edzjx/Md2Crypto

此项目来源一个字谜解体过程一个程序猿在自己的微信公众号里出了一个字谜。其中用到了MD2加密算法,这是各很古老的加密算法。从网上搜到作者92年发布的C代码还能正常执行。此项目介绍解题过程,和使用C,C#,Java,Python3来测试代码。文章结构破…

java stringbuffer原理_深入理解Java:String

在讲解String之前,我们先了解一下Java的内存结构。一、Java内存模型按照官方的说法:Java 虚拟机具有一个堆,堆是运行时数据区域,所有类实例和数组的内存均从此处分配。JVM主要管理两种类型内存:堆和非堆,堆…

java dubbo jsf_cubelink

cubelink概要设计[TOC]1. 撰写记录更新时间内容作者2017-08-23 08:39:31撰写参数回调章节内容林斌2017-08-22 21:26:52增加了异步响应和异步回调章节林斌2017-08-22 14:36:36确定文档结构和大致框架林斌2. 设计目标设计一个具备治理,监控,服务发现能力的…

用java输出图形_java基础-输出一个简单的图形。

最近写了几行代码输出下面的图形。不多说了,代码如下。 * *** ***** public class javaDemoOne {/** * @brief 主函数 * @author wks * @param args */ public static void main(String[] args) {// TODO Auto-generated method stub inputGraPh(); System.out.print("\n…

python 的案例实战_python案例实战之一

分析思路:1、明确分析目标;2、导入库、导入数据;3、简单查看下数据行列、整体情况;4、数据清洗;5、确定维度和指标;6、分析并作图1、查看整体数据情况1.1引入使用的库import numpy as npimport pandas as p…

django 模板mysql_59 Django基础三件套 , 模板{{}}语言 , 程序连mysql Django项目app Django中ORM的使用...

主要内容:https://www.cnblogs.com/liwenzhou/p/8688919.html1 form表单中提交数据的三要素a : form标签必须要有action和method的属性b : 所有获取用户输入的标签必须放在form表单里,也必须要有那么name属性.因为往后端提交数据的时候name所对应的是关键字, input输入的值为va…

java不大于6位_末尾带4的完全平方数的数量并且打印输出_Java计算一个数加上100是完全平方数,加上168还是完全平方数...

题目:一个整数,它加上100后是一个完全平方数,加上168又是一个完全平方数,请问该数是多少?程序分析:在10万以内判断,先将该数加上100后再开方,再将该数加上268后再开方,如…

java使用Encoding导什么包_String getEncoding()

String getEncoding()描述 (Description)java.io.OutputStreamWriter.getEncoding()方法返回此流使用的字符编码的名称。如果编码具有历史名称,则返回该名称; 否则返回编码的规范名称。如果使用OutputStreamWriter(OutputStream,String)构造函数创建此实…

JAVA中增强循环中用线程_在Java中以循环方式运行线程

我是Java中的多线程和同步的新手。我正在尝试实现一项任务,其中给了我5个文件,每个文件将由一个特定线程读取。每个线程应从文件读取一行,然后将执行转发到下一个线程,依此类推。当所有5个线程都读取第一行时,然后再次…

java数据结构期末复习_java数据结构复习02

1.递归问题1.1计算阶乘packageinterview.recursion;importjava.util.Scanner;public classFact {public static voidmain(String[] args) {System.out.println("请输入n的值:");Scanner in newScanner(System.in);int n in.nextInt();int num fact(n);Sys…

java中methods方法_java中Class.getMethod方法

Method Class.getMethod(String name, Class>... parameterTypes)的作用是获得对象所声明的公开方法该方法的第一个参数name是要获得方法的名字,第二个参数parameterTypes是按声明顺序标识该方法形参类型。person.getClass().getMethod("Speak", null)…

centos6 yum快速安装mysql_centos6.10 yum安装mysql 5.6-Go语言中文社区

一、检查系统是否安装其他版本的MYSQL数据#yum list installed | grep mysql#yum -y remove 文件名二、安装及配置# wget http://repo.mysql.com/mysql-community-release-el6-5.noarch.rpm# rpm -ivh mysql-community-release-el6-5.noarch.rpm# yum repolist all | grep mysq…

java struts1_struts1.x

struts1.x摘要: 要想使用Struts,至少要依靠两个配置文件:web.xml和struts-config.xml。其中web.xml用来安装Struts框架。而struts-config.xml用来配置在Struts框架中要使用的资源。如Formbean、Action、插件等。如果使用了某些插件,如Validat…

java加花免杀_UPX加壳免杀添加花指令

UPX加壳、免杀、添加花指令是一款用于制作免杀的给力的工具。使用该软件可以进行软件的UPX加壳、E语言免杀、添加花指令。如果你正在为自己制作的软件过不了杀毒,那么赶快使用这款神器吧。加花方法:1.直接加花记住入口点---找零区域---NOP填充---记住新入…

java scanner转string,Java InputStream to String 转化

1. 概况这篇文章主要是讲怎样将InputStream转换为String。采用[weblink url"http://code.google.com/p/guava-libraries/"]Guava[/weblink]、[weblink url"http://commons.apache.org/proper/commons-io/"]Apache Commons IO [/weblink]以及普通Java代码实…

kafka php 教程,php的kafka踩坑(一)

最近项目上有一个需要用到消息队列的功能,从网上找了一些php相关的kafka使用的教程和博客,大抵都是安装php的拓展librdkafka(这里就不讲这个拓展的安装方法了,搜一下还是有很多教程的),然后直接用这个拓展进行开发,但是…

二叉树两节点距离java,求二叉树中两个节点的最远距离

问题定义如果我们把二叉树看成一个图,父子节点之间的连线看成是双向的,我们姑且定义"距离"为两节点之间边的个数。写一个程序求一棵二叉树中相距最远的两个节点之间的距离。计算一个二叉树的最大距离有两个情况:情况A: 路径经过左子树的最深节…

php中update()函数,update_option()函数

update_option()函数的功能是更新wp_options表中指定的一条数据。可以使用此函数代替add_option函数,尽管它不够灵活。 update_option函数会检查并判断选项是否已经存在。如果不存在,用add_option (’option_name’, ‘option_value’)添加选项。除非用户…

java解析MT940报文,swift MT报文解析处理

swift 官方资料:https://www2.swift.com/knowledgecentre/publications/us5mc_20180720/2.0?topicalec.htm#genalecswift 百科:https://baike.baidu.com/item/SWIFT/1108075prowide - swift 报文处理 开源框架:https://www.prowidesoftware.…

php怎么实现匿名评论,PHP-匿名对象与匿名类的实现过程-0905

* 匿名类:* 1. php 7.0 才支持* 2. 类似于匿名函数,就是没有名称的类* 3. 匿名类适合于一次性的创建与引用* 4. 匿名类总是与: new 配套使用类的三种访问方式实例/*** 匿名类:* 1. php 7.0 才支持* 2. 类似于匿名函数,就是没有名称的类* 3. 匿名类适合于一次性的创建与引用* 4.…