大数据排重

注意用来排重的那个集合放到Set中, 可以是HashSet,或者其他Set(推荐使用HashSet),因为Set的contains效率更高,比list高很多

----------------------------------------------------------------------------------------------------------------------------------------------------------------------

我们有1000万条数据,保存在一个txt中,每一行一行的读,然后如果有重复的数据则忽略,cardArr[0])里保存的是流水号,我们最终的数据 流水号不能相同

Set<String> serialNoList = new HashSet<String>();//保存流水号,用于去重- - - - - - - - - - 这里是个set,因为set的contains的效率更高

while ((line = reader.readLine()) != null) {

  

  String[] cardArr = line.split("\\|");

  //如果文件中的流水号重复,则去重
  if(serialNoList.contains(cardArr[0])){
    continue;
  }
  serialNoList.add(cardArr[0]);

}

http://blog.tommyyang.cn/2017/11/06/%E5%A4%A7%E6%95%B0%E6%8D%AEList%E5%8E%BB%E9%87%8D/

 

转载于:https://www.cnblogs.com/donefive/p/9705999.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/250599.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

大前端成长路径

路径(持续更新): 以下是我不同时期的博客链接可以和我的GitHub共同食用大家可以对比一下,我学的过程是缓慢型的… learning: 0个月 2018年09月开始接触前端,前端三剑客一个不知道一个不懂,于是对着W3C、菜鸟教程.一个一个敲开始啃红宝书《JavaScript高级程序设计》(第3版) le…

工具:meson+ninja(安装问题解决)

问题1&#xff1a;Python版本问题 报错信息&#xff1a; NOTICE: You are using Python 3.6 which is EOL. Starting with v0.62.0, Meson will require Python 3.7 or newer ubuntu 18默认的python3是3.6. 解决方案1&#xff1a;从源码安装python 3.7 wget https://www.pyth…

ListMapSet的操作和遍历

List&Map&Set的操作和遍历 Java的三大集合即&#xff1a;Set、List、Map。 Set&#xff1a;代表无序、不可重复的集合&#xff0c;常用的有HashSet&#xff08;哈希表实现&#xff09;、TreeSet&#xff08;红黑树实现&#xff09;&#xff1b;List&#xff1a;代表有序…

PHP中的魔术方法

概述 在面向对象编程中&#xff0c;PHP提供了一系列的魔术方法&#xff0c;这些魔术方法为编程提供了很多便利。PHP中的魔术方法通常以__(两个下划线)开始&#xff0c;并且不需要显示的调用而是由某种特定的条件出发。这篇文章简单总结了PHP中提供的魔术方法。 开始之前 在总结…

执行caffe的draw_net.py出现“GraphViz's executable dot not found”的解决方法

执行caffe的draw_net.py出现“GraphVizs executable "dot" not found”的解决方法 控制台输入如下指令画网络图&#xff1a;python ../../../python/draw_net.py train.prototxt train.png --rankdirTB &#xff08;Top-Bottom形式&#xff0c;纵向图&#xff09;pyt…

配置 --- vscode自定义代码段Snippets

目标 在vscode中输入vbs-vue 然后产生一个自己想要的模板 写好模板 在线上写好模板传送门: https://snippet-generator.app/ 1是标题,对应 2是前缀.对应在vue中使用的快捷键 vbs-vue3就是需要显示的代码段了 在vscode中配置 1.ctrlshiftp2.选择 Preferences: Configure U…

centos6安装composer

需要使用到curl&#xff0c;没有的话需要 yum -y install curl ###安装一、下载&#xff1a;curl -sS https://getcomposer.org/installer | php &#xff08;如果是网络原因多试几次&#xff09; 二、移动composer.phar移动到环境下让其变成可执行&#xff1a;mv compose…

透明图与元素居中

1,定位让元素居中 1. 透明度 opacity 默认值是1 不透明 0是全透明转载于:https://www.cnblogs.com/Shinigami/p/9709382.html

配置 --- vscode中react格式化解决方案

选择右下角的语言 在弹出框搜react选择 JavaScript React(或者根据需求选择 TypeScript React) 快捷键, windows下 Alt SHIFT F

【商城购物车】购物车逻辑

转载于:https://www.cnblogs.com/xuzhengzong/p/8746677.html

PHP递归实现无限极分类

PHP递归实现无限极分类 摘要 今天在编码的时候要用到二级的栏目分类&#xff0c;所以顺便就把无限极分类给整理了一下&#xff0c;采用的是递归方法 //实现无限级分类public function getTree(){$categorys Category::all();return $this->makeTree($categorys, cate_id,…

IO NIO

1,Java NIO Java non-blocking IO 即 非阻塞IO,线程在等待的时候&#xff0c;可以做其他的事情。 2,IO 对比NIO IO 是面向流&#xff0c;NIO 是面向缓冲 面向流是指每次从流中读出一个或者多个字节&#xff0c;直到全部读出为止 面向缓冲区是指将数据先存到一个缓存区 IO 是阻…

react --- 生命周期 给子组件传递数据

子组件 /src/components/LifeCycle.js import React, { Component } from reactexport class LifeCycle extends Component {constructor(props) {super(props);// 常用于初始化状态(状态初始化、属性初始化)console.log("1.组件构建函数执行");}componentWillMoun…

Vue---mock.js 使用

mockjs 概述 在我们的生产实际中&#xff0c;后端的接口往往是较晚才会出来&#xff0c;并且还要写接口文档&#xff0c;于是我们的前端的许多开发都要等到接口给我们才能进行&#xff0c;这样对于我们前端来说显得十分的被动&#xff0c;于是有没有可以制造假数据来模拟后端接…

Java 的抽象类

Java 的抽象类 用abstract关键字来修饰一个类时&#xff0c;这个类叫做抽象类&#xff1b;用abstract来修饰一个方法时&#xff0c;该方法叫做抽象方法。 抽象方法&#xff1a;只有方法的声明&#xff0c;没有方法的实现。以分号结束&#xff1a;abstract int abstractMethod…

react --- 按需加载组件

问题描述 使用 antd库时使用按钮,须导入如下 import Button from antd/lib/button import antd/dist/antd.css这样会导入全局的样式. 解决方案,配置按需加载 1.安装 react-app-rewired取代 react-scripts, 可以扩展webapack 的配置, 类似vue.config.jsnpm install react-ap…

flask 实现异步非阻塞----gevent

我们都知道&#xff0c;flask不支持异步非阻塞的请求&#xff0c;我们可以创建一个新项目去测试一下&#xff0c;推荐大家使用pycharm去开发我们的flask 使用特别的方便。 rom flask import Flask import time app Flask(__name__) app.route(/) def hello_world():time.slee…

Axure下拉框级联操作

现实生活中有很多的下拉框是级联操作的&#xff0c;即因为第一个下拉框的选择&#xff0c;影响到后面的下拉框的选择的列表的数据。或许在代码中&#xff0c;这些操作相对比较简单&#xff0c;通过前一个下拉框的选择项来控制后一个下拉框的数据的动态添加。那么&#xff0c;如…

react --- render持续调用解决方案

问题描述: 在某个组件中.有可能频繁的取数据(但是数据未改变,因此不需要更新).数据的频繁请求会触发render函数,造成性能消耗模拟代码如下 export class CommentList extends Component {constructor(props) {super(props);this.state {comments: []}}// 模拟频繁的获取新数…

Java 的工厂方法及代理模式

Java 的工厂方法及代理模式 工厂方法(FactoryMethod) 概述&#xff1a;定义一个用于创建对象的接口&#xff0c;让子类决定实例化哪一个类。FactoryMethod使一个类的实例化延迟到其子类。 适用性&#xff1a; 当一个类不知道它所必须创建的对象的类的时候当一个类希望由它的…