Java高手的30k之路|面试宝典|熟悉常用开源集合库Guava和ApacheCommonsCollections

Apache Commons Collections

Apache Commons Collections 是一个扩展 Java Collections Framework 的开源库,提供了许多实用的集合类和相关工具。

常用的集合类:

1. Bag 接口及其实现

Bag 是一个特殊的集合,允许重复元素,并能跟踪每个元素的出现次数。

  • HashBag:基于 HashMap 实现的 Bag
  • TreeBag:基于 TreeMap 实现的 Bag,元素有序。
  • LinkedHashBag:基于 LinkedHashMap 实现的 Bag,保留插入顺序。
Bag<String> bag = new HashBag<>();
bag.add("apple", 3); // 添加 3 个 "apple"
int count = bag.getCount("apple"); // 返回 3

2. BidiMap 接口及其实现

BidiMap 是一种双向映射,既可以通过键查找值,也可以通过值查找键。

  • DualHashBidiMap:基于 HashMap 实现的双向映射。
  • DualTreeBidiMap:基于 TreeMap 实现的双向映射。
  • DualLinkedHashBidiMap:基于 LinkedHashMap 实现的双向映射。
BidiMap<String, Integer> bidiMap = new DualHashBidiMap<>();
bidiMap.put("one", 1);
String key = bidiMap.getKey(1); // 返回 "one"

3. MultiMap 接口及其实现

MultiMap 允许一个键对应多个值。

  • MultiHashMap:基于 HashMap 实现的多值映射。
  • MultiValueMap:通用的多值映射实现,内部使用任何 MapCollection 实现。
MultiValuedMap<String, String> multiMap = new ArrayListValuedHashMap<>();
multiMap.put("fruit", "apple");
multiMap.put("fruit", "banana");
Collection<String> fruits = multiMap.get("fruit"); // 返回 ["apple", "banana"]

4. Trie 接口及其实现

Trie 是一种用于存储字符串的树形数据结构,通常用于实现前缀搜索。

  • PatriciaTrie:基于 Patricia trie 算法实现的 trie。
  • UnmodifiableTrie:不可修改的 trie。
Trie<String, String> trie = new PatriciaTrie<>();
trie.put("apple", "fruit");
trie.put("app", "application");
SortedMap<String, String> prefixMap = trie.prefixMap("ap"); // 返回前缀为 "ap" 的所有键值对

5. ListValuedMapSetValuedMap

这些是 MultiMap 的具体实现,允许一个键对应多个 ListSet 值。

  • ListValuedMap:例如 ArrayListValuedHashMap
  • SetValuedMap:例如 HashSetValuedHashMap
ListValuedMap<String, String> listValuedMap = new ArrayListValuedHashMap<>();
listValuedMap.put("color", "red");
listValuedMap.put("color", "blue");
List<String> colors = listValuedMap.get("color"); // 返回 ["red", "blue"]

6. IteratorUtilsCollectionUtils

这些工具类提供了许多实用方法,用于操作和转换集合。

  • IteratorUtils:例如 toList(), toArray(), chainedIterator() 等。
  • CollectionUtils:例如 isEmpty(), union(), intersection(), disjunction(), subtract() 等。
List<String> list = Arrays.asList("one", "two", "three");
boolean isEmpty = CollectionUtils.isEmpty(list); // 检查集合是否为空

7. LazyListLazyMap

LazyListLazyMap 是惰性集合,当访问到不存在的元素时,它们会自动创建元素。

  • LazyList:延迟加载的 List
  • LazyMap:延迟加载的 Map
Factory<String> factory = new Factory<String>() {public String create() {return "default";}
};
List<String> lazyList = LazyList.lazyList(new ArrayList<String>(), factory);
String value = lazyList.get(5); // 如果索引 5 之前没有元素,则返回 "default"

8. FixedSizeListFixedSizeMap

固定大小的集合,不能增加或减少元素。

  • FixedSizeList:固定大小的 List
  • FixedSizeMap:固定大小的 Map
List<String> list = Arrays.asList("one", "two", "three");
List<String> fixedSizeList = FixedSizeList.fixedSizeList(list);

9. UnmodifiablePredicated 集合

不可修改和带条件的集合。

  • UnmodifiableList:不可修改的 List
  • UnmodifiableMap:不可修改的 Map
  • PredicatedList:带条件的 List
  • PredicatedMap:带条件的 Map
List<String> list = new ArrayList<>(Arrays.asList("one", "two", "three"));
List<String> unmodifiableList = UnmodifiableList.unmodifiableList(list);

常用集合类典型的业务场景:

1. Bag

Bag 用于需要统计元素出现次数的场景。

业务场景:

  • 日志分析:统计不同类型日志出现的次数。
  • 问卷调查:统计问卷中各选项的选择次数。
Bag<String> logTypes = new HashBag<>();
logTypes.add("ERROR");
logTypes.add("INFO", 3); // 添加 3 次 "INFO"
int errorCount = logTypes.getCount("ERROR");

2. BidiMap

BidiMap 用于需要双向映射的场景,可以通过键查找值,也可以通过值查找键。

业务场景:

  • 用户ID和用户名映射:可以通过用户名查找用户ID,也可以通过用户ID查找用户名。
  • 双向字典:可以通过单词查找解释,也可以通过解释查找单词。
BidiMap<String, Integer> userMap = new DualHashBidiMap<>();
userMap.put("Alice", 1);
userMap.put("Bob", 2);
int aliceId = userMap.get("Alice");
String userName = userMap.getKey(2); // 返回 "Bob"

3. MultiMap

MultiMap 用于一个键映射多个值的场景。

业务场景:

  • 课程学生名单:一个课程可以有多个学生。
  • 订单商品列表:一个订单可以包含多个商品。
MultiValuedMap<String, String> courseStudents = new ArrayListValuedHashMap<>();
courseStudents.put("Math", "Alice");
courseStudents.put("Math", "Bob");
Collection<String> students = courseStudents.get("Math"); // 返回 ["Alice", "Bob"]

4. Trie

Trie 用于需要高效前缀搜索的场景。

业务场景:

  • 自动补全功能:输入文本时提供候选词。
  • 搜索建议:根据输入的前缀提供搜索建议。
Trie<String, String> trie = new PatriciaTrie<>();
trie.put("apple", "fruit");
trie.put("app", "application");
SortedMap<String, String> results = trie.prefixMap("ap"); // 返回前缀为 "ap" 的所有键值对

5. ListValuedMap 和 SetValuedMap

这些集合用于一个键映射多个列表或集合值的场景。

业务场景:

  • 标签系统:一个标签可以对应多个文章。
  • 权限管理:一个角色可以对应多个权限。
ListValuedMap<String, String> tagArticles = new ArrayListValuedHashMap<>();
tagArticles.put("Tech", "Article1");
tagArticles.put("Tech", "Article2");
List<String> articles = tagArticles.get("Tech"); // 返回 ["Article1", "Article2"]

6. LazyList 和 LazyMap

这些集合用于延迟加载的场景,当访问不存在的元素时自动创建元素。

业务场景:

  • 延迟初始化:只有在需要时才初始化集合中的元素。
  • 默认值处理:访问未设置的键时返回默认值。
Factory<String> factory = new Factory<String>() {public String create() {return "default";}
};
List<String> lazyList = LazyList.lazyList(new ArrayList<String>(), factory);
String value = lazyList.get(5); // 如果索引 5 之前没有元素,则返回 "default"

7. FixedSizeList 和 FixedSizeMap

这些集合用于固定大小的场景,不能增加或减少元素。

业务场景:

  • 固定大小缓存:缓存的大小是固定的。
  • 定长配置项:某些配置项的数量是固定的。
List<String> list = Arrays.asList("one", "two", "three");
List<String> fixedSizeList = FixedSizeList.fixedSizeList(list);

8. Unmodifiable 和 Predicated 集合

不可修改和带条件的集合用于需要确保集合不被修改或满足特定条件的场景。

业务场景:

  • 配置项:配置项加载后不可修改。
  • 数据验证:确保集合中的数据满足特定条件。
List<String> list = new ArrayList<>(Arrays.asList("one", "two", "three"));
List<String> unmodifiableList = UnmodifiableList.unmodifiableList(list);

Guava集合工具类

Google Guava是Google开发的一个开源Java库,旨在提供高质量的核心Java库,丰富了Java标准库的功能,帮助开发人员更加便捷地编写高效、可靠的Java代码。

Google Guava 提供了一系列强大的集合工具类和方法,这些工具类极大地简化了集合的操作,提高了代码的可读性和维护性。以下是一些常用的 Guava 集合工具类和方法:

1. Immutable Collections

Guava 提供了不可变集合的支持,确保集合在创建后无法修改。

List<String> immutableList = ImmutableList.of("a", "b", "c");
Set<String> immutableSet = ImmutableSet.of("a", "b", "c");
Map<String, String> immutableMap = ImmutableMap.of("key1", "value1", "key2", "value2");

2. Multiset

一种扩展的集合,允许重复元素,并提供计数功能。

Multiset<String> multiset = HashMultiset.create();
multiset.add("a");
multiset.add("a");
multiset.add("b");System.out.println(multiset.count("a")); // 输出 2
System.out.println(multiset.count("b")); // 输出 1

3. Multimap

一种集合,可以将一个键映射到多个值。

Multimap<String, String> multimap = ArrayListMultimap.create();
multimap.put("key1", "value1");
multimap.put("key1", "value2");System.out.println(multimap.get("key1")); // 输出 [value1, value2]

4. BiMap

一种特殊的映射,确保键和值都是唯一的,可以反转键和值。

BiMap<String, Integer> biMap = HashBiMap.create();
biMap.put("one", 1);
biMap.put("two", 2);System.out.println(biMap.inverse().get(1)); // 输出 one

5. Table

一种二维的集合,可以用来表示类似于数据库表的结构。

Table<String, String, Integer> table = HashBasedTable.create();
table.put("row1", "column1", 1);
table.put("row1", "column2", 2);System.out.println(table.get("row1", "column1")); // 输出 1

6. ClassToInstanceMap

一种映射,用于将类对象映射到其实例。

ClassToInstanceMap<Number> map = MutableClassToInstanceMap.create();
map.putInstance(Integer.class, 1);
map.putInstance(Double.class, 2.0);System.out.println(map.getInstance(Integer.class)); // 输出 1

7. RangeSetRangeMap

用于操作范围的集合和映射。

RangeSet<Integer> rangeSet = TreeRangeSet.create();
rangeSet.add(Range.closed(1, 10));
rangeSet.add(Range.closed(15, 20));System.out.println(rangeSet.contains(5)); // 输出 true
System.out.println(rangeSet.contains(12)); // 输出 false

8. Lists, Sets, Maps 等工具类

提供了对集合的各种操作方法。

List<String> list = Lists.newArrayList("a", "b", "c");
Set<String> set = Sets.newHashSet("a", "b", "c");
Map<String, Integer> map = Maps.newHashMap();List<List<String>> partitioned = Lists.partition(list, 2);
System.out.println(partitioned); // 输出 [[a, b], [c]]

9. IterablesIterators

用于操作 IterableIterator 的工具类。

Iterable<Integer> concat = Iterables.concat(Arrays.asList(1, 2),Arrays.asList(3, 4)
);System.out.println(concat); // 输出 [1, 2, 3, 4]

10. FluentIterable

流畅的 Iterable 接口,提供链式操作。

FluentIterable<String> fluentIterable = FluentIterable.from(list).filter(s -> s.startsWith("a")).transform(s -> s.toUpperCase());System.out.println(fluentIterable); // 输出 [A]

11. Collections2

提供了对 Collection 的操作方法。

Collection<String> filtered = Collections2.filter(list, s -> s.startsWith("a"));
System.out.println(filtered); // 输出 [a]

12. Ordering

强大的比较器工具类。

Ordering<String> ordering = Ordering.natural().nullsFirst();
List<String> sortedList = ordering.sortedCopy(list);
System.out.println(sortedList); // 输出 [a, b, c]

13. Maps.uniqueIndex

根据特定规则生成唯一键的映射。

Map<Integer, String> uniqueIndex = Maps.uniqueIndex(list, String::length);
System.out.println(uniqueIndex); // 输出 {1=a, 2=bb, 3=ccc}

Patricia trie

Patricia trie(Practical Algorithm to Retrieve Information Coded in Alphanumeric)也称为紧凑前缀树或 Radix trie,是一种空间高效的 Trie(前缀树)数据结构。它通过合并具有单个子节点的节点来减少内存使用。这使得 Patricia trie 特别适用于处理长的和稀疏的键集合,例如路由表、IP地址等。

Patricia trie 的特点

  1. 空间优化:

    • 通过合并只有一个子节点的节点,减少节点的数量。
    • 使用位操作和压缩节点表示多个字符的前缀,降低了存储需求。
  2. 高效的查找:

    • 在查找过程中,跳过多个字符的比较,可以在更少的步骤内找到结果。
  3. 有序性:

    • 保持了键的有序性,可以有效支持范围查询和有序遍历。

Patricia trie 的基本操作

  1. 插入:

    • 从根节点开始,逐位比较插入的键。
    • 在键的路径中找到最长的公共前缀,然后根据需要分裂或插入新节点。
  2. 查找:

    • 从根节点开始,逐位比较查找的键。
    • 跳过压缩的节点部分,直到找到完全匹配的键或到达树的末端。
  3. 删除:

    • 找到要删除的键对应的节点。
    • 根据情况合并或调整父节点,以保持树的紧凑性。

实例解析

假设我们要构建一个 Patricia trie 来存储以下字符串:"in", "inn", "inside", "inner", "interval"

  1. 构建过程:

    • 插入 "in": 树从根节点到叶子节点表示 "in"
    • 插入 "inn": 在 "in" 的基础上,添加一个分支表示 "n"
    • 插入 "inside": 从 "in" 分裂,插入 "side"
    • 插入 "inner": 从 "inn" 分裂,插入 "er"
    • 插入 "interval": 从 "in" 分裂,插入 "terval"
  2. 树结构:

         (root)/    \"in"  "inn"|      |"side" "er"|"terval"
    
  3. 查找:

    • 查找 "inner": 从根节点开始,匹配 "in" -> "n" -> "er",找到键。
    • 查找 "interval": 从根节点开始,匹配 "in" -> "n" -> "terval",找到键。
    • 查找 "inside": 从根节点开始,匹配 "in" -> "side",找到键。

Patricia trie 的应用

  1. IP 路由表: 用于存储和查找 IP 路由前缀。
  2. 压缩存储: 用于高效存储和检索长键集合。
  3. 字符串处理: 应用于需要高效前缀查找和匹配的场景。

Patricia trie 的实现

以下是一个简单的 Patricia trie 实现示例:

import java.util.*;class PatriciaTrieNode {Map<Character, PatriciaTrieNode> children;boolean isEndOfWord;public PatriciaTrieNode() {children = new HashMap<>();isEndOfWord = false;}
}public class PatriciaTrie {private PatriciaTrieNode root;public PatriciaTrie() {root = new PatriciaTrieNode();}public void insert(String word) {PatriciaTrieNode node = root;for (char ch : word.toCharArray()) {node.children.putIfAbsent(ch, new PatriciaTrieNode());node = node.children.get(ch);}node.isEndOfWord = true;}public boolean search(String word) {PatriciaTrieNode node = root;for (char ch : word.toCharArray()) {node = node.children.get(ch);if (node == null) {return false;}}return node.isEndOfWord;}public static void main(String[] args) {PatriciaTrie trie = new PatriciaTrie();trie.insert("in");trie.insert("inn");trie.insert("inside");trie.insert("inner");trie.insert("interval");System.out.println(trie.search("inner"));    // trueSystem.out.println(trie.search("interval")); // trueSystem.out.println(trie.search("inside"));   // trueSystem.out.println(trie.search("in"));       // trueSystem.out.println(trie.search("insider"));  // false}
}

总结

Patricia trie 是一种高效的空间优化前缀树,适用于存储和查找长键集合。它通过节点压缩和位操作优化了空间和查找效率,非常适合应用于 IP 路由表和其他需要高效前缀匹配的场景。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/28552.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

写作工具:用latex代码插入公式(GPT prompt)

其中所有的公式都直接显示latex代码&#xff0c;不要进行编译&#xff0c;注意公式必须前后有$$&#xff0c;单独的字母或单词不需要用latex&#xff0c;比如i这个字母&#xff1b;如&#xff1a; $ $\Gamma(z) \int_0^\infty t^{z-1}e^{-t}dt\,. $ $ &#xff08;复制粘贴该p…

单目标应用:基于三角拓扑聚合优化算法TTAO的微电网优化(MATLAB代码)

一、微电网模型介绍 微电网多目标优化调度模型简介_vmgpqv-CSDN博客 参考文献&#xff1a; [1]李兴莘,张靖,何宇,等.基于改进粒子群算法的微电网多目标优化调度[J].电力科学与工程, 2021, 37(3):7 二、三角拓扑聚合优化算法求解微电网 2.1算法简介 三角拓扑聚合优化算法&…

如何连接达梦数据库?

连接达梦数据库&#xff08;DM Database&#xff09;可以通过多种方式进行&#xff0c;包括使用 JDBC&#xff08;Java Database Connectivity&#xff09;驱动程序&#xff0c;这是最常见的方式之一。以下是使用 Java 通过 JDBC 连接达梦数据库的详细步骤&#xff1a; 1. 准备…

梦想编织者Luna:COZE从童话绘本到乐章的奇妙转化

前言 Coze是什么&#xff1f; Coze扣子是字节跳动发布的一款AI聊天机器人构建平台&#xff0c;能够快速创建、调试和优化AI聊天机器人的应用程序。只要你有想法&#xff0c;无需有编程经验&#xff0c;都可以用扣子快速、低门槛搭建专属于你的 Chatbot&#xff0c;并一键发布…

002、浅谈MongoDB数据库的优势

1. 灵活的数据模型 MongoDB 的文档存储方式允许你随时更改文档的结构而不需要中断应用程序&#xff0c;特别适合需求变化快的场景。 实例&#xff1a; 电商平台&#xff1a; 在一个电商平台中&#xff0c;不同类别的商品可能有不同的属性。例如&#xff0c;电子产品有保修期&…

gbase8s数据库的逻辑日志、物理日志和两种特殊情形的学习

(一) 日志的介绍 1. 日志的类别 数据库日志主要是分为记录日志、逻辑日志和物理日志。 记录日志&#xff1a;记录日志包括了数据库的报错日志、连接日志、sql执行等信息&#xff0c;这些日志不存储在dbspace上&#xff0c;而是保存在操作系统的文件内逻辑日志和物理日志&…

linux下C语言如何操作文件(二)

上篇文章中,我们简单介绍了file_util.h中定义的各函数,今天我们来讲解如何实现头文件中定义的各函数。首先,在file_util.c中,我们需要引入相应的头文件: #include <stdio.h> #include <stdlib.h> #include <stdbool.h> #include <unistd.h> #inc…

Kali之metasploit学习

目标&#xff1a;尝试使用metasploit制作一个windows 后门&#xff08;exe文件&#xff09; 一&#xff1a;使用metasploit生成一个exe安装包。 二、将对应的可执行文件放入到目标机 python3 -m http.server 端口号&#xff1a; 模块化启动一个端口。 windows 证书管理工具&…

Python(二)---数据类型与变量、以及运算符

文章目录 前言1.Python程序的构成1.1.代码的组织和缩进1.2.使用\行连接符 2.对象和引用、标识符规则2.1.对象2.2.引用2.3.标识符规则 3.变量和简单赋值语句3.1.变量的声明和赋值3.2.删除变量和垃圾回收机制3.3.常量3.4.链式赋值3.5.系列解包赋值 4.最基本内置数据类型4.1.数字和…

【MySQL】BIT_OR函数在二进制分组group by中的妙用

BIT_OR函数的妙用 使用的是官方文档的例子。参考地址&#xff1a;https://dev.mysql.com/doc/refman/8.0/en/calculating-days.html 1. 先看例子 1、假设有如何的表&#xff08;year&#xff0c;month&#xff0c;day字段分别表示年、月、日&#xff09; CREATE TABLE t1 (…

使用了代理IP怎么还会被封?代理IP到底有没有效果

代理IP作为一种网络工具&#xff0c;被广泛应用于各种场景&#xff0c;例如网络爬虫、海外购物、规避地区限制等。然而&#xff0c;很多用户在使用代理IP的过程中却发现自己的账号被封禁&#xff0c;这让他们不禁产生疑问&#xff1a;使用了代理IP怎么还会被封&#xff1f;代理…

速盾:cdn加速怎么计费?

CDN加速&#xff08;Content Delivery Network&#xff09;是一种将内容部署在全球多个节点上&#xff0c;通过就近访问提供服务的技术。它可以加快网站的速度和可靠性&#xff0c;同时减轻源服务器的负载。在使用CDN加速服务时&#xff0c;计费是一个重要的问题&#xff0c;下…

芯片验证分享8 —— 代码审查2

大家好&#xff0c;我是谷公子&#xff0c;上节课给大家讲了代码审查中的代码正向检查&#xff0c;今天我们来讲代码审查的其他方法。 今天介绍的检查方法有&#xff1a; 代码反向检查 桌面检查 同行评审 可用性验证 这些验证方法可以应用在芯片开发的任何阶段。代码审查…

《Cloud Native Data Center Networking》(云原生数据中心网络设计)读书笔记 -- 01 为什么需要一个新的网络架构

关于专栏 本专栏是工作之后阅读 Cloud Native Data Center Networking &#xff08; O’Reilly, 2019&#xff09;的读书笔记。这本书是我在数据中心从事云网络工作的启蒙、扫盲读物。可惜&#xff0c;其中文版翻译并非尽善尽美&#xff0c;必须结合英文原版才能理解原作者要表…

第 4 章:从 Spring Framework 到 Spring Boot

通过前面几个章节的介绍&#xff0c;相信大家已经对 Spring Framework 有了一个基本的认识&#xff0c;相比早期那些没有 Spring Framework 加持的项目而言&#xff0c;它让生产力产生了质的飞跃。但人们的追求是无止境的&#xff0c;这也驱动着技术的发展。开发者认为 Spring …

基于SSM+Jsp的列车票务信息管理系统

开发语言&#xff1a;Java框架&#xff1a;ssm技术&#xff1a;JSPJDK版本&#xff1a;JDK1.8服务器&#xff1a;tomcat7数据库&#xff1a;mysql 5.7&#xff08;一定要5.7版本&#xff09;数据库工具&#xff1a;Navicat11开发软件&#xff1a;eclipse/myeclipse/ideaMaven包…

期末算法复习

0-1背包问题&#xff08;动态规划&#xff09; 例题 算法思想&#xff1a; 动态规划的核心思想是将原问题拆分成若干个子问题&#xff0c;并利用已解决的子问题的解来求解更大规模的问题。 主要是状态转移方程和状态 算法描述&#xff1a; 初始化一个二维数组dp&#xff0…

312. 戳气球

. - 力扣&#xff08;LeetCode&#xff09; 这是区间问题&#xff0c;f[i][j] 是在{nums[i]::nums[j]}的获得的最大零钱数&#xff0c;跟回文字符串的思路差不多。 方法一&#xff1a; i ∈{0:: n-1} 从左往右来看。 class Solution { public:int maxCoins(vector<int>…

WebForms 导航

WebForms 导航 WebForms 是 ASP.NET 的一种模型,用于构建交互式的网页。它提供了一种事件驱动的编程模型,类似于传统的桌面应用程序。在 WebForms 中,导航是指用户在网页之间的移动,这可以通过多种方式实现。本文将详细介绍 WebForms 中的导航机制,包括页面间的跳转、回发…

【计算机毕业设计】259基于微信小程序的医院综合服务平台

&#x1f64a;作者简介&#xff1a;拥有多年开发工作经验&#xff0c;分享技术代码帮助学生学习&#xff0c;独立完成自己的项目或者毕业设计。 代码可以私聊博主获取。&#x1f339;赠送计算机毕业设计600个选题excel文件&#xff0c;帮助大学选题。赠送开题报告模板&#xff…