华为OD机试 - 查找舆情热词(Java 2024 C卷 100分)

在这里插入图片描述

华为OD机试 2024C卷题库疯狂收录中,刷题点这里

专栏导读

本专栏收录于《华为OD机试(JAVA)真题(A卷+B卷+C卷)》。

刷的越多,抽中的概率越大,每一题都有详细的答题思路、详细的代码注释、样例测试,发现新题目,随时更新,全天CSDN在线答疑。

一、题目描述

网上新闻越来越多,希望对新闻进行热词处理并归类,方便获取信息,现在已经将每篇文章处理为2个字符串,即一个标题,一个正文串,字符串中使用“ ”作为分隔符进行分词。

M篇新闻按照新闻发布的先后顺序处理完并输入,现在希望对所有新闻中出现的词语进行处理,输出出现频率最高的topN个词语,作为热词。标题中出现的词语频率系数为3,正文中出现的词语频率系数为1;返回的答案按照词语出现频率由高到低排序,当词语出现的频率相同时,在标题中出现的频率次数高的排在前面;如果仍然相同,则按照词语在标题中出现的先后顺序进行排序,先出现的排在前面;如果仍然相同,则按照词语在正文中出现的先后顺序进行排序,先出现的排在前面。

二、输入描述

第一行输入为正整数topN和文章数M,即要输出的出现频率最高的词语的个数和处理文章的数量,由于每篇文章被处理为标题和正文2行,因此后面有2 * M行数据。

从第二行起,是按顺序处理后每篇文章的标题串和正文串,即第二行是第一篇文章的标题串,第三行是第一篇文章的正文串,第四行是第二篇文章的标题串,第五行是第二篇文章的正文串,以此类推。

三、输出描述

使用一行输出出现频率最高的topN个词语,每个词语以“ ”隔开。

1、输入

3 2
xinguan feiyan xinzeng bendi quezhen anli
ju baodao chengdu xinzeng xinguan feiyan bendi quezhen anli yili shenzhen xinzeng bendi quezhen anli liangli yiqing zhhengti kongzhi lianghao
xinguan yimiao linchuang shiyan
wuzhong xinguan yimiao tongguo sanqi linchuang shiyan xiaoguo lianghao

2、输出

xinguan xinzeng bendi

四、解题思路

题目描述就是解题思路:

  1. 标题中出现的词语频率系数为3,正文中出现的词语频率系数为1;
  2. 返回的答案按照词语出现频率由高到低排序
  3. 当词语出现的频率相同时,在标题中出现的频率次数高的排在前面;
  4. 如果仍然相同,则按照词语在标题中出现的先后顺序进行排序,先出现的排在前面;
  5. 如果仍然相同,则按照词语在正文中出现的先后顺序进行排序,先出现的排在前面。

五、Java算法源码

public class Test02 {static Map<String, Integer> map = new HashMap<>();static Map<String, Integer> titleMap = new HashMap<>();static Map<String, Integer> contentMap = new HashMap<>();public static void main(String[] args) {Scanner sc = new Scanner(System.in);int[] line1 = Arrays.stream(sc.nextLine().split(" ")).mapToInt(Integer::parseInt).toArray();int topN = line1[0];int M = line1[1];List<String[]> arrList = new ArrayList<>();for (int i = 0; i < M * 2; i++) {String[] arr = sc.nextLine().split(" ");arrList.add(arr);if (i % 2 == 0) {// 标题for (int j = 0; j < arr.length; j++) {int sum = titleMap.getOrDefault(arr[j], 0);// 标题中出现的词语频率系数为3sum += 3;titleMap.put(arr[j], sum);sum = map.getOrDefault(arr[j], 0);sum += 3;map.put(arr[j], sum);}} else {// 正文for (int j = 0; j < arr.length; j++) {int sum = contentMap.getOrDefault(arr[j], 0);// 正文中出现的词语频率系数为1sum++;contentMap.put(arr[j], sum);sum = map.getOrDefault(arr[j], 0);sum++;map.put(arr[j], sum);}}}List<Map.Entry<String, Integer>> list = new ArrayList<Map.Entry<String, Integer>>(map.entrySet());Collections.sort(list, new Comparator<Map.Entry<String, Integer>>() {@Overridepublic int compare(Map.Entry<String, Integer> o1, Map.Entry<String, Integer> o2) {// 返回的答案按照词语出现频率由高到低排序if(o1.getValue() != o2.getValue()){return o2.getValue() - o1.getValue();}Integer title1 = titleMap.getOrDefault(o1.getKey(), 0);Integer title2 = titleMap.getOrDefault(o2.getKey(), 0);// 如果仍然相同,则按照词语在标题中出现的先后顺序进行排序,先出现的排在前面;if (title1 != title2) {return title2 - title1;}// word1先出现返回-1,word2先出现返回1,都未出现返回0int ret = getIndexInTitle(arrList, o1.getKey(), o2.getKey(), 0);if (ret != 0) {return ret;}// 如果仍然相同,则按照词语在正文中出现的先后顺序进行排序,先出现的排在前面。return getIndexInTitle(arrList, o1.getKey(), o2.getKey(), 1);}});// 获取topNStringJoiner stringJoiner = new StringJoiner(" ");for (int i = 0; i < topN; i++) {stringJoiner.add(list.get(i).getKey());System.out.println(list.get(i).getKey() + "-" + list.get(i).getValue());}System.out.println(stringJoiner);}/*** 在标题和正文中分别比较word1和word2出现的先后顺序** @param arrList 输入字符串* @param word1* @param word2* @param start   0表示标题,1表示正文* @return*/private static int getIndexInTitle(List<String[]> arrList, String word1, String word2, int start) {for (int i = start; i < arrList.size(); i += 2) {String[] arr = arrList.get(i);for (int j = 0; j < arr.length; j++) {if (word1.equals(arr[j])) {// word1先出现return -1;} else if (word2.equals(arr[j])) {// word2先出现return 1;}}}// word1、word2都未出现return 0;}
}

六、效果展示

1、输入

3 2
nezha1 nezha2 nezha10 nezha4 nezha5 nezha6
nezha1 nezha2 nezha3 nezha4 nezha4 nezha6 nezha1 nezha2 nezha3 nezha5 nezha6
nezha1 nezha7 nezha8 nezha9 nezha4 nezha10
nezha1 nezha7 nezha8 nezha9 nezha10 nezha11 nezha1 nezha7 nezha8 nezha9 nezha10 nezha11

2、输出

nezha1 nezha10 nezha4

3、说明

在这里插入图片描述

在这里插入图片描述


🏆下一篇:华为OD机试 - 简易内存池 - 逻辑分析(Java 2024 C卷 200分)

🏆本文收录于,华为OD机试(JAVA)真题(A卷+B卷+C卷)

刷的越多,抽中的概率越大,每一题都有详细的答题思路、详细的代码注释、样例测试,发现新题目,随时更新,全天CSDN在线答疑。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/787641.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vue3性能提升主要通过哪几方面?

&#x1f4dd;个人主页&#xff1a;爱吃炫迈 &#x1f48c;系列专栏&#xff1a;Vue &#x1f9d1;‍&#x1f4bb;座右铭&#xff1a;道阻且长&#xff0c;行则将至&#x1f497; 文章目录 编译优化diff算法优化提取动态节点 静态提升预字符串化缓存内联事件处理函数SSR优化 源…

YOLOv9有效改进专栏汇总|未来更新卷积、主干、检测头注意力机制、特征融合方式等创新![2024/4/1]

​ 专栏介绍&#xff1a;YOLOv9改进系列 | 包含深度学习最新创新&#xff0c;助力高效涨点&#xff01;&#xff01;&#xff01; 专栏介绍 YOLOv9作为最新的YOLO系列模型&#xff0c;对于做目标检测的同学是必不可少的。本专栏将针对2024年最新推出的YOLOv9检测模型&#xff0…

Python高级技术应用:解锁异步编程的威力与实践

在当今软件开发的领域中,异步编程已经成为一种重要的技术手段,特别是在处理高并发和I/O密集型任务时。Python作为一种功能丰富且灵活的编程语言,提供了多种方式来实现异步编程,如使用asyncio库、async/await关键字等。本文将深入探讨Python中异步编程的原理、优势以及实际应…

HackTheBox-Machines--Topology

文章目录 1 端口扫描2 漏洞探测三 权限提升 Topology 测试过程 1 端口扫描 nmap -sC -sV 10.129.23.122 漏洞探测 端口扫描发现22和80端口&#xff0c;访问80端口&#xff0c;发现LaTeX方程生成器&#xff0c;访问该按钮发现子域&#xff1a; latex.topology.htb。 将域名添加…

超图新建三维数据集继续学习

1 新建三维数据集 之前操作过新建三维数据集&#xff0c;还不熟悉&#xff0c;继续熟悉&#xff1b; 现在有一个文件型的数据源&#xff0c;名为swtest1&#xff1b;它前面小图标上有UDX三个字母&#xff0c;表明这是一个UDX类型的数据源&#xff1b;在此数据源上右击&#x…

李白打酒加强版(c++实现)

题目 话说大诗人李白&#xff0c;一生好饮。 幸好他从不开车。 一天&#xff0c;他提着酒壶&#xff0c;从家里出来&#xff0c;酒壶中有酒 2 斗。 他边走边唱&#xff1a; 无事街上走&#xff0c;提壶去打酒。 逢店加一倍&#xff0c;遇花喝一斗。 这一路上&#xff0c;…

【观察者模式】

观察者模式 什么是观察者模式&#xff1f; 观察者模式定义了对象之间的一种一对多依赖关系&#xff0c;允许多个观察者对象同时监听某一个主题对象。这种模式是事件驱动编程的核心&#xff0c;其主要目标是实现对象间的松耦合。松耦合的设计允许我们构建灵活的系统&#xff0…

SSH端口转发

SSH介绍 SSH通过网络远程访问主机提供保护&#xff0c;可以对客户端和服务端之间的数据传输进行压缩和加密&#xff0c;有身份验证、SCP、SFTP、和端口转发的功能 SSH转发常用的参数介绍&#xff1a; -C请求压缩所有数据-D动态转发、即socks代理-f后台执行SSH指令-g允许远程…

hxp CTF 2021 - A New Novel LFI(新颖的解法)

一、环境 unbentu&#xff0c;docker https://2021.ctf.link/assets/files/includers%20revenge-25377e1ebb23d014.tar.xz 二、解析 PHP Filter 当中有一种 convert.iconv 的 Filter &#xff0c;可以用来将数据从字符集 A 转换为字符集 B &#xff0c;其中这两个字符集可以…

极狐GitLab 13.11 重磅发布多项与 DevSecOps 相关的功能【五】

GitLab 是一个全球知名的一体化 DevOps 平台&#xff0c;很多人都通过私有化部署 GitLab 来进行源代码托管。极狐GitLab &#xff1a;https://gitlab.cn/install?channelcontent&utm_sourcecsdn 是 GitLab 在中国的发行版&#xff0c;专门为中国程序员服务。可以一键式部署…

我的一年创作纪念日

机缘 实际上在之前的文章之中我已经介绍过自己与csdn的缘分了&#xff0c;当初对算法十分的痴迷&#xff0c;也很希望能够将自己的一些理解写在csdn上&#xff0c;所以就开始了在csdn上的写作。 收获 在创作过程中最大的收获还是对过去所学的知识的总结吧&#xff0c;可惜的就…

蓝桥杯算法题-图形排版

题目描述 小明需要在一篇文档中加入 N 张图片&#xff0c;其中第 i 张图片的宽度是 Wi&#xff0c;高度是 Hi。   假设纸张的宽度是 M&#xff0c;小明使用的文档编辑工具会用以下方式对图片进行自动排版&#xff1a; 1. 该工具会按照图片顺序&#xff0c;在宽度 M 以内&…

企业客户信息反馈平台的设计与实现|Springboot+ Mysql+Java+ B/S结构(可运行源码+数据库+设计文档)

本项目包含可运行源码数据库LW&#xff0c;文末可获取本项目的所有资料。 推荐阅读300套最新项目持续更新中..... 最新ssmjava项目文档视频演示可运行源码分享 最新jspjava项目文档视频演示可运行源码分享 最新Spring Boot项目文档视频演示可运行源码分享 2024年56套包含ja…

《数据结构学习笔记---第九篇》---循环队列的实现

文章目录 1.循环队列的定义 2.循环队列的判空判满 3.创建队列并初始化 4.入队和出队 5. 返回队尾队首元素 6.释放循环队列 1.循环队列的定义 定义&#xff1a;存储队列元素的表从逻辑上被视为一个环。 我们此次实现的循环队列&#xff0c;采用顺序表 typedef struct {int…

Xception模型详解

简介 Xception的名称源自于"Extreme Inception"&#xff0c;它是在Inception架构的基础上进行了扩展和改进。Inception架构是Google团队提出的一种经典的卷积神经网络架构&#xff0c;用于解决深度卷积神经网络中的计算和参数增长问题。 与Inception不同&#xff0…

图像生成:SD lora加载代码详解与实现

文章目录 前言一、SD模型介绍二、模型加载1. 模型架构加载2. safetensors权重加载3. lora权重加载 三、Name匹配四、权重融合1、构建net类2、匹配lora weight和model weight3、基于lora权重创建lora模块4、权重融合 五、整体pipeline总结 前言 SD中lora的加载相信都不陌生&…

VSCode美化

今天有空收拾了一下VSCode&#xff0c;页面如下&#xff0c;个人觉得还是挺好看的~~ 1. 主题 Noctis 色彩较多&#xff0c;有种繁杂美。 我使用的是浅色主题的一款Noctis Hibernus 2. 字体 Maple Mono 官网&#xff1a;Maple-Font 我只安装了下图两个字体&#xff0c;使…

堆积排序python实现

堆积排序(Heap Sort)是一种基于二叉堆的排序算法。Python语言实现堆积排序算法可以如下所示: def heapify(arr, n, i):largest = i # Initialize largest as rootl = 2 * i + 1 # left = 2*i + 1r = 2 * i + 2

Java常用API之Encoders类解读

写在开头&#xff1a;本文用于作者学习Java常用API 我将官方文档中Collections类中所有API全测了一遍并打印了结果&#xff0c;日拱一卒&#xff0c;常看常新 在Spark中&#xff0c;Encoders类提供了一些静态方法用于创建不同数据类型的编码器。 首先&#xff0c;我遇到这样…

区块链面试题总结

1、什么是区块链&#xff1f; 区块链是不间断的经济交易数字分类账&#xff0c;可以进行编程&#xff0c;以记录不止金融交易&#xff0c;还可以记录其他有价值的东西&#xff0c;简单来说&#xff0c;区块链是一个不可变记录的分布式数据库&#xff0c;该数据库由计算机集群来…