离散化C++

离散化(Discretization)是一种将连续数据映射到离散值的技术,常用于将大数据范围压缩到较小范围,例如将数值映射到索引。离散化在算法竞赛中常用于处理数值范围较大但数据量较小的问题(如区间问题、统计问题等)。

以下是离散化的模板和示例:


1. 离散化的基本步骤

  1. 排序:将所有需要离散化的值排序。
  2. 去重:去除重复的值。
  3. 映射:通过二分查找将原始值映射到离散化后的索引。

2. 离散化模板

2.1 使用 std::vectorstd::unique

#include <iostream>
#include <vector>
#include <algorithm>// 离散化函数
std::vector<int> discretize(std::vector<int>& nums) {// 1. 排序std::vector<int> sorted_nums = nums;std::sort(sorted_nums.begin(), sorted_nums.end());// 2. 去重auto last = std::unique(sorted_nums.begin(), sorted_nums.end());sorted_nums.erase(last, sorted_nums.end());// 3. 映射std::vector<int> result(nums.size());for (size_t i = 0; i < nums.size(); i++) {result[i] = std::lower_bound(sorted_nums.begin(), sorted_nums.end(), nums[i]) - sorted_nums.begin();}return result;
}int main() {std::vector<int> nums = {100, 200, 50, 100, 300, 50};// 离散化std::vector<int> discretized = discretize(nums);// 输出结果std::cout << "Original: ";for (int num : nums) {std::cout << num << " ";}std::cout << std::endl;std::cout << "Discretized: ";for (int num : discretized) {std::cout << num << " ";}std::cout << std::endl;return 0;
}

输出:

Original: 100 200 50 100 300 50 
Discretized: 1 2 0 1 3 0 

2.2 离散化后还原原始值

如果需要还原离散化后的值,可以通过离散化数组进行映射。

#include <iostream>
#include <vector>
#include <algorithm>// 离散化函数
std::pair<std::vector<int>, std::vector<int>> discretizeWithMap(std::vector<int>& nums) {// 1. 排序std::vector<int> sorted_nums = nums;std::sort(sorted_nums.begin(), sorted_nums.end());// 2. 去重auto last = std::unique(sorted_nums.begin(), sorted_nums.end());sorted_nums.erase(last, sorted_nums.end());// 3. 映射std::vector<int> result(nums.size());for (size_t i = 0; i < nums.size(); i++) {result[i] = std::lower_bound(sorted_nums.begin(), sorted_nums.end(), nums[i]) - sorted_nums.begin();}return {result, sorted_nums};
}int main() {std::vector<int> nums = {100, 200, 50, 100, 300, 50};// 离散化auto [discretized, map] = discretizeWithMap(nums);// 输出结果std::cout << "Original: ";for (int num : nums) {std::cout << num << " ";}std::cout << std::endl;std::cout << "Discretized: ";for (int num : discretized) {std::cout << num << " ";}std::cout << std::endl;std::cout << "Map: ";for (int num : map) {std::cout << num << " ";}std::cout << std::endl;// 还原离散化后的值std::cout << "Reconstructed: ";for (int num : discretized) {std::cout << map[num] << " ";}std::cout << std::endl;return 0;
}

输出:

Original: 100 200 50 100 300 50 
Discretized: 1 2 0 1 3 0 
Map: 50 100 200 300 
Reconstructed: 100 200 50 100 300 50 

3. 离散化的应用场景

3.1 区间问题

离散化常用于处理区间问题,例如区间合并、区间查询等。

#include <iostream>
#include <vector>
#include <algorithm>// 区间合并
std::vector<std::pair<int, int>> mergeIntervals(std::vector<std::pair<int, int>>& intervals) {if (intervals.empty()) return {};// 离散化std::vector<int> nums;for (const auto& interval : intervals) {nums.push_back(interval.first);nums.push_back(interval.second);}auto [discretized, map] = discretizeWithMap(nums);// 区间合并std::sort(intervals.begin(), intervals.end());std::vector<std::pair<int, int>> merged;for (const auto& interval : intervals) {if (merged.empty() || merged.back().second < interval.first) {merged.push_back(interval);} else {merged.back().second = std::max(merged.back().second, interval.second);}}return merged;
}int main() {std::vector<std::pair<int, int>> intervals = {{1, 3}, {2, 6}, {8, 10}, {15, 18}};// 区间合并auto merged = mergeIntervals(intervals);// 输出结果std::cout << "Merged Intervals: ";for (const auto& interval : merged) {std::cout << "[" << interval.first << ", " << interval.second << "] ";}std::cout << std::endl;return 0;
}

输出:

Merged Intervals: [1, 6] [8, 10] [15, 18] 

3.2 统计问题

离散化可以用于统计某个范围内数据的频率。

#include <iostream>
#include <vector>
#include <algorithm>// 统计频率
std::vector<int> countFrequency(std::vector<int>& nums) {// 离散化auto [discretized, map] = discretizeWithMap(nums);// 统计频率std::vector<int> freq(map.size(), 0);for (int num : discretized) {freq[num]++;}return freq;
}int main() {std::vector<int> nums = {100, 200, 50, 100, 300, 50};// 统计频率auto freq = countFrequency(nums);// 输出结果std::cout << "Frequency: ";for (int count : freq) {std::cout << count << " ";}std::cout << std::endl;return 0;
}

输出:

Frequency: 2 2 1 1 

4. 总结

  • 离散化的核心步骤是排序、去重和映射。
  • 离散化可以用于处理区间问题、统计问题等。
  • 通过离散化,可以将大数据范围压缩到较小范围,提高算法效率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/68811.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

win10部署本地deepseek-r1,chatbox,deepseek联网(谷歌网页插件Page Assist)

win10部署本地deepseek-r1&#xff0c;chatbox&#xff0c;deepseek联网&#xff08;谷歌网页插件Page Assist&#xff09; 前言一、本地部署DeepSeek-r1step1 安装ollamastep2 下载deepseek-r1step2.1 找到模型deepseek-r1step2.2 cmd里粘贴 后按回车&#xff0c;进行下载 ste…

5.3.2 软件设计原则

文章目录 抽象模块化信息隐蔽与独立性衡量 软件设计原则&#xff1a;抽象、模块化、信息隐蔽。 抽象 抽象是抽出事物本质的共同特性。过程抽象是指将一个明确定义功能的操作当作单个实体看待。数据抽象是对数据的类型、操作、取值范围进行定义&#xff0c;然后通过这些操作对数…

4-图像梯度计算

文章目录 4.图像梯度计算(1)Sobel算子(2)梯度计算方法(3)Scharr与Laplacian算子4.图像梯度计算 (1)Sobel算子 图像梯度-Sobel算子 Sobel算子是一种经典的图像边缘检测算子,广泛应用于图像处理和计算机视觉领域。以下是关于Sobel算子的详细介绍: 基本原理 Sobel算子…

图漾相机-ROS2-SDK-Ubuntu版本编译(新版本)

文章目录 前言1.Camport ROS2 SDK 介绍1.1 Camport ROS2 SDK源文件介绍1.2 Camport ROS2 SDK工作流程1.2.1 包含头文件1.2.2 2 初始化 ROS 2 节点1.2.3 创建节点对象1.2.4 创建发布者对象并实现发布逻辑1.2.5 启动 ROS 2 1.3 ROS2 SDK环境配置与编译1.3.1 Ubuntu 20.04 下ROS2 …

海外问卷调查渠道查:企业经营的利器

一、海外问卷调查的基本概念 市场&#xff1a;市场主要由需求者和供给者组成的一种经济关系&#xff0c;主要是商品和服务的交换的一种方式和手段&#xff0c;市场类型按不同标准来划分。按地域划分&#xff0c;则分为国内市场和国际市场&#xff0c;按照产品类型划分&#xf…

向上调整算法(详解)c++

算法流程&#xff1a; 与⽗结点的权值作⽐较&#xff0c;如果⽐它⼤&#xff0c;就与⽗亲交换&#xff1b; 交换完之后&#xff0c;重复 1 操作&#xff0c;直到⽐⽗亲⼩&#xff0c;或者换到根节点的位置 这里为什么插入85完后合法&#xff1f; 我们插入一个85&#xff0c;…

LeetCode题练习与总结:根据二叉树创建字符串--606

一、题目描述 给你二叉树的根节点 root &#xff0c;请你采用前序遍历的方式&#xff0c;将二叉树转化为一个由括号和整数组成的字符串&#xff0c;返回构造出的字符串。 空节点使用一对空括号对 "()" 表示&#xff0c;转化后需要省略所有不影响字符串与原始二叉树…

人工智能入门课【手写自注意力机制】

原理 自注意力&#xff08;Self-Attention&#xff09;是一种强大的机制&#xff0c;广泛应用于自然语言处理、计算机视觉等领域&#xff0c;尤其是在Transformer架构中发挥了关键作用。它的核心思想是让模型能够动态地关注输入序列中不同位置之间的关系&#xff0c;从而更好地…

gentoo 中更改$PS1

现象&#xff1a;gentoo linux Xfce桌面&#xff0c;Terminal 终端&#xff0c;当进入很深的目录时&#xff0c;终端提示符会很长&#xff0c;不方便。如下图所示&#xff1a; 故需要修改$PS1 gentoo 默认的 PS1 在 /etc/bash/bashrc .d/10-gentoo-color.bash中定义&a…

安全防护前置

就业概述 网络安全工程师/安全运维工程师/安全工程师 安全架构师/安全专员/研究院&#xff08;数学要好&#xff09; 厂商工程师&#xff08;售前/售后&#xff09; 系统集成工程师&#xff08;所有计算机知识都要会一点&#xff09; 学习目标 前言 网络安全事件 蠕虫病毒--&…

【自然语言处理(NLP)】深度学习架构:Transformer 原理及代码实现

文章目录 介绍Transformer核心组件架构图编码器&#xff08;Encoder&#xff09;解码器&#xff08;Decoder&#xff09; 优点应用代码实现导包基于位置的前馈网络残差连接后进行层规范化编码器 Block编码器解码器 Block解码器训练预测 个人主页&#xff1a;道友老李 欢迎加入社…

mysqldump+-binlog增量备份

注意&#xff1a;二进制文件删除必须使用help purge 不可用rm -f 会崩 一、概念 增量备份&#xff1a;仅备份上次备份以后变化的数据 差异备份&#xff1a;仅备份上次完全备份以后变化的数据 完全备份&#xff1a;顾名思义&#xff0c;将数据完全备份 其中&#xff0c;…

cf集合***

当周cf集合&#xff0c;我也不知道是不是当周的了&#xff0c;麻了&#xff0c;下下周争取写到e补f C. Kevin and Puzzle&#xff08;999&#xff09; 题解&#xff1a;一眼动态规划&#xff0c;但是具体这个状态应该如何传递呢&#xff1f; 关键点&#xff1a;撒谎的人不相…

大模型概述(方便不懂技术的人入门)

1 大模型的价值 LLM模型对人类的作用&#xff0c;就是一个百科全书级的助手。有多么地百科全书&#xff0c;则用参数的量来描述&#xff0c; 一般地&#xff0c;大模型的参数越多&#xff0c;则该模型越好。例如&#xff0c;GPT-3有1750亿个参数&#xff0c;GPT-4可能有超过1万…

Linux-CentOS的yum源

1、什么是yum yum是CentOS的软件仓库管理工具。 2、yum的仓库 2.1、yum的远程仓库源 2.1.1、国内仓库 国内较知名的网络源(aliyun源&#xff0c;163源&#xff0c;sohu源&#xff0c;知名大学开源镜像等) 阿里源:https://opsx.alibaba.com/mirror 网易源:http://mirrors.1…

简单易懂的倒排索引详解

文章目录 简单易懂的倒排索引详解一、引言 简单易懂的倒排索引详解二、倒排索引的基本结构三、倒排索引的构建过程四、使用示例1、Mapper函数2、Reducer函数 五、总结 简单易懂的倒排索引详解 一、引言 倒排索引是一种广泛应用于搜索引擎和大数据处理中的数据结构&#xff0c;…

Deepseek智能AI--国产之光

以下是以每个核心问题为独立章节的高质量技术博客整理&#xff0c;采用学术级论述框架并增强可视化呈现&#xff1a; 大型语言模型深度解密&#xff1a;从哲学思辨到系统工程 目录 当服务器关闭&#xff1a;AI的终极告解与技术隐喻情感计算&#xff1a;图灵测试未触及的认知深…

如何用ChatGPT批量生成seo原创文章?TXT格式文章能否批量生成!

如何用ChatGPT批量生成文章&#xff1f;这套自动化方案或许适合你 在内容创作领域&#xff0c;效率与质量的天平往往难以平衡——直到AI写作技术出现。近期观察到&#xff0c;越来越多的创作者开始借助ChatGPT等AI模型实现批量文章生成&#xff0c;但如何系统化地运用这项技术…

【回溯+剪枝】组合问题!

文章目录 77. 组合解题思路&#xff1a;回溯剪枝优化 77. 组合 77. 组合 ​ 给定两个整数 n 和 k&#xff0c;返回范围 [1, n] 中所有可能的 k 个数的组合。 ​ 你可以按 任何顺序 返回答案。 示例 1&#xff1a; 输入&#xff1a;n 4, k 2 输出&#xff1a; [[2,4],[3,…

04树 + 堆 + 优先队列 + 图(D1_树(D7_B+树(B+)))

目录 一、基本介绍 二、重要概念 非叶节点 叶节点 三、阶数 四、基本操作 等值查询(query) 范围查询(rangeQuery) 更新(update) 插入(insert) 删除(remove) 五、知识小结 一、基本介绍 B树是一种树数据结构&#xff0c;通常用于数据库和操作系统的文件系统中。 B树…