基础数学:图论与信息论

微积分与概率论由此进:基础数学:微积分和概率与统计-CSDN博客

线代与优化理论由此进:基础数学:线性代数与优化理论-CSDN博客

数值分析与离散数学由此进:基础数学:数值分析与离散数学-CSDN博客

四、图论与搜索算法

1.图结构基础

(1) 图的表示方法

  • 邻接矩阵:

        定义:对于图 G=(V,E),邻接矩阵 A\in \left \{ 0,1 \right \}^{|V| \times |V|},其中

                A_{ij}=\left\{\begin{matrix} 1 \quad (i,j)\in E\\ 0 \quad otherwise \end{matrix}\right.

        适用:稠密图的存储,快速判断节点间是否联通

  • 邻接表:

        定义:为每个节点存储其邻居列表,例如 Adj[v]=\left \{ u|(v,u)\in E \right \}

        适用:稀疏图的高效存储,节省空间

  • 权重图的扩展:

        定义:邻接矩阵元素 A_{ij} 表示边权,邻接表存储 (u,w_{vu}) 对

(2) 树与图遍历

  • 树的性质:

        无环联通图,任意两节点间有唯一路径

        节点数 |V|=|E|+1

  • 深度优先搜索(DFS):

        算法步骤:

          1.从起点出发,访问未被访问的邻居节点

          2.递归访问邻居的邻居,直到无法继续

          3.回溯到最近未探索完的节点继续

        复杂度:时间复杂度 O(|V|+|E|),空间复杂度 O(|V|) (递归栈)

        应用:树形思维(ToT)中的深度探索

  • 广度优先搜索(BFS):

        算法步骤:

          1.使用队列管理待访问节点

          2.访问当前节点的所有邻居,再访问邻居的邻居

        复杂度:时间复杂度 O(|V|+|E|),空间复杂度 O(|V|) (队列)

        应用:寻找最短路径(无权图)

2.最短路径算法

(1)Dijkstra算法

  • 核心思想:贪心策略,逐步扩展当前最短路径
  • 数学描述:

        初始化距离 d(s)=0,其他节点 d(u)=\infty

        优先队列按距离排序,每次取出距离最小的节点 u

        对 u 的邻居 v,松弛操作:

                d(v)=min(d(v),d(u)+w(u,v))

  • 复杂度:使用优先队列(如斐波那契堆):O(|E|+|V|log|V|)
  • 限制:仅适用于非负权边

(2)A*算法

  • 启发式搜索:

        定义评估函数 f(n)=g(n)+h(n),其中

          g(n):从起点到节点 n 的实际代价

          h(n):启发函数,估计 n 到终点的代价

  • 算法步骤:

        1.优先队列按 f(n) 排序

        2.每次扩展 f(n) 最小的节点

        3.到达终点或队列为空时终止

  • 应用:PRM路径规划中的全局搜索

3.搜索策略优化

(1) 剪枝策略

  • Alpha-Beta算法:

        用于博弈树搜索,剪除对最终决策无影响的分支

        核心思想:若某分支的评估值已不可能优于当前最优解,则停止搜索

  • 应用场景:树形思维(ToT)中减少无效路径的探索

(2)多路径生成与自洽性验证

  • 蒙特卡洛树搜索(MCTS):

        四步骤:选择(Selection)、扩展(Expansion)、模拟(Simulation)、回溯(Backpropagation)

        选择策略:

        使用Upper Confidence Bound(UCB)平衡探索与利用:

                UCB_{v_{i}}=\frac{Q(v_{i})}{N(v_{i})}+c\sqrt{\frac{ln(N(v))}{N(v_{i})}}

        其中 Q(v_{i}) 为节点价值,N(v_{i}) 为访问次数,c 为探索系数

  • 自洽性:

        通过生成多条路径 \left \{ p_1,p_2,...,p_k \right \},投票选择最一致的答案

        投票规则:多数投票,广义投票等...

4.应用

(1)PRM路径规划:从理论到实践:带你快速学习基于PRM的三种搜索方法-CSDN博客

流程:

  1. 采样阶段:在构型空间中随机采样节点(蒙特卡洛采样)
  2. 连接阶段:对邻近节点尝试连接,过滤碰撞边
  3. 查询阶段:使用A*或Dijkstra算法在路线图中搜索路径

(2)树形思维:从理论到实践:树形思维探索(ToT)-CSDN博客

树结构构建:

  1. 根节点为初始问题,子节点为推理步骤的中间假设
  2. 节点扩展策略:基于概率或启发式生成子节点

(3)并行采样与顺序修订:从理论到实践:并行采样+顺序修订的联合优化-CSDN博客

联合优化框架:

  1. 并行采样:生成多条候选路径 \left \{ p_i \right \}
  2. 顺序修订:对每条路径局部优化(如梯度下降修正参数)
  3. 聚合结果:选择综合得分最高的路径

5.核心公式

Dijkstra松弛操作:d(v)=min(d(v),d(u)+w(u,v))

A*评估函数:f(n)=g(n)+h(n)

UCB选择策略:UCB_{v_{i}}=\frac{Q(v_{i})}{N(v_{i})}+c\sqrt{\frac{ln(N(v))}{N(v_{i})}}

五、信息论

1.熵与信息度量

(1)信息熵

  • 定义:信息熵衡量随机变量 X 的不确定性,定义为:

        H(X)=-\sum_{x\in X}^{}P(x)logP(x)

        单位:以2为底的对数单位为比特(bits),以自然对数 ln⁡ln 为单位为奈特(nats)

        直观解释:熵越大,不确定性越高。例如,均匀分布的熵最大

  • 示例:抛一枚公平硬币,P(正面) = P(反面) = 0.5,熵为:

        H(X)=-0.5log0.5-0.5log0.5=1\:bit

        若硬币不均匀(如P(正面) = 0.9),则熵降低为:

                H(X)=-0.9log0.9-0.1log0.1\approx 0.469 \:bit

(2)交叉熵

  • 定义:衡量用分布 Q 近似真实分布 P 的额外成本:

        H(P,Q)=-\sum_{x}^{}P(x)logQ(x)

  • 应用:

        分类任务的损失函数(如交叉熵损失)

        语言模型训练中,最小化预测分布与真实分布的交叉熵

(3)KL散度

  • 定义:衡量分布 P 与 Q 的差异:

        D_{KL}(P||Q)=\sum_{x}^{}P(x)log\frac{(P(x))}{Q(x)}=H(P,Q)-H(P)

        性质: 非负性 D_{KL}(P||Q)\geq 0,非对称性 D_{KL}(P||Q) \neq D_{KL}(Q||P)

  • 应用:

        变分推断中,最小化 D_{KL}(Q||P) 以近似后验分布

        模型蒸馏中,让学生模型分布逼近教师模型

(4)互信息

  • 定义:衡量两个随机变量 X 和 Y的相关性:

        I(X;Y)=H(X)-H(X||Y)=H(Y)-H(Y||X)=D_{KL}(P(X,Y)||P(X)P(Y))

  • 应用:

        特征选择:选择与目标变量互信息高的特征

        多路径生成:筛选与问题相关性高的推理路径

2.编码理论

(1)压缩编码基础

  • 霍夫曼编码(Huffman Coding)

        原理:为高频符号分配短码,低频符号分配长码,构建最优前缀码

        数学形式:最小化平均码长 L=\sum_{x}^{}P(x)l(x),其中 l(x) 是符号 x 的码长

  • 算术编码(Arithmetic Coding)

        原理:将整个输入序列映射到一个区间 [0,1),用区间长度编码概率

        优势:接近香农熵极限,尤其适合高阶统计依赖的数据

(2)BPE算法的数学原理:从理论到实践:字节对编码(BPE)算法-CSDN博客

3.应用

(1)注意力机制中的信息瓶颈:从理论到实践:Pytorch实现注意力机制到Triton优化-CSDN博客

(2)模型不确定性的量化:从理论到实践:absmax、zeropoint和LLM.int8()在gpt-2的应用-CSDN博客

(3)多路径生成的自洽性验证:从理论到实践:CoT的多路径生成与自洽性-CSDN博客

4.核心公式

信息熵:H(X)=-\sum_{x\in X}^{}P(x)logP(x)

交叉熵:H(P,Q)=-\sum_{x}^{}P(x)logQ(x)

KL散度:D_{KL}(P||Q)=\sum_{x}^{}P(x)log\frac{(P(x))}{Q(x)}=H(P,Q)-H(P)

互信息:I(X;Y)=H(X)-H(X||Y)=H(Y)-H(Y||X)=D_{KL}(P(X,Y)||P(X)P(Y))

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/78742.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

构建智能期货交易策略分析应用:MCP与AI的无缝集成

引言 随着金融科技的快速发展,数据驱动的交易决策已成为期货交易领域的重要趋势。本文将深入探讨一个结合了Model Content Protocol (MCP)和AI技术的期货交易策略分析应用——Futures MCP。该应用不仅提供了丰富的技术分析工具,还通过MCP协议与大型语言…

0x02.Redis 集群的实现原理是什么?

回答重点 Redis 集群(Redis cluster)是通过多个 Redis 实例组成的,每个主节点实例负责存储部分的数据,并且可以有一个或多个从节点作为备份。 具体是采用哈希槽(Hash Slot)机制来分配数据,将整…

基本的DOS命令

一.打开CMD方式: winR 输入cmd 开始系统命令提示符 在任意文件夹下,shift+鼠标右击,在此处打开命令 资源管理器的地址栏前面输入cmd 以管理员身份打开cmd:选择以管理员方式运行 二.常用的Dos命令 #盘符切换 盘符…

深度剖析:架构评估的常用方法与应用

架构评估是确保系统架构满足需求、性能和质量等方面要求的重要环节,以下是一些常见的架构评估方法的详细介绍: 一、基于调查问卷或检查表的评估方法 1.方法概述:该方法通过设计一系列针对性的问题或检查项,形成问卷或检查表&…

代码随想录算法训练营第十六天

LeetCode题目: 530. 二叉搜索树的最小绝对差501. 二叉搜索树中的众数236. 二叉树的最近公共祖先3272. 统计好整数的数目(每日一题) 其他: 今日总结 往期打卡 530. 二叉搜索树的最小绝对差 跳转: 530. 二叉搜索树的最小绝对差 学习: 代码随想录公开讲解 问题: 给你一个二叉搜…

基于双闭环PID控制器的永磁同步电机控制系统匝间故障Simulink仿真

欢迎微♥关注“电击小子程高兴的MATLAB小屋”获取巨额优惠 1.模型简介 本仿真模型基于MATLAB/Simulink(版本MATLAB 2013Rb)软件。建议采用matlab2013 Rb及以上版本打开。(若需要其他版本可联系代为转换,高于该版本的matlab均可正…

02-libVLC的视频播放器:播放音视频文件以及网络流

libvlc_new(0, nullptr)功能:创建并初始化libVLC的核心实例,是使用所有libVLC功能的前提。 参数:第一个参数:参数数量(通常设为0)第二个参数:参数列表(通常为nullptr,表示使用默认配置)返回值:成功返回libvlc_instance_t*指针,失败返回nullptr。注意事项:可通过参…

2025蓝桥杯省赛C++B组解题思路

由于题面还没出来,现在先口胡一下思路 填空题直接打表找规律或者乱搞一下就能出,从大题开始说。 1,题意: 给你一个数组,这个数组里有几个数可以被一个连续递增的数字区间求和得出 思路:诈骗题,显…

防止邮件伪造的策略 SPF 介绍

SPF是Sender Policy Framework的缩写,即发件人策略框架,是一种用于防止电子邮件伪造的技术,用来验证发件人邮箱域名的真实性。以下是关于它的详细说明: 1. 定义与作用 SPF是一种电子邮件验证系统,它通过在域名的DNS记…

JavaScript Symbol与BigInt

目录 Symbol类型 一、Symbol 的核心特性 1. 唯一性 2. 不可变性 3. 不可枚举性 二、创建 Symbol 1. 基础创建 2. 全局 Symbol 注册表 三、Symbol 作为对象属性 1. 定义 Symbol 属性 2. 遍历 Symbol 属性 四、内置 Symbol 值 五、实际应用场景 1. 避免属性名冲突 …

AI Agent工程师认证-学习笔记(3)——【多Agent】MetaGPT

学习链接:【多Agent】MetaGPT学习教程 源代码链接(觉得很好,star一下):GitHub - 基于MetaGPT的多智能体入门与开发教程 MetaGPT链接:GitHub - MetaGPT 前期准备 1、获取MetaGPT (1)使用pip获取MetaGPT pip install metagpt==0.6.6#或者在国内加速安装镜像 #pip in…

【leetcode hot 100 416】分割等和子集

解法一:(动态规划)①定义:dp[i]表示是否可以在nums找到元素之和为i,dp[sum/21] ②初始状态:dp[0]true;dp[i]false ③状态转移方程:dp[i] dp[i] || dp[i - num]; class Solution {public boole…

高中数学联赛模拟试题精选第2套几何题(改编)

在 △ A B C \triangle ABC △ABC 中, 点 M M M 是边 A C AC AC 的中点. 在线段 A M AM AM, C M CM CM 上分别取点 P P P, Q Q Q, 使得 P Q A C / 2 PQAC/2 PQAC/2. 设 △ A B Q \triangle ABQ △ABQ 的外接圆与边 B C BC BC 相交于点 X X X, △ B C P \triangle …

UWB双通道隧道人员定位方案

技术基础:UWB(超宽带技术) 定义:UWB(Ultra-Wideband)是一种通过纳秒级窄脉冲传输数据的无线通信技术,占用500MHz以上的超宽频段。 核心优势: 高精度定位:时间分辨率极高&…

Linux 入门八:Linux 多进程

一、概述 1.1 什么是进程? 在 Linux 系统中,进程是程序的一次动态执行过程。程序是静态的可执行文件,而进程是程序运行时的实例,系统会为其分配内存、CPU 时间片等资源。例如,输入 ls 命令时,系统创建进程…

MTCNN 人脸识别

前言 此处介绍强大的 MTCNN 模块,给出demo,展示MTCNN 的 OOP, 以及ROS利用 C 节点,命令行调用脚本执行实际工作的思路。 MTCNN Script import argparse import cv2 from mtcnn import MTCNN import osclass MTCNNProcessor:def…

01_核心系统下的技术原理解析

15年前,基本上国内的核心系统被C垄断,基本上是IBM的那套东西,场景也是比价复杂,这里不再赘述,TPS太过于庞大,技术上确实比较复杂。为此我这里抛砖引玉,说下对应的支付系统: &#x…

Python 实现最小插件框架

文章目录 Python 实现最小插件框架1. 基础实现项目结构plugin_base.py - 插件基类plugins/hello.py - 示例插件1plugins/goodbye.py - 示例插件2main.py - 主程序 2. 更高级的特性扩展2.1 插件配置支持2.2 插件依赖管理2.3 插件热加载 3. 使用 setuptools 的入口点发现插件3.1 …

电感详解:定义、作用、分类与使用要点

一、电感的基本定义 电感(Inductor) 是由导线绕制而成的储能元件,其核心特性是阻碍电流变化,将电能转化为磁能存储。 基本公式: 自感电动势: E -L * (di/dt) (L:电感值&#xff0c…

运行一次性任务与定时任务

运行一次性任务与定时任务 文章目录 运行一次性任务与定时任务[toc]一、使用Job运行一次性任务1.创建一次性任务2.测试一次性任务3.删除Job 二、使用CronJob运行定时任务1.创建定时任务2.测试定时任务3.删除CronJob 一、使用Job运行一次性任务 1.创建一次性任务 (…