如何度量信息的大小

信息这个词让我们感到熟悉而又陌生。熟悉是因为我们所处在一个信息时代,与生活密切相关的就有大量的各种信息,比如书籍、手机、电脑等。而陌生是因为很难精确说明信息是什么并且如何量化信息,比如“地球是圆的”一句话包含了多少信息呢,在古代和现代这句话包含的信息量是不是就不一样了呢。

万物都包含着信息,信息可被处理并使用(从广义上称为计算),从广义的信息和信息处理角度看,我们看到的事物变化其实是宇宙的计算。也许可以说世界的本质就是信息+计算。很多科学家认为最有希望统一广义相对论和量子力学的就是信息理论。

将信息量化是信息革命的基础,在香农发表《通信的数学理论》之前,信息是一个很抽象而且无法具体确切定义的东西,比如一个人说某公司拥有大量的信息,它有一亿封邮件,那一亿封邮件包含了多少信息?而在物理和化学等领域都已经有各类量纲可以用于丈量各类物体特性,为了让信息可以测量,香农独自提出了比特(bit)概念,使用比特来丈量信息,比特也成为了量纲成员。

熵是物理学的概念,在热力学系统中,熵和能量可以用来刻画系统的变化。熵可以在分子层面进行理解,物理系统由原子分子组成,所有粒子的瞬时状态(位置、速度)描述了整体状态。粒子不断从某个微观态转变到另一个微观态,而熵对应着微观态的量,微观态越多熵就越高。也就是说熵用来表示不确定程度。

借鉴于物理学中的熵的概念,香农将其引入到通信领域,香农认为某个系统要携带信息就必须要有多个状态,而且状态越多,所能包含的信息就越多。此外,还需要引入概率问题,因为在给定条件下,所有可能状态的概率之和必须为1。而可能状态越多则平均任意一个状态发生的可能性就越低。

信息与可能状态数量、概率、文本长度、文本本身意义都有密切的关系,但从通信角度来看,可以不必关心文本本身的意义。为了对文本信息进行度量,首先需要确定有多少个可能状态及其对应的概率,将每个状态概率都与概率的对数相乘,然后累加所有项。得到的结果即是信息熵的大小,单位为比特。

信息熵可以用来刻画系统携带信息的能力,也可以用来表示某个事物所携带的信息量。当使用信息熵来描述事物的信息量时,它缺乏考虑冗余,比如重复的两句话并没有带来两倍的信息量。还有顺序不同的两句话虽然信息量相同,但是从语言层面上的意义并非相同。

调和日常意义的信息与信息熵的办法是将信息熵视为文本所能包含的最大信息量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/867642.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

centos7部署mysql8.0

1.安装MySQL的话会和MariaDB的文件冲突,所以需要先卸载掉MariaDB。查看是否安装mariadb rpm -qa | grep mariadb 2. 卸载mariadb rpm -e --nodeps 查看到的文件名 3.下载MySQL安装包 MySQL官网下载地址: MySQL :: Download MySQL Community Serverhttps://dev.mys…

19.JWT

1►JWT博客推荐 阮老师讲得很好了,网址如下: http://www.ruanyifeng.com/blog/2018/07/json_web_token-tutorial.html 2►ry是怎么践行JWT的呢? 问题一:不登录的时候有token吗? 答:没有,所…

blender 纹理绘制-贴花方式

贴画绘制-1分钟blender_哔哩哔哩_bilibili小鸡老师的【Blender风格化角色入门教程】偏重雕刻建模https://www.cctalk.com/m/group/90420100小鸡老师最新的【风格化角色全流程进阶教程】偏重绑定。早鸟价进行中!欢迎试听https://www.cctalk.com/m/group/90698829, 视…

Splunk Enterprise 中的严重漏洞允许远程执行代码

Splunk 是搜索、监控和分析机器生成大数据的软件领先提供商,为其旗舰产品 Splunk Enterprise 发布了紧急安全更新。 这些更新解决了几个构成重大安全风险的关键漏洞,包括远程代码执行 (RCE) 的可能性。 受影响的版本包括 * 9.0.x、9.1.x 和 9.2.x&…

ARM架构和Intel x86架构

文章目录 1. 处理器架构 2. ARM架构 3. Intel x86架构 4. 架构对比 1. 处理器架构 处理器架构是指计算机处理器的设计和组织方式,它决定了处理器的性能、功耗和功能特性。处理器架构影响着从计算机系统的硬件设计到软件开发的各个方面。在现代计算技术中&#…

计算机组成原理学习笔记(一)

计算机组成原理 [类型:: [[计算机基础课程]] ] [来源:: [[B站]] ] [主讲人:: [[咸鱼学长]] ] [评价:: ] [知识点:: [[系统软件]] & [[应用软件]] ] [简单解释:: 管理计算机系统的软件; 按照任务需要编写的程序 ] [问题:: ] [知识点:: [[机器字长]] ] [简单…

绝区壹--LLM的构建模块

前言 语言是人类交流的本质,大型语言模型 (LLM) 凭借其出色的理解和生成类似人类的文本的能力,彻底改变了我们与语言互动和利用语言的方式。深入研究 LLM 的构建块(向量、标记和嵌入),揭示了使这些模型能够以前所未有…

辣子简报芬芳喜事特辑

【辣子简报芬芳喜事特辑】🎉在这个季节的尾声,当一缕阳光温柔地洒在打包好的行囊上,我们不约而同地停下了忙碌的脚步,回望那段共同编织的璀璨时光——79天的并肩作战,如同一段精彩绝伦的旅程,如今已缓缓驶向…

3D地图是智慧城市可视化项目绕不开的技术!来我帮你解决

**3D地图:智慧城市可视化项目绕不开的技术!来我帮你解决** 智慧城市已成为未来城市发展的必然趋势。而3D地图作为智慧城市可视化项目的核心技术之一,其重要性不言而喻。本文将深入探讨3D地图在智慧城市建设中的应用及其优势,为您…

2-5 softmax 回归的简洁实现

我们发现通过深度学习框架的高级API能够使实现线性回归变得更加容易。 同样,通过深度学习框架的高级API也能更方便地实现softmax回归模型。 本节如在上节中一样, 继续使用Fashion-MNIST数据集,并保持批量大小为256。 import torch from torc…

黑马的ES课程中的不足

在我自己做项目使用ES的时候,发现了黑马没教的方法,以及一些它项目的小问题 搜索时的匹配方法 这个boolQuery().should 我的项目是通过文章的标题title和内容content来进行搜索 但是黑马它的项目只用了must 如果我们的title和content都用must&#x…

Apache Seata新特性支持 -- undo_log压缩

本文来自 Apache Seata官方文档,欢迎访问官网,查看更多深度文章。 本文来自 Apache Seata官方文档,欢迎访问官网,查看更多深度文章。 Apache Seata新特性支持 – undo_log压缩 Seata新特性支持 – undo_log压缩 现状 & 痛点…

【IT领域新生必看】 Java编程中的重写(Overriding)规则:初学者轻松掌握的全方位指南

文章目录 引言什么是方法重写(Overriding)?方法重写的基本示例 方法重写的规则1. 方法签名必须相同示例: 2. 返回类型可以是子类型(协变返回类型)示例: 3. 访问修饰符不能比父类的更严格示例&am…

WordPress子比主题美化文章顶部添加百度收录按钮

要在WordPress子主题中美化文章顶部并添加百度收录按钮,你可以按照以下步骤操作: 首先,确保你的主题支持自定义CSS。如果不支持,你需要在主题目录下创建一个名为style.css的文件,并将以下代码复制到该文件中。如果你的…

全网最详细的appium 自动化测试iOS(二)

一、环境准备: 1、安装appium 2、xcode (appium 版本:12.1.0 xcode版本:12.5 可正常运行,ps:appium 版本:12.1.0 xcode版本:13.0 一直报奇奇怪怪的错误) 3、依赖工具包安装 brew install…

VSCode设置字体大小

方法1:Ctrl 和 Ctrl -,可以控制整个VSCode界面的整体缩放,但是不会调整字体大小 方法2:该方法只能设置编辑器界面的字号,无法改变窗口界面的字号。 (1)点开左下角如下图标,进入…

谷粒商城学习笔记-15-数据库初始化

文章目录 一,创建数据库1,数据库名称2,创建数据库 二,创建表1,仓储模块建表2,订单模块建表3,商品模块建表4,优惠券模块建表5,会员模块建表6,DBeaver批量执行S…

小白 | Linux安装python3

一、更新包列表 首先,确保你的包管理器是最新的: sudo apt update 二、安装 Python 3 安装 Python 3 以及常用的开发工具 sudo apt install python3 python3-pip python3-venv 三、验证安装 python3 --version

FreeRTOS——事件标志组

一、事件标志组 前面所介绍的队列、信号量,只能实现与单个任务进行同步。而有时候某个任务可能需要与多个事件或任务进行同步,此时,事件标志组的作用就凸显出来 1.1 事件标志组简介 事件标志位:用一个位,来表示事件是…

二、Spring

二、Spring 1、Spring简介 1.1、Spring概述 官网地址:https://spring.io/ Spring 是最受欢迎的企业级 Java 应用程序开发框架,数以百万的来自世界各地的开发人员使用 Spring 框架来创建性能好、易于测试、可重用的代码。 Spring 框架是一个开源的 Jav…