大语言模型基石:文字与数字的起源与演变

大语言模型基石:文字与数字的起源与演变


1、文字

1.1、起源

  我们的祖先在还没有发明文字和语言之前就已经开始使用“咿咿呀呀”的声音来传播信息了,比如在野外活动遇到危险,然后发出“咿咿呀呀”的声音来提醒同伴小心,同伴在接收到信息后首先要做的就是解码,从“咿咿呀呀”中解读想要传递的信息。
  对发明并掌握文字的现代人来说,只是将祖先的“咿咿呀呀”替换成了象形文字和楔形文字,但是其本质都是为了传递信息。之所以会诱导我们的祖先发明文字,是因为其掌握的信息越来越多、语言越来越丰富和越来越抽象,人类大脑已经很难记住这么多的词汇,最终我们的祖先为了高效的记录信息,便走上发明文字的道路。
image.png
  约在公元前3400年左右,苏美尔人发展出了楔形文字,这是目前已知的最早的完整文字系统之一。楔形文字最初是以图画为基础,但很快就发展成为一种表意和表音的混合系统。这种文字系统在美索不达米亚地区(伊拉克境内)广泛使用,并由腓尼基人传播到其他地区。
  在甲骨文(公元前14世纪)出现的前约两千年(公元前24世纪左右),古埃及文明已开始使用图形表示事物,形成了最早的象形文字。无论是甲骨文还是古埃及的象形文字早期文字的数量都是和想要记录的信息相关,由于人类掌握的信息越来越多,象形文字就从刚开始的几百个,渐渐发展成几个千。此时的先祖们又一次站在的推动历史进程的拐点,开始了第一次对象形文字的归纳总结,从而就出现了一词多义的多义词、一词多音的多音词等等。
  高度概括又带来了难理解和歧义,不同的人接收到同一段文字可能会做出不同的解读。为了解决这样的问题就只能依靠上下文,其可以解决大多数歧义(除非估计捣乱)。我们阅读古籍看见的下面的标注,其实就是后人结合上下文按照自己理解进行去歧义的过程。

1.2、本质

  从文明古国文字起源不难看出都是因为随着对世界的认识越来越丰富,带来的信息也越来越多,原有记录信息和传播信息的方式已经不能满足当下需求不得不做出的演进。各文明古国在历史上相互隔绝,在没有交流沟通的前提下形成了不同的文字,但是其文字背后的本质都是为了记录所见所谓、所思所想的信息。
  我们把时间线拉到秦始皇统一六国之前春秋战国时期,在秦始皇还没有统一六国之前各国都有自己的文字和语言,各国之间商贸之所以能正常进行,正是因为在文字的本质是信息这个大前提下产生了翻译。当下翻译很常见,中英互翻和中法互翻等等,同样也没有逃过文字只是信息的载体,而非信息本身的底层本质。

2、数字

2.1、起源

  文字的出现是因为我们祖先掌握越来越多的信息导致大脑不能有效的记住这些信息,那么数字的出现也是因为我们祖先掌握的东西越来越多,只是这里的东西换成了财产。在远古时期我们的祖先拥有的财产可能就只有身上的几片树叶,根本没有到需要数一数的地步,所以就用不上数字,但是随着生产力的提高和部落的出现个人拥有的财产也随之增长,此时就到了需要数一数才能搞清楚自己有多少财产的时候了。
  正如一则小故事,两个部落首领要比一比谁说的数字大,A首领想了想说3,B首领因为家境贫寒想了半天没能想出比3大的数字,并说你赢了。由此数字的发明就是为了记录财产等需要数一数才能清楚有多少的东西。
  我们的祖先早期就是通过掰手指来数数,刚学加减法时候的我们也是如此,恰好人类双手有十根手指,便有了我们日常使用的十进制,如果人类手指不是十根,那么我们现在可能使用的就是其它进制的计数系统了。但是玛雅文明并没有使用十进制,而是将脚趾的十根也加了进来形成了二十进制,从而玛雅文明的计数法就和其他文明在本质上就有了区别,这可能也是玛雅文明如此神秘的原因之一吧。十多年前关于2012年世界末日的传说也是对玛雅文明技术系统的误解和夸大,玛雅人使用二十进制那么他们的日历系统也是基于二十进制的“长计数历”,并从公元前3114年8月11日玛雅文明的创世日期开始计算,正好到2012年12月21日为一个长计数历结束,所以这个日期只是表示一个周期结束和新周期的开始,而不是世界的终结。

2.2、发展

  约在35000年前人类就有了计数系统,但是所有古文明的计数系统在1、2、3的记录方式都是采用简单书写的几横(中国)、几竖(罗马)或者几点(美索不达米亚)。因为我们的祖先使用十进制的计算系统,那么在记录大数字的时候就又有编码的过程,如中国使用个十百千万亿兆来表示进位,罗马则使用相对复杂的系统来表示进位。
  同样是逢十进一中国使用十百千万亿兆来进行编码,然后使用乘法的规则进行解码,如一百万写法的含义就是110010000。而罗马使用“I代表1、V代表5、X代表10、L代表50、C代表100、D代表500、M代表1000”的系统来进行编码,然后使用加减法的规则进行解码(小数字出现在大数字左边为减、右边为加),如IV表示5-1=4,VI表示5+1=6,二者一比较高下立判。
  虽然中国和罗马在数字都有自己的独特发明,但是最高效的还是印度人发明由阿拉伯人传播包含0在内的10个阿拉伯数字,因为其便利性进而推过为全世界通用的数字计数系统。阿拉伯数字具有高度的抽象性,它很好的将文字和数字进行了分离,而不是像中国和罗马那么在文字上创造数字使得二者高度耦合。


一键三连,让我的信心像气球一样膨胀!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/794288.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

考古:IT架构演进之IOE架构

考古:IT架构演进之IOE架构 IOE架构(IBM, Oracle, EMC)出现在20世纪末至21世纪初,是一种典型的集中式架构体系。在这个阶段,企业的关键业务系统往往依赖于IBM的小型机(后来还包括大型机)、Oracle…

基于SpringBoot+Vue的儿童书法机构管理系统

一、项目背景介绍: 儿童书法机构的管理是一个具有挑战性的任务,需要有效的信息管理和资源分配。传统的手动管理方式存在着效率低下、易出错等问题。为了解决这些问题,基于SpringBootVue的儿童书法机构管理系统应运而生。该系统利用现代化的技…

Linux--进程(2)

目录 前言 1. 进程的状态 1.1 进程排队 1.2 运行,阻塞,挂起 2.Linux下具体的进程状态 2.1僵尸和孤儿 3.进程的优先级 4.Linux的调度与切换 前言 这篇继续来学习进程的其它知识 上篇文章:Linux--进程(1)-CS…

ES12 学习

文章目录 1. 逻辑赋值操作符2. 数字分隔符_3. replaceAll4. Promise.any5. WeakRefs6. FinalizationRegistry 1. 逻辑赋值操作符 逻辑赋值操作符 ??、&&、|| let a true let b true a && b // a a && b a || b // a a || b obj.introduction ?…

Redis -- 缓存击穿问题

缓存击穿问题也叫热点Key问题,就是一个被高并发访问并且缓存重建业务较复杂的key突然失效了,无数的请求访问会在瞬间给数据库带来巨大的冲击。 常见的解决方案有两种: 互斥锁 逻辑过期 逻辑分析:假设线程1在查询缓存之后&…

静态路由协议实验1

要求: 使用静态路由协议使得全网可达。 第一步、规划IP地址。并配置IP。 第二步、写静态路由 [r1]ip route-static 192.168.3.0 24 192.168.2.2 [r1]ip route-static 192.168.4.0 24 192.168.2.2 [r1]ip route-static 192.168.5.0 24 192.168.2.2[r2]ip route-st…

一、next-auth 身份验证凭据-使用电子邮件和密码注册登录

一、next-auth 身份验证凭据-使用电子邮件和密码注册登录 文章目录 一、next-auth 身份验证凭据-使用电子邮件和密码注册登录一、前言二、前置准备1、环境配置2、相关库安装(1)vercel 配置(2)Yarn 包管理配置 3、next项目初始化与…

【Oracle】oracle、mysql、sql server三者区别

欢迎来到《小5讲堂》,大家好,我是全栈小5。 这是《Oracle》系列文章,每篇文章将以博主理解的角度展开讲解, 特别是针对知识点的概念进行叙说,大部分文章将会对这些概念进行实际例子验证,以此达到加深对知识…

Shell脚本之基础-2

目录 一、字符处理 cut命令 awk命令 sed命令 字符串排序 二、条件判断 文件类型判断 文件权限判断 两个文件的判断 整数比较 字符串判断 多重判断 三、流程控制 if分支 if else 双分支结构 case分支 for循环 while循环 一、字符处理 cut命令 命令格式&#x…

深入剖析JavaScript中的this(下)

五、事件处理函数的this 5.1 事件绑定 <button id"btn">点击我</button>function handleClick(e) {console.log(this);// <button id"btn">点击我</button> }document.getElementById(btn).addEventListener(click, handleClick…

CSS基础:4种简单选择器的详解

你好&#xff0c;我是云桃桃。 一个希望帮助更多朋友快速入门 WEB 前端的程序媛。大专生&#xff0c;2年时间从1800到月入过万&#xff0c;工作5年买房。 分享成长心得。 261篇原创内容-公众号 后台回复“前端工具”可获取开发工具&#xff0c;持续更新中 后台回复“前端基础…

MySQL客户端安装并配置免密登录

最近在写脚本时需要向MySQL数据库中存储数据&#xff0c;且脚本运行的服务器与MySQL服务器不是同一台服务器&#xff0c;而且需要保证MySQL密码的安全性&#xff0c;不能在脚本中暴露&#xff0c;所以就需要在服务器上安装MySQL客户端&#xff0c;并配置免密登录。 一、虚拟机…

Git安装教程(图文安装)

Git Bash是git(版本管理器)中提供的一个命令行工具&#xff0c;外观类似于Windows系统内置的cmd命令行工具。 可以将Git Bash看作是一个终端模拟器&#xff0c;它提供了类似于Linux和Unix系统下Bash Shell环境的功能。通过Git Bash&#xff0c;用户可以在Windows系统中运行基于…

Vue项目登录页实现获取短信验证码的功能

之前我们写过不需要调后端接口就获取验证码的方法,具体看《无需后端接口,用原生js轻松实现验证码》这个文章。现在我们管理后台有个需求,就是登录页面需要获取验证码,用户可以输入验证码后进行登录。效果如下,当我点击获取验证码后能获取短信验证码: 这里在用户点击获取…

Linux 线程:线程同步、生产者消费者模型

目录 一、死锁 二、条件变量实现线程同步 1、为什么需要线程同步 2、条件变量、同步、竞态条件 3、条件变量函数&#xff1a;初始化 销毁 等待 唤醒 4、实现简单的多线程程序 不唤醒则一直等待 实现线程同步 三、生产者消费者 1、借助超市模型理解 2、优点 四、基于…

数字乡村创新实践探索:科技赋能农业现代化与乡村治理体系现代化同步推进

随着信息技术的飞速发展&#xff0c;数字乡村作为乡村振兴的重要战略方向&#xff0c;正日益成为推动农业现代化和乡村治理体系现代化的关键力量。科技赋能下的数字乡村&#xff0c;不仅提高了农业生产的效率和品质&#xff0c;也为乡村治理带来了新的机遇和挑战。本文旨在探讨…

Linux 环境下 Redis基础配置及开机自启

Linux 环境下 Redis基础配置及开机自启 linux环境安装redis<redis-6.0.5.tar.gz> 1-redis基本安装配置 解压 获取到tar包后&#xff0c;解压到相关目录&#xff0c;一般是将redis目录放在usr/local/redis目录下&#xff0c;可以使用-C指定到解压下目录 tar -zvxf re…

Java数据结构栈

栈&#xff08;Stack&#xff09; 概念 栈是一种先进后出的数据结构。 栈的使用 import java.util.Stack; public class Test {public static void main(String[] args) {Stack<Integer> s new Stack();s.push(1);s.push(2);s.push(3);s.push(4);System.out.println(s…

3. python练习题3-自由落体

3. python练习题3-自由落体 【目录】 文章目录 3. python练习题3-自由落体1. 目标任务2. 解题思路3. 知识回顾-%占位符格式化处理3.1 概述3.2 占位符的多种用法3.3 格式化操作符辅助指令3.4 将整数和浮点数格式化为字符串 4. 解题思路4.1 球第1次下落4.2 球第2次下落 5. 最终代…

day60 动态规划part17

这两题看了自己写的笔记还不懂的话&#xff0c;看看这个up的思路就行&#xff1a; https://space.bilibili.com/111062940/search/video?keyword%E5%9B%9E%E6%96%87 647. 回文子串 中等 提示 给你一个字符串 s &#xff0c;请你统计并返回这个字符串中 回文子串 的数目。 回…