计算机语言史话论文,【论文节选】自然语言处理发展历史。

说实话看完文章有点失望,作者带有一贯的学术吹嘘风,就像吹嘘云计算,物联网等等。谈到现状,只字不提问题,一句话“一旦自然语言处理的研究获得成功,那么机器将能够进行思考,人类将得到继工业革命后的又一次解放。不同的是工业革命解放了人类的身体,而自然语言处理将解放人类的大脑。”您在写YY小说啊?

没有认识到未来需要解决的问题,就不可能走下去。期待未来真有大牛研究出来吧。

下面是节选的历史。没什么实际意义,就是给自己扫盲而已。

1.什么是自然语言处理

自然语言处理(Natural Language Processing, NLP)是一种对自然语言信息进行处理的技术[4],从语言学的角度来说,自然语言处理也叫计算语言学(Computational Linguistics)。自然语言处理包括自然语言理解(Natural Language Understanding, NLU)和自然语言生成(Natural Language Generation, NLG)两部分。自然语言理解是指对自然语言的内容和意图的深层把握。在人工智能领域中,自然语言理解特指计算机对自然语言的内容和意图的深层把握。自然语言生成是指从非自然语言输入到自然语言输出的处理。自然语言理解与自然语言生成互为逆过程[5]。图1简单地表示了自然语言处理、自然语言理解和自然语言生成三者之间的关系。其中,语言A和语言B可以是相同的语言,也可以是不同的语言。当语言A和语言B是相同的语言时,整个过程表示为聊天式交流;而当语言A和语言B是不同的语言时,整个过程则表示为机器翻译式交流。

2.发展概况

自然语言处理的发展大致经历了4个阶段:1956年以前的萌芽期;1957-1970年的快速发展期;1971 -1993年的低谷的发展期和1994年至今的复苏融合期。

2.1萌芽期(1956年以前)

1956年以前,可以看作自然语言处理的基础研究阶段。一方面,人类文明经过了几千年的发展,积累了大量的数学、语言学和物理学知识。这些知识不仅是计算机诞生的必要条件,同时也是自然语言处理的理论基础。另一方面,阿兰·图灵在1936年首次提出了“图灵机”的概念。“图灵机”作为计算机的理论基础,促使了1946年电子计算机的诞生。而电子计算机的诞生又为机器翻译和随后的自然语言处理提供了物质基础。

由于来自机器翻译的社会需求,这一时期也进行了许多自然语言处理的基础研究。1948年Shannon把离散马尔可夫过程的概率模型应用于描述语言的自动机。接着,他又把热力学中“熵”(entropy)的概念引用于语言处理的概率算法中。上世纪50年代初,Kleene研究了有限自动机和正则表达式。1956年,Chomsky又提出了上下文无关语法,并把它运用到自然语言处理中。他们的工作直接引起了基于规则和基于概率这两种不同的自然语言处理技术的产生。而这两种不同的自然语言处理方法,又引发了数十年有关基于规则方法和基于概率方法孰优孰劣的争执。

另外,这一时期还取得了一些令人瞩目的研究成果。比如,1946年Köenig进行了关于声谱的研究。1952年Bell实验室语音识别系统的研究。1956年人工智能的诞生为自然语言处理翻开了新的篇章。这些研究成果在后来的数十年中逐步与自然语言处理中的其他技术相结合。这种结合既丰富了自然语言处理的技术手段,同时也拓宽了自然语言处理的社会应用面。

2.2快速发展期(1957-1970)

自然语言处理在这一时期很快融入了人工智能的研究领域中。由于有基于规则和基于概率这两种不同方法的存在,自然语言处理的研究在这一时期分为了两大阵营。一个是基于规则方法的符号派(symbolic),另一个是采用概率方法的随机派(stochastic)。

这一时期,两种方法的研究都取得了长足的发展。从50年代中期开始到60年代中期,以Chomsky为代表的符号派学者开始了形式语言理论和生成句法的研究,60年代末又进行了形式逻辑系统的研究。而随机派学者采用基于贝叶斯方法的统计学研究方法,在这一时期也取得了很大的进步。但由于在人工智能领域中,这一时期多数学者注重研究推理和逻辑问题,只有少数来自统计学专业和电子专业的学者在研究基于概率的统计方法和神经网络,所

以,在这一时期中,基于规则方法的研究势头明显强于基于概率方法的研究势头。

这一时期的重要研究成果包括1959年宾夕法尼亚大学研制成功的TDAP系统,布朗美国英语语料库的建立等。1967年美国心理学家Neisser提出认知心理学的概念,直接把自然语言处理与人类的认知联系起来了。

2.3低速的发展期(1971 -1993)

随着研究的深入,由于人们看到基于自然语言处理的应用并不能在短时间内得到解决,而一连串的新问题又不断地涌现,于是,许多人对自然语言处理的研究丧失了信心。从70年代开始,自然语言处理的研究进入了低谷时期。

但尽管如此,一些发达国家的研究人员依旧不依不挠地继续着他们的研究。由于他们的出色工作,自然语言处理在这一低谷时期同样取得了一些成果。70年代,基于隐马尔可夫模型(Hidden Markov Model, HMM)的统计方法在语音识别领域获得成功。80年代初,话语分析(Discourse Analysis)也取得了重大进展。之后,由于自然语言处理研究者对于过去的研究进行了反思,有限状态模型和经验主义研究方法也开始复苏。

2.4复苏融合期(1994年至今)

90年代中期以后,有两件事从根本上促进了自然语言处理研究的复苏与发展。一件事是90年代中期以来,计算机的速度和存储量大幅增加,为自然语言处理改善了物质基础,使得语音和语言处理的商品化开发成为可能;另一件事是1994年Internet商业化和同期网络技术的发展使得基于自然语言的信息检索和信息抽取的需求变得更加突出。这样,自然语言处理的社会需求更加迫切,自然语言处理的应用面也更加宽广,自然语言处理不再局限于机器翻译、语音控制等早期研究领域了。

从90年代末到21世纪初,人们逐渐认识到,仅用基于规则的方法或仅用基于统计的方法都是无法成功进行自然语言处理的。基于统计、基于实例和基于规则的语料库技术在这一时期开始蓬勃发展,各种处理技术开始融合,自然语言处理的研究又开始兴旺起来。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/552597.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vue开发跨平台应用

native script 开发android和ios的框架,js引擎和本地交互没有webview,更加高效 npm install -g nativescript ns create my-app --js ns create my-app --template typescript ns create my-app --template angular ns create my-app --template vue 编译 ns build android …

杭州招聘计算机专业毕业生,毕业季必看!杭州高校毕业生就业情况:这些专业最吃香!这个岗位最缺人!...

原标题:毕业季必看!杭州高校毕业生就业情况:这些专业最吃香!这个岗位最缺人!夏天,就是毕业的季节有一群人要离开校园,走上社会也有一群人要面临填志愿、选专业在杭州,什么专业最热门…

澳国立计算机录取分数,澳洲出国:2018年澳洲国立大学对高考成绩的本科录取分数线(多图)...

大师兄留学网(微信公众号:留学申请Free)是一支免费申请澳大利亚,新西兰,泰国,新加坡,马来西亚的零中介平台。大师兄留学网(微信号:Betty8990)在申请澳洲方面,有办理留学经验超过十年的学长学姐&…

寻仙手游维护公告服务器停服更新,寻仙手游3月1日停服更新公告 更新内容分享...

原标题:寻仙手游3月1日停服更新公告 更新内容分享在寻仙手游中,为了让玩家们更好的体验游戏。寻仙手游将于3月1日对游戏进行停服更新,本次更新新增了哪些新内容,今天小编就给大家带来寻仙手游3月1日停服更新公告的详细内容。寻仙手…

王者荣耀8月15日服务器维护,王者荣耀8月15日维护ios更新不了解 王者荣耀8月15日维护ios更新不了解决办法_蚕豆网新闻...

王者荣耀8月15日进行了维护更新,这次版本更新比较大,有新英雄马超等内容。但是维护完后不少玩家发现ios更新不了。大版本更新ios就很容易出现更新失败的情况,ios更新失败原因是什么?更新不了怎么解决?王者荣耀8月15日ios更新不了怎么办?第…

崩坏3服务器故障 临时维护,崩坏3 11.5游戏故障处理及补偿说明

崩坏3 11.5游戏故障补偿什么时候发?介绍了11.5游戏故障处理及补偿说明,希望这篇文章能够帮助到崩坏3的玩家!游戏介绍:崩坏3是由同名漫画改编的游戏作品,延续了崩坏学园2中的崩坏世界观,人气角色琪亚娜、雷电…

易语言通过服务器发送文件,易语言服务器与客户端发送文件

易语言服务器与客户端发送文件 内容精选换一换PL/pgSQL是一种可载入的过程语言。用PL/pgSQL创建的函数可以被用在任何可以使用内建函数的地方。例如,可以创建复杂条件的计算函数并且后面用它们来定义操作符或把它们用于索引表达式。SQL被大多数数据库用作查询语言。…

服务器将office转pdf文件,Windows服务-Office转PDF文件

一. 应用场景开发一个课件在线学习功能,要求将WORD, EXCEL, PPT类型课件可在线打开学习;最初设想使用第三方office插件,无奈价格太高放弃使用;我们最终的方案是:利用office自身的另存为功能,在服务器将上传…

最拼爹的css属性:z-index失效情况记录

最近自己用angular封装了一个多级下拉菜单的控件,使用过程中发现一个奇怪的bug 第一反应是菜单z-index太小,被覆盖了,结果设置成9999都没有效果。 调试样式后发现,是因为引用菜单控件的时候,父元素的position为fixed,右边控件的position为relative,而菜单父元素没有设置…

ubuntu nginx添加站点配置失效处理

最近开始接触阿里云服务器,一步步开始自己配置,记录下自己的一步一坑: nginx安装很简单,apt-get install nginx 成功后就可以打开默认站点 nginx配置文件在/etc/nginx目录下的nginx.conf 查看里面的文件内容可以知道&#xff0…

java实现rtsp转rtmp

RTSP转RTMP有多种实现方式,原理差不多。 最简单的可以用ffmpeg来实现: ffmpeg -i "rtsp流路径" -vcodec copy -acodec copy -f flv "rtmp://127.0.0.1:1935/live/" 上面实现了功能,但是没有工程化,实用性不…

中用BBP公式计算_如何计算基础代谢率

了解基础代谢率(BMR)以后,可以知道身体减重、保持重量或增重时需要多少卡路里。基础代谢是身体休息的时候用掉的能量,即便没有动,身体还是在使用能量,维持体温、输送血液、呼吸、消化食物等等。基础代谢可以…

RTSP数据流无插件浏览器播放实现

最近接的音视频处理的项目比较多,停下来整理一下思路,分享一下我踩过的坑,希望能够帮到别人。 我们平时接触到的视频流一般有以下几种: 1.RTSP(Real Time Streaming Protocol)协议,RTSP在体系结构上位于RTP和RTCP之上&…

把类成员改成指针_如果类中存在管理其他类对象的指针,通过析构函数释放它们...

C.33: If a class has an owning pointer member, define a destructorC.33:如果类包含拥有所有权的指针成员,定义析构函数Reason(原因)An owned object must be deleted upon destruction of the object that owns it.从属对象必须通过拥有该对象的所有者类的析构函…

MySQL 服务无法启动--服务没有报告任何错误 ---Failed to find valid data directory.

系统重装后重新安装mysql环境,各种踩坑。服务无法启动 mysqld --console 查看详细错误:Failed to find valid data directory 发现mysql目录没有data文件夹,创建后问题依旧。 移除mysql, mysqld -remove mysql 重新初始化 mys…

docker内存阀值_kubernetes调度之资源耗尽处理配置

本篇将介绍如何使用kubelet处理资源耗尽的情况当可用的计算机资源非常低的时候,kubelet仍然要保证节点的稳定性.当处理不可压缩的计算机资源(比如内存或磁盘空间)时,这尤其重要,当这些资源被耗尽时,节点将变得不稳定驱离策略kubelet会积极的监视并阻止可用计算机资源耗尽.这种情…

hadoop fs命令无法使用_Hadoop从入门到入土(三)HDFS集群简单维护及JAVA客户端连接HDFS...

集群简单维护查看日志上篇我们搭建了集群,并且完成了hdfs的搭建,但在我的linux02和linux03上,发现一个问题,我启动了datanode之后,开始进程还在,一会就自己消失了,这是为什么呢?(如下…

c++ 函数返回空_Python all() 函数

all() 函数用于判断给定的可迭代参数 iterable 中的所有元素是否都为 TRUE,如果是返回 True,否则返回 False。元素除了是 0、空、None、False 外都算 True。语法all(iterable) # iterable -- 元组或列表。示例>>> all([a, b, c, d]) # 列表li…

python3.6和3.7的区别_python3.6和3.7有什么区别

Python 3.7 已经发布了,目前Python的用户,主要使用的版本 应该是 Python3.6 和 Python2.7 ,那么是不是该转到 Python 3.7 呢?首先大家要知道Python 3.7 是对 Python 3.6 的升级。Python官方对 3.7 的新特性:(推荐学习&…

vue 日期格式化返回指定个数月份_12、vue中日期格式化转换的函数

/*** format time depend on the offer timestamp or Date instance* param {Number, Date } date 要转换的日期* param {String} format 字符串日期格式 default DD/MM/YYYY HH:mm* param {Boolean} instance describe 配置项, 如果为true 返回转换后的日期对象实例 …