随笔-机器如何学习我们的知识?

1、 人类语言的语法知识。

不同的人类语言有不同的语言表达形式,包括语言符号,语言符号的组合和应用规则。阿拉伯文字、斯拉夫文字、罗马文字、拉丁文字、象形文字等代表着不同语言背景、语言文化。

2、 机器可用的词典知识库有哪些?

1) 类别词库。特定实体词、功能词、非功能词。
2) 组合词库。组合词库包括搭配词库,共现词库。
a) 搭配词库:
i. 位置共现:窗口共现、互信息、卡方
ii. 句法共现:成份共现(VP/NP)、依存共现(SBV,VOB,ATT,POB等)
iii. 语义共现:语义角色共现(工具,结果,趋向)
iv. 概念共现:同义词标准化、上位词、反义词等替换标准化
3) 替换词库。同义词库,兄弟节点词库,父亲节点词库,儿子节点词库

3、 语言模板的自我习得?

借助句子非主要成分移除,成份位置规则。
1) 手工枚举下的语言模板
2) 基于事实实例自举方式的语言模板生成
3) 基于类型符号替换的语言模板生成

4、 推理规则的自我习得?

1) 基于关系事实的推理规则反推
2) 基于类概念的推理规则生成
3) 基于类属性或描述的推理规则生成

5、 语料的自我扩充?

语料的自我扩充分成两个,一个是从无到有,另一个是从少到多。
1) 基于回标的方式。确定标准句,对回标候选句进行置信度评分。
2) 基于回译的方式。翻译成中间语言,再反向翻译回来,形成另一种表述形式。
3) 基于句式迁移的方式。陈述句,否定句,祈使句、被字句、把字句。定语后置、状语前置等变换句法。
4) 基于同义词替换的方式。扩展问的常用方式。
5) 基于概念体系替换的方式。
6) 基于非功能词插入和删除的方式。
7) 基于搭配与语言模型的生成方式。基于给定词,结合搭配信息和语言成立性模型进行语言实例生成。
8) 基于生成对抗网络的语言实例生成。

6、 人类的语言能力体现在能够在不同句式上来回变通

1) 缩句:把结构比较复杂的句子中的修饰、限制和补充说明的成分去掉保留主要成分的意思。简单地说:缩句就像把一棵树的树枝、枝叶都去掉,只留下树的主干一样。
纵横交错的河道里穿行着行动轻快灵活的小艇(缩句)河道里穿行着小艇。
运动健儿的脸上露出了胜利的喜悦。 (缩句)脸上露出了喜悦。
我们要把时间当成生命一样爱惜。(缩句)我们要把时间爱惜。
六岁的弟弟津津有味地吃着又香又甜的苹果。(缩句)弟弟吃着苹果。
一只从树上掉下来的小麻雀无可奈何的拍打着小翅膀。麻雀拍打着翅膀。
2)去“枝”留“干”法;凡是用来进行修饰或限制的词都尽量去掉,包括 :形容词、数量词、表示程度、时间、地点的词。

7、 如何更好地将语言学家的工作计算机化,句子转写器。

1)底层的语言实例是千变万化的,往上走,词性组合模式回少一些,再往上走,句法组合模式会少一些,再往上走,语义模式会更少一些。语言是遵从一定的模式和组合规则形成的。语言的生成是一种抽象语言模式的实例化过程。

8、语言规则与分布式表示的对抗,规则的形式化、数值化。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/480311.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

最全BAT前端开发面试80题:算法+html+js+css!含答案大赠送!

最全前端开发面试题目:包含算法网络css面试jsh5面试题目,尾部有最全BAT前端面试经典77题和答案,想要的就快来领走吧~(领取方式见文末) 一、前端算法面试 1、基本排序的方式 冒泡、快排、桶排、堆排序、归并排序、插入…

求大于n的最小质数

hash取模运算时选取比较大的质数,就可以有效减少冲突。 有定理,一个数如果不能被2到它的平方根的所有数整除,它就是质数。 /*** description: 求大于n的最小质数* author: michael ming* date: 2019/5/9 22:35* modified by: */ #include &l…

超一流 | 从XLNet的多流机制看最新预训练模型的研究进展

关注小夕并星标,解锁自然语言处理搜索、推荐与算法岗求职秘籍文 | 老饕(某厂研究员,祖传调参)美 | 人美心细小谨思密达导读作为 NLP 近两年来的当红炸子鸡,以 ELMo/BERT 为代表的语言预训练技术相信大家已经很熟悉了。…

论文浅尝 | 神经网络与非神经网络简单知识问答方法的强基线分析

来源:NAACL 2018链接:http://aclweb.org/anthology/N18-2047本文关注任务为面向简单问题的知识库问答(仅用KB中的一个事实就能回答问题)。作者将任务划分为实体检测,实体链接,关系预测与证据整合&#xff0…

干货 | 搞定用户画像只需5个步骤

【转】http://www.sohu.com/a/115611583_445326有一句话是,千万人撩你,不如一人懂你,这句话在互联网圈可以说成是,真正的了解用户,才能得到用户,所以,用户画像的重要性不言而喻。什么是用户画像…

领域情报搜索实践:真实场景下的问答实施策略与风险分析

知识搜索,对于一个企业而言,目前无论是在对内管理还是对外服务的业务上,都有着大量的需求,并表现出急迫性的特征。 例如,很多企业都积累了大量的企业知识资产,并且规模以每年200%的速度增长,其…

数据结构--二叉树 Binary Tree

文章目录1.概念2.存储方式2.1 链式存储(二叉树代码大部分是链式实现的)2.2 顺序存储(基于数组)3.二叉树的遍历3.1 基于链表的二叉树实现代码3.2 基于数组的二叉树实现代码3.3 非递归法 二叉树遍历1.概念 二叉树,每个节…

算法工程师思维导图—数据结构与算法

卖萌屋的妹子们(划掉)作者团整理的算法工程师思维导图,求职/自我提升/查漏补缺神器。该手册一共分为数据结构与算法、数学基础、统计机器学习和深度学习四个部分。点击这里查看具体使用指南。该手册有两种获取方式:公众号后台回复…

通过预训练提升语言理解

官方地址:https://blog.openai.com/language-unsupervised/文章:https://s3-us-west-2.amazonaws.com/openai-assets/research-covers/language-unsupervised/language_understanding_paper.pdf代码:https://github.com/openai/finetune-tran…

最全Java架构师130面试题:微服务、高并发、大数据、缓存等中间件

一、数据结构与算法基础 说一下几种常见的排序算法和分别的复杂度。 用Java写一个冒泡排序算法 描述一下链式存储结构。 如何遍历一棵二叉树? 倒排一个LinkedList。 用Java写一个递归遍历目录下面的所有文件。 二、Java基础 接口与抽象类的区别&#xf…

智能投顾全面解读

智能投顾全面解读 <p>传统投顾一直是与理财产品的销售紧密结合在一起的。投顾即销售&#xff0c;在国内理财界也是约定俗成的现实。<br></p><p>传统投资顾问即证券投资顾问业务遵循《证券投资顾问业务暂行规定》&#xff0c;开展证券投资顾问业务的机构…

数据结构--二叉查找树 Binary Search Tree

文章目录1.二叉查找树概念2.二叉查找树操作2.1 查找2.2 插入2.3 删除2.4 其他3. 支持重复数据的二叉查找树4 有散列表了&#xff0c;还需要二叉查找树&#xff1f;5 代码实现1.二叉查找树概念 二叉查找树要求&#xff0c;在树中的任意一个节点&#xff0c;其左子树中的每个节点…

最新蚂蚁金服Java面试题:Docker+秒杀设计+RocketMQ+亿级数据设计

蚂蚁金服一面&#xff1a; 1 自我介绍 2 讲一下ArrayList和linkedlist的区别&#xff0c;ArrayList的扩容方式&#xff0c;扩容时机。 3 hashmap的实现&#xff0c;以及hashmap扩容底层实现。 4 NIO了解么&#xff0c;讲一下和BIO的区别&#xff0c;AIO呢。阻塞&#xff0c;…

论文浅尝 | 常识用于回答生成式多跳问题

链接&#xff1a;https://arxiv.org/pdf/1809.06309.pdfAnsweringTasks多跳问题一般需要模型可以推理、聚合、同步上下文中不同的信息。就需要理解那些人类通过背景知识可以理解的限制关系。本文提出了一个很强的baseline模型&#xff08;multi-attention pointer-generator d…

中国智能投顾行业

原文地址&#xff1a; 中国智能投顾行业 一、概要 财富管理与新兴金融科技的结合&#xff0c;使得财富管理行业正在进入新的阶段——智能财富管理。近几年全球出现的智能投顾模式已然成为智能财富管理的一大热点。智能投顾&#xff0c;简而言之&#xff0c;就是基于投资者的投…

别让数据坑了你!用置信学习找出错误标注(附开源实现)

星标/置顶小屋&#xff0c;带你解锁最萌最前沿的NLP、搜索与推荐技术文 | JayLou娄杰&#xff08;NLP算法工程师&#xff0c;信息抽取方向&#xff09;编 | 北大小才女小轶美 | Sonata1 前言在实际工作中&#xff0c;你是否遇到过这样一个问题或痛点&#xff1a;无论是通过哪种…

助力句子变换:35W抽象、43W同义、13W简称三大知识库对外开源

句子变换&#xff0c;是指根据给定中文句子&#xff0c;借助某种语言处理手段&#xff0c;扩展出一定数据规模的中文句子集合&#xff0c;是一个从1到N的过程&#xff0c;目的在于解决搜索&#xff08;查询扩展&#xff09;、分类&#xff08;样本扩充&#xff09;、抽取&#…

数据结构--红黑树 Red Black Tree

文章目录1.概念2.操作2.1 左旋、右旋&#xff08;围绕某个节点的左/右旋&#xff09;2.2 插入2.3 删除3. 代码1.概念 二叉树在频繁动态增删后&#xff0c;可能退化成链表&#xff0c;时间复杂度由 O(lgn) 变成 O(n)。&#xff08;不平衡&#xff09;平衡二叉树&#xff0c;树中…

深度学习在用户画像标签模型中的应用

原文地址&#xff1a;https://blog.csdn.net/chaishen10000/article/details/79324016 最近一段时间都在学习深度学习&#xff0c;想着在用户画像标签模型中看能不能用上&#xff0c;终于&#xff0c;用了一个多月的时间&#xff0c;结合实际的场景和数据&#xff0c;搭建了一套…

最强京东Java面试题(共现场4面)

一面&#xff08;基础面&#xff1a;约1个小时&#xff09; 自我介绍&#xff0c;主要讲讲做了什么和擅长什么 springmvc和spring-boot区别 Autowired的实现原理 Bean的默认作用范围是什么&#xff1f;其他的作用范围&#xff1f; 索引是什么概念有什么作用&#xff1f;MyS…