聊天机器人的分类及综述

文章目录

  • @[toc] 目录
    • 前言:
    • 1、技术方向
    • 2、chatbot的知识框架
    • 3、应用的分类
    • 4、chatbot的几个challenges
    • 5、工业应用综述
    • 总结:

目录

前言:

最近由于工作需要,要开发一款智能客服,目前正在搞业务咨询模块的功能,所以这里就记录下整个过程,权当是学习笔记吧。实现一款智能客服根据实现的功能不同要用到不同的技术,如面对客户提问的问题的匹配方面可以通过正则表达式或者Python中的AIML库来实现;对于相似问题的推荐可以采用数据库的关键字检索或者将问题向量化后通过ML方式来实现等,对于问题向量化的技术又牵涉到NLP的相关技术,如对句子的分词处理等,这里面又牵涉到如何提取需要的关键词,如何剔除不想要的关键词等步骤,每个步骤的实现方式也有很多,如可以根据需要选取jieba,NLTK,gensim等Python的第三方库等等,但是今天我们首先介绍下这个Chatbot的大体的情况,至于怎么实现我会在后面介绍。

1、技术方向

1.1、传统的实现方式:Retrieval-based(基于检索)
这里写图片描述

1.2、Generative:即可以自己生产应答语句。(如chatterbot利用AI技术实现的方式)
这里写图片描述

2、chatbot的知识框架

这里写图片描述
由上图可以看到纵轴方向分为开放领域和封闭领域,横轴方向分为基于检索和
基于生成式对话两种模式。可以看到以上四种方式的技术实现的难度。目前稳定使用的是基于规则的应用(采用基于检索的技术),智能机器仍处于探索阶段(采用基于生产力的技术)。我们要做的也就是在封闭领域(如专业问题咨询等)Rules-Based和SmartMachine结合起来,尽可能满足业务的需求。

3、应用的分类

long&short(即对话的长是否牵涉到上下文,短即是否是单轮对话)

4、chatbot的几个challenges

4.1、语境的判断
语⾔语境:这句话在说什么内容?(涉及到对语⾔的embed,⽐如word vector,即把单词给向量化,然后采用数学方法来处理)
物理语境:这句话在哪⾥说的?(涉及到物理环境,⽐如在哪⾥,现在⼏点)
4.2、统一的语言个性(防止chatbot由于输入数据的问题发生精神分裂现象)
这里写图片描述

4.3、模型的验证(即如何判断chatbot回答的答案是否是自己想要的)
这里写图片描述

4.4、多样性问题(对于问题的回答必须尽可能的不一样,不能直接由单一的指标确定)
这里写图片描述

5、工业应用综述

1、语音助手:微软走被动的输出路线,google走主动推送的路线。
2、餐饮:
3、旅游:旅游向导
4、医疗:前台客服
5、新闻:聊天式推送新闻。
6、财经:聊天式的个人理财管家
7、健身
主流的发展方向结合智能家居偏向于硬件的能活下来
目前稳定的方向还是基于查找、知识库、规则即Rule-base来的。

总结:

以上是之前在查资料过程中总结的一些东西,主要还是想对这个方向的情况有一个清楚的了解,只有了解后,你才能决定我们要怎么怎么做,毕竟干任何事都是这样,不能闭门造车嘛。以上是今天总结的一些东西,如有不足或错误,请大家指教、批评。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/456578.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【python】数据结构和算法 + 浅谈单链表与双链表的区别

有这么一句话说“程序数据结构算法”,也有人说“如果把编程比作做菜,那么数据结构就好比食材(菜),算法就好比厨艺(做菜的技巧)”。 当然这是笼统的说法,不过也稍微懂得了数据结构和…

webpack使用优化(基本篇)

转自:https://github.com/lcxfs1991/blog/issues/2 前言 本文不是webpack入门文章,如果对webpack还不了解,请前往题叶的Webpack入门,或者阮老师的Webpack-Demos。 为什么要使用Webpack 与react一类模块化开发的框架搭配着用比较好…

word2vec中单词向词向量的转换过程详解

目录前言:1、Word2Vec两种模型的大致印象2、CBOW模型流程举例3、CBOW模型流程举例总结: 目录 前言: 针对word2vec是如何得到词向量的?这篇文章肯定能解决你的疑惑。该篇文章主要参考知乎某大神的回答,个人在此基础上…

JavaScript学习笔记(四)——jQuery插件开发与发布

jQuery插件就是以jQuery库为基础衍生出来的库,jQuery插件的好处是封装功能,提高了代码的复用性,加快了开发速度,现在网络上开源的jQuery插件非常多,随着版本的不停迭代越来越稳定好用,在jQuery官网有许多插…

《树莓派学习指南(基于Linux)》——1.4 将Raspbian烧录到SD卡

本节书摘来异步社区《树莓派学习指南(基于Linux)》一书中的第1章,第1.4节,作者:【英】Peter Membrey ,【澳】David Hows ,更多章节内容可以访问云栖社区“异步社区”公众号查看 1.4 将Raspbian烧录到SD卡 …

python单向链表和双向链表的图示代码说明

图示说明: 单向链表: insert、 remove、 update、pop方法 class Node:def __init__(self, data):self.data dataself.next Nonedef __str__(self):return str(self.data)# 通过单链表构建一个list的结构: 添加 删除 插入 查找 获取长…

AIML知识库数据匹配原理解析

目录:前言:1、AIML系统工作流程2、AIML的核心推理机制3、推理举例4、匹配规则及实践中遇到的一些问题的解释总结: 目录: 前言: 参考:《Alice机理分析与应用研究》 关于AIML库这里就不介绍了&#xff0c…

【Python】模拟面试技术面试题答

一、 python语法 1. 请说一下你对迭代器和生成器的区别? 2. 什么是线程安全? 3. 你所遵循的代码规范是什么?请举例说明其要求? 4. Python中怎么简单的实现列表去重? 5. python 中 yield 的用法…

Win7 U盘安装Ubuntu16.04 双系统

Win7系统下安装Ubuntu系统,主要分为三步: 第1步:制作U盘启动盘 第2步:安装Ubuntu系统 第3步:创建启动系统引导 第1步:制作U盘启动盘 1.下载Ubuntu16.04安装镜像,官网地址:http://www…

Word2VecDoc2Vec总结

转自:http://www.cnblogs.com/maybe2030/p/5427148.html 目录:1、词向量2、Distributed representation词向量表示3、word2vec算法思想4、doc2vec算法思想5、Doc2Vec主要参数详解总结: 目录: 1、词向量 自然语言理解的问题要转…

《游戏视频主播手册》——2.2 哪些人适合做游戏主播

本节书摘来自异步社区《游戏视频主播手册》一书中的第2章,第2.2节,作者 王岩,更多章节内容可以访问云栖社区“异步社区”公众号查看。 2.2 哪些人适合做游戏主播 据不完全统计,目前国内有超过26000名活跃的游戏主播。所谓“活跃的…

干货分享!DevExpressv16.2最新版演示示例等你来收!(上)

2019独角兽企业重金招聘Python工程师标准>>> 为解决大家找资源难的问题,EVGET联合DevExpress控件中文网盘点热门的DevExpress资讯、Demo示例、版本升级及下载,以及各种教程推荐等。更多下载及资讯也可以在DevExpress控件中文网中找到&#xf…

一文看懂哈夫曼树与哈夫曼编码

转自:http://www.cnblogs.com/Jezze/archive/2011/12/23/2299884.html 在一般的数据结构的书中,树的那章后面,著者一般都会介绍一下哈夫曼(HUFFMAN)树和哈夫曼编码。哈夫曼编码是哈夫曼树的一个应用。哈夫曼编码应用广泛,如JPEG中…

解决:未能将管道连接到虚拟机: 所有的管道范例都在使用中。

虚拟机无端出现: VMware Workstation 无法连接到虚拟机。请确保您有权限运行该程序、访问改程序使用的所有目录以及访问所有临时文件目录。未能将管道连接到虚拟机: 所有的管道范例都在使用中。 原因:Ubuntu开机慢到开不开,我就在任务管理器强制结束了…

CCF推荐各种国际学术会议和期刊目录

这是中国计算机学会推荐国际学术会议和期刊目录2015年版本的内容, 主要罗列了国际上计算机相关的各个方向的顶级学术会议和期刊目录(包含A、B、C三个等级)。 包含的方向有: 计算机体系结构/并行与分布计算/存储系统计算机网络网络…

第四次作业类测试代码+036+吴心怡

一、类图 二、代码 package application; public class Commission { /* * hp:耳机 80元 mpc:手机壳 10元 cpsp:手机贴膜 8元 */ public float calculate(String line) { int hp 0, mpc 0, cpsp 0; String[] input null; float money 0;…

LSI/LSA算法原理与实践Demo

目录:1、使用场景2、优缺点3、算法原理3.1、传统向量空间模型的缺陷3.2、Latent Semantic Analysis (Latent Semantic Indexing)3.3、算法实例 4、文档相似度的计算5、对应的实践Demo 目录: 1、使用场景 文本挖掘中,主题模型。聚类算法关注…

Linux学习134 Unit 8

Unit8 ldap网络帐号1.ldap是什么ldap目录服务认证,和windows活动目录类似,就是记录数据的一种方式2.ldap客户端所须软件yum sssd krb5-workstation -y3.如何开启ldap用户认证authconfig-tui┌────────────────┤ Authentication Configu…

FastText原理总结

目录:1、应用场景2、优缺点3、FastText的原理4、FastText词向量与word2vec对比 目录: 1、应用场景 fastText是一种Facebook AI Research在16年开源的一个文本分类器。 其特点就是fast。相对于其它文本分类模型,如SVM,Logistic …

解决 :sudo:/etc/sudoers 可被任何人写

问题: sudo:sudo /etc/sudoers is world writable sudo:no valid sudoers sources found ,quitting sudo:unable to initialize policy plugin 解决方案: 方法一: 1.开机按shift或esc进入ubantu高级模式 再进行recovery模式 2.选择root命令行模式 3.…