- 目录
- 前言:
- 1、简介
- 2、详细说明
- 总结:
目录
前言:
智能客服客户咨询功能的实现主要依靠的就是Python的AIML库,这里就先介绍下AIML。
详细的使用教程可参考:https://github.com/andelf/PyAIML
目前大部分AIML只支持Py2.7版本并且不支持中文,即使有支持Py3且支持中文的版本,AIML的一些功能也有一些缺陷,但是黄天不负有心人,经过博主不断的搜寻,最终找到了一款算是比较稳定的支持Py3版本的AIML。
地址:https://github.com/Shuang0420/aiml
后期博主会将自己的项目发布出来,到时候大家有兴趣的也可以参考下。
1、简介
AIML是Artificial Intelligence Markup Language的缩写, 用于描述一类称为AIML的对象,同时部分描述了计算机程序处理这些对象时的表现。AIML是XML语言(可扩展标记语言)的衍生。
AIML对象是由topic和category单元组成的,格式化或未格式化的数据均可。格式化的数据是由字符组成的,其中有的组成符号数据,有的构成AIML元素。AIML元素将应答数据封装在文档中。包含这些元素的字符数据有可能被AIML解释器格式化,也有可能在之后的响应中处理。
aiml中的元素不区分大小写
2、详细说明
1、think元素
型如: <think><set name="topic">Me</set></think>
放置在template元素里面,表示一旦用户的输入匹配到该category时,再回复应答的同时,给一个变量赋值,这里也就是把Me记在脑子里,以后就可以用<get name=”topic”/>
来取出先前记住的内容。
2、<star/>表示*
比如有一个匹配模式是<pattern>* 你 好 *<pattern>
;这里pattern元素里的匹配模式是用*
号表示任意匹配的,但在其他元素里面不能用*号,而用<star/>
这个元素来表示。
3、<srai>元素
表示<srai>
里面的话会被当作是用户输入,从新查找匹配模式,直到找到非<srai>
定义的回复。例如:
<srai>我 是 <star/></srai>
,那么机器人会把“我 是 *”当作是用户输入来从新查找匹配模式。(PS:srai不能很好的匹配中文)
4、<condition>元素
(condition元素即为做选择操作时使用的元素,类似于if-else语句。)
放在template元素里面,可以有多个condition元素,但不能嵌套(目前还不支持),有3种形式:
<condition name="name" value="value">你好 </condition>
<condition name="name" contains="value"> 你好</condition>
<condition name="name" exists="value">你好 </condition>
Name是预先定义的变量,第一种表示name变量的值如果和value相等,回复内容就包括”你好”;第二种表示name变量的值如果里面包含value这个字符串,回复内容就包括“你好”;第三种表示name变量的值如果存在value的值,回复内容就包括“你好”(这个什么意思还不明确)
举个使用例子:
<category>
<pattern>你 好</pattern>
<template>
你好阿!
<condition name="用户名字" value="张三">
你又来了阿:)
</condition>
</template>
</category>
a. 情况一:如果事先用think设置了变量“用户名字”,而且等于“张三”,那么用户接受到的回复内容是:你好阿!你又来了阿;)
b.情况二:如果事先没有定义或者变量“用户名字”的值不等于“张三”,那么用户接受到的回复内容是:你好阿!
写法有一下几种:
<category>
<pattern>我 头 发 的 颜 色 是 蓝 色 *</pattern>
<template>哇塞,你很
<condition name="用户性别" value="女"> 漂亮阿!</condition>
<condition name="用户性别" value="男">英俊阿!</condition>
</template>
</category><category>
<pattern>我 头 发 的 颜 色 是 蓝 色 *</pattern>
<template>哇塞,你很
<condition>
<li name="用户性别" value="女">漂亮阿!</li>
<li name="用户性别" value="男">英俊阿!</li>
</condition>
</template>
</category><category>
<pattern>我 头 发 的 颜 色 是 蓝 色 *</pattern>
<template>哇塞,你很
<condition name="用户性别">
<li value="女"> 漂亮阿!</li>
<li value="男"> 英俊阿!</li>
</condition>
</template>
</category><category>
<pattern>我 头 发 的 颜 色 是 蓝 色 *</pattern>
<template>哇塞,你很
<condition>
<li name="用户性别" value="女"> 漂亮阿!</li>
<li>好看!</li>
</condition>
</template>
</category>
这里最后一个li元素表示默认的情况;即找不到condition相匹配时,就用默认的。
6、<gender>元素
替换性别以及代名词,例如:
<gender>She told him to take a hike.</gender>
将被替换成:He told her to take a hike,跟性别有关的单词都将被替换,中文怎么处理不是很清楚。
7、<get name=””名字/>
即得到name的值。
8、<gossip>元素
用来把改元素里面的内容保存到gossip.log文件里。
9、<if>元素
判断元素,有以下形式:
<if name="topic" value="cars"></if>
<if name="topic" contains="cars"></if>
<if name="topic" exists="true"></if>
例子:
<template>
<if name="用户名称" exists="true">
你的名字叫 <get name=”用户名称”/>.
<else/>
你叫什么名字?
</if>
</template>
10、<input>表示用户输入
例如:
<input index="2"/>将输出用户倒数第2次的输入,看如下对话:
用户:好阿
机器人:你也好,你叫什么名字?
用户:我叫黑山
机器人:呵呵,你好黑山。
如果有aiml文件里有片断:
<category>
<pattern>嘿 嘿</pattern>
<template>
<gossip>你刚才说:“<input index="2"/>”?</gossip>
</template>
</category>
如果这个时候用户输入“嘿嘿”,那么机器人将回复:你刚才说:“我叫黑山”?
Index属性的数字表示倒数第几句话,1:倒数第一句,2:倒数第2句,依此类推。
11、<learn filename=”xxx.aiml”>元素
表示让机器人学习某个aiml文件。
12、<li></li>元素
可以在random元素或condition等元素当中使用,表示一个列表;
13、<pattern>表示匹配模式
里面的内容必须大写,可以有星号* 或下划线_,星号表示匹配所有,任意情况;下划线的意义跟星号一样,除了不能匹配字典里面Z后面的字母。
14、<person>和<person2>
第一个是把第一人称转换成第3人称;第2个是把第一人称转成第2人称。<person/>等于 <person><star/></person>
15、<random>随机元素
一般和<li>
一起使用,表示从列表里随机取一个。
16、<sentence>元素用来格式化句子
比如:
<sentence>this is some kind of sentence test.</sentence>
可以格式化成:This is some kind of sentence test.即把句子首字母大写,还可以添加标点符号等。如:
<category><pattern>你是谁</pattern><template><sentence>你好我是聊天机器人小君</sentence></template>
</category>
17、<star/>表示星号
已经不推荐使用,只针对0。9版本,目前一般要加index属性来使用,
例如:<star index="1"/>,看如下对话:
用户:我的名字叫黑山!
<pattern>* 名 字 叫 *</pattern>
<template>呵呵,我知道了,你的名字叫<star index="2"/>。
</template>
18、<system><system>元素
表示调用系统函数,
例如:
<system>date</system>表示取系统当前日期
警告:使用这个元素要千万小心,因为有可能使用户运行你的系统命令。
19、<template>定义回复的模板。
20、<that>元素
表示先前机器人说的话,例如:
<category>
<pattern>好</pattern>
<that>一 起 聊 聊 电 影 好 吗 *</that>
<template>那你喜欢什么电影那?</template>
</category>
即:如果机器人先前问用户“一起聊聊电影好吗?”,而且现在用户回答了“好”,那么匹配正确,回复内容为:“那你喜欢什么电影那?”
如果要取前面的前面机器人的话,可以用:<that index=”nx,ny”>,例如:<that index=”2,<?xml:namespace prefix = st1 ns = "urn:schemas-microsoft-com:office:smarttags" />1”>表示取机器人倒数第2句的话,<that index=”2,1”>也等于<justbeforethat/>
21、<thatstar index=”n”>元素
先前第n个机器人说过的星号部分的话,
<thatstar/>等于<thatstar index="1"/>.看个例子:
<category>
<pattern>你好</pattern>
<template>
计算机 的 型 号 是 什 么
</template>
</category> <category>
<pattern>*</pattern>
<that>* 的 型 号 是 什 么</that>
<template><star/>
这个型号是<thatstar/>里面
<random>
<li>很好的商品</li>
<li>很流行的商品</li>
<li>很华丽的商品</li>
<random>。
</template>
</category>
对话场景:
用户:你好
机器人:计算机 的 型 号 是 什 么
用户:p4
机器人:p4这个型号是计算机里面很好的商品
22、<think>
记录用户输入且里面的内容不回复给用户。
例如:
<category>
<pattern>I AM FEMALE</pattern>
<template>Thanks for telling me your gender.
<think>
<set name=gender>female</set>
</think>
</template>
</category>
这里把female这个值保存到gender这个变量里,且回复内容不包括female。
23、<Topic name=”film”>元素
用来设置主题,例如:
<aiml>
<topic name="功夫"><category> <pattern> phrase </pattern> <that> phrase </that> <template> phrase </template> </category>
</topic>
</aiml>
只有当前的topic系统变量是“功夫”时才会匹配到这里。
24、<topicstar index=”n”>
元素用来得到先前倒数第n次谈论的主题。
总结:
个人感觉在业务咨询模块,包括在整个智能客服的项目中,这个AIML知识库即用以上的这些语法组成的知识库的设计是最重要、最耗时的工作,因为如果把这个知识库设计好,后面可以省去很多事情,但是如何才能设计好这个知识库呢?这就是一个经验问题了,你除了需要有相关的尽可能多的数据外,还得了解咨询业务中那些问题是常见的,对于一些常见问题你需要怎么去设计这个知识库去匹配等等,最终你还需要熟悉整个AIML的标签以及如何将业务问题最优化的使用这些标签来表示(毕竟真实的业务咨询场景出现的问题会是各种各样,一旦数据量大了之后,很有可能整个知识库就会发生冲突,如输入一个问题,有两个匹配的答案,那么这时系统就会崩溃。。。后面就会有一大堆的问题接踵而来)。所以感觉这部分跟技术关联不是特别大,更多的是和业务关联比较大。