词典配置
概念解释
用户的常用表达中,同一类型的名词将会被总结为词典。
词典是同类单词的合集,如:地址、歌曲名、歌手等,在用户说法中通过节点和词典的绑定和调用,进行重要信息的提取和语义槽调用。
例如一个说法「我喜欢绿色」,我们都知道绿色是一种颜色,但如果我们不预先告诉机器,机器是不会知道的。为了让机器能够理解绿色,我们可以创建一个词典,把常见的颜色(红橙黄绿青蓝紫等)填上,这样机器再遇到这些词,就能知道是一种颜色。
以天气查询为例,用户可能会询问:
明天合肥天气怎么样
明天厦门会下雨吗
我们可以把以上两句话抽象为一个查询天气的意图
其中常用表达如下:
【时间节点】【位置节点】【天气名词】【任意字】
【时间节点】【位置节点】【任意字】【天气名词】【任意字】
【时间节点】和【位置节点】分别需要关联对应的词典:
time 词典 | location 词典 |
---|---|
今天 | 北京 |
明天 | 上海 |
后天 | 合肥 |
周一 | 厦门 |
周二 | 武汉 |
…... | …... |
预置词典
预置词典平台为开发者预置的词典,可直接使用,但不支持编辑。每个系统词典内已包含丰富的词条。
操作指南
本页面介绍如何创建、编辑、删除、批量上传词典。
创建词典
点击词典列表右上角的【新建词典】。
输入词典的名称。词典名称应体现它的作用范围。
删除词典
点击删除,如果词典未和文法关联,则可删除单个词典。
如果词典已和文法关联,则需要解除关联后才可以删除词典。
编辑词典
点击【新增词典】,创建词典,点击【进入词典】;
点击【新建词条】,输入词条名和同义词;
首个同义词默认为词条名,可以继续添加同义词,按enter分割同义词;
点击保存,保存该词条。
批量导入
点击下载demo,在csv文件中修改,直接上传;
勾选【清空原词典并导入】,可清空原词典内容,导入新词条
上传规则:
1.一次能上传最多4万条
2.文件大小不能超过10M;
3.词条名为必填项,首行不能为空,词条不能以逗号分割;
4.如只填写词条名,未添加同义词,默认同义词为该词条名;
5.如有多个同义词,分单元格写在词条名后,详见模板;
6.若词条名为空,有同义词,该词条则过滤;
7.若词条名重复,则会覆盖同名词条;
8.词条名中不能有逗号,同义词中如果有逗号会被切分成不同的同义词