说明:收录各省市地方标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210607009.3 (22)申请日 2022.05.31 (71)申请人 深圳集智数字科技有限公司 地址 518000 广东省深圳市南 山区南山街 道南山社区南 新路1003号103 (72)发明人 武文杰 袁子涵  (74)专利代理 机构 北京嘉科知识产权代理事务 所(特殊普通 合伙) 11687 专利代理师 张艳 (51)Int.Cl. G06F 40/295(2020.01) G06F 16/35(2019.01) G06F 16/36(2019.01) (54)发明名称 意图识别方法、 系统、 装置及存 储介质 (57)摘要 本公开涉及智能语义技术领域, 提供了一种 意图识别方法、 系统、 装置及存储介质。 该方法包 括: 将意图模板中的实体的类型定义为与具体业 务场景相应的实体类型名称; 将意图模板中实体 对应的位置用实体类型名称进行占位替代, 占位 替代后生 成的意图模板为占位替代文本, 将全部 占位替代文本经过模型训练并进行编码, 将全部 占位替代文本经过编码后的向量存入到向量索 引库中; 接收到用户输入的文本后, 通过命名实 体的识别将文本中的相关实体替换为实体类型 名称, 并与用户输入文本同时在向量索引库中进 行语义检索, 将搜索到的经过排序后的用户意图 结果返回给用户。 本公开能够实现对通用意图的 识别, 提高了识别 广度和精准度, 架构简单, 资源 利用率高。 权利要求书2页 说明书8页 附图4页 CN 114970535 A 2022.08.30 CN 114970535 A 1.一种意图识别方法, 其特 征在于, 包括: 在具体业务场景中, 将意图模板 中的实体的类型定义为与具体业务场景相应的实体类 型名称, 所述实体 类型名称为实体的对象名称; 将意图模板中实体对应的位置用所述与具体业务场景相应的实体类型名称进行占位 替代, 占位替代后生成占位替代文本, 形成占位替代后的意图模板, 将全部占位替代文本经 过模型训练并进行编码, 将全部占位 替代文本经 过编码后的向量存 入到向量索引库中; 接收到用户输入的文本后, 通过命名实体的识别将文本中的相关实体替换为与具体业 务场景相应的实体类型名称, 将替换后的用户输入文本和替换前的用户输入文本同时在所 述向量索引库中进行语义搜索, 将搜索到的用户意图结果进行排序, 将搜索到的经过排序 后的用户意图结果返回给用户。 2.根据权利要求1所述的意图识别方法, 其特征在于, 所述向量索引库包括 elasticsearc h, 或者fais s。 3.根据权利要求2所述的意图识别方法, 其特征在于, 将所述替换前的用户输入文本和 所述替换后的用户输入文本同时在所述向量索引库中进行语义检索, 分别计算所述替换前 的用户输入文本和所述替换后的用户输入文本与向量索引库中所有的文本 向量的余弦距 离, 该余弦距离用于表征意图识别的相似度, 将搜索到的用户意图结果按照得分大小进行 排序, 将搜索到的经 过排序后的用户意图结果结果返回给用户。 4.根据权利要求2所述的意图识别方法, 其特征在于, 其特征在于, 将所述替换前的用 户输入文本和所述替换后的用户输入文本同时在所述向量索引库中进 行语义检索, 分别计 算所述替换前 的用户输入文本和所述替换后的用户输入文本与向量索引库中所有的文本 向量的欧氏距离或者曼哈顿距离, 该欧氏距离或者曼哈顿距离用于表征意图识别的相似 度, 将搜索到的用户意图结果按照得分大小进行排序, 将搜索到的经过排序后的用户意图 结果结果返回给用户。 5.根据权利要求1 ‑4任一所述的意图识别方法, 其特征在于, 采用基于神经网络的机器 学习算法将所述替换前的用户输入文本和所述替换后的用户输入文本同时在所述向量索 引库中进行语义检索。 6.根据权利要求5所述的意图识别方法, 其特征在于, 选择交叉熵损失函数对所述神经 网络进行模型的优化与调整。 7.根据权利要求6所述的意图识别方法, 其特征在于, 所述交叉熵损失函数为带有加性 间隔的交叉熵损失函数。 8.一种意图识别系统, 其特 征在于, 包括: 实体类型定义模块, 被配置为在具体业务场景中, 将意图模板中的实体的类型定义为 与具体业 务场景相应的实体 类型名称, 所述实体 类型名称为实体的对象名称; 实体位置占位与编码模块, 被配置为将意图模板中实体对应的位置用所述与 具体业务 场景相应的实体类型名称进行占位替代, 占位替代后生成占位替代文本, 形成占位替代后 的意图模板, 将全部占位替代文本经过模型训练并进行编码, 将全部占位替代文本经过编 码后的向量存 入到向量索引库中; 用户意图识别模块, 被配置为接收到用户输入的文本后, 通过命名实体的识别将文本 中的相关实体替换为与具体业务场景相应的实体类型名称, 将替换后的用户输入文本和替权 利 要 求 书 1/2 页 2 CN 114970535 A 2换前的用户输入文本同时在所述向量索引库中进 行语义搜索, 将搜索到的用户意图结果进 行排序, 将搜索到的经 过排序后的用户意图结果返回给用户。 9.一种装置, 包括存储器, 处理器及存储在存储器上并可在处理器上运行的计算机程 序, 所述处 理器执行所述程序时实现权利要求1至7中任一项所述的方法。 10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在 于, 所述计算机程序被处 理器执行时实现如权利要求1至7中任一项所述方法的步骤。权 利 要 求 书 2/2 页 3 CN 114970535 A 3

.PDF文档 专利 意图识别方法、系统、装置及存储介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 意图识别方法、系统、装置及存储介质 第 1 页 专利 意图识别方法、系统、装置及存储介质 第 2 页 专利 意图识别方法、系统、装置及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:59:45上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。