说明:收录各省市地方标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210613640.4 (22)申请日 2022.05.31 (71)申请人 腾讯科技 (深圳) 有限公司 地址 518057 广东省深圳市南 山区高新区 科技中一路腾讯大厦3 5层 (72)发明人 左新宇 方舟 荆宁 梁海金  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 杜维 (51)Int.Cl. G06F 16/35(2019.01) G06F 16/36(2019.01) G06F 40/30(2020.01) G06K 9/62(2022.01) (54)发明名称 实体分类方法、 装置、 电子设备、 程序产品及 介质 (57)摘要 本申请实施例公开了实体分类方法、 装置、 电子设备、 程序产品及介质, 可应用于数据处理 技术领域。 其中方法包括: 基于描述文本信息以 及激励文本信息确定分类特征; 将分类特征分别 输入多个分类模 型中, 得到每个分类模型针对目 标实体的候选分类结果; 多个分类子模型包括一 级分类模型以及至少一个二级分类模 型; 若一级 分类模型的候选分类结果指示目标实体属于第 一候选类别, 根据第一候选类别和至少一个二级 分类模型中的目标二级分类模型的候选分类结 果, 确定目标实体的目标分类结果。 采用本申请 实施例, 有助于提升对实体分类的效率。 本申请 实施例还可应用于云技术、 人工智能、 智慧交通、 辅助驾驶、 智能家电等各种场景。 权利要求书2页 说明书19页 附图7页 CN 115129870 A 2022.09.30 CN 115129870 A 1.一种实体分类方法, 其特 征在于, 所述方法包括: 获取目标实体的描述文本信息, 并生成所述目标实体的激励文本信息, 所述激励文本 信息用于提 示生成用于对所述目标实体进行实体分类的特 征; 基于所述描述文本信息以及所述激励文本信息确定分类特 征; 将所述分类特征分别 输入多个分类模型中, 得到每个分类模型针对所述目标实体的候 选分类结果; 所述多个分类子模型包括 一级分类模型以及至少一个二级分类模型; 若所述一级分类模型的候选分类结果指示所述目标实体属于第 一候选类别, 根据 所述 第一候选类别和所述至少一个二级分类模型中的目标二级分类模型的候选 分类结果, 确定 所述目标实体的目标分类结果。 2.根据权利要求1所述方法, 其特征在于, 所述多个分类模型分别有对应的至少一个候 选类别, 所述 一级分类模型的每 个候选类别均具有对应的二级分类模型; 所述根据所述第一候选类别和所述至少一个二级分类模型中的目标二级分类模型的 候选分类结果, 确定所述目标实体的目标分类结果, 包括: 将所述第一候选类别对应的二级分类模型确定为所述至少一个二级分类模型中的所 述目标二级分类模型; 若所述目标二级分类模型的候选分类结果指示所述目标实体属于第 二候选类别, 则确 定所述目标分类结果用于指示所述目标实体属于所述第一 候选类别和所述第二 候选类别。 3.根据权利要求2所述方法, 其特 征在于, 所述方法还 包括: 若所述目标二级分类模型的候选分类结果指示所述目标实体所属候选类别为空, 则确 定所述目标分类结果用于指示所述目标实体属于所述第一 候选类别。 4.根据权利要求1所述方法, 其特征在于, 所述基于所述描述文本信 息以及所述激励文 本信息确定分类特 征, 包括: 对所述描述文本信息与所述激励文本信息进行拼接处 理, 得到目标拼接序列; 将所述目标拼接序列输入预训练语言模型, 得到所述分类特 征。 5.根据权利要求1所述方法, 其特征在于, 所述多个分类模型分别有对应的至少一个候 选类别, 所述每个分类模型对应的至少一个候选类别中每个候选类别均关联有对应的至少 一个标签词, 所述多个分类模型中的任一分类模型表示 为目标分类模型; 所述将所述分类特征分别输入多个分类模型中, 得到每个分类模型针对所述目标实体 的候选分类结果, 包括: 将所述分类特征输入所述目标分类模型中, 得到标签词集中的每个标签词对应的预测 概率, 所述标签词集为所述目标分类模型的每个候选类别分别对应的至少一个标签词的集 合; 基于所述标签词集中的每个标签词对应的预测概率, 确定出所述目标分类模型针对所 述目标实体的候选分类结果。 6.根据权利要求5所述方法, 其特征在于, 所述基于所述标签词集中的每个标签词对应 的预测概 率, 确定出 所述目标分类模型针对所述目标实体的候选分类结果, 包括: 若所述标签词集中存在预测概率大于或等于阈值的标签词, 将预测概率大于或等于 阈 值且预测概率最大的标签词确定为预测标签词, 并确定所述候选分类结果用于指示所述目 标实体属于所述预测标签词对应的候选类别;权 利 要 求 书 1/2 页 2 CN 115129870 A 2若所述标签词集不存在预测概率大于或等于阈值的标签词, 则确定所述候选分类结果 用于指示所述目标实体所属类别为空。 7.根据权利要求5所述方法, 其特 征在于, 所述方法还 包括: 获取针对所述目标分类模型的样本实体数据, 所述样本实体数据携带对应的标注标签 词; 调用初始的目标分类模型确定所述样本实体数据针对所述标签词集中的每个标签词 对应的样本概 率, 并基于所述标签词集中的每 个标签词对应的样本概 率确定样本标签词; 基于所述标注标签词与所述样本标签词训练得到所述目标分类模型。 8.根据权利要求1所述方法, 其特征在于, 所述多个分类模型分别有对应的至少一个候 选类别, 所述一级分类模型对应的至少一个候选类别中每个候选类别均关联有对应的至少 一个标签词, 所述第一 候选类别为目标 标签词对应的候选类别; 所述根据所述第一候选类别和所述至少一个二级分类模型中的目标二级分类模型的 候选分类结果, 确定所述目标实体的目标分类结果, 包括: 若所述目标标签词具有对应的二级分类模型, 将所述目标标签词对应的二级分类模型 确定为所述至少一个二级分类模型中的所述目标二级分类模型; 若所述目标二级分类模型的候选分类结果指示所述目标实体属于第 二候选类别, 则确 定所述目标分类结果用于指示所述目标实体属于所述第一 候选类别和所述第二 候选类别。 9.一种实体分类装置, 其特 征在于, 所述装置包括: 获取单元, 用于获取目标实体的描述文本信 息, 并生成所述目标实体的激励文本信 息, 所述激励文本信息用于提 示生成用于对所述目标实体进行实体分类的特 征; 处理单元, 用于基于所述描述文本信息以及所述激励文本信息确定分类特 征; 所述处理单元, 还用于将所述分类特征分别输入多个分类模型中, 得到每个分类模型 针对所述目标实体的候选分类结果; 所述多个分类子模型包括一级分类模 型以及至少一个 二级分类模型; 所述处理单元, 还用于若所述一级分类模型的候选分类结果指示所述目标实体属于第 一候选类别, 根据所述第一候选类别和所述至少一个二级分类模型中的目标二级分类模型 的候选分类结果, 确定所述目标实体的目标分类结果。 10.一种电子设备, 其特征在于, 包括处理器、 存储器, 其中, 所述存储器用于存储计算 机程序, 所述计算机程序包括程序指 令, 所述处理器被配置用于调用所述程序指 令, 执行如 权利要求1 ‑8任一项所述的方法。 11.一种计算机程序产品, 其特征在于, 包括计算机指令, 所述计算机指令被处理器执 行时实现如权利要求1 ‑8任一项所述方法。 12.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质存储有计算机程 序, 所述计算机程序包括程序指令, 所述程序指令当被处理器执行时使所述处理器执行如 权利要求1 ‑8任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 115129870 A 3

.PDF文档 专利 实体分类方法、装置、电子设备、程序产品及介质

文档预览
中文文档 29 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 实体分类方法、装置、电子设备、程序产品及介质 第 1 页 专利 实体分类方法、装置、电子设备、程序产品及介质 第 2 页 专利 实体分类方法、装置、电子设备、程序产品及介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 10:59:24上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。