说明:收录各省市地方标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210440483.1 (22)申请日 2022.04.25 (71)申请人 企知道网络技 术有限公司 地址 518051 广东省深圳市南 山区西丽 街 道西丽社区留仙大道创智云城1标段1 栋D座2201 (72)发明人 邹伟东 黄威威 蔡子哲  (51)Int.Cl. G06F 16/36(2019.01) G06F 16/901(2019.01) (54)发明名称 文本结构的表征方法、 装置、 计算机设备及 存储介质 (57)摘要 本申请公开了一种文本结构的表征方法、 装 置、 计算机设备及存储介质, 其中, 该文本 结构的 表征方法包括: 获取携带项目主题的政策文本, 基于政策文本获取标准化实体词和文本逻辑关 系; 基于标准化实体词和文本逻辑关系, 建立政 策文本对应的至少一个最小逻辑单元; 基于图数 据库的图谱结构, 将项目主题作为根节点, 将每 一最小逻辑单元作为最小叶节 点, 并根据文本逻 辑关系将根节 点和每一最小叶节 点进行连接, 形 成政策文本对应的政策表征结构; 将与政策表征 结构相关的其他政策文本对应的其他节点进行 关联, 形成政策文本对应的政策图谱。 该方法可 快速判定政 策之间的相似度或将政 策进行归类, 查找出与企业相匹配的政策。 权利要求书2页 说明书9页 附图3页 CN 114817561 A 2022.07.29 CN 114817561 A 1.一种文本结构的表征 方法, 其特 征在于, 包括: 获取携带项目主题的政策文本, 基于所述政策文本获取标准化实体词和文本逻辑关 系; 基于所述标准化实体词和所述文本逻辑关系, 建立所述政策文本对应的至少一个最小 逻辑单元; 基于图数据库的图谱结构, 将所述项目主题作为根节点, 将每一所述最小逻辑单元作 为最小叶节点, 并根据所述文本逻辑关系将所述根节点和每一所述最小叶节点进行连接, 形成所述政策文本对应的政策表征 结构; 将与所述政策表征结构相关的其他政策文本对应的其他节点进行关联, 形成所述政策 文本对应的政策图谱。 2.根据权利要求1所述的文本结构的表征方法, 其特征在于, 所述基于所述政策文本获 取标准化实体词和文本 逻辑关系, 包括: 采用深度学习模型抽取所述政策文本中的所述文本逻辑关系和具有实 际意义的初始 实体词, 其中, 所述文本 逻辑关系是通过逻辑表达式来实现的; 将所述初始实体词标准 化, 形成标准 化实体词。 3.根据权利要求1所述的文本结构的表征方法, 其特征在于, 所述文本逻辑关系 包括逻 辑表达式, 所述逻辑表达式包括至少一个逻辑表达符; 所述基于所述标准化实体词和所述文本逻辑关系, 建立所述政策文本对应的至少一个 最小逻辑单 元, 包括: 提取所述逻辑表达 式中的每一所述逻辑表达符, 获取与每一所述逻辑表达符表达的逻 辑关系相对应的所述标准 化实体词作为逻辑单 元实体词; 结合所述逻辑表达符和所述逻辑单 元实体词, 形成所述 最小逻辑单 元。 4.根据权利要求1所述的文本结构的表征方法, 其特征在于, 所述将与 所述政策表征结 构相关的其 他政策文本对应的其 他节点进行关联, 包括: 将与所述 根节点相关的所述 其他政策文本对应的其 他节点进行关联; 或者, 将与所述 最小叶节点相关的所述 其他政策文本对应的其 他节点进行关联。 5.根据权利要求1所述的文本结构的表征方法, 其特征在于, 在所述形成所述政策文本 对应的政策表征 结构之后, 还 包括: 基于所述政策表征 结构进行分析, 获取 所述政策文本的从属类别。 6.根据权利要求1所述的文本结构的表征方法, 其特征在于, 在所述形成所述政策文本 对应的政策表征 结构之后, 还 包括: 基于所述图数据库, 对所述政策表征结构进行项目匹配, 获取满足相似度阈值的其他 项目作为推荐 项目。 7.根据权利要求1所述的文本结构的表征方法, 其特征在于, 在所述形成所述政策文本 对应的政策图谱之后, 还 包括: 获取目标对象的已申请项目列表; 基于所述已申请项目列表对应的所有政策图谱进行项目匹配, 获取 可申请项目列表。 8.一种文本结构的表征装置, 其特 征在于, 包括:权 利 要 求 书 1/2 页 2 CN 114817561 A 2获取文本逻辑模块, 用于获取携带项目主题的政策文本, 基于所述政策文本获取标准 化实体词和文本 逻辑关系; 建立最小单元模块, 用于基于所述标准化实体词和所述文本逻辑关系, 建立所述政策 文本对应的至少一个最小逻辑单 元; 形成表征结构模块, 用于基于图数据库的图谱结构, 将所述项目主题作为根节点, 将每 一所述最小逻辑单元作为最小叶节点, 并根据所述文本逻辑关系将所述根节点和每一所述 最小叶节点进行 连接, 形成所述政策文本对应的政策表征 结构; 形成政策图谱模块, 用于将与所述政策表征结构相关的其他政策文本对应的其他节点 进行关联, 形成所述政策文本对应的政策图谱。 9.一种计算机设备, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器 上运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求 1至 7任一项所述文本结构的表征 方法。 10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在 于, 所述计算机程序被处理器执行时实现如权利要求1至7任一项所述文本结构的表征方 法。权 利 要 求 书 2/2 页 3 CN 114817561 A 3

.PDF文档 专利 文本结构的表征方法、装置、计算机设备及存储介质

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 文本结构的表征方法、装置、计算机设备及存储介质 第 1 页 专利 文本结构的表征方法、装置、计算机设备及存储介质 第 2 页 专利 文本结构的表征方法、装置、计算机设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:00:06上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。