说明:收录各省市地方标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210517692.1 (22)申请日 2022.05.12 (71)申请人 咪咕文化科技有限公司 地址 100032 北京市西城区华远街1 1号 申请人 中国移动通信集团有限公司 (72)发明人 陈辉 刘霄 罗元帅 周东谕  张聪  (74)专利代理 机构 北京银龙知识产权代理有限 公司 11243 专利代理师 倪晓璇 (51)Int.Cl. G06F 16/36(2019.01) G06K 9/62(2022.01) G06N 3/04(2006.01) (54)发明名称 文本分析方法及装置 (57)摘要 本申请公开了一种文本 分析方法及装置, 涉 及小说改剧本技术领域。 该方法, 包括: 根据第一 文本的特征数据, 获取所述第一文本中的目标角 色的成长轨迹的第一有向无环图; 根据第二文 本, 对所述第一有向无环图进行拓展, 获取第二 有向无环图, 所述第二文本与所述第一文本的相 关度大于或等于第一预设值; 根据所述第二有向 无环图, 获取所述目标角色的所述成长轨迹的分 析结果。 上述方案, 能够实现对第一文本的分析, 达到对小说改编剧本的辅助支持的目的。 权利要求书2页 说明书13页 附图4页 CN 114936289 A 2022.08.23 CN 114936289 A 1.一种文本分析 方法, 其特 征在于, 包括: 根据第一文本的特征数据, 获取所述第 一文本中的目标角色的成长轨迹的第 一有向无 环图; 根据第二文本, 对所述第 一有向无环图进行拓展, 获取第 二有向无环图, 所述第 二文本 与所述第一文本的相关度大于或等于第一预设值; 根据所述第二有向无环图, 获取 所述目标角色的所述成长 轨迹的分析 结果。 2.根据权利要求1所述的方法, 其特征在于, 所述特征数据包括: 阅读用户对所述第一 文本的阅读行为数据和所述第一文本的属性数据中的至少一项。 3.根据权利要求1或2所述的方法, 其特征在于, 所述获取所述第一文本中的目标角色 的成长轨迹的第一有向无环图, 包括: 根据所述特征数据, 获取所述第一文本中的目标文本块, 所述目标文本块为段落或章 节; 根据所述目标文本块, 分别提取所述目标角色对应的角色状态作为第 一有向无环图的 节点; 根据每个角色状态在对应的目标文本块中出现的先后顺序以及多个目标文本块之间 的先后顺序, 生成所述第一有向无环图。 4.根据权利要求3所述的方法, 其特征在于, 所述根据所述特征数据, 获取所述第一文 本中的目标文本块, 包括: 获取所述第一文本对应的所有 文本块的特 征数据的权 重; 根据所述权 重, 在所有 文本块中选取多个目标文本块; 其中, 所述目标文本块的权 重大于或等于第二预设值。 5.根据权利要求3所述的方法, 其特征在于, 所述根据每个角色状态在对应的目标文本 块中出现的先后顺序以及多个目标文本块之间的先后顺序, 生成所述第一有向无环图, 包 括: 根据相邻的两个目标文本块中第 一目标文本块的内容, 确定所述相邻的两个目标文本 块对应的节点之间的事 件; 根据每个角色状态在对应的目标文本块中出现的先后 顺序以及节点之间的事件, 生成 所述第一有向无环图; 其中, 所述第一目标文本块 为相邻的两个目标文本块中时间靠前的目标文本块。 6.根据权利要求1所述的方法, 其特征在于, 所述根据第二文本, 对所述第一有向无环 图进行拓展, 获取第二有向无环图, 包括: 获取所述第二文本的第一角色的成长 轨迹的第三有向无环图; 将所述第三有向无环图中第一角色的不同角色状态分别与所述第一有向无环图中的 目标角色的角色状态进行比对; 在所述第三有向无环图中选取K个第一角色状态, 所述第一角色状态与所述第一有向 无环图中的目标角色的角色状态的相似度大于或等于第三预设值; 将所述第一有向无环图中的目标角色的角色状态与第 二角色状态进行拼接, 获取目标 角色的新增成长轨迹, 所述第二角色状态在所述第三有向无环图中与所述第一角色状态相 邻、 且位于所述第一角色状态之后;权 利 要 求 书 1/2 页 2 CN 114936289 A 2将所述新增成长 轨迹添加到所述第一有向无环图, 形成第二有向无环图; 其中, K为大于或等于1的整数。 7.根据权利要求1所述的方法, 其特征在于, 所述根据所述第二有向无环图, 获取所述 目标角色的所述成长 轨迹的分析 结果, 包括: 获取所述第 二有向无环图中的所述目标角色的所述成长轨迹的第 一分析结果, 所述第 一分析结果包括对所述成长 轨迹所包含的角色状态的评价指标的分析 结果; 根据所述第一分析 结果, 确定所述目标角色的所述成长 轨迹的分析 结果。 8.根据权利要求7所述的方法, 其特征在于, 所述根据所述第一分析结果, 确定所述目 标角色的所述成长 轨迹的分析 结果, 包括: 将所述成长轨迹所包含的角色状态的评价指标的分析结果进行加权求和, 确定所述成 长轨迹的分析 结果。 9.一种文本分析装置, 其特 征在于, 包括: 第一获取模块, 用于根据第一文本的特征数据, 获取所述第一文本中的目标角色的成 长轨迹的第一有向无环图; 第二获取模块, 用于根据第 二文本, 对所述第 一有向无环图进行拓展, 获取第 二有向无 环图, 所述第二文本与所述第一文本的相关度大于或等于第一预设值; 第三获取模块, 用于根据所述第二有向无环图, 获取所述目标角色的所述成长轨迹的 分析结果。 10.一种文本分析装置, 其特 征在于, 包括收发机和处 理器; 所述处理器, 用于: 根据第 一文本的特征数据, 获取所述第 一文本中的目标角色的成长 轨迹的第一有向无环图; 根据第二文本, 对所述第 一有向无环图进行拓展, 获取第 二有向无环图, 所述第 二文本 与所述第一文本的相关度大于或等于第一预设值; 根据所述第二有向无环图, 获取 所述目标角色的所述成长 轨迹的分析 结果。 11.一种文本分析装置, 其特征在于, 包括存储器、 处理器及存储在所述存储器上并可 在所述处理器上运行的计算机程序, 所述处理器执行所述程序时实现如权利要求1 ‑8任一 项所述的文本分析 方法的步骤。 12.一种可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器执行时 实现如权利要求1 ‑8任一项所述的方法中的步骤。权 利 要 求 书 2/2 页 3 CN 114936289 A 3

.PDF文档 专利 文本分析方法及装置

文档预览
中文文档 20 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共20页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 文本分析方法及装置 第 1 页 专利 文本分析方法及装置 第 2 页 专利 文本分析方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:00:03上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。