说明:收录各省市地方标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210535537.2 (22)申请日 2022.05.17 (71)申请人 北京沃东天骏信息技 术有限公司 地址 100000 北京市经济技 术开发区科创 十一街18号院2号楼4层A402室 申请人 北京京东世纪贸易有限公司 (72)发明人 康志恒  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 郄晨芳 (51)Int.Cl. G06F 16/78(2019.01) G06F 40/216(2020.01) G06F 40/289(2020.01) G06F 16/36(2019.01) (54)发明名称 视频热点的挖掘方法、 装置、 电子设备及存 储介质 (57)摘要 本申请提供了一种视频热点的挖掘方法、 装 置、 电子设备及存储介质, 其中, 在视频热点的挖 掘方法中, 首先获取待挖掘热点的视频的请求语 句, 然后针对每一条请求语句, 对请求语句进行 分词处理, 得到请求语句的关键词。 再针对每一 个关键词, 获取关键词所属的类别对应的代表 词, 并将关键词替换成代表词。 按照各个代表词 出现的频率, 对各个代表词进行排序, 得到第一 排序集合。 按照预设的时间窗口, 对各个代表词 按照时间顺序进行排序, 得到第二排序集合。 最 后将第一排序集合与第二排序集合的交集, 作为 待挖掘热点的视频的热词集合。 解决了现有技术 对于直播视频的热点挖掘, 通常由人工进行判断 与挖掘, 难以保证热点挖掘的效率和热点挖掘的 质量的问题。 权利要求书2页 说明书8页 附图2页 CN 114925236 A 2022.08.19 CN 114925236 A 1.一种视频 热点的挖掘方法, 其特 征在于, 包括: 获取待挖掘热点的视频的请求语句; 针对每一条所述请求语句, 对所述请求语句进行分词处理, 得到所述请求语句的关键 词; 针对每一个所述关键词, 获取所述关键词所属的类别对应的代表词, 并将所述关键词 替换成所述代 表词; 按照各个所述代 表词出现的频率, 对各个所述代 表词进行排序, 得到第一 排序集合; 按照预设的时间窗口, 对各个所述代 表词按照时间顺序进行排序, 得到第二 排序集合; 将所述第一排序集合与所述第二排序集合的交集, 作为待挖掘热点的视频的热词集 合。 2.根据权利要求1所述的方法, 其特征在于, 所述针对每一条所述请求语句, 对所述请 求语句进行分词处 理, 得到所述请求语句的关键词, 包括: 结合预先构建的关键词词库, 利用最大正向匹配算法对所述请求语句进行分词处理, 得到所述请求语句的关键词。 3.根据权利要求1所述的方法, 其特征在于, 所述针对每一条所述请求语句, 对所述请 求语句进行分词处 理, 得到所述请求语句的关键词, 包括: 利用预先构建的分词模型, 对所述请求语句进行分词处理, 得到所述请求语句的关键 词。 4.根据权利要求1所述的方法, 其特征在于, 所述针对每一个所述关键词, 获取所述关 键词所属的类别对应的代 表词, 并将所述关键词替换成所述代 表词, 包括: 针对每一个所述关键词, 通过预先构建的近义词词库, 查找出所述关键词对应的代表 词, 并将所述关键词替换成所述关键词对应的代表词; 其中, 所述近义词词 库中记录了各个 所述代表词以及各个所述代 表词的近义词。 5.根据权利要求1所述的方法, 其特征在于, 所述将所述第 一排序集合与所述第 二排序 集合的交集, 作为待挖掘热点的视频的热词集 合之后, 还 包括: 针对所述热词集合中的每一个热词, 召回所述热词对应的请求语句, 并将所述热词作 为所述热词对应的请求语句的主 热词, 将所述热词对应的请求语句中包括的其他热词 作为 副热词; 基于召回的每一条所述请求语句的所述主热词以及所述副热词, 生成主副热词关系图 谱。 6.一种视频 热点的挖掘装置, 其特 征在于, 包括: 获取单元, 用于获取待挖掘热点的视频的请求语句; 处理单元, 用于针对每一条所述请求语句, 对所述请求语句进行分词处理, 得到所述请 求语句的关键词; 替换单元, 用于针对每一个所述关键词, 获取所述关键词所属的类别对应的代表词, 并 将所述关键词替换成所述代 表词; 第一排序单元, 用于按照各个所述代表词出现的频率, 对各个所述代表词进行排序, 得 到第一排序集合; 第二排序单元, 用于按照预设的时间窗口, 对各个所述代表词按照时间顺序进行排序,权 利 要 求 书 1/2 页 2 CN 114925236 A 2得到第二 排序集合; 运算单元, 用于将所述第一排序集合与所述第二排序集合的交集, 作为待挖掘热点的 视频的热词集 合。 7.根据权利要求6所述的装置, 其特 征在于, 所述 替换单元, 包括: 替换子单元, 用于针对每一个所述关键词, 通过预先构建的近义词词库, 查找出所述关 键词对应的代表词, 并将所述关键词替换成所述关键词对应的代表词; 其中, 所述近义词词 库中记录 了各个所述代 表词以及各个所述代 表词的近义词。 8.根据权利要求6所述的装置, 其特 征在于, 还 包括: 召回单元, 用于针对所述热词集合中的每一个热词, 召回所述热词对应的请求语句, 并 将所述热词作为所述热词对应的请求语句的主 热词, 将所述热词对应的请求语句中包括的 其他热词作为副热词; 图谱生成单元, 用于基于召回的每一条所述请求语句的所述主热词以及所述副热词, 生成主副热词关系图谱。 9.一种电子设备, 其特 征在于, 包括: 一个或多个处 理器; 存储装置, 其上存 储有一个或多个程序; 当所述一个或多个程序被所述一个或多个处理器执行时, 使得所述一个或多个处理器 实现如权利要求1至 5中任意一项所述的方法。 10.一种计算机存储介质, 其特征在于, 其上存储有计算机程序, 其中, 所述计算机程序 被处理器执行时实现如权利要求1至 5中任意一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114925236 A 3

.PDF文档 专利 视频热点的挖掘方法、装置、电子设备及存储介质

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 视频热点的挖掘方法、装置、电子设备及存储介质 第 1 页 专利 视频热点的挖掘方法、装置、电子设备及存储介质 第 2 页 专利 视频热点的挖掘方法、装置、电子设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:01:16上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。