说明:收录各省市地方标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211190613.7 (22)申请日 2022.09.28 (71)申请人 百度在线网络技 术(北京)有限公司 地址 100085 北京市海淀区上地十街10号 百度大厦三层 (72)发明人 崔东林 (74)专利代理 机构 北京易光知识产权代理有限 公司 11596 专利代理师 阎敏 王姗姗 (51)Int.Cl. G06T 7/00(2017.01) G06V 10/44(2022.01) G06V 10/764(2022.01) G06V 10/82(2022.01) G06V 20/40(2022.01)G06N 3/08(2006.01) G06N 3/04(2006.01) (54)发明名称 视频内容的质量评价方法、 网络训练方法和 装置 (57)摘要 本公开提供了视频内容的质量评价方法、 网 络训练方法和装置, 涉及人工智 能技术领域, 尤 其涉及大数据、 深度学习和智能推荐等技术领 域。 具体实现方案为: 获取目标视频的多模态特 征; 以及; 获取目标视频的参考信息的信息 特征; 参考信息包括创作目标视频的账号信息和/或目 标视频的操作记录; 基于多模态特征和信息特 征, 确定目标视频的内容质量。 本公开使用视频 信号的多模态特征和视频的离散信息的信息特 征进行质量评价, 实现了从多个角度全面的对视 频内容质量进行评价, 能够得到准确的视频质量 评价结果。 权利要求书4页 说明书12页 附图5页 CN 115496734 A 2022.12.20 CN 115496734 A 1.一种视频内容的质量评价方法, 包括: 获取目标视频的多模态特 征; 以及; 获取所述目标视频的参考信 息的信息特征; 所述参考信 息包括创作 所述目标视频的账 号信息和/或所述目标视频的操作记录; 基于所述多模态特 征和所述信息特 征, 确定所述目标视频的内容质量。 2.根据权利要求1所述的方法, 其中, 所述获取目标视频的多模态特 征, 包括: 获取以下至少两种特征分别作为待融合特征: 所述目标视频中多帧图像各自的图像特 征、 所述目标视频的视频 特征、 所述目标视频的文本信息的文本特 征; 将获取的至少两种待融合特 征进行融合处 理, 得到所述目标视频的多模态特 征。 3.根据权利要求2所述的方法, 其中, 获取目标视频中多帧图像各自的图像特 征, 包括: 从所述目标视频中提取 出多帧图像; 将每帧图像分别输入基于图像的掩码自动编码网络MAE, 得到每帧图像分别对应的初 始图像特 征; 将每帧图像的初始图像特征分别输入第 一全连接网络的特征提取模块, 得到每帧图像 的图像特 征, 其中, 所述第一全连接网络是以完成图像质量评价 为训练任务进行训练的。 4.根据权利要求2或3所述的方法, 其中, 获取 所述目标视频的视频 特征, 包括: 将所述目标视频的帧序列, 依序输入基于视频的掩码自动编码网络MAE, 得到所述目标 视频的初始视频 特征; 将所述初始视频特征输入第 二全连接网络的特征提取模块, 得到所述目标视频的视频 特征; 其中, 所述第二全连接网络是以完成视频内容质量评价 为训练任务进行训练的。 5.根据权利要求2 ‑4中任一项所述的方法, 其中, 获取所述目标视频的文本信 息的文本 特征, 包括: 提取所述目标视频的视频帧中包括的第一文本信息; 以及, 获取所述目标视频的音频中的第二文本信息; 对所述第一文本信息和所述第二文本信息进行 特征提取, 得到所述文本特 征。 6.根据权利要求1 ‑5中任一项所述的方法, 所述账号信 息包括以下中的至少一种: 粉丝 数、 作品数、 是否为优质作者; 所述操作记录包括以下中的至少一种: 视频的点赞 数、 点踩数、 转发数、 评论。 7.根据权利要求1 ‑6中任一项所述的方法, 还 包括: 提取所述目标视频的封面质量特 征; 所述基于所述多模态特 征和所述信息特 征, 确定所述目标视频的内容质量, 包括: 将所述多模态特征、 所述信息特征和所述封面质量特征, 输入基于注意力的质量评价 网络, 得到所述目标视频的内容质量。 8.一种神经网络训练方法, 包括: 将样本图像输入基于图像的掩码自动编码网络MAE, 得到所述样本图像的初始图像特 征; 将所述样本图像的初始图像特征输入第 一全连接网络的特征提取模块, 得到样本图像 的图像特 征; 采用所述第 一全连接网络的分类模块对样本图像的图像特征进行分类处理, 得到样本权 利 要 求 书 1/4 页 2 CN 115496734 A 2图像的内容质量; 基于样本图像的内容质量和样本图像的质量标签确定损失; 基于所述损失调整所述第一全连接网络的特 征提取模块和分类模块的网络参数; 其中, 所述第 一全连接网络提取的目标视频的图像特征用于构建目标视频的多模态特 征, 所述多模态特 征用于对所述目标视频进行内容质量评价。 9.一种神经网络训练方法, 包括: 将样本视频输入基于视频的掩码自动编码网络MAE, 得到所述样本视频的初始视频特 征; 将样本视频的初始视频特征输入第 二全连接网络的特征提取模块, 得到样本视频的视 频特征; 采用所述第 二全连接网络的分类模块对样本视频的视频特征进行分类处理, 得到样本 视频的内容质量; 基于样本 视频的内容质量和样本 视频的质量标签确定损失; 基于所述损失调整所述第二全连接网络的特 征提取模块和分类模块的网络参数; 其中, 所述第 二全连接网络提取的目标视频的视频特征用于构建目标视频的多模态特 征, 所述多模态特 征用于对所述目标视频进行内容质量评价。 10.一种视频内容的质量评价装置, 包括: 获取模块, 用于获取目标视频的多模态特征; 以及; 获取所述目标视频的参考信 息的信 息特征; 所述参考信息包括创作所述目标视频的账号信息和/或所述目标视频的操作记录; 评价模块, 用于基于所述多模态特 征和所述信息特 征, 确定所述目标视频的内容质量。 11.根据权利要求10所述的装置, 其中, 执行所述获取目标视频的多模态特征, 所述获 取模块用于: 获取以下至少两种特征分别作为待融合特征: 所述目标视频中多帧图像各自的图像特 征、 所述目标视频的视频 特征、 所述目标视频的文本信息的文本特 征; 将获取的至少两种待融合特 征进行融合处 理, 得到所述目标视频的多模态特 征。 12.根据权利要求11所述的装置, 其中, 执行获取目标视频中多帧图像各自的图像特 征, 所述获取模块用于: 从所述目标视频中提取 出多帧图像; 将每帧图像分别输入基于图像的掩码自动编码网络MAE, 得到每帧图像分别对应的初 始图像特 征; 将每帧图像的初始图像特征分别输入第 一全连接网络的特征提取模块, 得到每帧图像 的图像特 征, 其中, 所述第一全连接网络是以完成图像质量评价 为训练任务进行训练的。 13.根据权利要求11或12所述的装置, 其中, 执行获取所述目标视频的视频特征, 所述 获取模块用于: 将所述目标视频的帧序列, 依序输入基于视频的掩码自动编码网络MAE, 得到所述目标 视频的初始视频 特征; 将所述初始视频特征输入第 二全连接网络的特征提取模块, 得到所述目标视频的视频 特征; 其中, 所述第二全连接网络是以完成视频内容质量评价 为训练任务进行训练的。 14.根据权利要求11 ‑13中任一项所述的装置, 其中, 执行获取所述目标视频的文本信权 利 要 求 书 2/4 页 3 CN 115496734 A 3
专利 视频内容的质量评价方法、网络训练方法和装置
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 思考人生 于
2024-02-07 20:35:27
上传分享
举报
下载
原文档
(855.1 KB)
分享
友情链接
DB22-T 475-2009 房地产估价规程 吉林省.pdf
GB-T 12967.3-2022 铝及铝合金阳极氧化膜及有机聚合物膜检测方法 第3部分:盐雾试验.pdf
DB4403-T 422.1—2024 诚信计量管理规范 第1部分:通则 深圳市.pdf
GM-T 0003.3-2012 SM2椭圆曲线公钥密码算法第3部分:密钥交换协议.pdf
GA-T 1720-2020 移动警务 数字证书格式要求.pdf
GB-T 6890-2012 锌粉.pdf
GB-T 42627-2023 机械安全 围栏防护系统 安全要求.pdf
GB-T 22652-2019 阀门密封面堆焊工艺评定.pdf
TTAF 044-2019 Android应用质量技术要求及评分细则.pdf
T-SHZSAQS 00143—2022 竞技场测试法评定湖羊性情技术规程.pdf
SY-T 7650-2021 盐穴储气库造腔井下作业规范.pdf
DB37-T 3802-2019 花生品种鉴定技术规程 SSR标记法 山东省.pdf
GB 1589-2016 汽车、挂车及汽车列车外廓尺寸、 轴荷及质量限值.pdf
SAE_2012-01-1037_Integrating In-Wheel Motors into Vehicles - Real-World Experiences.pdf
DB3201-T 1113-2022 法人主数据规范 南京市.pdf
信通院 应用程序接口-API数据安全研究报告-2020年.pdf
T-ZMDS 10011—2021 近红外脑组织血氧监测仪参数测试方法.pdf
GB-T 42107-2022 国家科技重大专项文件归档与档案管理规范.pdf
GB-T 30282-2023 信息安全技术 反垃圾邮件产品技术规范.pdf
DB44-T 983-2012 水泥回转窑节能评价方法 广东省.pdf
1
/
22
评价文档
赞助2.5元 点击下载(855.1 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。