(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210695640.3
(22)申请日 2022.06.20
(71)申请人 西南财经 大学
地址 611130 四川省成 都市温江区柳台大
道555号
(72)发明人 王俊 谭晶桦 陈俊霄 金汉磊
(74)专利代理 机构 泰和泰律师事务所 51219
专利代理师 曾祥坤
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 16/9535(2019.01)
G06F 16/9538(2019.01)
G06F 40/109(2020.01)
G06F 40/295(2020.01)
G06Q 40/04(2012.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
基于公司衍生关系的知识感知和时间敏感
的金融新闻推荐系统及方法
(57)摘要
本发明提供一种基于公司衍生关系的知识
感知和时间敏感的金融新闻推荐系统及方法, 自
动处理大量媒体信息, 为投资者推荐有价值的新
闻信息来追踪股票走势。 本发明的金融新闻推荐
系统, 包括知识感知的新闻表示层构建模块, 基
于相关公司的用户嵌入生成模块, 新闻推荐模
块; 知识感知的新闻表示层构建模块通过三元组
提取实体以及识别实体 之间的关系, 通过句子分
析提取实体, 根据上下文在现有的金融知识图谱
中匹配实体, 融合内部与外部知识; 基于相关公
司的用户嵌入生成模块基于用户的阅读历史与
公司关系生成基于相关公司的用户嵌入; 新闻推
荐模块定义时间敏感衰减机制, 根据新闻发布时
间的距离, 加入时间惩罚项, 以推荐同时具有重
大影响和及时性的新闻。
权利要求书3页 说明书10页 附图3页
CN 115238082 A
2022.10.25
CN 115238082 A
1.一种基于公司衍生关系的知识感知和时间敏感的金融新闻推荐系统, 其特征在于,
包括知识感知的新闻表示层构建模块, 基于相关公司的用户嵌入生成模块, 新闻推荐模块;
其中, 知识感知的新闻表示层构建模块通过三元组提取实体以及识别实体之间的关系, 简
单地表示新闻, 采用(h, r, t)的形式表示三联体, 其中h, t∈E是实体, r∈R是两者之间的关
系, 并对于每一条新闻通过句 子分析提取实体以及相 应的关系集合, 根据上下文在现有的
金融知识图谱中匹配实体, 融合内部与外部知识; 基于相关公司的用户嵌入生成模块基于
用户的阅读历史与公司关系生成基于相关公司的用户嵌入; 新闻推荐模块定义时间敏感衰
减机制, 根据新闻发布时间的距离, 加入时间惩罚项, 以推荐同时具有重大影响和及时性的
新闻。
2.根据权利要求1所述的基于公司衍生关系的知识感知和时间敏感的金融新闻推荐系
统, 其特征在于: 所述知识感知的新闻表示层构建模块包括三元表 示组构建子模块, 字面到
矢量的转化子模块, 破碎的三联体子模块, 知识学习融合子模块, 内部和外部知识结合子模
块, softmax函数归一化子模块, 上下文分析子模块; 三元表示组构建子模块构建 的三元表
示组包含两个实体及二者之间的联系, 以(h, r, t)的形式表 示为三联体; 字面到矢量的转化
子模块完成从字面到矢量的转化过程, 将三联体用矢量关系式vh+vr≈vt表示; 知识学习融
合子模块, 从一 条新闻N中, 通 过句子分析提 取实体h, 以及句子中与之相关的实体 集合ENh和
相应的关系集合RNh, 然后根据其上下文在现有的金融知识图谱KG中匹配实体; 内部和外部
知识结合子模块, 通过平移法得到实体(vh, vr, vt)和关系(vh, vr′, vt)向量组, 充分结合h和t
之间的内部和外部知识; 上下文分析子模块, 考虑实体的上下文信息, 通过上下文分析来增
加实体位置 ‑频率权重weh, 将新闻N中的所有实体向量eNh∈EN与权重乘积weh∈WN相加, 然后
与处理新闻文本向量vN相连接, 得到具有知识感知的新闻表示
3.根据权利要求2所述的基于公司衍生关系的知识感知和时间敏感的金融新闻推荐系
统, 其特征在于: 所述字面到矢量的转化子模块 实施嵌入矢量转换过程中的损失函数L计算
公式是L=∑s∑S′[γ+d(vh+vr, vt)‑d(vh′+vr, vt′)]+, 其中使用L2规范精确测量vk+vr和vt之
间的距离d, [x]+代 表x的正部分, γ>0是边际超参数。
4.根据权利要求2所述的基于公司衍生关系的知识感知和时间敏感的金融新闻推荐系
统, 其特征在于: 所述破碎的三联体子模块定义了破碎的三联体S ′(h, r, t)={(h′, r, t)|h′∈
E}∪{(h, r, t ′)|t′∈E}, 其中h ′和t′是同一新闻中的随机实体。
5.根据权利要求2所述的基于公司衍生关系的知识感知和时间敏感的金融新闻推荐系
统, 其特征在于: 所述内部和外部知识结合子模块结合h和t之间的内部和外部知识过程中,
使用线性整流 函数(Rectified Linear Unit, ReLU); h的知识融合公式是
w=wiδ(h, r, t)|wQ; 其中,
表示向量的连接, w表
示权重, 它是根据三联体(h, r, t)选择的; δ(h, r, t)是控制 信息从尾部实体转移到头部的权
重, 由两层全连接神经网络计算; 线 性整流函数(Rectified Linear Unit, ReLU), 又称修正
线性单元, 是一种人工神经网络中常用的激活函数(activation function), 指代以斜坡函
数及其变种为代 表的非线性 函数。
6.根据权利要求2所述的基于公司衍生关系的知识感知和时间敏感的金融新闻推荐系
统, 其特征在于: 所述softmax函数归一化子模块用softmax函数实施归一化, 其计算公式是权 利 要 求 书 1/3 页
2
CN 115238082 A
2或
其中, ε 1
和 ε2是softmax函数拟合过程中的残差; δ0()函数即归一化指数函数, 或称Softmax函数,
是逻辑函数的一种推广, 它能将一个含任意实数的K维向量z “压缩”到另一个K维实向量σ
(z)中, 使得每一个元 素的范围都在(0, 1)之间, 并且所有元 素的和为1。
7.根据权利要求2所述的基于公司衍生关系的知识感知和时间敏感的金融新闻推荐系
统, 其特征在于: 所述上 下文分析子模块, 以如下公式计算得到具有知识感知的新闻表示
8.根据权利要求1所述的基于公司衍生关系的知识感知和时间敏感的金融新闻推荐系
统, 其特征在于: 所述基于相关公司的用户嵌入生成模块包括新闻区分子模块和用户嵌入
子模块; 新闻区分子模块将公司关系作为加权值来区分不同新闻的功 能, 首先假设用户会
接受所有推荐的新闻, 将其视为阅读历史, 给定一个首选股票s, 用户的嵌入将由该股票及
其几个相关股票的首推新闻来计算; 用户嵌入子模块将历史周期设定为2周, 使用
表示
股票s的新闻集,
是这一时期第k个相关公司的推荐新闻集, 用户嵌入表示 为
其中, rk是股票s与其相关股票之间的第k个相关系
数,
是股票s的推荐新闻集。
9.根据权利要求8所述的基于公司衍生关系的知识感知和时间敏感的金融新闻推荐系
统, 其特征在于: 所述推荐新闻集
是集合
中的新闻嵌入向量。
10.根据权利要求1所述的基于公司 衍生关系的知识感知和时间敏感的金融新闻推荐
系统, 其特征在于: 所述新闻推荐模块根据新闻发布时间的距离, 加入时间惩罚项Δ(Tnow‑
Tt); 时间距离越远, 时间衰减就越大; 最后, 向用户介绍衰减期的前K条新闻; Tt表示新闻发
布时间, Tnow表示当前时间; 所提机制的实现过程采用公式包括
和
11.根据权利要求1所述的基于公司 衍生关系的知识感知和时间敏感的金融新闻推荐
系统, 其特征在于: 所述基于公司衍生关系的知识感知和时间敏感的金融新闻推荐系统还
包括显示模块; 显示模块展示推荐系统向用户推荐的金融新闻, 页面背 景以黑色为主, 字体
颜色为蓝色。
12.一种运行在如权利要求1至11任一项所述的基于公司衍生关系的知识感知和时间
敏感的金融新闻推荐系统之上的基于公司衍生关系的知识感知和时间敏感的金融新闻推
荐方法, 其特 征在于, 包括以下步骤:
Step1、 构建知识感知的新闻表示层, 通过三元组提取实体以及识别实体之间的关系,
简单地表示新闻; 采用(h, r, t)的形式表示三联体, 其中h, t∈E是实体, r∈R是两者之间的
关系; 并对于每一条新闻通过句 子分析提取实体以及相应的关系集合, 根据上下文在现有
的金融知识图谱中匹配实体, 融合的内部与外 部知识;
Step2、 基于用户的阅读历史与公司关系生成基于相关公司的用户嵌入;
Step3、 定义时间敏感衰减机制, 根据新 闻发布时间的距离, 加入时间惩罚项, 以推荐同权 利 要 求 书 2/3 页
3
CN 115238082 A
3
专利 基于公司衍生关系的知识感知和时间敏感的金融新闻推荐系统及方法
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 10:57:49上传分享