说明:收录各省市地方标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210161359.1 (22)申请日 2022.02.22 (71)申请人 平安普惠企业管理有限公司 地址 518000 广东省深圳市前海深港合作 区前湾一路1号A栋201室 (72)发明人 胡文亮 (74)专利代理 机构 深圳市沃德知识产权代理事 务所(普通 合伙) 44347 专利代理师 高杰 于志光 (51)Int.Cl. G06F 16/215(2019.01) G06F 16/23(2019.01) (54)发明名称 数据抽取方法、 装置、 电子设备及存 储介质 (57)摘要 本发明涉及数据处理技术, 揭露一种数据抽 取方法, 包括根据所述数据源优 先级对所有数据 接口进行排序, 得到接口序列; 从所述接口序列 中的第一个数据接口对应数据源中抽取数据映 射至预设的字段, 得到第一接口数据; 判断所述 第一接口数据中是否存在空白字段; 当所述第一 接口数据中存在空白字段, 从其他接口中抽取数 据对第一接口数据中的空白字段进行补充替换 直至所述第一接口数据不存在空白字段或所有 接口全部被抽取完毕, 得到更新后的第一接口数 据, 并将该数据发送至预设终端。 本发明还涉及 一种区块链 技术, 所述第一接口数据可以存储在 区块链节点中。 本发明还提出一种数据抽取装 置、 设备以及介质。 本发明可以提高数据抽取的 效率。 权利要求书2页 说明书9页 附图2页 CN 114547011 A 2022.05.27 CN 114547011 A 1.一种数据抽取 方法, 其特 征在于, 所述方法包括: 获取不同数据源的数据接口及对应的数据源优先级, 根据 所述数据源优先级对所有数 据接口进行排序, 得到 接口序列; 从所述接口序列中的第 一个数据接口对应数据源中抽取数据映射至预设的字段, 得到 第一接口数据; 判断所述第一接口数据中是否存在空白字段; 当所述第一接口数据中不存在空白字段, 将所述第 一接口数据发送至数据抽取人员的 预设终端设备; 当所述第一接口数据中存在空白字段, 对所述接口序列进行接口数量更新, 判断更新 后的所述接口序列中接口数量是否大于零; 当更新后的所述接口序列中接口数量大于零, 从更新后的所述接口序列中的第 一个数 据接口对应数据源中抽取 数据映射至预设的字段, 得到第二接口数据; 利用所述第 二接口数据对所述第 一接口数据中的空白字段进行相同字段的数据替换, 得到更新后的第一接口数据, 并返回所述判断所述第一接口数据中是否存在空白字段步 骤; 当更新后的所述接口序列中接口数量不大于零, 将所述第 一接口数据发送至所述终端 设备。 2.如权利要求1所述的数据抽取方法, 其特征在于, 所述从所述接口序列中的第 一个数 据接口对应数据源中抽取 数据映射至预设的字段, 得到第一接口数据, 包括: 获取所述接口序列中第一个数据接口 的配置信息及字段映射 规则; 利用所述配置信 息对所述第 一个数据接口对应的的数据源进行数据抽取, 得到初始抽 取数据; 将所述初始抽取 数据映射至预设的字段, 得到所述第一接口数据。 3.如权利要求1所述的数据抽取方法, 其特征在于, 所述判断所述第 一接口数据中是否 存在空白字段, 包括: 查询所述第一接口数据中每 个字段对应的值是否为空值; 当所述第一接口数据中存在字段对应的值 为空值, 那么将该字段确定为空白字段。 4.如权利要求1所述的数据抽取方法, 其特征在于, 所述利用所述第 二接口数据对所述 第一接口数据中的空白字段进行相同字段的数据替换, 得到更新后的第一接口数据, 包括: 将所述空白字段确定为待替换字段; 提取所述第二接口数据中所述待替换字段对应的值, 得到待替换 数值; 将所述待替换数值替换所述第 一接口数据中相同字段的值, 得到更新后的第 一接口数 据。 5.如权利要求1所述的数据抽取方法, 其特征在于, 所述将所述第 一接口数据发送至所 述终端设备, 包括: 将所述第一接口数据封装为预设的文件格式的文件, 得到目标文件; 将所述目标文件发送至所述终端设备。 6.如权利要求1至5中任意一项所述的数据抽取方法, 其特征在于, 所述对所述接口序 列进行接口数量更新, 包括:权 利 要 求 书 1/2 页 2 CN 114547011 A 2将所述接口序列中的第一个数据接口删除, 得到更新后的接口序列。 7.如权利要求2所述的数据抽取方法, 其特征在于, 所述利用所述配置信 息对所述第 一 个数据接口所属的数据源进行 数据抽取, 得到初始抽取 数据, 包括: 从所述配置信息中解析 所述第一个数据接口 的输入/输出参数; 将所述配置信息对应的数据源确定为目标 数据源; 将所述输入/ 输出参数转换成所述目标 数据源的数据源可 执行语言; 将所述数据源可执行语言发送至所述目标数据源, 接收所述目标数据源根据 所述数据 源可执行语言返回的数据, 得到所述初始抽取 数据。 8.一种数据抽取装置, 其特 征在于, 包括: 数据抽取模块, 用于获取不同数据源的数据接口及对应的数据源优先级, 根据所述数 据源优先级对所有数据接口进行排序, 得到接口序列; 从所述接口序列中的第一个数据接 口对应数据源中抽取 数据映射至预设的字段, 得到第一接口数据; 空白字段判断模块, 用于判断所述第一接口数据中是否存在空白字段; 当所述第一接 口数据中不存在空 白字段, 将所述第一接口数据发送至数据抽取人员的预设终端设备; 当 所述第一接口数据中存在空 白字段, 对所述接口序列进行接口数量更新, 判断更新后的所 述接口序列中接口数量是否大于零; 接口数量判断模块, 用于当更新后的所述接口序列中接口数量大于零, 从更新后的所 述接口序列中的第一个数据接口对应数据源中抽取数据映射至预设的字段, 得到第二接口 数据; 利用所述第二接口数据对所述第一接口数据中的空白字段进行相同字段的数据替 换, 得到更新后的第一接口数据, 并返回所述判断所述第一接口数据中是否存在空 白字段 步骤; 当更新后的所述接口序列中接口数量不大于零, 将所述第一接口数据发送至所述终 端设备。 9.一种电子设备, 其特 征在于, 所述电子设备包括: 至少一个处 理器; 以及, 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的计算机程序, 所述计算机程 序被所述至少一个处理器执行, 以使 所述至少一个处理器能够执行如权利要求 1至7中任一 项所述的数据抽取 方法。 10.一种计算机可读存储介质, 存储有计算机程序, 其特征在于, 所述计算机程序被处 理器执行时实现如权利要求1至7中任一项所述的数据抽取 方法。权 利 要 求 书 2/2 页 3 CN 114547011 A 3
专利 数据抽取方法、装置、电子设备及存储介质
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 人生无常 于
2024-03-18 11:20:10
上传分享
举报
下载
原文档
(575.4 KB)
分享
友情链接
DB13-T 2815-2018 顶管工程施工及验收技术规程 河北省.pdf
YD-T 4043-2022 基于人工智能的多中心医疗数据协同分析平台参考架构.pdf
T-CESA 1041—2019 信息技术 人工智能 服务能力成熟度评价参考模型.pdf
GB-T 16664-1996 企业供配电系统节能监测方法.pdf
GB-T 23262-2009 非金属密封填料试验方法.pdf
GB/T 40143-2021 志愿服务组织基本规范.pdf
T-CCUA 016—2021 超级计算数据中心设计要求.pdf
TTAF 150—2023 移动互联网应用人工智能模型安全指南.pdf
T-CI 152—2023 基于区块链的制造业产品生命周期价值链数据管理与数据共享技术规范.pdf
GB-T 40327-2021 轮式移动机器人导引运动性能测试方法.pdf
YD-T 1729-2008 电信网和互联网安全等级保护实施指南.pdf
思度安全-DSMM-019 数据安全事件应急管理规范V1.0.pdf
GB-T 41554-2022 地理空间观测平台及传感器资源元数据.pdf
GB-T 27542-2019 蓄电池托盘搬运车.pdf
YD-T 交互式应用程序安全测试工具能力要求.pdf
T-CSAE 81—2018 能量回馈式整车动力学控制系统 性能要求及台架试验方法.pdf
GB-T 32808-2016 阀门 型号编制方法.pdf
安华金和 数据安全治理白皮书5.0 行业数据安全治理实践集.pdf
T-QGCML 106—2021 生物基热拌用高性能沥青再生剂.pdf
DB43-T 2574-2023 林业信息化系统运维和服务规范 湖南省.pdf
1
/
3
14
评价文档
赞助2.5元 点击下载(575.4 KB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。