(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210224918.9
(22)申请日 2022.03.07
(71)申请人 达而观信息科技 (上海) 有限公司
地址 201203 上海市浦东 新区亮秀路1 12号
B座301、 303、 304室
(72)发明人 张涛 何双钻 刘迪康 金克
邵万骏 纪达麒 陈运文
(74)专利代理 机构 上海智力专利商标事务所
(普通合伙) 31105
专利代理师 周涛
(51)Int.Cl.
G06F 9/451(2018.01)
G06F 8/38(2018.01)
(54)发明名称
一种软件界面结构化元 素的批量 抓取方法
(57)摘要
本发明涉及一种软件界面结构化元素的批
量抓取方法, 包括开发流程阶段和运行流程阶
段, 在开发流程阶段获取三个选择器, 三个选择
器分别对应祖先节点、 孩子节 点组和孩子节点组
中的目标节点; 运行流程阶段RPA机器人通过三
个选择器提取结构化数据, 获得由目标节点组成
的节点组, RPA机器人获取节点组内目标节点的
属性并按照节点组和孩子节点组生成结构化数
据的二维数组。 本发明解决现有技术中RPA机器
人获取结构化数据时遇到的系统软件不提供
API、 数据分页、 数据结构不明显的问题, 简化了
RPA机器人获取结果化数据的过程以及提高RPA
机器人获取 结果化数据的效率。
权利要求书1页 说明书4页 附图3页
CN 114691265 A
2022.07.01
CN 114691265 A
1.一种软件界面结构化元素的批量抓取方法, 其特征在于, 包括开发流程阶段和运行
流程阶段, 在开 发流程阶段获取三个选择器, 三个选择器分别对应祖先节点、 孩子节点组和
孩子节点组中的目标节 点; 运行流程阶段RPA机器人通过三个选择器提取结构化数据, 获得
由目标节点组成的节点组, RPA机器人获取节点组内目标节点的属性并按照节点组和孩子
节点组生成结构化数据的二维数组。
2.根据权利要求1所述的一种软件 界面结构化元素的批量抓取方法, 其特征在于, 运行
流程阶段, 当结构数据处于不同页面时, RPA机器人进行翻页操作, 获取每页的结构化数据
并将获取的结构化数据拼接在一 起。
3.根据权利要求1或2所述的一种软件界面结构化元素的批量抓取方法, 其特征在于,
所述选择器保存了目标节点、 孩 子节点组以及祖 先节点中的元 素属性及 层级关系。
4.根据权利要求3所述的一种软件 界面结构化元素的批量抓取方法, 其特征在于, 开发
流程阶段包括以下步骤:
步骤一、 人工 选取结构化数据中的两个控 件类型相同的界面元 素;
步骤二、 借助分析模块分析两个界面元素的层级和位置关系, 找到两个所述界面元素
的共同祖 先节点, 将祖 先节点的选择器作为第一个选择器;
步骤三、 获取祖先节点的所有孩子节点组, 将从祖先节点查找孩子节点组的选择器作
为第二个选择器;
步骤四、 将孩子节点组中的查找控件类型相同的节点的选择器作为第三个选择器; 若
步骤1中的两个界面元 素在孩子节点组层级, 则第三个选择器为空。
5.根据权利要求4所述的一种软件 界面结构化元素的批量抓取方法, 其特征在于, 在运
行流程阶段, RPA机器人通过三个选择器提取 结构化数据时包括以下步骤:
步骤1、 RPA机器人根据第一个选择器找到祖 先节点;
步骤2、 RPA机器人根据第二个选择器找到 孩子节点组;
步骤3、 RPA机器人根据第二个选择器, 分别从孩子节点组的每个孩子节点出发查找孩
子节点下对应的目标节点并形成目标节点组;
步骤4、 RPA机器人获取目标节点的指定属性, 并按照目标节点组和孩子节点组形成结
构化数据的二维数组。
6.根据权利要求1所述的一种软件 界面结构化元素的批量抓取方法, 其特征在于, 所述
分析模块 为语法分析算法。权 利 要 求 书 1/1 页
2
CN 114691265 A
2一种软件界面 结构化元素的批量抓取方 法
技术领域
[0001]本发明涉及RPA机器人流程自动化领域, 具体涉及一种软件界面结构化元素的批
量抓取方法。
背景技术
[0002]机器人流程自动化(Robotic Process Automation, 后文简称RPA)是运行在个人
计算机或服务器上的软件, 主要功能是模拟人操控 各种系统软件、 自动执行业务流程, 适用
于大批量、 高重复的业务场景。 RPA机器人的主要功能之一就是获取系统软件界面上的数
据, 其中就包括结构化数据(结构化数据指的是在一个记录文件里面以固定格式存在的数
据, 例如表格、 目录等)。
[0003]目前获取结构化数据的主要方法是调用系统软件提供的应用程序编程接口
(Application Programming Interface, 后文简称API), 该 方法存在以下问题:
[0004]1、 对于不 提供API的系统软件无效;
[0005]2、 对于分页显示的结构化数据无效;
[0006]3、 对于结构不明显的数据无效。
[0007]为了解决上述技术问题, 现有技术提出的解决方案是分别获取结构化中的每个数
据, 然后按照发现的规 律拼接起来, 然而这种解决方案存在以下问题:
[0008]1、 发现结构化数据的规 律困难;
[0009]2、 数据量大的时候, 单独获取每 个数据耗费时间;
[0010]3、 将获取到的数据按照特定规 律组合效率低, 容 易出错。
发明内容
[0011]为了解决现有技术中RPA机器人获取结构 化数据时遇到的系统软件不提供AP I、 数
据分页、 数据结构不明显的问题, 简化RPA机器人获取结果化数据的过程以及提高RPA机器
人获取结果化数据的效率, 本发明提供了一种软件界面结构化元 素的批量 抓取方法。
[0012]本发明的技 术目的是通过以下技 术方案实现的:
[0013]一种软件界面结构化元素的批量抓取方法, 包括开发流程阶段和运行流程阶段,
在开发流程阶段获取三个选择器, 三个选择器分别对应祖先节点、 孩子节点组和孩子节点
组中的目标节点; 运行流程阶段RPA机器人通过三个选择器提取结构化数据, 获得由目标节
点组成的节点组, RPA机器人获取节点组内目标节点的属性并按照节点组和孩子节点组生
成结构化数据的二维数组。
[0014]进一步地, 运行流程阶段, 当结构数据处于不同页面时, RPA机器人进行翻页操作,
获取每页的结构化数据并将获取的结构化数据拼接在一 起。
[0015]进一步地, 选择器保存了目标节点、 孩子节点组以及祖先节点中的元素属性及层
级关系。
[0016]进一步地, 开发流 程阶段包括以下步骤:说 明 书 1/4 页
3
CN 114691265 A
3
专利 一种软件界面结构化元素的批量抓取方法
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 11:24:59上传分享