说明:收录各省市地方标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210504049.5 (22)申请日 2022.05.10 (71)申请人 图谱天下 (北京) 科技有限公司 地址 100007 北京市东城区青龙胡同甲1号 东城文化人才 (国际) 创业园5 02室 (72)发明人 雷真 安波 孙绍军 赵阿民  (74)专利代理 机构 北京世衡知识产权代理事务 所(普通合伙) 11686 专利代理师 张超艳 (51)Int.Cl. G06F 16/36(2019.01) G06F 16/33(2019.01) G06F 40/279(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01)G06N 3/08(2006.01) G06Q 10/10(2012.01) (54)发明名称 简历筛选方法及装置 (57)摘要 本发明提供简历筛选方法及装置, 所述简历 筛选方法包括获得符合客户端用人需求的标准 简历; 按与标准简历相似度由高到低的顺序筛选 出至少一个候选简历。 本发明采用与符合客户端 用人需求的标准简历匹配的方法筛选候选简历, 能够更为简单有效的筛选出与客户端用人需求 相符的候选人才。 权利要求书2页 说明书11页 附图4页 CN 114741538 A 2022.07.12 CN 114741538 A 1.一种简 历筛选方法, 其特 征在于, 包括: 获得符合 客户端用人需求的标准简 历; 按与标准简 历相似度由高到低的顺序筛 选出至少一个候选简 历。 2.根据权利要求1所述的简历筛选方法, 其特征在于, 所述获得符合客户端用人需求的 标准简历的步骤 包括: 客户端上传初始简历 或/和从简历库调取初始简历, 优选地, 客户端上传已胜任人才的 简历作为初始简历; 或/和从简历库调出客户端已胜任人才的简历作为初始简历, 所述简历 库包括客户端数据库或/和第三方 数据库; 将上述初始简 历文本化; 将文本化的初始简历结构化, 提取内容块, 所述内容块包括基本信息、 教育经历、 工作 经历和自我评价的一个或多个; 对内容块进行知识抽取, 获得知识信息, 所述知识信 息包括毕业院校、 工作地域、 学历、 任职公司、 职位、 项目和技能中的一个或多个; 将知识信 息归一化到知识图谱的知识标引, 知识标引是知识图谱对简历中知识和实体 的标引, 形成标准简 历; 优选地, 所述将文本化的初始简 历结构化的步骤 包括: 采用深度学习方法提取初始简 历的各字段, 一个字段作为 一个内容 块; 利用规则匹配的方法将内容 块进行组合。 3.根据权利要求2所述的简历筛选方法, 其特征在于, 所述对内容块进行知识抽取的步 骤包括: 采用实体识别模型抽取内容 块的知识信息, 优选地, 所述采用实体识别模型抽取内容 块的知识信息的步骤 包括: 利用标准 术语进行检索; 对标准术语对应的信息采用Ber t+BiLSTM+CRF的模型进行抽取; 对于非标准 术语对应的信息采用Ber t+BiLSTM+MLP模型进行抽取。 4.根据权利要求2所述的简历筛选方法, 其特征在于, 所述按与标准简历相似度由高到 低的顺序筛 选出至少一个候选简 历的步骤 包括: 利用结构化搜索按照内容块对候选简历进行召回, 所述结构化搜索包括一个或多个知 识标引的表达式; 利用结构化匹配的方法获得 标准简历与召回的候选简 历的相似度; 按相似度由高到低对候选简 历进行排序; 选取排序靠前的设定数量的候选简 历。 5.根据权利要求4所述的简历筛选方法, 其特征在于, 所述利用结构化搜索按照内容块 对候选简 历进行召回的步骤 包括: 利用结构化搜索筛选简历, 优选地, 包括: 对数值型信息采用差值查找法搜索; 对实体 采用垂直 性搜索; 按照内容 块筛选出的简 历进行结构化; 优选地, 所述按照内容块筛选出的简历进行结构化的步骤之前还包括: 将TFIDF作 为特 征权重, 通过字面相似度筛 选出与标准简 历相似的简 历。权 利 要 求 书 1/2 页 2 CN 114741538 A 26.根据权利要求4所述的简历筛选方法, 其特征在于, 所述利用结构化匹配的方法获得 标准简历与召回的候选简 历的相似度的步骤 包括: 分别获得 标准简历和候选简 历的各内容 块的相似度; 对各内容 块的相似度进行加权组合获得 标准简历与候选简 历的相似度; 优选地, 所述分别获得 标准简历和候选简 历的各内容 块的相似度的步骤 包括: 获得内容 块的字段类型, 所述字段类型包括数字类型、 文本类型和知识类型; 不同字段类型采用不同相似度方法, 获得内容 块各字段的相似度; 对各字段的相似度进行加权组合获得内容 块的相似度。 7.根据权利要求6所述的简历筛选方法, 其特征在于, 所述不同字段类型采用不同相似 度方法的步骤 包括: 通过归一化差值方法获得数字类型的字段的相似度, 优选地, 通过差值绝对值的倒数 获得数字类型的字段的相似度; 采用基于Ber t的文本相似度方法获得文本类型的字段的相似度; 采用基于图神经网络的知识 表示相似度方法获得知识类型的字段的相似度; 优选地, 所述采用基于Bert的文本相似度 方法获得文本类型的字段的相似度的步骤包 括: 对于文本信息采用Bert+BiLSTM进行建模, 使用余弦相似度获得文本类型的字段的相 似度; 优选地, 所述采用基于图神经网络的知识表示相似度方法获得知识类型的字段的相似 度的步骤 包括: 与标准简 历的工作地 域的知识标引完全匹配的相似度为1, 否则为0; 采用类别相似度获得与标准简历的毕业院校的毕业院校的知识标引、 知识标引、 技能 的知识标引相关的简 历、 职位的知识标引的相似度。 8.一种简 历筛选装置, 其特 征在于, 包括: 标准化部, 获得符合 客户端用人需求的标准简 历; 筛选部, 按与标准化部提供的标准简历相似度由高到低的顺序筛选出至少一个候选简 历。 9.一种电子设备, 其特 征在于, 所述电子设备包括至少一个处 理器; 以及, 与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的指令, 所述指令被所述至少一个处 理器执行, 以使所述至少一个处理器能够执行如权利要求1至7中任一所述的简历筛选方 法。 10.一种计算机可读存储介质, 存储有计算机程序, 其特征在于, 所述计算机程序被处 理器执行时实现如权利要求1至7中任一所述的简 历筛选方法。权 利 要 求 书 2/2 页 3 CN 114741538 A 3

.PDF文档 专利 简历筛选方法及装置

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 简历筛选方法及装置 第 1 页 专利 简历筛选方法及装置 第 2 页 专利 简历筛选方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 11:00:57上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。