利索能及
我要发布
收藏
专利号: 2025103656415
申请人: 安徽先驱科技服务有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-27
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于大数据的人力资源数据管理方法,其特征在于,包括:S1,获取样本简历数据集,以及待评估对象的简历;

S2,从样本简历数据集中提取性别和年龄,作为偏见特征;

S3,对样本简历数据集进行语义编码,得到简历的语义编码特征向量集合;

S4,根据偏见特征,对简历的语义编码特征向量集合进行降维处理,得到降低偏见影响的特征向量集合S;

S5,对降低偏见影响的特征向量集合S进行聚类分析,得到多个代表不同特征组合的特征向量中心点;

S6,采用改进的哈希算法对待评估对象的简历进行语义编码,得到待评估对象的哈希值;

S7,计算待评估对象的哈希值与各特征向量中心点之间的相似度,根据相似度进行人力资源数据管理;

得到降低偏见影响的特征向量集合S,包括:

分别计算简历的语义编码特征向量集合中各维度与性别特征和年龄特征之间的相关系数;

将相关系数绝对值大于预设阈值对应的维度标记为偏见敏感维度,得到性别偏见维度集合和年龄偏见维度集合;

分别计算性别偏见维度集合和年龄偏见维度集合的衰减系数λ1和λ2;

根据各维度的相关系数绝对值和衰减系数λ1和λ2,生成偏见调整权重矩阵;

根据偏见调整权重矩阵,对简历的语义编码特征向量集合进行降维处理,得到降低偏见影响的特征向量集合S;

分别计算性别偏见维度集合和年龄偏见维度集合的衰减系数λ1和λ2,包括:其中,μ1和μ2表示性别偏见维度集合和年龄偏见维度集合中相关系数绝对值的平均值,σ1和σ2表示性别偏见维度集合和年龄偏见维度集合中相关系数绝对值的标准差;c1表示性别偏见抑制参数,c2表示年龄偏见抑制参数,b1和b2为调节参数;

采用改进的哈希算法对待评估对象的简历进行语义编码,包括:构建m个独立的独立哈希函数族{h1,h2,.....,hm},其中,每个哈希函数族hl表示将特征向量映射到b位二进制哈希码的函数集合;

利用m个独立的独立哈希函数族{h1,h2,.....,hm}对待评估对象的简历进行特征映射,得到m组b位的二进制哈希码;

将m组b位的二进制哈希码按序组合,作为待评估对象的哈希值。

2.根据权利要求1所述的基于大数据的人力资源数据管理方法,其特征在于:S5,得到多个代表不同特征组合的特征向量中心点,包括:设置最优聚类数N,其中N为大于3的正整数;

计算特征向量集合S中每个特征向量v的局部密度值ρ(v),局部密度值ρ(v)定义为特征向量v的R-邻域内特征向量的数量,其中R-邻域指欧氏距离小于半径R的区域;

随机选择特征向量集合S中的一个特征向量v1作为第一个初始中心点,并将v1添加到中心点集合C中;

对于特征向量集合S中每个未被选为中心点的特征向量vi,计算vi到中心点集合C中最近中心点的距离Di,并计算特征向量vi的局部密度值ρ(vi);

根据距离Di和局部密度值ρ(vi)计算每个未选中特征向量vi的选择概率{Pi};

根据选择概率{Pi},选择具有最高选择概率的特征向量vmax作为下一个中心点,并将vmax添加到中心点集合C中;

如果新选择的中心点vmax与任一已选中心点的距离小于预设的最小距离阈值MinDist,则放弃vmax,并从剩余未选中特征向量中选择具有次高选择概率的特征向量作为中心点;

重复直至中心点集合C中包含N个初始聚类中心点。

3.根据权利要求2所述的基于大数据的人力资源数据管理方法,其特征在于:其中,α和β为权重系数,用于平衡距离因素和密度因素的影响,γ为离群点惩罚系数,Oi为离群指标,当特征向量vi与其K近邻的平均距离超过全局平均距离的预设倍数时,Oi取值为1,否则为0。

4.根据权利要求1所述的基于大数据的人力资源数据管理方法,其特征在于:构建哈希函数族hl,包括:

随机生成b个d维单位向量{r1,r2,.....,rd},其中,d表示特征向量的维度;

对于待评估对象的特征向量ve,计算ve与每个随机单位向量rk的内积,得到投影值pk=ve×rk;

当投影值pk大于等于零时,对应的哈希位设置为1,反之设置为0;

将b个哈希位按顺序组合,形成b位二进制哈希码作为哈希函数族hl。

5.根据权利要求1所述的基于大数据的人力资源数据管理方法,其特征在于:S7,计算待评估对象的哈希值与各特征向量中心点之间的相似度,包括:采用步骤S6中改进的哈希算法对各特征向量中心点进行语义编码,得到各特征向量中心点的哈希值;

分别计算待评估对象的哈希值与各特征向量中心点的哈希值之间的相似度Sim(He,Hj);其中,He表示待评估对象的哈希值,Hj表示第j个特征向量中心点的哈希值;

根据计算得到的相似度对待评估对象进行分类,将待评估对象归类到相似度最高的特征向量中心点对应的类别中;

基于分类结果,对待评估对象进行人力资源管理,所述管理包括人才匹配和职位推荐。

6.根据权利要求5所述的基于大数据的人力资源数据管理方法,其特征在于:计算待评估对象的哈希值与各特征向量中心点的哈希值之间的相似度Sim(He,Hj),采用如下公式:其中,hq(*)表示第q个哈希函数族生成的哈希码部分,Hamming(*)表示汉明距离,b表示每个哈希函数族生成的哈希码位数。