利索能及
我要发布
收藏
专利号: 2021103541076
申请人: 山东省人工智能研究院
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-10
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于企业特征传播的企业服务推荐方法,其特征在于,包括如下步骤:a)获取n个企业经营数据,该数据中每个企业具有企业属性表C、服务属性表S及服务交互记录表R,将n个企业经营数据进行标准化处理;

b)在标准化处理后的数据中根据企业属性表C中的经营状态、所属行业、企业类型、经营范围和业务范围5个类别字段,使相同值进行连接,得到知识图谱,其中head为头实体,tail为尾实体,e为头尾实体间关系;

c)在服务交互记录表R中搜索目标预测服务s中包含的交互企业c′,s∈S,c′∈C,将搜索记录添加到目标预测服务s中形成企业交互集合Sets;

d)利用知识图谱将企业交互集合Sets中企业作为head节点,通过头尾实体间关系e寻找尾实体tail,将寻找到的尾实体tail组成的集合建立第一次传播集合将 作为head节点,通过头尾实体间关系e寻找尾实体,将寻找到的尾实体tail组成的集合建立第二次传播集合 重复上述循环,直至将 作为head节点,通过头尾实体间关系e寻找尾实体,将寻找到的尾实体tail组成的集合建立第n次传播集合e)随机初始化所有企业的embedding编码和n个转化矩阵r,n为传播次数,embedding编码和转化矩阵r的训练的目标为h×r=t,h为头实体的embedding,t为尾实体的embedding,h、r、t的维度均为d;

f)通过公式wi=hirτco计算相似度权重wi,式中co为目标企业c的embedding编码,hi为传播集合 中第i个企业的embedding编码,τ∈{1,...,n},rτ为第τ次传播的转化矩阵,wi的维度为d;

d

g)通过公式 计算目标服务的转换向量aτ,aτ∈R ,R为实数,d嵌入维度,ci为传播集合 中的企业的embedding编码;

d×d

h)随机初始化二维合并矩阵T∈R ,通过公式 计算目标服务特征向量vτ;

i)重复步骤h)直至得到n个企业服务表示向量v1,...,vn;

j)通过公式 计算目标企业c对目标预测服务s采纳的概率,完成企业特征传播预训练模型的建立;

k)通过公式 计算损

失函数L,式中 为预测值,y为预测企业和服务对应的标签,log为以e为底的对数函数,α∈(0,1),α为权重, 为第τ次传播下,传播集合 中的第i个企业的embedding编码, 为为第τ次传播下,传播集合 中的第i个企业对应尾结点的embedding编码;

l)对企业属性表C中企业经营范围关键词使用multi‑hot编码,得到编码后的输出结果Ik,对企业属性表C中证照类信息l1,l2,...,lx使用SPSS软件分别进行k‑means算法聚类操作,x为企业属性表C中证照类信息中字段的个数,聚类中心k=5,聚类后生成5类标签信息,将5类标签信息使用one‑hot编码形式的向量进行拼接,得到证照输入集合Il;

m)对企业属性表C中企业风险类信息t1,t2,...,ty使用SPSS软件分别进行k‑means算法聚类操作,y为企业属性表C中风险类信息中字段的个数,聚类中心k=5,聚类后生成5类标签信息,将5类标签信息使用one‑hot编码形式的向量进行拼接,得到证照输入集合It;

n)通过公式 计算输入嵌入向量Ic, 为向量拼接,通过公式计算输入嵌入向量Is,Iside为服务属性表S中目标服务的特征;

o)将向量Ic通过多层MLP转化为d维向量得到企业embedding向量Vc;

p)将向量Is通过多层MLP转化为与企业embedding向量Vc相同维度服务embedding向量Vs;

q)利用公式 得到预测得分 完成企业特征传播网络模型的建立,θ为全局变量,T为转置;

i)利用损失函数L使用Adam优化方法对企业特征传播网络模型进行优化;

s)保持优化后的企业特征传播网络模型的参数;

t)将优化后的企业特征传播网络模型的预测得分 按大小排序,将得分最高的10个项目推荐给用户。

2.根据权利要求1所述的基于企业特征传播的企业服务推荐方法,其特征在于:步骤a)中企业属性表C中包含字段有:企业名、经营状态、所属行业、企业类型、经营范围、业务类型、营业执照数量、商标数量、著作权证数量、专利数量、认证数量、到期营业执照数量、到期商标数量、到期著作权证数量、到期专利数量、到期认证数量、企业纳税异常数量,经营异常数量,行政处罚数量,欠税记录数量,股权出资,动产抵押数量;服务属性表S包含字段有:服务编号、服务所属类型、服务价格;服务交互记录表R包含字段有:企业名、服务编号。

3.根据权利要求1所述的基于企业特征传播的企业服务推荐方法,其特征在于:步骤a)中标准化处理的过程为:将服务交互记录表R中没有的企业和服务在企业属性表C、服务属性表S中进行过滤,对于企业属性表C中的数值型缺失,使用企业属性表C中该字段的平均值差值处理,对于企业属性表C中类别缺失,使用相同所述行业对应该字段的众数补充。

4.根据权利要求1所述的基于企业特征传播的企业服务推荐方法,其特征在于:步骤b)中特征包括企业的经营状态、所述行业、企业类型、经营范围、业务类型。

5.根据权利要求1所述的基于企业特征传播的企业服务推荐方法,其特征在于:步骤l)中证照类信息包含字段有:营业执照数量、商标数量、著作权证数量、专利数量、认证数量、到期营业执照数量、到期商标数量、到期著作权证数量、到期专利数量、到期认证数量。

6.根据权利要求1所述的基于企业特征传播的企业服务推荐方法,其特征在于:步骤m)中企业风险类信息包含字段有:企业纳税异常数量,经营异常数量,行政处罚数量,欠税记录数量,股权出资,动产抵押数量。