1.一种基于哈夫曼树的异构部分重复码的构造方法,其特征在于,包括以下步骤:步骤1,对一定时间内的分布式存储系统的轨迹数据进行统计分析,得到不同访问频率的k个数据块;
步骤2,将不同访问频率的k个数据块作为哈夫曼树的叶子结点,通过哈夫曼算法构造得到哈夫曼树;
步骤3,根据公式
得到第i个数据块的重复度ρi,i=1,2,…k,其中Li表示哈夫曼树的第i个数据块的路径长度,ε为重复度因子,l为修正因子, 表示向下取整;
步骤4,对不同访问频率的k个数据块进行MDS编码产生p个校验块,并将第y个校验块的重复度设置为ρy,y=1,2,…p;
步骤5,通过成对平衡设计算法构造异构FR码:
步骤5.1,将得到的p个校验块及其重复度添加到不同访问频率的k个数据块及其重复度,得到p+k个数据节点及第x个数据节点对应的重复度ρx,x=1,2,…p+k;
步骤5.2,定义一个成对平衡设计,并将成对平衡设计中的区组B的大小设置为第x个数据节点对应的重复度ρx即|Bx|=ρx;
步骤5.3,根据以下公式构造异构FR码:
Nj={x:j∈Bx}
其中,Nj表示第j个异构FR的存储节点,j=1,2…v,x表示第x个数据节点。
2.如权利要求1所述的一种基于哈夫曼树的异构部分重复码的构造方法,其特征在于,步骤4所述的将第y个校验块的重复度设置为ρy具体为min(ρi)≤ρy≤max(ρi)-1,i=1,
2,…,k。
3.如权利要求1所述的一种基于哈夫曼树的异构部分重复码的构造方法,其特征在于,所述的成对平衡设计具体为定义一个V集合,V集合中的元素个数为v,Ω为V的区组集合,Ω={B1,…,Bp+k},当Ω中区组的大小(数)均在某个正整数集合S中,V的任意两个元素恰含于Ω的λ个区组中,则将二元组(V,Ω)称为成对平衡设计。
4.如权利要求1所述的一种基于哈夫曼树的异构部分重复码的构造方法,其特征在于,步骤5所述的数据节点包括数据块和校验块。