利索能及
我要发布
收藏
专利号: 2021115278217
申请人: 湖南师范大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-10-14
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于增强连接时序分类网络的步态识别方法,其特征在于包括:S1、将步态图片依据时序进行分组,并按组构建非完整周期的子步态能量图;

S2、随机抽取预定长度的子步态能量图,依据时序先后构建具有相同序列标签的步态训练数据;通过深度卷积网络和具有时序特征的双向长短期记忆网络来提取步态的静态和动态时序特征,利用连接时序分类器在训练过程中自动对齐序列标签的优势,结合三元组损失,将样本分为正样本、负样本和自身样本,以提高分类器对细小差异的鉴别能力;

S3、在仅对周期内固定行走条件的各类数据进行时序分类训练的前提下,针对周期内变化行走角度的曲线行走和合成的行走条件变化数据进行测试。

2.根据权利要求1所述基于增强连接时序分类网络的步态识别方法,其特征在于,所述步骤S1中,将步态图片依据时序分成3~5帧/组。

3.根据权利要求1所述基于增强连接时序分类网络的步态识别方法,其特征在于,所述步骤S2中,包括:

(1)采用前馈的方式,利用深度卷积神经网络DenseNet的稠密连接机制,直接将所有层相连接,从而减少梯度消失,加强特征间的传递,同时减少相关参数和计算量;

(2)利用长短期记功能的循环神经网络Bi‑LSTM来提取步态时序特征;

(3)利用深度卷积神经网络、循环神经网络和基于CTC的连接时序分类器,来构建端到端的增强连接时序分类网络模型EN‑CTCNet,以实现更加灵活的局部标签预测和步态识别;

(4)构建增强连接时序分类网络EN‑CTCNet的多目标混合损失函数,包括CTC损失函数、Triplet Loss损失函数和Softmax损失函数,利用Triplet Loss损失函数的优势扩大类间差异,缩小类内差异,提高识别效率。

4.根据权利要求3所述基于增强连接时序分类网络的步态识别方法,其特征在于,所述步骤(1),具体为:

1.1)令S为固定分布 中的步态训练样本集;输入空间 是所有i维向量的有限序列集合;目标空间(预测空间) 表示为有限字符ID条件下所有序列的集合,通常将元素称为标记或标记序列;每个步态训练样本都由一组序列(x,z)组成;目标序列z=(z1,z2,...,zM)小于或等于输入序列x=(x1,x2,...,xT),即M≤T;因为输入序列与目标序列通常具有不同的长度,输入序列可以是随机大小,而输出序列只能是一个或者几个ID,所以没有先验的方法对输入序列和输出序列进行预对齐处理;

利用步态样本集S来训练一个增强连接时序分类器,并能对任意长度的步态测试序列数据进行分类,输出最有可能的序列标签,即:

1.2)利用DenseNet网络进行步态特征的降维和提取,其输出特征定义为

1.3)使用长度为T的序列向量x=(x1,x2,...,xT),其中 并将x作为Bi‑LSTM网络的输入。

5.根据权利要求3所述基于增强连接时序分类网络的步态识别方法,其特征在于,所述步骤(2),具体为:

2.1)长短期记功能的循环神经网络是基于xt和ht‑1来计算ht,只不过对内部的结构进行了更加精心的涉及,加入了输入门it、遗忘门ft以及输出门ot三个门和一个内部记忆单元Ct;

其中,输入门控制当前计算的新状态以多大程度更新到记忆单元中,遗忘门控制前一步记忆单元中的信息有多大程度被遗忘掉,输出门控制当前的输出有多大程度上取决于当前的记忆单元;

2.2)在步态序列标记任务中,步态ID的集合用A表示,在本发明提出的增强时序分类方法中,有Softmax输出层单元|A|,表示为在时间节点t所观测到的相应标签概率;

通过引入了一个额外的标签单元,名称为“边界间隔”,用 表示;

边界间隔用来观察和标记行条件的变化;带有 的扩展步态ID集合表示为在不同时间节点t,Softmax输出层定义了所有ID的概率,每一个时间节点取一个ID并连接起来便构成了一条路径π;将这条路径所有时刻的ID观察概率相乘得到路径总概率,它体现了输入序列到输出路径序列的概率;

2.3)利用DenseNet网络输出特征定义为 长度为T的序列向量x=(x1,x2,...,xT),其中 并将x作为Bi‑LSTM网络的输入;Bi‑LSTM网络的输出与Softmax层相连,连接权重定义为WBlstm;Bi‑LSTM网络输入与输出的关系为:即通过该子网络实现了序列空间的连续映射 通过该映射将输入序列x映射到连续输出 定义为在时间t时观测到标签k的概率。

6.根据权利要求3所述基于增强连接时序分类网络的步态识别方法,其特征在于,所述步骤(3),具体为:

T

3.1)令A′为步态ID集合 上长度为T的序列集合;假设每次观察的条件概率都是输出独立的,可以通过输入序列x来获得集合中任何路径π的概率分布,输入序列x是原始步态序列图经过DenseNet步态空间特征提取网络和Bi‑LSTM步态时序特征提取网络后输出的序列特征,其对应路径π的概率分布表示为:

3.2)定义集合A′的一个ID标签序列为l,因为集合A′可能有多个路径映射到同一序列,T

因此需要重新定义多对一的函数来重新映射路径集,并获得预测的ID标签序列,即:Fm:A′→A≤T,其中A≤T表示可能的路径集,即在原始路径的基础上,预测的ID序列的长度不大于输入序列的长度;

定义映射函数Fm的思想:从路径中删除所有重复的标签和区间边界 例如:相当于网络从原始输入序列标签转换为预测标签,或者从预测到的标签转换为另一个新标签;与文本序列中有多个字母的情境不同,在步态识别中,步态序列通常具有相同的ID,因此,如下的预测结果“ID1ID2ID2ID2”就显得不那么合理了,因此引入投票策略来获得最终预测结果,即:

Pvote(ID1ID2ID2ID2)=ID2ID2ID2显然,基于CTC算法的识别方法不需要输入数据与预测标签之间的一一对齐,注意力更多的集中在整个序列的最终预测结果;

最终将l∈A≤T标记为其对应的所有路径的概率之和,那么ID标签序列的实际预测概率可以表示为:

7.根据权利要求3所述基于增强连接时序分类网络的步态识别方法,其特征在于,所述步骤(4),具体为:

4.1)构建增强连接时序分类网络EN‑CTCNet的多目标混合损失函数,包括CTC损失函数、Triplet Loss损失函数以及Softmax损失函数,根据ID标签序列实际概率,定义CTC损失函数为:

LCTC=‑lnp(l|x)

4.2)基于CTC的步态识别方法可以输出一个序列的ID,该序列ID非常适用于以随机步态帧作为输入来实现周期弱相关的步态识别,并且其还具有处理周期内步行条件变化的潜力;

4.3)为了尽可能保留更多的步态识别信息,训练中对所有的样本,按照三元组进行分类,分为自身样本、正样本和负样本;

其中,正样本与自身样本是属于同一类的样本,而负样本是与自身样本不在同一类的样本。定义基于三元组的能量损失函数:通过最小化三元组能量损失函数,完成对三元组分类器的学习,基于三元组的分类器,可以将同类样本差异极小化,不同类样本之间的差异最大化,很好地完成对测试样本的分类识别;同时,EH‑CTCNet有效结合CTC损失函数、Triplet Loss损失函数以及Softmax损失函数,总权重损失函数定义为:

Wloss=ω1Lctc+ω2Ltriples+ω3Lsoftmax上式中ω1,ω2,ω3表权重值,满足ω1+ω2+ω3=1;

通过控制ω1,ω2,ω3的大小,以提取到最适合网络训练的特征,实现不影响网络分类识别的同时,在一定程度上加快网络的收敛速度。

8.根据权利要求1所述基于增强连接时序分类网络的步态识别方法,其特征在于,步骤S3中,利用KY4D和CASIA‑B步态数据库的训练样本对基于增强连接时序分类网络模型进行训练,并对CASIA‑B测试数据进行人为拼接测试。

9.根据权利要求8所述基于增强连接时序分类网络的步态识别方法,其特征在于,所述步骤S3中,具体为:

1)KY4D数据集包含42位具有3D视觉人体模型和2D步态图像序列的受试者;该步态数据序列有16个摄像头进行捕获,图像分辨率为1032×776;每一个视角下都包含有4个正常行走序列{t1,t2,t3,t4}和2个曲线轨迹行走序列{t5,t6};

CASIA‑B数据集是一个多视图的步态数据集,主要考虑2个协变条件,即:服装变化和物体携带;该数据集包含有124名受试者的视频序列,对于每名受试者都有10个步态序列:6个正常行走条件序列(nm‑01~nm‑06)、2个携带背包序列,2个大衣序列,每个序列都有11个不同的视角,在0°~180°范围内,间隔为18°;每位受试者包含有11×(6+2+2)=110个序列;

CASIA‑B提供了背景减除法后的剪影基准图像,只需要通过对齐其质心来对齐这些轮廓,并将这些轮廓归一化处理为120×80;

2)对于CASIA‑B步态数据集验证所述的增强连接时序分类网络性能时,将正常行走背包、穿大衣协变条件下的数据各人为的选取1/2周期进行拼接测试。