1.一种行为识别的方法,其特征在于,包括:
采集待检测的图像信息,所述图像信息中包括至少一个人物影像和至少一个物体对象;
确定所述人物影像在所述图像信息中的位置区域,以及,确定所述物体对象的种类;
提取在所述人物影像的位置区域中的人物特征信息,将所述人物特征信息输入预置的堆叠沙漏网络结构模型,获得所述人物影像中包含的多个肢体关键点;
根据预设的肢体关键点与物体对象的种类之间的匹配关系,识别所述多个肢体关键点中的目标关键点;
针对任一目标关键点,计算所述目标关键点与各个物体对象之间的行为概率值;
依据所述行为概率值,确定所述图像信息中的人物行为。
2.根据权利要求1所述的方法,其特征在于,所述确定所述人物影像在所述图像信息中的位置区域,以及,确定所述物体对象的种类的步骤包括:采用预置的卷积神经网络模型对所述图像信息进行特征提取,获得多个图像特征;
针对所述图像特征,采用预置的区域候选网络模型生成多个建议窗口;
将所述多个建议窗口映射至所述卷积神经网络模型的最后一层卷积特征图上,获得多个矩形框;
将各个矩形框转换为固定尺寸的特征图;
对所述固定尺寸的特征图进行特征训练,确定所述图像信息中人物影像的位置区域和物体对象的种类。
3.根据权利要求1所述的方法,其特征在于,所述堆叠沙漏网络结构模型由多个预先训练得到的沙漏网络组成,所述将所述人物特征信息输入预置的堆叠沙漏网络结构模型,获得所述人物影像中包含的多个肢体关键点的步骤包括:将所述人物特征信息输入第一个沙漏网络,并输出对应所述第一个沙漏网络的第一热力图;
依次将前一个沙漏网络的输入信息和输出信息作为后一个沙漏网络的输入信息,直到从最后一个沙漏网络中输出目标热力图,所述目标热力图中标记有所述人物影像中包含的多个肢体关键点。
4.根据权利要求3所述的方法,其特征在于,所述肢体关键点与物体对象的种类之间的匹配关系中记录有分别与各个肢体关键点相对应的多个行为词,所述根据预设的肢体关键点与物体对象的匹配关系,识别所述多个肢体关键点中的目标关键点的步骤包括:针对任一肢体关键点,判断所述肢体关键点对应的多个行为词是否与所述物体对象构成相应词组;
若所述肢体关键点对应的任一行为词与所述物体对象构成相应词组,则识别所述肢体关键点为目标关键点。
5.根据权利要求3所述的方法,其特征在于,所述针对任一目标关键点,计算所述目标关键点与各个物体对象之间的行为概率值的步骤包括:确定所述物体对象在所述图像信息中的位置区域;
根据所述物体对象在所述图像信息中的位置区域,确定各个物体对象的位置中心点;
针对任一目标关键点,分别将所述目标关键点与各个物体对象的位置中心点连接;
计算所述目标关键点与各个物体对象的位置中心点之间的距离,所述距离与对应的目标关键点与物体对象之间的行为概率值成反比。
6.根据权利要求1所述的方法,其特征在于,所述依据所述行为概率值,确定所述图像信息中的人物行为的步骤包括:提取所述行为概率值最大值对应的目标关键点和物体对象;
依据所述行为概率值最大值对应的目标关键点和物体对象生成目标行为,作为所述图像信息中的人物行为。
7.一种行为识别的装置,其特征在于,包括:
图像信息采集模块,用于采集待检测的图像信息,所述图像信息中包括至少一个人物影像和至少一个物体对象;
图像信息确定模块,用于确定所述人物影像和物体对象在所述图像信息中的位置区域,以及,确定所述物体对象的种类;
肢体关键点识别模块,用于提取在所述人物影像的位置区域中的人物特征信息,将所述人物特征信息输入预置的堆叠沙漏网络结构模型,获得所述人物影像中包含的多个肢体关键点;
目标关键点识别模块,用于根据预设的肢体关键点与物体对象的种类之间的匹配关系,识别所述多个肢体关键点中的目标关键点;
行为概率值计算模块,用于针对任一目标关键点,计算所述目标关键点与各个物体对象之间的行为概率值;
人物行为确定模块,用于依据所述行为概率值,确定所述图像信息中的人物行为。
8.根据权利要求7所述的装置,其特征在于,所述堆叠沙漏网络结构模型由多个预先训练得到的沙漏网络组成,所述肢体关键点识别模块包括:模型训练子模块,用于将所述人物特征信息输入第一个沙漏网络,并输出对应所述第一个沙漏网络的第一热力图;依次将前一个沙漏网络的输入信息和输出信息作为后一个沙漏网络的输入信息,直到从最后一个沙漏网络中输出目标热力图,所述目标热力图中标记有所述人物影像中包含的多个肢体关键点。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述行为识别的方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述行为识别的方法的步骤。