利索能及
我要发布
收藏
专利号: 2018112589265
申请人: 杭州海康威视数字技术股份有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-08-05
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种获取神经网络的方法,其特征在于,所述方法包括:在将从训练集数据库中选择的n个样本数据输入至待训练的神经网络后,获取所述待训练的神经网络对所述n个样本数据进行识别和转换后输出的n个概率分布列序列,所述n个概率分布列序列中第k个概率分布列序列包括m个概率分布列,所述第k个概率分布列序列中第g个所述概率分布列为,所述n个样本数据中第k个样本数据的第g个单元数据的类别的概率分布,n、k、m和g均为整数,1≤k≤n,1≤g≤m,所述训练集数据库中的训练集包括样本数据和所述样本数据的标定序列,所述样本数据包括图片或语音,所述标定序列为文本序列;

确定所述第k个概率分布列序列到第k个标定序列的编辑概率,所述第k个概率分布列序列到第k个标定序列的编辑概率为,通过编辑操作将所述第k个概率分布列序列生成所述第k个标定序列的概率,所述第k个标定序列为所述第k个样本数据的标定序列,所述第k个样本数据的标定序列为,包含所述第k个样本数据中各个单元数据的真实类别对应的元素的序列;

基于所述n个概率分布列序列中各个所述概率分布列序列到相应标定序列的编辑概率,对所述待训练的神经网络进行优化,得到用于预测图片或者语音对应的文本序列的神经网络。

2.根据权利要求1所述的方法,其特征在于,所述确定所述第k个概率分布列序列到第k个标定序列的编辑概率,包括:分别计算所述第k个概率分布列序列的第m-1个前缀到所述第k个标定序列的第s-1个前缀的编辑概率、所述第k个概率分布列序列到所述第k个标定序列的第s-1个前缀的编辑概率、以及所述第k个概率分布列序列的第m-1个前缀到所述第k个标定序列的编辑概率,所述第k个概率分布列序列的第j个前缀为,从所述第k个概率分布列序列的第0个概率分布列到所述第k个概率分布列序列的第j个概率分布列构成的分布列序列,所述第k个标定序列的第i个前缀为,从所述第k个标定序列的第0个元素到所述第k个标定序列的第i个元素构成的序列,j和i均为自然数,0≤j≤m-1,0≤i≤s-1;所述第k个概率分布列序列的第0个概率分布列为空单元数据的类别的概率分布列,所述第k个标定序列的的第0个元素为空元素;

根据所述第k个概率分布列序列的第m-1个前缀到所述第k个标定序列的第s-1个前缀的编辑概率、所述第k个概率分布列序列到所述第k个标定序列的第s-1个前缀的编辑概率、以及所述第k个概率分布列序列的第m-1个前缀到所述第k个标定序列的编辑概率,计算所述第k个概率分布列序列到所述第k个标定序列的编辑概率。

3.根据权利要求2所述的方法,其特征在于,所述计算所述第k个概率分布列序列的第m-1个前缀到所述第k个标定序列的第s-1个前缀的编辑概率,包括:当j=0、且i=0时,所述第k个概率分布列序列的第j个前缀到所述第k个标定序列的第i个前缀的编辑概率等于1;

当0

当j=0、且0

当1≤j≤m-1、且1≤i≤s-1时,根据所述第k个概率分布列序列的第j-1个前缀到所述第k个标定序列的第i-1个前缀的编辑概率、所述第k个概率分布列序列的第j个前缀到所述第k个标定序列的第i-1个前缀的编辑概率、以及所述第k个概率分布列序列的第j-1个前缀到所述第k个标定序列的第i个前缀的编辑概率,计算所述第k个概率分布列序列的第j个前缀到所述第k个标定序列的第i个前缀的编辑概率。

4.根据权利要求3所述的方法,其特征在于,所述根据所述第k个概率分布列序列的第j-1个前缀到所述第k个标定序列的第i-1个前缀的编辑概率、所述第k个概率分布列序列的第j个前缀到所述第k个标定序列的第i-1个前缀的编辑概率、以及所述第k个概率分布列序列的第j-1个前缀到所述第k个标定序列的第i个前缀的编辑概率,计算所述第k个概率分布列序列的第j个前缀到所述第k个标定序列的第i个前缀的编辑概率,包括:基于所述第k个概率分布列序列的第j-1个前缀到所述第k个标定序列的第i-1个前缀的编辑概率,计算所述第k个概率分布列序列的第j个前缀到所述第k个标定序列的第i个前缀的保留概率;

基于所述第k个概率分布列序列的第j个前缀到所述第k个标定序列的第i-1个前缀的编辑概率,计算所述第k个概率分布列序列的第j个前缀到所述第k个标定序列的第i个前缀的插入概率;

基于所述第k个概率分布列序列的第j-1个前缀到所述第k个标定序列的第i个前缀的编辑概率,计算所述第k个概率分布列序列的第j个前缀到所述第k个标定序列的第i个前缀的删除概率;

基于所述第k个概率分布列序列的第j个前缀到所述第k个标定序列的第i个前缀的保留概率、插入概率、以及删除概率,确定所述第k个概率分布列序列的第j个前缀到所述第k个标定序列的第i个前缀的编辑概率。

5.根据权利要求4所述的方法,其特征在于,所述基于所述第k个概率分布列序列的第j-1个前缀到所述第k个标定序列的第i-1个前缀的编辑概率,计算所述第k个概率分布列序列的第j个前缀到所述第k个标定序列的第i个前缀的保留概率,包括:获取所述第k个概率分布列序列中第j个概率分布列发生保留操作的概率,所述第j个概率分布列发生所述保留操作为,对所述第j个概率分布列不做编辑;

获取所述第j个所述概率分布列中与所述第k个标定序列中的第i个元素对应的类别的概率;

基于所述第k个概率分布列序列中第j个概率分布列发生保留操作的概率、所述第j个所述概率分布列中与所述第k个标定序列中的第i个元素对应的类别的概率、以及所述第k个概率分布列序列的第j-1个前缀到所述第k个标定序列的第i-1个前缀的编辑概率,确定所述第k个概率分布列序列的第j个前缀到所述第k个标定序列的第i个前缀的保留概率。

6.根据权利要求4所述的方法,其特征在于,所述基于所述第k个概率分布列序列的第j个前缀到所述第k个标定序列的第i-1个前缀的编辑概率,计算所述第k个概率分布列序列的第j个前缀到所述第k个标定序列的第i个前缀的插入概率,包括:获取所述第k个概率分布列序列中第j个概率分布列发生插入操作的概率;

获取所述第j个概率分布列发生所述插入操作时插入所述第k个标定序列中第i个元素对应的类别的概率;

基于所述第k个概率分布列序列中第j个概率分布列发生插入操作的概率、所述第j个概率分布列发生所述插入操作时插入所述第k个标定序列中第i个元素对应的类别的概率、以及所述第k个概率分布列序列的第j个前缀到所述第k个标定序列的第i-1个前缀的编辑概率,确定所述第k个概率分布列序列的第j个前缀到所述第k个标定序列的第i个前缀的插入概率。

7.根据权利要求4所述的方法,其特征在于,所述基于第k个概率分布列序列的第j-1个前缀到所述第k个标定序列的第i个前缀的编辑概率,计算所述第k个概率分布列序列的第j个前缀到所述第k个标定序列的第i个前缀的删除概率,包括:获取所述第k个概率分布列序列中第j个概率分布列发生删除操作的概率;

基于所述第k个概率分布列序列中第j个概率分布列发生删除操作的概率、以及所述第k个概率分布列序列的第j-1个前缀到所述第k个标定序列的第i个前缀的编辑概率,确定所述第k个概率分布列序列的第j个前缀到所述第k个标定序列的第i个前缀的删除概率。

8.根据权利要求2所述的方法,其特征在于,所述计算第k个概率分布列序列到所述第k个标定序列的第s-1个前缀的编辑概率,包括:当i=0时,基于所述第k个概率分布列序列的第m-1个前缀到所述第k个标定序列的第i个前缀的编辑概率,计算所述第k个概率分布列序列到所述第k个标定序列的第i个前缀的编辑概率;

当0

9.一种序列预测方法,其特征在于,所述方法包括:

将待测数据输入神经网络,所述神经网络是采用如权利要求1-8中任一项权利要求所述的神经网络的训练方法训练出的,所述待测数据包括图片或者语音,所述神经网络用于预测所述图片或者语音对应的文本序列;

获取所述神经网络对所述待测数据进行识别和转换后输出的预测的概率分布列序列,所述预测的概率分布序列包括多个概率分布列,各个概率分布列包括多个概率;

基于所述神经网络输出的预测的概率分布列序列,确定所述待测数据对应的预测序列,所述预测序列为文本序列。

10.一种神经网络的训练装置,其特征在于,所述装置包括:获取模块,用于在从训练集数据库中选择的将n个样本数据输入至待训练的神经网络后,获取所述待训练的神经网络对所述n个样本数据进行识别和转换后输出的n个概率分布列序列,所述n个概率分布列序列中第k个概率分布列序列包括m个概率分布列,所述第k个概率分布列序列中第g个所述概率分布列为,所述n个样本数据中第k个样本数据的第g个单元数据的类别的概率分布,n、k、m和g均为整数,1≤k≤n,1≤g≤m,所述训练集数据库所中的训练集包括样本数据和所述样本数据的标定序列,所述样本数据包括图片或语音,所述标定序列为文本;

确定模块,用于确定所述第k个概率分布列序列到第k个标定序列的编辑概率,所述第k个概率分布列序列到第k个标定序列的编辑概率为,通过编辑操作将所述第k个概率分布列序列生成所述第k个标定序列的概率,所述第k个标定序列为所述第k个样本数据的标定序列,所述第k个样本数据的标定序列为,包含所述第k个样本数据中各个单元数据的真实类别对应的元素的序列;

优化模块,用于基于所述n个概率分布列序列中各个所述概率分布列序列到相应标定序列的编辑概率,对所述待训练的神经网络进行优化,得到用于预测图片或者语音对应的文本序列的神经网络。