买专利、卖专利、专利购买、专利交易、专利出售、高企申报-视频分类方法、装置、设备及计算机可读存储介质

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

视频分类方法、装置、设备及计算机可读存储介质

￥19800

专利号： 2019108056722

申请人：北京百度网讯科技有限公司

专利类型：发明专利

专利状态：已下证

更新日期：2025-02-06

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种视频分类的方法，应用于视频分类装置，其特征在于，所述方法包括：从数据服务器中获取待处理数据集，所述待处理数据集中包括多个已标注体育类别的视频数据；

获取终端设备发送的优化请求，根据所述优化请求对所述待处理数据集进行优化操作，获得待训练数据集；

通过所述待训练数据集对预设的待训练模型进行训练，获得类别识别网络模型；

获取终端设备发送的至少一个待识别体育视频，通过所述类别识别网络模型对所述至少一个待识别体育视频进行识别，获得各待识别体育视频对应的体育类别信息；

根据各待识别体育视频对应的体育类别信息对所述至少一个待识别体育视频进行分类操作；

所述通过所述类别识别网络模型对所述至少一个待识别体育视频进行识别，包括：将所述待识别体育视频输入至所述类别识别网络模型，所述类别识别网络模型用于对所述待识别体育视频在时间、高度以及宽度三个维度进行不同卷积核大小的完整卷积操作，获得三对输出结果，对六个输出结果相加，对相加后的输出结果进行全局平均池化操作，获得池化后的输出结果，将所述池化后的输出结果输入至先降维再升维的两层全连接层，获得与所述三对输出结果对应的矩阵，根据各矩阵的权重对所述矩阵进行加权操作，获得输出向量，根据所述输出向量确定所述待识别体育视频的体育类别信息。

2.根据权利要求1所述的方法，其特征在于，所述优化请求包括删除请求，所述删除请求中包括预设的第一体育类别标识；

相应地，所述根据所述优化请求对所述待处理数据集进行优化操作，获得待训练数据集，包括：删除所述待处理数据集中与所述预设的第一体育类别标识对应的体育视频数据，获得待训练数据集。

3.根据权利要求1所述的方法，其特征在于，所述优化请求包括重命名请求，所述重命名请求中包括至少一个预设的第二体育类别标识以及目标体育类别标识；

相应地，所述根据所述优化请求对所述待处理数据集进行优化操作，获得待训练数据集，包括：根据所述重命名请求对所述待处理数据集中与所述预设的第二体育类别标识对应的体育视频数据的类别修改为所述目标体育类别标识，获得所述待训练数据集。

4.根据权利要求1所述的方法，其特征在于，所述优化请求包括添加请求，所述添加请求中包括至少一个第三体育类别标识对应的体育视频数据；

相应地，所述根据所述优化请求对所述待处理数据集进行优化操作，获得待训练数据集，包括：根据所述添加请求将所述至少一个第三体育类别标识对应的体育视频数据添加至所述待处理数据集中，获得所述待训练数据集。

5.根据权利要求1所述的方法，其特征在于，所述优化请求包括视频质量调节请求，所述视频质量调节请求中包括色彩度参数、尺寸参数、角度参数中的至少一项；

相应地，所述根据所述优化请求对所述待处理数据集进行优化操作，获得待训练数据集，包括：根据所述视频质量调节请求对所述待处理数据集中的体育视频数据的质量进行调节，获得所述待训练数据集。

6.根据权利要求1‑5任一项所述的方法，其特征在于，所述通过所述待训练数据集对预设的第一待训练模型进行训练之前，还包括：针对所述待训练数据集中的每一体育视频，随机抽取至少一个的视频段落；

针对每一视频段落，按照预设的采样频率在所述视频段落中抽取预设数量的图像信息，将所述预设数量的图像信息输入至所述第一待训练模型。

7.根据权利要求1‑5任一项所述的方法，其特征在于，所述类别识别网络模型包括CoSKNet模型。

8.一种视频分类装置，其特征在于，包括：

待处理数据获取模块，用于从数据服务器中获取待处理数据集，所述待处理数据集中包括多个已标注体育类别的视频数据；

优化模块，用于获取终端设备发送的优化请求，根据所述优化请求对所述待处理数据集进行优化操作，获得待训练数据集；

训练模块，用于通过所述待训练数据集对预设的待训练模型进行训练，获得类别识别网络模型；

识别模块，用于获取终端设备发送的至少一个待识别体育视频，通过所述类别识别网络模型对所述至少一个待识别体育视频进行识别，获得各待识别体育视频对应的体育类别信息；

分类模块，用于根据各待识别体育视频对应的体育类别信息对所述至少一个待识别体育视频进行分类操作；

所述识别模块包括：

识别单元，用于将所述待识别体育视频输入至所述类别识别网络模型，所述类别识别网络模型用于对所述待识别体育视频在时间、高度以及宽度三个维度进行不同卷积核大小的完整卷积操作，获得三对输出结果，对六个输出结果相加，对相加后的输出结果进行全局平均池化操作，获得池化后的输出结果，将所述池化后的输出结果输入至先降维再升维的两层全连接层，获得与所述三对输出结果对应的矩阵，根据各矩阵的权重对所述矩阵进行加权操作，获得输出向量，根据所述输出向量确定所述待识别体育视频的体育类别信息。

9.一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1‑7中任一项所述的方法。

10.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行权利要求1‑7中任一项所述的方法。

11.一种视频分类方法，其特征在于，包括：

获取待处理数据集，所述待处理数据集中包括多个已标注体育类别的视频数据；

获取优化请求，根据所述优化请求对所述待处理数据集进行优化操作，获得待训练数据集；

通过所述待训练数据集对预设的待训练模型进行训练，获得类别识别网络模型；

获取至少一个待识别体育视频，通过所述类别识别网络模型对所述至少一个待识别体育视频进行识别，获得各待识别体育视频对应的体育类别信息；

所述通过所述类别识别网络模型对所述至少一个待识别体育视频进行识别，包括：将所述待识别体育视频输入至所述类别识别网络模型，所述类别识别网络模型用于对所述待识别体育视频在时间、高度以及宽度三个维度进行不同卷积核大小的完整卷积操作，获得三对输出结果，对所述六个输出结果相加，对相加后的输出结果进行全局平均池化操作，获得池化后的输出结果，将所述池化后的输出结果输入至先降维再升维的两层全连接层，获得与所述三对输出结果对应的矩阵，根据各矩阵的权重对所述矩阵进行加权操作，获得输出向量，根据所述输出向量确定所述待识别体育视频的体育类别信息。

12.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1‑7中任一项所述的方法。