利索能及
我要发布
收藏
专利号: 2020115715638
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种PPT视频段提取方法,其特征在于,所述PPT视频段提取方法包括:响应于PPT视频段提取指令,获取待处理视频;

对所述待处理视频进行文字识别,得到第一初始文件;

对所述第一初始文件进行合并处理,得到至少一个初始页面;

对所述至少一个初始页面中的每个初始页面进行校正,并根据校正后的页面进行特征构建,得到第一特征;

提取所述待处理视频中的语音作为待处理语音,对所述待处理语音进行语音识别,得到第二初始文件;

对所述第二初始文件进行清洗及校正处理,并对处理后的文件进行合并处理,得到第二特征;

对所述第一特征及所述第二特征进行匹配,得到第三特征;

对所述第三特征进行章节切分,得到至少一个子章节;

采用TextRank算法提取所述至少一个子章节中每个子章节的目标信息;

基于时间戳技术对所述目标信息进行整合,得到至少一个短视频。

2.如权利要求1所述的PPT视频段提取方法,其特征在于,所述对所述第一初始文件进行合并处理,得到至少一个初始页面包括:计算所述第一初始文件中所包括的页面间的相似度;

根据所述相似度对所述第一初始文件中所包括的页面进行划分,得到至少一个相似页面集;

对于所述至少一个相似页面集中的每个相似页面集,获取所述相似页面集中所包含的每个页面的开始时间及结束时间;

从每个页面的开始时间中获取最早的开始时间作为第一时间,及从每个页面的结束时间中获取最晚的结束时间作为第二时间;

根据所述第一时间及所述第二时间建立时间范围作为所述相似页面集的持续时间范围;

对所述相似页面集中所包含的页面进行并集处理,得到合并页面;

根据所述相似页面集的持续时间范围及所述合并页面构建与所述相似页面集对应的初始页面;

组合每个相似页面集对应的初始页面,得到所述至少一个初始页面。

3.如权利要求1所述的PPT视频段提取方法,其特征在于,所述对所述至少一个初始页面中的每个初始页面进行校正,并根据校正后的页面进行特征构建,得到第一特征包括:从所述第一初始文件中获取每个初始页面的文本框位置置信度及文本识别结果置信度;

当检测到有初始页面的文本框位置置信度低于第一置信度,及所述文本识别结果置信度低于第二置信度时,从所述至少一个初始页面中删除检测到的初始页面,得到至少一个过滤页面;

获取所述至少一个过滤页面中每个页面的文本框位置信息,并根据每个页面的文本框位置信息对每个页面上的文本框进行合并处理,得到至少一个位置校正页面;

采用NLP对所述至少一个位置校正页面上的文本进行断句处理,得到至少一个校正页面;

识别所述至少一个校正页面的配置特征,并根据所述配置特征构建表格数据作为所述第一特征。

4.如权利要求1所述的PPT视频段提取方法,其特征在于,所述对所述第二初始文件进行清洗及校正处理,并对处理后的文件进行合并处理,得到第二特征包括:获取所述第二初始文件中每个句子的时间戳;

根据每个句子的时间戳对所述第二初始文件进行句式校正,得到校正语句;

采用NLP对所述校正语句进行清洗,得到清洗语句;

计算所述清洗语句中每个句子间的时间间隔;

根据每个句子间的时间间隔及每个句子的时间戳计算与每个句子对应的比率;

根据与每个句子对应的比率对所述清洗语句进行合并处理,得到所述第二特征。

5.如权利要求1所述的PPT视频段提取方法,其特征在于,所述对所述第一特征及所述第二特征进行匹配,得到第三特征包括:获取所述第一特征的时间戳范围,及获取所述第二特征的时间戳范围;

根据所述第一特征的时间戳范围及所述第二特征的时间戳范围计算每个第一特征与每个第二特征的重合度;

将所述重合度大于或者等于配置重合度的第一特征及第二特征进行合并,得到第一匹配特征;

基于动态规划对所述第一匹配特征中的每个特征进行全局比对及局部比对,得到比对结果;

根据所述比对结果对所述第一匹配特征中的每个特征进行二次匹配,并整合匹配成功的特征,得到所述第三特征。

6.如权利要求1所述的PPT视频段提取方法,其特征在于,所述对所述第三特征进行章节切分,得到至少一个子章节包括:从所述第三特征中获取目录页,根据所述目录页的目录项目对所述第三特征进行章节切分,得到至少一个第一切分章节,计算每个第一切分章节的内容与对应的目录项目的相关度,从所述至少一个第一切分章节中获取所述相关度大于或者等于配置相关度的章节构建所述至少一个子章节;或者

识别所述第三特征中每个页面的子标题,根据识别到的子标题对所述第三特征进行章节切分,得到至少一个第二切分章节,计算每个第二切分章节的内容与对应的子标题的相关度,从所述至少一个第二切分章节中获取所述相关度大于或者等于所述配置相关度的章节构建所述至少一个子章节。

7.如权利要求1所述的PPT视频段提取方法,其特征在于,所述采用TextRank算法提取所述至少一个子章节中每个子章节的目标信息包括:获取每个子章节中的每个句子;

采用TextRank算法对每个句子进行预处理,得到候选句子;

计算所述候选句子间的相似度,并根据所述候选句子间的相似度建立图模型;

根据所述图模型确定每个候选句子的权重;

按照由高到低的顺序对每个候选句子的权重进行排序;

获取排在前预设位的权重对应的候选句子作为对应的子章节的目标信息。

8.一种PPT视频段提取装置,其特征在于,所述PPT视频段提取装置包括:获取单元,用于响应于PPT视频段提取指令,获取待处理视频;

识别单元,用于对所述待处理视频进行文字识别,得到第一初始文件;

合并单元,用于对所述第一初始文件进行合并处理,得到至少一个初始页面;

校正单元,用于对所述至少一个初始页面中的每个初始页面进行校正,并根据校正后的页面进行特征构建,得到第一特征;

所述识别单元,还用于提取所述待处理视频中的语音作为待处理语音,对所述待处理语音进行语音识别,得到第二初始文件;

所述校正单元,还用于对所述第二初始文件进行清洗及校正处理,并对处理后的文件进行合并处理,得到第二特征;

匹配单元,用于对所述第一特征及所述第二特征进行匹配,得到第三特征;

切分单元,用于对所述第三特征进行章节切分,得到至少一个子章节;

提取单元,用于采用TextRank算法提取所述至少一个子章节中每个子章节的目标信息;

整合单元,用于基于时间戳技术对所述目标信息进行整合,得到至少一个短视频。

9.一种电子设备,其特征在于,所述电子设备包括:存储器,存储至少一个指令;及处理器,执行所述存储器中存储的指令以实现如权利要求1至7中任意一项所述的PPT视频段提取方法。

10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现如权利要求1至7中任意一项所述的PPT视频段提取方法。