利索能及
我要发布
收藏
专利号: 2024105752338
申请人: 西南大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于大语言模型的智慧课堂讲授摘要生成系统,其特征在于:包括:

语音获取模块,用于获取教师课堂讲授的语音信息;

语音识别模块,用于将语音信息识别为文本信息;

文本纠错模块,用于根据预设的文本错误库,结合上下文,识别文本信息中的错误语句,并对错误部分进行纠错替换,形成二次文本信息;

主题切割模块,用于根据句子关联度算法对二次文本信息中的句子进行主题切割,形成若干个子主题;所述句子关联度算法包括如下内容:先将两个句子中的单词分别提取出,再将两个句子中的单词依次进行一一组队,两两形成一个单词对,所有的单词对形成一个集合A,然后将每个单词对中的两个单词进行编码,形成两个向量,并计算每对单词的信息内容,将余弦相似度与每对单词的最小信息内容相乘,并对所有这样的单词对求和,计算出两个句子中的总体语义关联度,为语义相似度,根据语义相似度低于预设的识别阈值,确定主题边界为块对Ri和Ri+1,每个块对为同一主题;

子摘要生成模块,用于将每个子主题输入进LLMs生成对应的子摘要;

摘要生成模块,用于将子摘要按照预先设置的识别顺序进行整理,形成最终的课堂讲授摘要。

2.根据权利要求1所述的基于大语言模型的智慧课堂讲授摘要生成系统,其特征在于:还包括纠错数据库更新模块,用于接收用户输入的纠错信息,并对文本错误库进行更新;所述纠错信息包括纠错条件、纠错对象和纠错结果;所述文本纠错模块还用于根据纠错对象对文本信息进行全文查找得到若干个疑似对象,然后分别判断疑似对象是否满足纠错条件,若满足则将疑似对象替换为纠错结果;若不满足,则结束。

3.根据权利要求2所述的基于大语言模型的智慧课堂讲授摘要生成系统,其特征在于:所述主题切割模块还用于接收用户输入的目录数据,然后根据目录数据的要点分类情况,形成初始的推荐识别阈值;所述目录数据包括图像数据和文本数据,若为图像数据,则进行OCR识别为文本数据。

4.根据权利要求3所述的基于大语言模型的智慧课堂讲授摘要生成系统,其特征在于:所述语音识别模块还用于在将语音信息识别为文本信息过程中,对语音信息中的响度、音频进行识别,若出现部分语音信息片段的响度、音频与其相邻的片段超过预设阈值的,则将该语音信息片段标注为重点片段,并在最终的课堂讲授摘要中进行突出显示。

5.根据权利要求4所述的基于大语言模型的智慧课堂讲授摘要生成系统,其特征在于:所述语音识别模块还用于对语音信息中的音色进行识别,并将语音信息中相同音色占比超过预设阈值的语音片段标注为教师语音,将与教师语音的音色不同的语音片段标注为交互语音;若语音信息识别过程中存在交互语音,则识别交互语音后的教师语音中是否存在预设关键词,若存在,则将该交互语音识别与教师语音连续识别为文本信息;若不存在,则放弃识别该交互语音。

6.根据权利要求5所述的基于大语言模型的智慧课堂讲授摘要生成系统,其特征在于:所述摘要生成模块还用于接收用户输入的识别顺序,所述识别顺序默认为时间顺序,当存在用户输入的识别顺序时,按照用户输入的识别顺序进行整理。

7.一种基于大语言模型的智慧课堂讲授摘要生成方法,包括如下内容:

S1.语音获取步骤,获取教师课堂讲授的语音信息;

S2.语音识别步骤,将语音信息识别为文本信息;

S3.文本纠错步骤,根据预设的文本错误库并结合上下文识别文本信息中的错误语句,并对错误部分进行纠错替换,形成二次文本信息;

S4.主题切割步骤,根据句子关联度算法对二次文本信息中的句子进行主题切割,形成若干个子主题;所述句子关联度算法包括如下内容:先将两个句子中的单词分别提取出,再将两个句子中的单词依次进行一一组队,两两形成一个单词对,所有的单词对形成一个集合A,然后将每个单词对中的两个单词进行编码,形成两个向量,并计算每对单词的信息内容,将余弦相似度与每对单词的最小信息内容相乘,并对所有这样的单词对求和,计算出两个句子中的总体语义关联度,为语义相似度,根据语义相似度低于预设的识别阈值,确定主题边界为块对Ri和Ri+1,每个块对为同一主题;

S5.子摘要生成步骤,将每个子主题输入进LLMs生成对应的子摘要;

S6.摘要生成步骤,将子摘要按照预先设置的识别顺序进行整理,形成最终的课堂讲授摘要。