买专利、卖专利、专利购买、专利交易、专利出售、高企申报-一种基于英语朗读自动打分进行分拆运算精准矫正的方法

首页

利索能及专利检索

电话：15618600796

查出售查求购

我要发布

专利交易专利求购

一种基于英语朗读自动打分进行分拆运算精准矫正的方法

￥10500

专利号： 2019103469589

申请人：深圳市数字星河科技有限公司

专利类型：发明专利

专利状态：已下证

更新日期：2026-05-22

缴费截止日期：暂无

联系人

专利简介

专利详情

购买说明

摘要:

权利要求书:

1.一种基于英语朗读自动打分进行分拆运算精准矫正学习的方法，其特征包括的步骤和要素有：将语音朗读打分分为测试模式和练习测评模式，测试模式只对朗读语音进行测试打分，而练习测评模式时，朗读英语句子语音打分达标时，直接进入下一条文本内容的朗读；分值不达标情况下，运算分析发音错误的单词，采用循环递推打分分拆识别法，首先将文本分拆成单词组，获得单词的标准语音及其声学特征等作为标准参考模型，先假设单词被朗读的时长为标准时长，在被测语音上依次分拆该时长的语音段，进行比对获得最高分值的语音段；

步骤1、英语文本和汉字文本不同，英语文本text通过空格来分隔单词，因此通过split等函数，使用空格为识别子字符串界限的字符，将英语文本变成由各个单词组成的单词数组a，即a=Split（text）；含有缩写符号'的连续字母组合看成一个单词；

步骤2、通过第三方的语音接口获得指定英语单词的语音，实施例：将英语文本post提交给百度语音开发平台的网址，获得返回mp3等格式的语音文件；（或通过文本转语音的引擎等获得特定文本单词的语音）；

步骤3、并通过预分析获得语音特征，转换成新的标准参考模型M，同时记录单词语音的时长S，并预先假设单词文本被测试朗读的时长S；

步骤4、取被测试朗读语音中，起始时间1、结束时间为S这一区间为新的被测朗读语音，和步骤3中的M进行比对运算，通过公式1、公式2、公式3计算分值J；

步骤5、取被测试朗读语音中，依次将起始时间加1、结束时间加1这一区间为新的被测朗读语音组，直至结束时间等于原始被测语音的时长、分别和步骤3中的M进行比对运算，通过公式1、公式2、公式3计算分值；

步骤6、将步骤4和步骤5计算的分值进行比对，获得最大值的数值A，及和最大值相对应的起始时间T1和结束时间T2等参数。

2.根据权利要求1所述一种基于英语朗读自动打分进行分拆运算精准矫正学习方法，其特征还包含的步骤及要素：基于权利要求1获得的最高分值的语音段，然后进行向前向后的加减时长的修正，获得单词较为理想匹配的语音段，紧接权利要求一的步骤：步骤7、取被测试朗读语音中，依次将起始时间加T1循环减1、结束时间T2这一区间为新的被测朗读语音组，直到递减1的起始时间等于1，循环运算中所得语音段的声学特征和步骤3中的M进行比对运算获得分值，分值和步骤6中的A分值比对,如分值大于A，则将A的值设定为当前分值并将T1设定为当前分值对应的起始时间，分值小于A则跳出起始时间递减1的循环；

步骤8、依次将结束时间T2循环减1、起始时间T1这一区间为新的被测朗读语音组，直到递减1的结束时间等于T1，循环运算中所得语音段的声学特征和步骤3中的M进行比对运算获得分值，分值和步骤7中的A分值比对,如分值大于A，则将A的值设定为当前分值并将T2设定为当前分值对应的结束时间，分值小于A则跳出起始时间递减1的循环；

步骤9、取被测试朗读语音中，依次将起始时间加T1循环加1、结束时间T2这一区间为新的被测朗读语音组，直到递增加1的起始时间等于T2，循环运算中所得语音段的声学特征和步骤3中的M进行比对运算获得分值，分值和步骤8中的A分值比对,如分值大于A，则将A的值设定为当前分值并将T1设定为当前分值对应的起始时间，分值小于A则跳出起始时间递减1的循环；

步骤10、依次将结束时间T2循环加1、起始时间T1这一区间为新的被测朗读语音组，直到递加1的结束时间等于原始被测语音整体的时长，循环运算中所得语音段的声学特征和步骤3中的M进行比对运算获得分值，分值和步骤9中的A分值比对,如分值大于A，则将A的值设定为当前分值并将T2设定为当前分值对应的结束时间，分值小于A则跳出起始时间递加1的循环；

步骤11、记录单词和通过上述步骤所得的在被朗读语音上对应的起始、结束时间及分值等数据，重复步骤2—10，获得步骤1分拆的所有单词在被朗读语音上对应的起始时间和结束时间，以及相应的分值，其中i下标为单词在文本句子中的序号；

步骤12、单词分值低于系统设置的错误阀值，即定性为朗读发音不合格，则调出上述步骤中当前单词映射的文本，显示到特定的用户界面，提醒用户该单词发音错误，并设置播发点击功能标识播发链接到步骤2形成的单词语音位置，配置相应的程式让学员点击所述播发标记就可听到标准的单词语音，并对单词进行音素、音节级别的分拆分析。

3.一种将发音评分不合格单词进行分拆分析运算的方法，其特征包括的步骤和要素有：

S1、单词word根据字节分拆出字母；

S2、创建英语音素音标的知识库，其中包含国际音标48个音素，为每个音素记录设置相应的类别、朗读知识点、匹配的标准语音储存路径及其语音声学特征等数据库表格栏，记录知识点；

S3、创建关于音标、字母、字母组合对应关系的对照库，首先将英语发音规则里26个字母及常用的字母组合及其对应的音标增加到规则库所对应的数据库相应的表格，并增加诸如两个相同元音排列在一起等特殊字母组合，同时创建字母分类等栏，记载字母诸如元音、辅音等类别所属等信息；

S4、创建英语发音规则库，将各种英语发音规则整理出方便程式可以逻辑运算的表达形式，并按照可进行逻辑运算的方式进行分类：1、字符特性特征：含有这些特征关键词的即此记录的音标为对应字母或字母字母组合的默认发音，而这种特征关键词，通过以特征符号例如&符号相间隔组合在同一记录，例：开音节&重音；2、列举：将含有当前记录的字母或字母组合发音为当前记录的音标的单词或句子，列举到本记录，不同的单词或句子用特征符号隔开；

S5、基于单词末尾e不发音的英语发音规则，判定S1步骤得出的X(len-1)字符数组最后一位是否是e，如是则强制字符数组减去最后一位成员:len=len-1；

S6、创建A、Z两个变量，并赋初始值A=0；

S7、如len减A的值大于或等于4时则Z=4，否则Z=len-A；将A重新赋值：A=A+1,在X(len-

1)字符数组成员中取第A个至第Z个字符组合，组合起来到常用发音字母组合的对照库中检索，根据检索结果分别处理；

当检索到多个记录则将当前组合的字符提交给S9步骤的自定义函数guizefunction（当前组合的字符,word，A,Z）嵌入运算；当A+Z>len直接执行S10步骤否则将A赋值：A=A+Z-1并重新开始本步骤；只检索到唯一记录则将这记录的音标、和A、Z值一起记录，当A+Z>len直接执行S10步骤否则将A赋值：A=A+Z-1并重新开始本步骤；没有检索到记录则进入下一步骤；

S8、如当Z=1则跳转到上面S 7步骤，否则将Z赋值为Z-1，取其中第A至Z个字符，组合起来到常用发音字母组合的规则库中检索，根据检索结果分别处理：只检索到唯一记录则将这记录的音标、和A、Z值一起记录，将A赋值：A=A+Z-1并直接跳转执行S7步骤；

检索到多个记录则将当前组合的字符提交给S9步骤的自定义函数guizefunction（当前组合的字符,word，A,Z）嵌入运算；A=A+Z-1并直接跳转执行S7步骤，没有记录则重复开始本步骤，进行循环分析，直至Z值为1；

S9、规则运算的自定义函数guizefunction（str,str1，Index1，index2），a、在英语发音规则库中检索str字符串，并对检索中的记录中“列举”栏记录的内容是否包含当前的单词，如果包含则返回当前记录里音标作为本函数的结果，将音标、和Index1，index2值一起记录，并终止本函数的运算，没有则进行下一个记录检验；

b、判定str在str1中其后一个字节位置字母是否是辅音字母，先设置两个字符变量tex、texx，如index1+index2+1>len(word)则tex=right（word，1）否则tex=MID(str1, index1+index2+1, 1)，如tex为“r”或“w”或“y”则texx赋值为“开音节”否则在规则库内检索字母或字母组合为tex的记录，将记录中“字母分类栏”的记录如包含“元音”则texx赋值为“开音节”，否则texx赋值为“闭音节”；

C、在规则库中检索str字符，并逐条验证记录中特征关键词栏的内容是否存在texx的内容，如果有则将本记录对应的音标返回给本函数，将音标、和Index1，index2值一起记录，否则验证符合条件的下一条记录；

S10、将分拆出与英语文本单词、字母及字母组合及其对应的音素音标、检索到相关的知识点，显示到用户界面，让用户学习掌握。

4.根据权利要求1所述一种将发音评分不合格单词进行分拆分析运算的方法，其特征还包含的步骤及要素：英语单词音节分拆的技术方案；

步骤1、通过权利要求3记录的构成与英语单词文本字母及字母组合对应的一组音标及每个音标对应字母的起始位置、结束位置；

步骤2、分别在知识库内检索音标，获得一个或一组音标分类为元音的音素；

步骤3、根据步骤1音素对应的位置数值，依次使用mid等函数获得元音对应字母或字母组之间的字母，如只有一个字母，则将后面一个元音所对应的起始位置值减1，如两个字母则将前一个元音对应的结束位置值加1；

步骤4、通过步骤3获得一组音素及新的起始位置和结束位置的值，按照这组音素对应的起始位置和结束位置计算获得相对应的字母或字母组，输出到用户界面，作为单词分拆音节的结果。