利索能及
我要发布
收藏
专利号: 2019107734352
申请人: 江苏大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.基于C/S架构和说话人识别技术的文件加密解密系统,包括客户端和服务端;其特征在于,

所述客户端包括:用户登录界面模块、新用户注册模块、老用户登录模块、文件加密和解密模块、现场语音采集模块;所述用户登录界面模块提供友好的用户交互界面,让用户选择登录或注册;所述新用户注册模块包括用于采集用户声纹的提示性语句和发送注册信息到服务器功能,并且包括提示用户操作过程中出现的问题的可能原因;所述老用户登录模块包括用户选择使用传统密码或声纹密码登录系统,登录成功提示或登录失败的可能原因提示;所述文件加密和解密模块能使用加密算法和解密算法对用户的文件进行加密或解密;所述现场语音采集模块能调用用户设备上的麦克风进行语音录制;

所述服务端包括:用户验证模块、语音降噪模块、模型训练模块、模型识别判决模块、数据库存储模块;所述语音降噪模块连接到所述模型训练模块,所述语音降噪模块连接到模型识别判决模块,所述模型识别判决模块连接到所述用户验证模块;所述语音降噪模块是所有用户传输到服务器的语音都必经的预处理模块,用于提高用户语音的质量;所述模型训练模块是用于采集用户的语音进行提取用户的声纹特征并保存,所述声纹特征用于模型识别判决;所述用户验证模块包括用户输入密码登录的验证和用户用声纹密码登录的验证,以模型识别判决模块的判决结果作为验证结果;所述模型识别判决模块是采用说话人识别技术,把用户传输到服务器的语音进行说话人识别,同时结合用户的操作请求来进行判决,最后把判决结果反馈到客户端;所述数据库存储模块是存储用户的基本信息和密码信息,用于用户的验证;

所述模型识别判决模块能够:

A.提取梅尔频率倒谱系数MFCC提取梅尔频率倒谱系数的过程为预加重、分帧加窗、短时傅里叶变换STFT、Mel频率滤波和离散余弦变换DCT,具体如下:(a)预加重:将语音的低频范围预加重处理,提高语音信号高频段的信噪比;

(b)分帧加窗:语音信号在一个短时间范围内,其特性基本保持不变即相对稳定,将语音信号分成若干段,每一段为一帧,每帧的时长设置为20ms;

为了保证帧与帧之间的平滑过渡,保持连续性,每个语音帧乘一个窗函数保证两端能平滑过渡;

(c)短时傅里叶变换:把语音从时域变换到频域,在频域中进行分析;

(d)Mel频率滤波:把离散频谱用序列三角滤波器进行滤波得到一组系数;

(e)DCT变换:在经过一次变换,最后求得MFCC倒谱系数;

B.使用高斯混合模型GMM进行计算概率将上述提取的MFCC倒谱系数,作为一批观察数据(1) (2) (s)

X={x ,x ,…,x }单高斯模型用多位高斯正态分布概率密度函数表示:其中x是维数为d的样本向量;μ是模型期望;∑是模型方差;

数据的概率分布函数通过概率加权函数表示(i)

上式为高斯混合模型,其中αj表示第j个单高斯模型在混合模型中占的比例,Nj(x ;

μj,Σj)表示第j个单高斯模型,μj是均值向量,∑j是协方差矩阵;

通过最大后验概率来辨认语音的说话人身份,最大后验概率表示为假设数据库中说话人的可能性相等,则 其中N为数据库中说话人人数;

那么辨认的目标函数为

*

i表示识别出的说话人,θi为说话人对应的模型参数;

P(x|θ)的对数形式为

C.识别出的说话人与用户当前登录的用户名进行验证对比如果语音识别出的说话人与当前用户名一致,则验证通过,服务端反馈成功的信息给客户端,否则反馈失败的信息给客户端。

2.根据权利要求1所述的基于C/S架构和说话人识别技术的文件加密解密系统,其特征在于,新用户注册模块能够:

A.用户输入用户名和密码进行注册使得用户使用账户密码登录方式登录到系统;

B.用户浏览录音例句

界面上提示的例句作为提示用户录制语音,C.用户点击录制语音按钮

用户点击录制语音按钮后会出现当前录音时间提示,超过11秒将自动停止录音,客户端程序也根据内置阈值自动停止录音,或当用户停止说话时,声波能量低于内置阈值,录音自动停止;当例句录音完毕后,用户注册成功;

D.发送录制语音到服务端

当用户把例句录音完毕后,客户端自动把录制的语音发送到服务端,服务端进行模型的训练,当服务端提示训练完成时,用户注册成功。

3.根据权利要求1所述的基于C/S架构和说话人识别技术的文件加密解密系统,其特征在于,所述老用户登录模块能够:A.用户点击声纹识别快速登录按钮当用户点击按钮之后,系统提示用户录制语音,此时用户使用麦克风说话,系统系登录界面会有例句提示;

B.停止语音录制

系统自动判断用户是否已经停止说话,当采集的声波能量低于系统内置的阈值时,系统自动停止录音,或者如果用户说话超过11秒,系统也会自动停止;

C.用户身份的验证

用户语音录制完毕之后,系统立即将语音发送到服务端进行身份验证,如果用户的身份验证成功,由服务端反馈信息,用户即可登录进入系统,如果验证失败,则提示可能原因;

D.在不方便使用语音登录的情况下,点击使用密码登录按钮,用户输入完毕后,点击登录,经过系统验证成功后,用户可以登录进入系统。

4.根据权利要求1所述的基于C/S架构和说话人识别技术的文件加密解密系统,其特征在于,所述文件加密和解密模块能够:A.用户直接选择文件

用户通过对话框选中文件后,系统读取文件内容,并且进行判断该文件是否是已加密文件或者是普通文件;

B.加密处理

系统判断是普通文件,则提示用户是否进行加密,用户选择加密时,首先进行用户的身份验证,用户录制一段语音后发送到服务端,服务端验证当前登录用户和当前说话人是同一人时,服务端使用RSA算法产生公钥和私钥,并将公钥反馈给客户端;

C.客户端使用公钥对文件进行加密根据RSA算法,客户端使用服务端反馈回来的公钥对文件进行加密,同时改变加密文件的名称,追加已加密的文字,提示用户该文件是已加密的文件,同时客户端在文件头部加入特定的加密标志符;

D.解密处理

系统判断是已加密文件,则提示用户是否进行解密,用户选择解密时,首先进行用户的身份验证,用户录制一段语音后发送到服务端,服务端验证当前登录用户和当前说话人是同一人时,服务端从数据库中查找到解密文件的密钥并发送给客户端;

E.客户端使用私钥对文件进行解密客户端首先去除特定的加密标志,然后通过RSA算法使用私钥对文件进行解密,并且把文件的名字恢复正常,去除已加密的提示文字。

5.根据权利要求4所述的基于C/S架构和说话人识别技术的文件加密解密系统,其特征在于,所述RSA算法设计如下:A.首先找到两个大素数p、q,并设置为1024位;

B.计算n=p*q, 其中n表示两个互质的整数之积, 表示的是n的欧拉函数值;

C.任意选择一个满足要求的证书e,满足 并且 其中gcd()表示求最大公约数;

D.计算d,满足 即d是e在模 下的乘法逆元;

E.以{e,n}为公钥,{d,n}为私钥;

F.明文为A,则密文C=(A^e)%n。

6.根据权利要求1所述的基于C/S架构和说话人识别技术的文件加密解密系统,其特征在于,所述用户验证模块能够:A.收到用户使用数字密码的验证请求服务器监听端口当接收到用户的登录系统请求时,系统对用户输入的用户名和密码进行验证,服务器通过查询数据库进行密码验证,如果验证成功则把成功的信息反馈到用户的客户端,从而客户端可以进行进一步操作;

B.收到用户使用声纹密码的身份验证请求服务器监听端口当接收到用户发送的语音,系统利用语音降噪模块进行降噪处理,所述语音降噪模块采用双门限端点检测技术,去除用户语音中的静音段,把用户真正说话的语音段截取出来,然后采用维纳滤波法的语音增强算法,减少用户语音的背景噪声,突出说话人的声音,然后使用说话人模型库中的GMM模型进行模式匹配,匹配成功则返回验证成功的信息给客户端。

7.根据权利要求1所述的基于C/S架构和说话人识别技术的文件加密解密系统,其特征在于,所述模型训练模块是服务器接收到用户注册时发送来的语音,先把语音通过语音降噪模块进行预处理,然后使用高斯混合模型GMM进行训练,得到属于用户的声纹模型并且保存到数据库中,新用户就注册成功;所述数据库存储模块用于保存用户的基本信息和传统的密码信息和用户的声纹密码信息,当服务器需要时能够读写数据库。

8.根据权利要求1‑7任一项所述的基于C/S架构和说话人识别技术的文件加密解密系统,其特征在于,所述系统基于服务器实现,所述服务器采用网络负载均衡服务器。