1.一种敏感信息的检测方法,所述方法包括:拦截外发邮件,并从所拦截的外发邮件中提取出第一文字数据;
获取预设监控字段,并从所述第一文字数据中识别出与所述预设监控字段对应的第一监控字段值;
对所述第一监控字段值进行组合生成第一组合特征,并将所述第一组合特征输入敏感数据检测模型中得到第一敏感概率;
当所述第一敏感概率小于等于预设值时,则提取所述外发邮件的附件;
对所述附件中的文件进行反隐藏解析,并判断解析后的文件数据是否发生改变;
当解析后的文件数据发生改变时,则判定所述外发邮件存在数据泄露;
提取解析后的文件数据中的发生改变的数据,并生成第一预警信息;
将提取的数据和第一预警信息发送至管理终端。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:当解析后的文件数据未发生改变时,则从解析后的文档类型的附件中提取第二文字数据;
将所述第二文字数据输入至敏感数据检测模型中进行敏感信息检测;
当所述第二文字数据检测到敏感信息时,则判定所述外发邮件存在数据泄露;
提取检测到的敏感信息,并生成第二预警信息;
将所提取到的敏感信息和第二预警信息发送至管理终端。
3.根据权利要求1所述的方法,其特征在于,所述对所述附件中的文件进行反隐藏解析,并判断解析后的文件数据是否发生改变,包括:对所述附件中的压缩包附件进行解压,并识别解压后的文件以及文件类型;
取消文件类型为文档类型的附件的文字隐藏设置,并判断取消设置后的附件是否存在新增文字;
采用图像隐写检测算法对文件类型为图像类型的附件进行隐写检测;
当存在新增文字和/或检测到图像类型的附件进行了隐写时,则判定解析后的文件数据发生了改变。
4.根据权利要求3所述的方法,其特征在于,所述对所述附件中的文件进行反隐藏解析,并判断解析后的文件数据是否发生改变,包括:将文件类型为文档类型的附件还原为压缩包文件;
检测压缩包文件中是否还包括除文档类型的附件之外的多余文件;
当检测到多余文件时,则判定解析后的文件数据发生了改变。
5.根据权利要求2至4任意一项所述的方法,其特征在于,所述将所述第二文字数据输入至敏感数据检测模型中进行敏感信息检测,包括:从所述第二文字数据中识别出与预设监控字段对应的第二监控字段值;
对所述第二监控字段值进行组合生成第二组合特征,并将所述第二组合特征输入敏感数据检测模型中得到第二敏感概率;
当所述第二敏感概率大于预设概率值时,则判定检测到敏感信息。
6.根据权利要求5所述的方法,其特征在于,所述从所拦截的外发邮件中提取出第一文字数据,包括:根据所述外发邮件的邮件标题和邮件正文生成第一文字数据;
所述从所拦截的外发邮件中提取出第一文字数据之后,还包括:根据敏感字符列表识别所述第一文字数据中是否存在敏感字符;
当未识别到敏感字符时,则第一文字数据继续获取预设监控字段。
7.一种敏感信息的检测装置,其特征在于,所述装置包括:拦截模块,用于拦截外发邮件,并从所拦截的外发邮件中提取出第一文字数据;
第一识别模块,用于获取预设监控字段,并从所述第一文字数据中识别出与所述预设监控字段对应的第一监控字段值;
第一敏感概率获取模块,用于对所述第一监控字段值进行组合生成第一组合特征,并将所述第一组合特征输入敏感数据检测模型中得到第一敏感概率;
第一提取模块,用于当所述第一敏感概率小于等于预设值时,则提取所述外发邮件的附件;
解析模块,用于对所述附件中的文件进行反隐藏解析,并判断解析后的文件数据是否发生改变第一判定模块,用于当解析后的文件数据发生改变时,则判定所述外发邮件存在数据泄露;
第二提取模块,用于提取解析后的文件数据中的发生改变的数据,并生成第一预警信息;
第一发送模块,用于将提取的数据和第一预警信息发送至管理终端。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:第三提取模块,用于当解析后的文件数据未发生改变时,则从解析后的文档类型的附件中提取第二文字数据;
敏感信息检测模块,用于将所述第二文字数据输入至敏感数据检测模型中进行敏感信息检测;
第二判定模块,用于当所述第二文字数据检测到敏感信息时,则判定所述外发邮件存在数据泄露;
第四提取模块,用于提取检测到的敏感信息,并生成第二预警信息;
第二发送模块,用于将所提取到的敏感信息和第二预警信息发送至管理终端。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。