利索能及
我要发布
收藏
专利号: 2018103691391
申请人: 厦门快商通信息技术有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2025-03-03
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种财务审计询证系统,其特征在于,所述系统包括数据层、基础层、应用层;

所述数据层用于存储和管理系统所需的数据;所述基础层用于提供系统所需的通用基础功能和模块;所述应用层用于向用户提供面对面的服务;

所述数据层与所述基础层连接;所述应用层与所述数据层和所述基础层连接;

所述数据层负责包括对所述财务审计询证系统的相关数据进行数据仓储、数据清洗、信息检索、支持基础层模型训练的数据脱敏服务中的至少一种处理;

所述基础层包括定向爬虫模块、信息抽取模块、模板系统模块、印刷文本OCR模块、印章识别比对模块、推理引擎模块中的至少一者;

所述应用层在所述基础层和所述数据层之上构筑的以实现具体业务;所述具体业务包括背调子系统、询证函自动生成、运单自动填写与追踪、回函自动确认与分类中的至少一者;

所述数据脱敏服务用于实现对函证的敏感隐私数据进行可靠保护;

所述定向爬虫模块用于精准地获取目标网站的信息;

所述信息抽取模块用于提取被征询方信息,所述被征询方信息包含以下一种或几种:被询证方的单位名称、地址、联系人、联系方式;

所述模板系统模块为询证函自动生成提供模板文件;

所述印刷文本OCR模块用于对回函的印刷文本进行汉字识别;

所述印刷文本OCR模块的分析识别包括对所述模板文件具有统一的页眉、页脚,以及自动生成的模板文件中,在需要进行回函真实性核验的关键要素信息附近引入不影响阅读、不改变原文语义的定位图案,协助所述印刷文本OCR模块定位到需要核对的关键信息,针对函证用语特点,训练专门的语言模型,自动修正错误的印刷文本OCR模块识别结果;

所述印章识别比对模块用于对被征询方回函的印章检测与印章内容识别;

所述推理引擎模块用于负责整个所述财务审计询证系统工作流的控制和各模块的智能调度;

所述背调子系统用于辅助调查被询证方的信息是否属实;

所述询证函自动生成用于自动生成询证函;

所述运单自动填写与追踪用于自动填写运单相关信息以及追踪运单;

所述回函自动确认与分类用于对被征询方回函的自动确认及其分类;

所述数据脱敏服务是对函证涉及的商业敏感信息通过脱敏规则进行数据的变形;所述脱敏规则进行数据的变形包含以下一种或几种操作:信息切割、信息打散、抽样选取。

2.根据权利要求1所述的财务审计询证系统,其特征在于,所述财务审计询证系统还包括接口层,所述接口层用于与其他平台或应用进行对接。

3.根据权利要求1所述的财务审计询证系统,其特征在于,所述定向爬虫模块用于精准地获取目标网站的信息;所述定向爬虫模块包括引擎、下载器、下载中间件、爬虫中间件、调度器以及至少一爬虫;所述爬虫为负责对某个数据源的页面进行解析,并从中分离出目标信息的程序;

所述信息抽取模块用于提取被征询方信息,所述信息抽取包含命名实体识别和实体关系抽取两项任务;所述信息抽取模块从网络中采用实体命名识别技术提取被询证方信息,所述网络包含以下一种或几种:被询证方公司官网、工商网站、招聘网站;

所述模板系统模块包含至少一种模板文件,不同类别的询证业务对应不同的模板文件;所述模板文件包含固定的文本和待替换的变量;所述待替换的变量以点位符的形式保存在模板文件中。

4.根据权利要求3所述的财务审计询证系统,其特征在于,所述实体命名识别技术为深度神经网络模型,所述深度神经网络模型为双向长短时记忆神经网络和条件随机场混合模型。

5.根据权利要求4所述的财务审计询证系统,其特征在于,所述深度神经网络模型构造包含依次关联的嵌入层、双向LSTM层、CRF层;

所述嵌入层根据预训练好的字向量,将输入文本中的每个字由独热编码,映射为低维稠密的字向量;

所述双向LSTM层结合上下文信息,自动提取句子特征;

所述CRF层,使用Viterbi动态规划算法来求解最优路径,进行句子级的序列标注;

所述深度神经网络模型还根据所述序列标注的结果从原始文本中截取相应字符串得到所需的结构化信息。

6.根据权利要求1所述的财务审计询证系统,其特征在于,所述背调子系统通过定向爬虫的技术,分别以待查实的公司名称、地址、联系方式作为检索词,在通用搜索引擎和/或垂直网站上进行搜索,然后将检索结果与被审计单位提供的被询证方的信息进行比对,将比对的结果以可视化的形式直观地展示给审计人员;

所述运单自动填写与追踪包括运单自动填写功能和运单追踪功能;所述运单自动填写功能为通过模拟浏览器的技术,所述财务审计询证系统在计算机内存中自动启动一个无头浏览器,然后通过Javascript脚本读入运单相关信息,再通过Javascript脚本自动填写到运单中;

所述运单追踪功能为所述财务审计询证系统采用定向爬虫的技术从快递公司网站定时抓取相关运单的信息,以实时追踪运单信息;所述运单信息包含以下一种或几种:运单历史投递的轨迹、当前投递的情况、运单所处的位置、负责的快递人员及联系方式;

所述回函自动确认与分类通过调用所述基础层中的印刷文本OCR、印章识别与比对、以及推理引擎模块,进行被征询方回函的自动确认及其分类。

7.根据权利要求1所述的财务审计询证系统,其特征在于,所述数据包括函证过程中产生的文件的扫描件、所述文件的相关元数据;所述扫描件包括发函信件扫描件、发函信封扫描件、回函信件扫描件、回函信封扫描件中的至少一者;所述相关元数据包括函证编号、函证内容、被询证者信息、被审计单位信息、请求函证的审计项目组信息中的至少一者。

8.根据权利要求7所述的财务审计询证系统,其特征在于,所述数据还包括所述财务审计询证系统运行时产生的中间数据,所述中间数据包括定向爬虫抓取的原始文档、信息抽取的结果中的至少一者。

9.根据权利要求1所述的财务审计询证系统,其特征在于,所述应用层的服务可复用所述基础层的模块。