利索能及
我要发布
收藏
专利号: 2019103282642
申请人: 平安科技(深圳)有限公司
专利类型:发明专利
专利状态:已下证
更新日期:2026-06-16
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种基于大数据的数据报表获取方法,其特征在于,包括:采集语音数据;

对所述语音数据进行语音识别以获得文本数据,对所述文本数据进行分词处理和语义识别处理;

根据处理结果获取目标查询实体和确定数据操作类别,基于所述目标查询实体和所述数据操作类别生成查询信息;

根据查询信息从数据库中查询获得目标数据,并对获得的所述目标数据进行处理后形成数据报表。

2.根据权利要求1所述的基于大数据的数据报表获取方法,其特征在于,所述基于所述目标查询实体和所述数据操作类别生成查询信息包括:确定被查询的数据库中数据的数据形式,结合所述目标查询实体、所述数据操作类别和所述数据形式确定与所述数据库对应的查询字段,并将确定的所述查询字段根据预设的组装规则进行组装生成SQL查询语句。

3.根据权利要求2所述的基于大数据的数据报表获取方法,其特征在于,所述结合所述目标查询实体、所述数据操作类别和所述数据形式确定与所述数据库对应的查询字段包括:判断所述数据形式是否为多维数据形式,其中多维数据由二维数据封装处理形成;

若判定结果为是则确定查询多维数据库的查询字段,并获取所述目标查询实体对应于所述多维数据库中的目标查询实体字段,以及获取所述数据操作类别对应于所述多维数据库中的数据操作类别字段,其中所述查询多维数据库的查询字段至少包括用于连接多维数据库的维度属性字段、纬度值中的中文实体字段和用于查询目标数据的范围字段,所述数据操作类别字段包括函数字段、换算字段、逻辑运算字段中的一种或多种。

4.根据权利要求1至3任一项所述的基于大数据的数据报表获取方法,其特征在于,所述对获得的所述目标数据进行处理后形成数据报表包括:获取与所述数据操作类别相对应的数据处理模型,根据所述数据处理模型对所述目标数据进行处理,其中,对所述目标数据进行处理包括数据变换、数据数学运算和数据逻辑运算中的一种或多种;

根据处理后的所述目标数据生成数据报表并输出。

5.根据权利要求1所述的基于大数据的数据报表获取方法,其特征在于,在对所述语音数据进行语音识别以获得文本数据之前,所述方法包括:对所述语音数据进行去噪处理,并甄别去噪处理后的所述语音数据所属的语言类别;

根据所述语言类别调用与所述语言类别对应的词库和分词规则。

6.根据权利要求1所述的基于大数据的数据报表获取方法,其特征在于,对所述文本数据进行语义识别处理包括:对分词处理后得到的各个词语进行语义匹配和词性标注,并基于语义匹配和词性标注的结果对分词处理后获得的各个词语之间的依存关系进行分析,获得各个词语的依存关系,以根据所述依存关系确定所述数据操作类别。

7.根据权利要求1所述的基于大数据的数据报表获取方法,其特征在于,在获取目标查询实体之后,所述方法还包括:确认获取的各个目标查询实体对应的索引信息,所述索引信息对应于所述数据库中的表结构中的列属性。

8.一种基于大数据的数据报表获取装置,其特征在于,包括:采集单元,用于采集语音数据;

语音识别单元,用于对所述语音数据进行语音识别以获得文本数据,对所述文本数据进行分词处理和语义识别处理;

查询信息生成单元,用于根据处理结果获取目标查询实体和确定数据操作类别,基于所述目标查询实体和所述数据操作类别生成查询信息;

数据生成单元,用于根据查询信息从数据库中查询获得目标数据,并对获得的所述目标数据进行处理后形成数据报表。

9.一种计算机设备,其特征在于,包括:

至少一个处理器;以及,

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如权利要求1至7中任一项所述的基于大数据的数据报表获取方法的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被至少一个处理器执行时实现如权利要求1至7中任一项权利要求所述的基于大数据的数据报表获取方法的步骤。