1.一种用于填充数据的方法,其特征在于,包括:
获取用户上传的表格,所述表格内包括若干单元格;
获取各单元格内的数据的字符特征;
根据各所述字符特征分别确定各单元格内的数据在预设的数据库中对应的字段;
根据各单元格内的数据对应的字段将各单元格内的数据填入所述数据库;
根据各所述字符特征分别确定各单元格内的数据在预设的数据库中对应的字段,包括:获取所述用户的用户信息,并获取各单元格的位置信息,其中,所述用户信息包括用户的岗位、年龄、性别、工作经历和表格浏览记录,单元格的位置信息为单元格在表格中的行列信息;将用户的岗位、年龄、性别、工作经历和表格浏览记录、各单元格对应的字符特征及各单元格的位置信息输入预设的字段预测模型进行字段预测,获得各单元格内的数据在预设的数据库中对应的字段。
2.根据权利要求1所述的方法,其特征在于,根据各所述字符特征分别确定各单元格内的数据在预设的数据库中对应的字段,包括:根据各所述字符特征分别确定不同列单元格内的数据是否为同一数据类型;
在各列单元格内的数据为同一数据类型的情况下,将每列单元格中任意一个单元格确定为备选单元格;
根据各所述备选单元格中数据的字符特征分别确定各备选单元格内的数据在预设的数据库中对应的字段;
将各备选单元格内的数据在预设的数据库中对应的字段确定为各备选单元格对应的一列单元格中各列单元格内的数据对应的字段。
3.根据权利要求2所述的方法,其特征在于,根据各所述字符特征分别确定不同列单元格内的数据是否为同一数据类型,包括:对每一列单元格,获取各单元格内的数据的字符串长度;
对每一列单元格,将各单元格内的字符特征和各单元格内对应的字符串长度输入预设的数据类型预测模型进行数据类型预测,获得每一列单元格对应的预测结果,所述预测结果用于表征对每一列单元格中各单元格内的数据是否为同一数据类型。
4.根据权利要求3所述的方法,其特征在于,所述数据类型预测模型通过以下方式获取:获取带有数据类型标签的第一样本数据,所述第一样本数据包括字符特征样本和字符串长度样本;
将所述带有数据类型标签的第一样本数据输入预设的第一神经网络模型进行训练,获得数据类型预测模型。
5.根据权利要求1所述的方法,其特征在于,所述字段预测模型通过以下方式获取:获取带有字段标签的第二样本数据,所述第二样本数据包括用户信息样本、字符特征样本和单元格位置样本;
将带有数据类型标签的第一样本数据输入预设的第二神经网络模型进行训练,获得数据类型预测模型。
6.一种用于填充数据的装置,其特征在于,包括:
第一获取模块,被配置为获取用户上传的表格,所述表格内包括若干单元格;
第二获取模块,被配置为获取各单元格内的数据的字符特征;
确定模块,被配置为根据各所述字符特征分别确定各单元格内的数据在预设的数据库中对应的字段;
填充模块,被配置为根据各单元格内的数据对应的字段将各单元格内的数据填入所述数据库;
根据各所述字符特征分别确定各单元格内的数据在预设的数据库中对应的字段,包括:获取所述用户的用户信息,并获取各单元格的位置信息,其中,所述用户信息包括用户的岗位、年龄、性别、工作经历和表格浏览记录,单元格的位置信息为单元格在表格中的行列信息;将用户的岗位、年龄、性别、工作经历和表格浏览记录、各单元格对应的字符特征及各单元格的位置信息输入预设的字段预测模型进行字段预测,获得各单元格内的数据在预设的数据库中对应的字段。
7.一种电子设备,包括处理器和存储有程序指令的存储器,其特征在于,所述处理器被配置为在运行所述程序指令时,执行如权利要求1至5任一项所述的用于填充数据的方法。
8.一种存储介质,存储有程序指令,其特征在于,所述程序指令在运行时,执行如权利要求1至5任一项所述的用于填充数据的方法。