1.一种OOXML文档夹带检测方法,其特征在于:包括如下步骤:S100、对OOXML文档进行解析得到解析后的多层级目录和文件;
S200、从embeddings目录中读取所有内嵌文件的OLE名称;
S300、根据内嵌文件的OLE名称,提取每个内嵌文件对应的ID;
S400、根据OOXML文档的类型以及内嵌文件的ID,从解析后的文件中提取每个内嵌文件的如下参数中所包含的参数:内嵌文件所属子表编号、内嵌文件所属页数、缩略图路径、内嵌文件位置、内嵌文件尺寸、内嵌文件透明度;
S500、根据所提取的内嵌文件参数判断每个内嵌文件是否属于隐藏文件,根据其缩略图路径获取缩略图并识别得到隐藏文件的名称和类型;
OOXML文档的类型为*.xlsx,每个内嵌文件均包含内嵌文件所属子表编号、缩略图路径、内嵌文件位置、内嵌文件尺寸这四个参数;
步骤S300中,依据内嵌文件的OLE名称从sheet1.xml.rels、sheet2.xml.rels、…文件中提取该内嵌文件对应的ID,并将内嵌文件ID所在文件名称中sheet后的数字作为该内嵌文件的所属子表编号m;
步骤S400中,内嵌文件参数通过如下步骤提取:
根据内嵌文件ID,从sheetm.xml文件中提取该内嵌文件对应的缩略图ID;
根据内嵌文件的缩略图ID,从sheetm.xml.rels文件中提取该内嵌文件对应的缩略图路径;
根据内嵌文件ID,从sheetm.xml文件中提取该内嵌文件如下的角点信息:左上角点所处列号form_xdr_col、行号form_xdr_row,左上角点与其所处单元格左上角顶点之间的纵向偏移距离form_xdr_colOff、横向偏移距离form_xdr_rowOff;
右下角点所处列号to_xdr_col、行号to_xdr_row,右下角点与其所处单元格右下角顶点之间的纵向偏移距离to_xdr_colOff、横向偏移距离to_xdr_rowOff;
根据子表m中行、列的宽度将内嵌文件的角点信息转换成该内嵌文件的位置和尺寸。
2.如权利要求1所述的OOXML文档夹带检测方法,其特征在于:所述的步骤S500中,根据所提取的内嵌文件参数判断每个内嵌文件是否属于隐藏文件包括:判断该内嵌文件的尺寸是否小于设定阈值,若小于,则认为该内嵌文件为隐藏文件,否则进入下一步;
判断同一个子表中,所有内嵌文件之间位置上是否有交集,若任意两个内嵌文件的位置有交集,则继续判断内嵌文件的交集所在区域占其本身所在区域的比值是否大于等于
90%,若是则将该内嵌文件视为隐藏文件。
3.一种OOXML文档夹带检测方法,其特征在于:包括如下步骤:S100、对OOXML文档进行解析得到解析后的多层级目录和文件;
S200、从embeddings目录中读取所有内嵌文件的OLE名称;
S300、根据内嵌文件的OLE名称,提取每个内嵌文件对应的ID;
S400、根据OOXML文档的类型以及内嵌文件的ID,从解析后的文件中提取每个内嵌文件的如下参数中所包含的参数:内嵌文件所属子表编号、内嵌文件所属页数、缩略图路径、内嵌文件位置、内嵌文件尺寸、内嵌文件透明度;
S500、根据所提取的内嵌文件参数判断每个内嵌文件是否属于隐藏文件,根据其缩略图路径获取缩略图并识别得到隐藏文件的名称和类型;
OOXML文档的类型为*.pptx,每个内嵌文件均包含内嵌文件所属页数、缩略图路径、内嵌文件位置、内嵌文件尺寸、内嵌文件透明度这五个参数;
步骤S300中,依据内嵌文件的OLE名称从slide1.xml.rels、slide2.xml.rels、…文件中提取该内嵌文件对应的ID,并将内嵌文件ID所在文件名称中slide后的数字作为该内嵌文件的所属页数编号n;
步骤S400中,内嵌文件参数通过如下步骤提取:
根据内嵌文件ID,从sliden.xml文件中提取该内嵌文件对应的spid以及透明度;
根据内嵌文件的spid,从vmlDrawingn.vml文件中提取该内嵌文件的位置、尺寸以及缩略图路径。
4.如权利要求3所述的OOXML文档夹带检测方法,其特征在于:所述的步骤S500中,根据所提取的内嵌文件参数判断每个内嵌文件是否属于隐藏文件包括:判断该内嵌文件的透明度是否小于设定阈值,若小于,则认为该内嵌文件为隐藏文件,否则进入下一步;
判断该内嵌文件的尺寸是否小于设定阈值,若小于,则认为该内嵌文件为隐藏文件,否则进入下一步;
判断该内嵌文件是否位于编辑域以外,若是,则认为该内嵌文件为隐藏文件,否则进入下一步;
判断同一个页数中,所有内嵌文件之间位置上是否有交集,若任意两个内嵌文件的位置有交集,则继续判断内嵌文件的交集所在区域占其本身所在区域的比值是否大于等于
90%,若是则将该内嵌文件视为隐藏文件。
5.一种计算机可读存储介质,其特征在于:其上存储有计算机程序,所述计算机程序被处理器执行时,实现如权利要求1‑4中任一项所述的OOXML文档夹带检测方法。
6.一种电子设备,其特征在于:包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序时,实现如权利要求1‑4中任一项所述的OOXML文档夹带检测方法。