1.一种临床影像诊断报告关键词提取方法,其特征在于,包括以下步骤:Step1:建立数据库,存储设定参数与录入文本;
Step2:设定可触发提取的关键词,包括科室关键词、项目关键词与病情诊断关键词,对独立关键词进行单组归类标签的制定,在触发提取指令后,进行记录并将关键词涉及的文本在归类标签下进行交叉归类,递交至存储端;
Step3:获取关键词数据,构建提取模型,对所获取关键词组进行分析,将科室关键词作为主归类标签,在主归类标签下,为项目关键词与病情诊断关键词制定两组及两组以上的复合归类标签,并实时刷新更替信息;
Step4:进行区域划分,录入所有诊断报告类型,对关键区域进行分别标记,过滤无用区域,在识别当前诊断报告类型后,对接每种类型专属的文字提取区域;
Step5:对诊断报告进行关键区域划分,录入所有诊断报告类型,对关键区域进行分别标记,过滤无用区域;
Step6:获取待提取的诊断报告递交至扫描端,进行文本的录入,对关键区域内文本数据的缺陷进行报警提示;
Step7:获取录入文本,在识别当前诊断报告类型后,对接每种类型专属的文字提取区域,对区域内文本数据进行预处理;
Step8:运行提取模型,按所设定提取机制提取关键词,在匹配过程中按顺序进行逐步的运算算法,并为诊断报告下发归类标签;
所述Step3中的复合归类标签在制定完毕后,进行程序自动查验,而后递交至人工复查,对存在逻辑错误的复合归类标签进行剔除;
所述Step3中的提取模型在运行时,对文本数据进行特征提取,转换为可用于机器学习的数字特征,完成文本数据的特征值化;
所述Step6中的报警提示的运行逻辑包括以下步骤:Step601:识别当前诊断报告类型,接收对应关键区域属性,开始扫描;
Step602:识别关键区域内文本是否存在文本遗漏、错别字以及重复冗余文字;
Step603:否,按照预定设置持续运行,接收录入文本;
Step604:是,扫描端进行报警提醒,暂停扫描;
Step605:确认继续扫描;
Step606:是,扫描端复位,清除已扫描内容;
Step607:否,从暂停处继续扫描剩余文本,扫描可识别问题区域,跳过无法识别区域;
Step608:标记问题区域,生成问题报告;
所述Step608中的问题报告的属性包括:生成时间、问题字节、涉及区域和诊断报告类型;
所述Step8中按所设定提取机制提取关键词的过程中,若遇到文本中无法识别的待定义字段,程序会跳过此段文本,进行下一段文本处理;
所述Step5中无用区域的属性包括:文中的空白行、空格和图像,在接收到过滤指令后,进行屏蔽,停止内容的读取;
所述Step7中的预处理过程包括:对文本进行分词、去除停用词处理和去除与文章语义无关的部分词汇,词汇包括:标点符号、形容词、副词、助词及人称代词。
2.一种临床影像诊断报告关键词提取的辅助装置,所述辅助装置是对如权利要求1中所述的一种临床影像诊断报告关键词提取方法的实施装置,其特征在于,包括:扫描器主体(1),用于文本分析,进行操控指令的发送与编辑,作为核心控制端;
承物板(2),用于承载待扫描诊断报告,限制扫描区域;
扫描头(3),用于对诊断报告进行扫描,识别文本字段;
警报灯(4),用于在接收到报警指令后,进行闪烁提醒;
复位按钮(5),用于将指令运行进程进行复位,完成初始化;
配网模块(6),用于提供无线网络配置,支持外部设备的接入;
语音播报器(7),用于在接收到报警指令后,进行语音播报提醒;
存储接口(8),用于将内部存储介质与外部存储介质进行对接;
控制按钮(9),用于操控装置的启停。
3.根据权利要求2所述的一种临床影像诊断报告关键词提取辅助装置,其特征在于,所述扫描器主体(1)的右侧安装有承物板(2),所述扫描器主体(1)右侧的中间处安装有配网模块(6),所述扫描器主体(1)右侧的底端安装有存储接口(8),所述扫描器主体(1)右侧的顶端安装有复位按钮(5),所述扫描器主体(1)的前后两侧皆安装有语音播报器(7),所述扫描器主体(1)的顶端安装有警报灯(4),所述扫描器主体(1)右侧的底端安装有扫描头(3),所述扫描器主体(1)左侧的底端安装有控制按钮(9)。