利索能及
我要发布
收藏
专利号: 2025106795439
申请人: 苏州工学院
专利类型:发明专利
专利状态:已下证
更新日期:2026-05-07
缴费截止日期: 暂无
联系人

摘要:

权利要求书:

1.一种药物中间体数据库构建及AI智能检索方法,其特征在于,包括:获取目标药物中间体的化学结构数据及合成路径数据,其中,所述化学结构数据来源于至少一种化学数据库或实验记录设备,所述合成路径数据包括反应条件、催化剂及产率参数;

将所述化学结构数据输入预设的特征提取模型,以识别并提取所述化学结构数据中的分子描述符,其中,所述分子描述符包括原子连接性、电子云分布及官能团拓扑关系;

基于所述分子描述符构建结构化中间体数据库,其中,所述数据库关联化学结构、合成路径及物化性质的多维度索引标签;

将所述结构化中间体数据库输入预设的AI检索模型,生成动态检索结果,其中,所述AI检索模型基于图神经网络算法匹配用户查询与数据库记录的相似性;

利用预设的优化算法对所述动态检索结果进行多维度排序,输出标准化检索列表;

基于所述分子描述符构建结构化中间体数据库包括:

根据所述分子描述符中的原子连接性分割化学结构图谱;

基于分割后的图谱生成层级化存储单元,并在每个单元内关联对应的合成路径及物化性质参数。

2.根据权利要求1所述的药物中间体数据库构建及AI智能检索方法,其特征在于,训练所述特征提取模型的步骤包括:获取初始训练样本集,其中,所述初始训练样本集中的每个样本均标注有对应的分子描述符标签;利用所述初始训练样本集迭代训练初始特征提取网络,直至所述初始特征提取网络输出的特征预测结果与所述分子描述符标签的匹配率大于或等于预设阈值;每次迭代过程中,根据前一次迭代的预测误差调整所述初始特征提取网络的权重参数,并剔除所述初始训练样本集中误差高于设定阈值的样本,形成缩减后的训练子集用于下一次迭代训练。

3.根据权利要求1所述的药物中间体数据库构建及AI智能检索方法,其特征在于,获取目标药物中间体的化学结构数据包括按照如下方式获取其中一种数据源的化学数据:连接至目标化学数据库服务器和/或实验设备实时数据接口;

根据预设数据采集协议从所述目标化学数据库服务器和所述实验设备实时数据接口二者至少之一提取原始化学数据,其中,所述预设数据采集协议包括数据格式、存储精度及元数据关联规则。

4.根据权利要求3所述的药物中间体数据库构建及AI智能检索方法,其特征在于,将所述化学结构数据输入预设的特征提取模型之前,所述方法还包括:对所述原始化学数据进行冗余信息过滤,消除不同数据源间的格式差异;

采用多尺度降噪算法去除所述原始化学数据中的异常值,保留分子结构关键信息。

5.根据权利要求1所述的药物中间体数据库构建及AI智能检索方法,其特征在于,将所述结构化中间体数据库输入预设的AI检索模型包括:在所述AI检索模型中设置查询约束条件,模拟用户按结构相似性、反应条件或产率范围的检索需求;

通过迭代计算图节点嵌入向量,匹配数据库记录与查询条件的多维相似度评分。

6.根据权利要求1所述的药物中间体数据库构建及AI智能检索方法,其特征在于,利用预设的优化算法对所述动态检索结果进行多维度排序包括:对所述动态检索结果进行权重分配,生成按结构相似度、合成难度或成本优先级的衍生排序列表;

基于自适应调整算法在所述衍生排序列表中注入符合化学逻辑的优化参数。

7.根据权利要求6所述的药物中间体数据库构建及AI智能检索方法,其特征在于,所述方法还包括按照如下方式训练所述优化算法:构建包含真实化学合成案例的优化训练集,其中,每个案例标注有对应的合成路径真值;

采用强化学习框架训练所述优化算法,使得所述优化算法生成的排序列表与所述真实化学合成案例的分布差异小于设定容差范围。

8.根据权利要求1所述的药物中间体数据库构建及AI智能检索方法,其特征在于,所述方法还包括:将所述标准化检索列表输入预设的验证模型,计算所述检索结果与实验记录数据的误差矩阵;

根据所述误差矩阵反向调整所述AI检索模型的图网络深度及特征嵌入维度;

所述验证模型通过如下步骤构建:

采集实验室中记录的合成路径数据作为验证基准;

建立基于注意力机制的误差评估网络,通过对比检索结果与验证基准的多维特征图输出误差权重向量。

9.根据权利要求1所述的药物中间体数据库构建及AI智能检索方法,其特征在于,所述方法还包括数据安全控制步骤:在接收到外部系统对所述结构化中间体数据库的访问请求时,验证请求方提供的身份令牌与预设权限列表的匹配性;

在匹配成功时,通过加密链路传输符合访问权限的数据子集至所述外部系统。