基于深度学习的新技术可以促进药物开发
服药时,您想确切地知道它的作用。制药公司经过广泛的测试,以确保您能做到。通过莱斯大学布朗工程学院创造的一种基于深度学习的新技术,他们可能很快就能更好地掌握正在开发的药物如何在人体中发挥作用。
赖斯的计算机科学家Lydia Kavraki实验室推出了代谢物翻译器,这是一种预测代谢物的计算工具,代谢物是药物和酶等小分子之间相互作用的产物。
赖斯大学的研究人员利用深度学习方法和大量反应数据集的优势,为开发人员提供了有关药物作用的全面信息。该方法不受公司用来确定代谢反应的规则的限制,从而为新发现开辟了道路。
当您试图确定某化合物是否为潜在药物时,必须检查其毒性。您想确认它已完成应做的工作,但您还想知道可能还会发生什么。”
莱斯大学计算机科学家Lydia Kavraki
皇家化学学会期刊《化学科学》详细介绍了由卡弗拉基(Kavraki),IBM的托马斯·J·沃森研究中心的埃莱尼·里察(Eleni Litsa)和水稻校友佩尔·达斯(Payel Das)进行的这项研究。
研究人员训练了Metabolite Translator来预测任何酶的代谢产物,但对照现有的基于规则的方法(主要针对肝脏中的酶)来衡量其成功。这些酶负责排毒和消除药物,农药和污染物等异种生物。但是,代谢产物也可以通过其他酶形成。
利察说:“我们的身体是化学反应的网络。” “它们具有作用于化学物质的酶,并可能断裂或形成键,从而将其结构改变为可能有毒或引起其他并发症的结构。现有方法主要针对肝脏,因为大多数异源性化合物都在肝脏中代谢。通过我们的工作,我们重新尝试捕获人类的新陈代谢。
利察说:“药物的安全性不仅取决于药物本身,还取决于在体内加工药物时可能形成的代谢产物。”
她说,基于化学分子等结构化数据的机器学习架构的兴起使这项工作成为可能。Transformer于2017年作为一种序列翻译方法引入,已在语言翻译中得到广泛使用。
代谢物翻译器基于SMILES(用于“简化的分子输入线输入系统”),这是一种使用纯文本而非图表表示化学分子的表示法。
丽莎说:“我们正在做的事情与将英语(如英语)翻译成德语完全一样。”
由于缺乏实验数据,实验室使用转移学习来开发代谢物翻译器。他们首先针对900,000种已知的化学反应对Transformer模型进行了预训练,然后使用人类代谢转化数据对其进行了微调。
研究人员通过分析65种药物和179种代谢酶的已知SMILES序列,将Metabolite Translator的结果与其他几种预测技术的结果进行了比较。尽管“代谢物翻译器”在非药物专用的通用数据集上进行了培训,但其性能与针对药物而专门开发的基于规则的方法一样出色。但是它也鉴定出了不常参与药物代谢的酶,而现有的方法并未发现这些酶。
Kavraki说:“我们的系统可以与基于规则的系统同样很好地进行预测,并且我们没有在系统中放置任何需要人工和专家知识的规则。” “使用基于机器学习的方法,我们正在训练一种系统,以了解人类的新陈代谢,而无需以规则的形式明确地编码这种知识。这项工作两年前不可能完成。”
Kavraki是诺亚·哈丁(Noah Harding)的计算机科学教授,生物工程,机械工程,电气和计算机工程教授,以及莱斯大学的肯·肯尼迪研究所所长。莱斯大学和得克萨斯州的癌症预防与研究所支持了这项研究。