为了解决这一痛点,研究人员们决定利用新兴的人工智能技术,开发一种全新的计算工具。按照他们的设想,这些工具不再是从2%的基因组里寻找致癌突变,而是能将范围扩展到100%的基因组!
图片来源:123RF
具体来看,研究人员们利用深度神经网络,开发了一个叫做“挖掘”(Dig)的算法。利用来源于37种不同癌症的基因组数据,这个算法从中确定了每一种癌症类型的背景突变率。“你用指定的癌症类型进行训练,它就能自动学会这个特定癌症中,跨越整个基因组不同区域的突变率。”本研究的第一作者,研究生Maxwell Sherman说道。如果知道在基因组的各个区域能看到多少预计突变,再用它来比对患者的真实数据,就能确认患者基因组中哪里的突变增多,从而找到潜在的全新致癌突变。
利用这一模型,研究团队找到了一些关于致癌突变的全新洞见。首先,他们观察了一种叫做隐新剪接突变(cryptic splice mutations)的突变类型。我们知道在基因里,编码蛋白的序列叫做外显子,而在外显子之间的序列叫做内含子。在正常的细胞运作中,转录出的mRNA会将其中的内含子剪去,留下外显子的部分拼接在一起,用于翻译成蛋白。而隐新剪接突变则发生在内含子中,会让细胞的这一过程产生错误,将不该保留的内含子留在了mRNA中,产生了不应有的错误蛋白。
研究指出,抑癌基因中会出现这样的隐新剪接突变,使得具有肿瘤抑制功能的蛋白失效,从而失去对癌症的防御能力。研究人员们估计,抑癌基因所具有的突变中,约有5%都属于这种突变类型。比例虽然不多,却给研究人员们提供了全新的治疗思路——目前一类叫做“反义寡核苷酸”的疗法已经在临床上验证了自己的潜力,有望用来矫正这些由于剪接问题导致的癌症。这也意味着此类原本多用于治疗罕见疾病的分子,能在更为广阔的疾病领域中造福病患。