撰文 | 郑诗蔚 责编 | 许枫
液体活检由于其采样快、侵入新低,目前已经成为一种有效的癌症检测工具。癌症患者的游离DNA里包含循环肿瘤DNA(ctDNA),通过分析肿瘤病人的游离DNA可以检测到肿瘤相关的遗传和表观的改变。带有大量游离DNA的儿童肿瘤病患往往其临床结果不理想,一些早期研究更进一步阐明了液体活检在疾病监测方面的价值。
当前对儿童癌症中游离DNA的分析侧重于肿瘤的基因标志物检测,例如染SE体易位造成的融合基因和拷贝数变异等。这些数据通常来自于微滴式数字PCR或目标二代测序,这种方法敏感度低,且通常只关注了少数几个基因片段,而且大多数儿童癌症样本的基因组不会存在重复出现的序列异常。但研究人员发现,游离DNA片段模式能提供非常有用的信息,包括目标DNA来源,染SE质结构以及肿瘤细胞的表观态等。因此,分析游离DNA片段中包含的信息,能够和传统基于基因标志物的检测手段形成很好的互补,并帮助医护人员更好地制定个新化的治疗方案。
2021年5月28日,奥地利CeMM研究中心的Bock课题组联合奥地利圣安娜儿童癌症研究所的Tomazou课题组,在Nature Communications上发表题为Multimodal analysis of cell-free DNA whole-genome sequencing for pediatric cancers with low mutational burden的文章。研究人员对95位尤文肉瘤患者,31位其他种类肉瘤患者,加上22位健康对照组中采集的共241份游离DNA样本进行了深度测序,并且对DNA片段的分布进行了详尽的分析。运用生物信息学和机器学习算法,研究人员总结出与尤文肉瘤相关的游离DNA片段分布规律和相关表观遗传特征,还建立了游离DNA片段与儿童实体瘤的临床关联。
研究人员首先在宏观上统计了DNA片段的长度分布。他们发现,尤文肉瘤样本的游离DNA片段长度明显短于健康对照组样本,长度集中于167bp——这与和单位核小体环绕的DNA长度相近。研究人员还发现,游离DNA片段长度偏短这一现象并不是尤文肉瘤独有的,在许多成伦肿瘤(肺癌和结肠癌)以及其他儿童肉瘤样本中也存在相同的现象。
另外,在许多未检测到肿瘤标志物的尤文肉瘤患者中,游离DNA片段长度仍然明显短于健康对照组。此外,研究人员还利用长度偏短这一特征,发现对游离DNA片段进行长度过滤,能提高尤文肉瘤样本中基因拷贝数变异检测的灵敏度。由于儿童肿瘤中基因拷贝数变异的现象相对不普遍,游离DNA片段长度分析或许能与传统检测手段形成互补,对未来的临床研究和检测可能大有帮助。
短游离DNA片段(20-150bp)在儿童肉瘤和成伦癌症样本中的比例分布(对比健康人对照组)
除宏观统计外,研究人员还着重分析了在不同基因组位点上游离DNA片段长度的富集差异。研究人员首先将全基因组分为100kb的连续区间,然后计算每个区间内短片段(100~150bp)和长片段(151~220bp)的数量比(S/L比),并与健康对照组的结果进行比较。他们发现在尤文肉瘤和其他儿童肉瘤中,肿瘤DNA片段的S/L比在整条染SE体中并不是均匀分布的,而且这种差异分布现象在移除带有拷贝数变异的区间后仍然存在。
为了探索这种差异分布的生物学意义,研究人员随后将存在差异分布的基因区间序列用LOLA软件做了富集分析,结果显示高S/L比(短片段集中)的位点与尤文肉瘤样本的H3K27ac ChIP-seq和尤文肉瘤特异的DNase I易感位点互相吻合,显示它们处于染SE质开放状态,在其他类型肿瘤样本中则没有检测到这种特殊现象。
尤文肉瘤,其他儿童肉瘤和健康样本中对比对照组log2(S/L)值在不同染SE体臂的分布
鉴于游离DNA片段化在整个基因组的不均匀分布体现了尤文肉瘤肿瘤细胞的染SE质结构,研究者进一步探索在未知遗传改变的条件下,检测游离DNA肿瘤来源的可行新。为此,研究人员开发了一款名为LIQUORICE(liquid biopsy regions-of-interest coverage estimation)的软件,用于比对游离DNA片段和与各种不同癌症相关的目标基因区域,并计算不同位点的游离DNA覆盖率。当应用LIQUORICE在尤文肉瘤的样本时,研究人员计算了以下四种目标基因区域的片段覆盖率:1)尤文肉瘤特异的DNase I染SE质开放位点;2)EWS-FLI1结合位点;3)EWS-FLI1正相关增强子;4)EWS-FLI1负相关增强子。
在尤文肉瘤患者,特别是在可检测到肿瘤标志物的样本中,LIQUORICE结果显示游离DNA在1-3类位点的覆盖率相比其他肉瘤和健康对照组显著下降。为了证实EWS调控区域游离DNA的减少反映肿瘤的表观状态,研究人员还对尤文肉瘤样本在全基因组规模做了甲基测序,结果显示在出现覆盖率下降的位点中,这些位点的甲基化程度显著降低,以此确认在片段覆盖率下降与染SE质结构改变相关。
对照组和肿瘤样本游离DNA片段在不同目标基因区间的覆盖率
最后,研究人员运用机器学习方法,探索能否通过游离DNA片段中隐藏的信息来预测尤文肉瘤病例。他们用文中提及的三种片段的定量统计方法(宏观片段大小,片段全基因组区间分布S/L比,目标基因组区间片段覆盖率),加上拷贝数变异作为输入数据进入分类器,发现训练后的分类器模型能够准确分辨尤文肉瘤病人和健康人的游离DNA(AUC值=0.97)。另外,训练后模型分类的灵敏度大大高于基于遗传学的传统分类方法(例如通过全基因组测序检测EWS-Ets融合基因),即使在0.1x的测序深度下分类器依然能准确区分尤文肉瘤样本信息。
分类器预测尤文肉瘤和健康对照组样本的ROC曲线图
综上所述,这份研究中展示了运用液体活检中游离DNA片段信息的新思路。区别于传统肿瘤标志物检测,游离DNA片段大小,在全基因组区间片段长度的差异分布,以及在目标基因区间的不同覆盖率均可以有效标记尤文肉瘤样本。通过生物信息学分析,研究人员还充分说明了游离DNA片段中包含了重要的表观遗传信息。由于许多儿童肿瘤的基因突变率相比成伦癌症要低,这项研究提出的游离DNA片段模式分析,有潜力提升儿童肿瘤的临床检测与监控效率。
撰文
责编
制作
排版 | 车洁 校对 | uu