DNA 甲基化与癌症
癌症中 DNA 甲基化的改变已经被认为是开发强大的诊断、预后和预测疾病发生生物标志物较有潜力目标。尽管有超过 14000 份文章中描述了基于 DNA 甲基化的生物标记物及其在癌症中的临床联系,但只有 14 种生物标记物被转化为商业化的临床测试。方法上和实验上的障碍都是造成这种巨大差异的主要原因,但是基于 DNA 甲基化的生物标记的基因组位置是一个内在的和必要的属性,它也有一个重要的和经常被忽视的作用。作者检查了 DNA 甲基化的位置对癌症生物标记物的发展的重要性,并通过商业上可获得的测试,详细研究了各种生物标记物的基因组位置和其他相关特征。作者还强调了公共数据库对 DNA 甲基化发展的价值。
DNA 甲基化生物标志物
在 2003 年,Peter Laird 表达了他对 DNA 甲基化生物标志物的信心,他相信近期人们对 DNA 甲基化在人类癌症中作用的理解所取得的进展,有一天会产生大量强有力的以 DNA 甲基化为基础的生物标记物,特别是用于癌症诊断。这种信念是基于大量的 DNA 甲基化的变化特征,使他们有成为生物标志物的前途:这些变化频繁地发生在癌症早期,容易被现有技术发现,DNA 甲基化在固定的样本中有稳定性,各种体液和细胞类型特异性样本中均存在。DNA 甲基化作为肿瘤标志物已经被大量发表。为了更准确地定义这个数字,作者在 PubMed 数据库中搜索描述 DNA 甲基化的生物标志物的出版物。根据对这些出版物中有代表性的子集进行人工整理,共检索到 14,743 篇研究文章,估计有 1,800 个标志物。然而,只有 14 个以 DNA 甲基化为基础的生物标记物目前已在市场上出售,共涉及 13 个基因:
1、Glutathione S- transferase P (GSTP1);
2、Adenomatous polyposis coli protein (APC);
3、Ras association domain- containingprotein 1 (RASSF1);
4、N- myc downregulated gene 4 (NDRG4);
5、Bone morphogenetic protein 3 (BMP3);
6、Septin-9 (SEPT9);
7、Short stature homeobox protein 2 (SHOX2);
8、Twist related protein 1 (TWIST1);
9、Homeobox protein OTX1 (OTX1);
10、One cut domain family member 2 (ONECUT2);
11、Methylated-DNA-protein- cysteine methyltransferase (MGMT);
12、Branched- chain-amino- acid aminotransferase, cytosolic (BCAT1);
13、DNA- binding protein Ikaros (IKZF1)。
这 14 种生物标志物,只有 9 种(GSTP1,APC、RASSF1、NDRG4、BMP3、两个 SEPT9 生物标志物、SHOX2 和 MGMT) 已被纳入一个或多个临床指南。此外,只有两项测试获得了 FDA 的批准:结肠卫士(NDRG4 和 BMP3) 用于分析粪便样本 DNA 和 Epi proColon (SEPT9) 用于便潜血的检测。甲基化标志物转化的成功率也就 0.8%。
DNA 甲基化标志物的临床转化
上述的转化成功率以及目前公众对科学研究的可靠性和效率的讨论,都值得作者反思,为什么很少有 DNA 甲基化的生物标记从发现和发表过渡到临床试验。这个问题的答案是复杂的、多方面的,主要与小样本测试和缺乏实质性的临床价值,以及各种方法的说明(如有偏差的病人选择、研究设计和数据分析不当,缺乏验证和 / 或不恰当的报告),这些妨碍了彻底评估生物标志物的临床价值。此外,开发定量分析特定生物标志物(包括提供验证和探索临床应用的试验)所需的资金投入是一个主要障碍。这些问题并不是基于 DNA 甲基化的生物标志物所特有的。生物标志物研究领域的研究人员普遍面临着类似的问题,尽管这些问题直到现在才开始得到解决。
除了围绕临床转化已有的问题,作者相信在癌症患者 DNA 甲基化生物标志物的发现和临床应用之间存在另一个经常被忽视的障碍。在 2011 年的时候,作者就发文强调过甲基化所在基因组位置对于生物标志物应用的重要性。作者认为,更好地理解和更详细地分析 DNA 甲基化的基因组位置的临床相关性,可以增加成功被转化的生物标志物的数量。从这个角度来看,目前公开的表观基因组数据为更好地选择基于 DNA 甲基化的生物标志物的位置提供了机会。
位置的重要性
传统上,DNA 甲基化研究和基于 DNA 甲基化的生物标志物研究主要集中于肿瘤抑制基因启动子 CpG 岛的高甲基化效应。然而,即使在单个启动子区域内,并非所有 CpG 岛在功能上都是相同的。例如,转录沉默通常是由启动子的一个或多个小部分的甲基化控制的,而不是由整个启动子区域控制的。因此,识别临床相关 CpG 岛的准确定位是发展 DNA 甲基化的生物标志物研究的重要一步。
应用于诊断的甲基化标志物
在一些研究中,GSTP1 的甲基化已被报道为一种很有前途的肝细胞癌(HCC) 诊断标志物,但特异性水平差异很大。这种差异被假设为是由于检测同一启动子的不同特定部分的造成的。研究人员采用亚硫酸氢盐测序发现,GSTP1 启动子的 5ʹ区域区分肝细胞癌和非恶性肝细胞癌肝脏疾病或没有确定的病理改变的肝脏组织特异性更强比 3ʹ启动子(分别为 97.1% 和 60%; P <0.001)。同一研究团队,在研究 RASSF1 的甲基化作为 HCC 早筛标志物时得出类似的结论(特异性依次为 72.9%,27.1% 和 38.6%,敏感性为固定的 90%;p<0.0001)。
预后甲基化标记
在之前的研究中,作者分析了 GREM1 启动子 CpG 岛内的三个不同的基因组区域,发现在这些区域中,只有一个区域的 CpGs 甲基化与透明细胞肾细胞癌(RCC) 患者的不良预后相关;风险比(HR) 2.32, 95% CI 1.52-3.53;P = 0.001)。胃癌患者也观察到类似的结果,MAL 启动子区的甲基化与胃癌的预后相关,并下调基因表达,该特定的启动子区域高甲基化靠近转录起始位点(TSS)。研究人员描述了位于 CpG 岛外的 NMDAR2B 基因启动子的一个小区域的甲基化与食管鳞状细胞癌患者和疾病特异性生存结果之间的关系(HR 3.13, 95%) 可信区间 1.05 - -9.72;P≤0.006),而 DNA 甲基化在另外两个位置,位于 TSS 下游和内侧 CpG 岛与患者预后无相关性。
有趣的是,单个 CpG 二核苷酸的甲基化状态,而不是包含多个 CpG 二核苷酸更广泛区域的甲基化状态已经被证明会影响基因表达的调控。在 CLL 中,ZAP70 基因经过高分辨率的甲基化扫描后发现,一个单 CpG 位点(TSS 下游 233bp 处)的甲基化状态与病人的预后显著相关。
早筛的甲基化标志物
在描述 MGMT 甲基化对胶质母细胞瘤患者的预测力的研究中,MGMT 的甲基化状态是通过甲基化特异性来评估的 PCR (MSP),使用引物仅覆盖 MGMT 基因的外显子和启动子区域的少量 CpG 二核苷酸。甲基化与 MGMT 表达和 / 或活性之间的直接相关性未被研究。在这一发现之后,许多 25 - 27 岁的研究者使用诸如焦磷酸测序等定量技术对 MGMT 基因的启动子区域进行了更详细的分析。这些研究的目的是为了对特定的甲基化模式有更深入的了解,以确定 转录调控中是重要的 CpG 二核苷酸,并确定临床价值的甲基化变化区域。已经发表的关于与 MGMT 表达相关的特定甲基化区域,甚至单个 CpG 二核苷酸的结果是相互矛盾的。商业化的 PredictMDx 产品测试所覆盖含的 CpGs 75-78 区域是目前研究建议的区域,该区域的 CpG 二核苷酸甲基化已被反复证明与有利的患者预后相关。
基因组结构
特定 CpG 二核苷酸在单个基因组区域的甲基化,可以调节转录,也可以决定生物标志物的临床价值。因此,确定一个潜在的相关的基因组位置对以 DNA 甲基化为基础的生物标志物很重要。除了位置之外,DNA 甲基化的基因组背景也必须考虑,例如,不同功能区域的存在,如外显子或增强子。这些不同区域的存在与甲基化特征有关。启动子区 CpG 岛往往是低甲基化的,而基因 body 区,特别是外显子区往往是甲基化的。2012 年发表的研究表明,在发育和疾病过程中,基因间区和基因内区 DNA 甲基化的改变都受到调节,这些改变积极参与了转录的调控。非启动子位点的甲基化在几个重要过程的调控中发挥作用,包括剪接、来自替代启动子的替代转录本的表达和增强子激活,尽管这种 DNA 修饰仍然是生物标志物开发的一个很大程度上未被探索的领域。然而,潜在的临床应用已经证明甲基化为基础的生物标志物在某些非启动子位置。例如,对于 15q25 染色体区域的多个邻近基因的长期表观遗传沉默(LRES) 呈阳性的胃癌患者,其疾病复发的风险较低(HR 0.6;95% 可信区间 0.38 - -0.94;P = 0.027)。异常增强子高甲基化也被证明是预后的患者生存 RCC (log- rank P < 0.05)。随着作者对这些类型的 DNA 甲基化模式的生物学和效应的理解进步,作者将毫无疑问地看到,启动子区域之外的甲基化生物标志物数量将会增加。
生物标志物的发展
为了使特定基因组位置的甲基化成为一个良好的生物标志物,必须在临床检测出感兴趣的组之间甲基化的显著差异:
例如,作为诊断生物标志物区分肿瘤和非肿瘤组织; 预后标记区分高危疾病患者和低危疾病患者; 或者预测标记区分有反应者和无反应者之间。理想情况下,相关基因在两组之间应该有差异表达。候选诊断生物标志物的一个经典例子是肿瘤抑制基因启动子的高甲基化。甲基化和基因表达之间的联系提供了一个清晰的生物学原理,但基于 DNA 甲基化的生物标记不一定与基因表达的可测量变化相关联。例如,在商业化的生物标志物中,有 4 个(APC、RASSF1 和 SEPT9 两个生物标志物)没有显示 DNA 甲基化和相关基因表达之间的相关性。
结论
十多年前,以 DNA 甲基化为基础的生物标记物被认为是癌症生物标记物研究的下一个“大事件”,但到目前为止,它们一直难以达到预期。对于为什么如此之少以 DNA 甲基化为基础的生物标记物商业化,有几种可能的解释,但作者认为 DNA 甲基化与其高精度的基因组位置之间的复杂关系是主要障碍之一。为了减少已发表的生物标志物数量和临床使用的生物标志物数量之间的差异,作者制定了三个简单的建议来开发基于 DNA 甲基化的生物标志物。根据这些建议开发的生物标志物并不能保证是可重复的或临床相关的,但是,至少 DNA 甲基化的生物标志物障碍,确定临床相关的区域,可以通过分析公开可用的数据来克服。为了系统地评估基于 DNA 甲基化的生物标记物的表现,并支持未来对此类生物标记物的发现和验证的准确报告,作者正在开发一个包含所有已发表生物标记物数据库,以及一个生物标记物的报告标准。作者希望这些建议和持续的努力将有助于提高基于 DNA 甲基化的标记的性能,促进可重复性,并减少目前在这一领域产生的研究浪费。
更多伯豪生物服务