人类和黑猩猩的DNA仅百分之一不同。人类加速区域(HAR)是基因组的一部分,具有意想不到的这些差异。HARs在哺乳动物体内稳定了数千年,但在早期人类中迅速发生了变化。长期以来,科学家们一直想知道为什么这些DNA片段会发生如此大的变化,以及这些变异如何将人类与其他灵长类动物区分开来。
现在,格拉德斯通研究所的研究人员分析了数以千计的人类和黑猩猩HAR,发现人类进化过程中积累的许多变化具有相互相反的影响。
这有助于回答一个长期存在的问题,即为什么HAR在被冻结数百万年后进化得如此之快。HAR的初始变化可能会过度提高其活性,然后需要将其调低。”
凯蒂·波拉德(KatiePollard)博士,格拉德斯通数据科学与生物技术研究所所长,新研究的主要作者
她说,这些发现对理解人类进化具有重要意义。此外-因为她和她的团队发现许多HARs在大脑发育中发挥作用-该研究表明人类HARs的变异可能使人们易患精神疾病。
“这些结果需要尖端的机器学习工具来整合我们团队生成的数十个新数据集,提供一个新的视角来检查HAR变体的演变,”该研究的第一作者和高级研究员SeanWhalen博士说在波拉德的实验室。
由机器学习启用
Pollard于2006年在比较人类和黑猩猩基因组时发现了HAR。虽然这些DNA片段在所有人类中几乎相同,但在人类和其他哺乳动物中却有所不同。Pollard的实验室继续证明绝大多数HAR不是基因,而是增强子——;控制基因活性的基因组调控区域。
最近,Pollard的小组想要研究人类HAR与黑猩猩HAR在增强子功能方面的区别。在过去,这需要在小鼠中一次测试一个HAR,使用一种在HAR处于活动状态时对组织进行染色的系统。
相反,Whalen将数百个已知的人类大脑增强子和数百个其他非增强子序列输入计算机程序,以便它可以识别预测任何给定DNA片段是否为增强子的模式。然后他使用该模型预测三分之一的HAR控制大脑发育。
“基本上,计算机能够学习大脑增强剂的特征,”Whalen说。
Pollard和她的团队知道每个HAR在人类和黑猩猩之间都有多重差异,因此质疑HAR中的个体变异如何影响其增强子强度。例如,如果黑猩猩和人类HAR之间有8个DNA核苷酸不同,那么这8个是否都具有相同的效果,使增强子更强或更弱?
“很长一段时间以来,我们一直在想,是否HAR的所有变体都需要它在人类中发挥不同的作用,或者一些变化是否只是搭便车与更重要的变化一起搭便车,”波拉德说,他也是该组织的负责人加州大学旧金山分校(UCSF)流行病学和生物统计学系的生物信息学部门,以及ChanZuckerbergBiohub调查员。
为了测试这一点,Whalen应用了第二种机器学习模型,该模型最初旨在确定人与人之间的DNA差异是否会影响增强子活动。计算机预测43%的HAR包含两个或更多具有较大相反效果的变体:给定HAR中的某些变体使其成为更强的增强子,而其他变化使HAR成为更弱的增强子。
这个结果让团队感到意外,他们原以为所有的变化都会将增强子推向同一个方向,或者说一些“搭便车”的变化对增强子根本没有影响。
测量HAR强度
为了验证这一令人信服的预测,Pollard与加州大学旧金山分校的NadavAhituv博士和AlexPollen博士实验室合作。研究人员将每个HAR融合到一个小的DNA条形码上。每次HAR激活,增强基因表达时,条形码就会转录成一段RNA。然后,研究人员使用RNA测序技术分析任何细胞中存在多少条形码——表明HAR在该细胞中的活跃程度。
“这种方法更加定量,因为我们有精确的条形码计数而不是显微镜图像,”Ahituv说。“它的吞吐量也高得多;我们可以在一次实验中查看数百个HAR。”
当该小组对人类和黑猩猩脑细胞前体中的700多个HAR进行实验室实验时,数据模仿了机器学习算法的预测。
“如果机器学习模型没有产生这些惊人的预测,我们可能根本不会发现具有相反效果的人类HAR变体,”Pollard说。
HAR变体在增强子水平上进行拉锯战的想法与已经提出的关于人类进化的理论非常吻合:我们物种的高级认知也是导致我们患上精神疾病的原因。
“这种模式表明的是一种叫做补偿性进化的东西,”波拉德说。“增强剂发生了很大的变化,但也许变化太大并导致了有害的副作用,所以随着时间的推移,这种变化被调低了——这就是我们看到相反效果的原因。”
Pollard推测,如果HAR的初始改变导致认知能力增加,那么随后的补偿性改变可能有助于降低患精神疾病的风险。她补充说,她的数据无法直接证明或反驳这个想法。但在未来,更好地了解HARs如何导致精神疾病,不仅可以阐明进化,还可以揭示这些疾病的新疗法。
“我们永远无法让时光倒流,也无法确切地知道进化过程中发生了什么,”波拉德说。“但我们可以使用所有这些科学技术来模拟可能发生的事情,并确定哪些DNA变化最有可能解释人类大脑的独特方面,包括其患精神疾病的倾向。”