科学研究

“女娲”来了!威尼斯电子游戏大厅郭国骥团队Nature Genetics发文 提出深度学习模型Nvwa并揭示细胞命运决定的共性规律

发布日期:2022-10-14 点击次数:

309.jpg


       2022年10月13日晚,Nature Genetics在线刊登了威尼斯电子游戏大厅郭国骥教授和威尼斯电子游戏大厅基础医学院韩晓平教授团队的学术论文“Deep learning of cross-species single cell landscapes identifies conserved regulatory programs underlying cell types”。该研究利用自主构建的高通量单细胞测序平台Microwell-seq绘制了斑马鱼、果蝇和蚯蚓的全身单细胞转录组图谱,并探究了八种代表性后生动物细胞类型的跨物种可比性,揭示了脊椎动物细胞类型保守的调控程序。此外,该研究提出了深度学习模型Nvwa(女娲),首次实现了完全基于基因组序列预测单细胞分辨率下的基因表达。该研究基于Nvwa模型学习衍生的谱系特异性基序,表征了跨物种细胞类型特异性的调节程序。

       预测基因表达和解析基因调控机制一直是基因组学的重要目标。在单细胞分辨率下进行生物体规模的表达预测对研究人员而言仍具有挑战性。如今单细胞图谱可以统一的标准呈现物种细胞的表型,因此有机会使用跨物种的单细胞数据来探索进化过程中不同细胞类型的表达和调控程序。研究团队假设可以直接从基因组序列预测生物体规模的单细胞基因表达,并试图在具有巨大细胞类型多样性的后生动物中检验这一假设。


      该研究中,研究人员首先使用其团队自主研发的高通量单细胞测序平台Microwell-seq绘制了斑马鱼、果蝇和蚯蚓的全身单细胞转录组图。其中,斑马鱼图谱收集了635,228个单细胞数据,果蝇图谱涵盖了276,706个单细胞数据,蚯蚓图谱包含了95,020个单细胞数据。该研究利用这三种模式动物的单细胞图谱,并结合其他五种代表性动物的单细胞图谱(人类、小鼠、海鞘、线虫和涡虫),挖掘了跨物种细胞谱系特异性的转录因子,探究了八种代表性后生动物细胞类型的跨物种可比性,揭示了脊椎动物细胞类型,特别是免疫细胞、基质细胞、神经元、上皮细胞、内皮细胞和生殖细胞的保守调节程序。


       研究团队表示,斑马鱼、果蝇和蚯蚓作为后生动物重要的进化节点,全身单细胞转录组图谱的绘制将有助于解析物种进化进程中细胞命运的决定机制。

640 (3).png



基于DNA序列编码基因表达模式的假设,该研究提出了深度学习模型Nvwa首次实现了完全基于基因组序列预测单细胞水平的基因表达,且预测准确度与实验测量精度相当。值得注意的是,Nvwa模型可以高度准确地预测几乎所有测试物种的基因表达。此外,通过检查模型第一层的卷积的基序特征Filter,团队揭示了细胞类型特异的基序。这些基序与在特异细胞类型中作用机制明确的转录因子基序相一致。基于Nvwa模型Filter的跨物种比较,该研究还发现同源Filter倾向于保持跨物种的细胞类型特异性。该工作首次建立了物种层面基因组编码细胞图谱的整合模型,并为解码多物种基因调控程序提供了宝贵资源。

图片


       威尼斯电子游戏大厅坚持“四个面向”,着重创新思维模式将临床治疗和基础医学研究连接起来,强调“从临床到基础”以及“从基础到临床”的双向转化,更好地服务人民生命健康。值得一提的是,Nvwa模型将为组学和精准医疗研究提供强大的技术支撑。例如:基于Nvwa模型可以实现多组学大数据整合的序列建模;利用Nvwa模型可以大规模解码单细胞尺度下的疾病/肿瘤基因组,进一步开发基因组学功能预测工具;应用Nvwa模型解析基因组序列的特性,实现DNA序列突变效应的预测,有助于筛选与复杂疾病关联的突变效应等。



       威尼斯电子游戏大厅特聘研究员王晶晶威尼斯电子游戏大厅基础医学院2019级直博生李佳琦博士后张霈婧汪仁英为本文共同第一作者。郭国骥教授、韩晓平教授和王晶晶研究员为本文的通讯作者。研究获得了国家重点研发计划国家自然科学基金的支持。

 
原文链接:
https://www.nature.com/articles/s41588-022-01197-7