前言:
在生命学科高层次人才中心和生命中心的共同支持下,清华大学生命学科高层次人才培养中心论坛每学期会邀请不同领域报告人,进行专题学术报告,倡导由研究生策划、主持、主导午餐会和撰写新闻稿件,借此机会加强师生互动,增进学术交流与讨论。
2025年12月26日,受清华大学生命学院交叉方向王海峰老师邀请,弗吉尼亚大学医学院基因组科学系副教授、UVA综合癌症中心计算基因组学主任臧充之老师做客清华大学生命学科高层次人才培养中心论坛,围绕“Computational Methods for Chromatin and Transcriptional Regulation”主题进行学术报告,报告会在生物医学馆E109会议室顺利进行。
本次报告会由清华大学生命科学学院2023级博士生燕文杰主持。会议伊始,主持人介绍了臧老师的学术背景与研究成果,讲座吸引了众多学生和老师们前来参与。
图 1 主持人做开场介绍
臧老师首先指出,转录调控在细胞分化、癌症进展等众多生命过程中发挥核心作用,而高通量公共组学数据的爆炸式增长为系统解析转录调控机制带来了前所未有的机遇。其课题组以“数据驱动的发现”为核心理念,开发了系列计算工具,在染色质图谱解析、转录因子活性预测及癌症基因调控研究中取得突破性进展。
报告第一部分,臧老师介绍了他实验室研发的生信分析工具 BART。该方法仅需用户提供一组共调控基因或峰段,即可整合数万套公共 ChIP-seq 数据,精准预测驱动性转录因子。最近,团队推出 BARTsc(单细胞版)与 BART -Spatial(空间版),成功应用于人类肿瘤微环境、小鼠脑发育等场景,在灵敏度与特异性上均优于现有工具,相关软件已开源。

图 2 报告精彩瞬间
第二部分,臧老师聚焦染色质可及性数据的技术偏差。针对 ATAC-seq 的酶切序列偏好与 CUT&Tag 的“开放染色质污染”假象,团队分别开发了 SELMA 与 PATTY 计算模型,通过机器学习校正偏差,显著提升 footprints 识别与组蛋白修饰峰判定的准确性。经验证,校正后单细胞聚类及下游调控 motif 推断的精度均得到大幅提高。
第三部分,臧老师分享了“转录凝聚体”前沿故事。通过整合转录因子结合图谱,团队提出“簇生倾向指数”(Cluster Propensity),首次在基因组水平上将转录因子的空间聚集特性与其相分离潜力定量关联,并发现高簇生倾向的因子显著富集于超级增强子区域,且与癌症患者预后密切相关,为精准锁定癌症关键驱动因子提供了新视角。
图 3 臧老师与学生交流互动
报告结束后,主持人引导臧老师与报名学生前往生物医学馆 E303会议室参加午餐交流会。大家就计算工具开发经验、多组学数据整合策略及癌症转化研究合作等话题展开深入探讨,同学们纷纷表示受益匪浅。本次论坛在热烈的氛围中圆满落幕。

图 4 午餐会合影
在此,特别鸣谢生命科学联合中心、清华大学生命科学学院对此次论坛的大力支持。
嘉宾介绍
臧充之博士现任弗吉尼亚大学医学院基因组科学系副教授,UVA 综合癌症中心计算基因组学主任。本科毕业于北京大学物理系,于乔治·华盛顿大学获物理学博士学位,随后在哈佛大学 Dana-Farber 癌症研究院完成计算生物学博士后训练,2016 年加入 UVA 任教。臧博士在 Nature、Nature Methods、Genome Research 等国际权威期刊发表论文 80 余篇,主持多项 NIH 项目,并担任美国、英国、瑞士及荷兰等多国基金评审专家,现任 NIH MRAF 评审组常务成员。其课题组致力于开发创新计算模型与开源工具,系统解析染色质与转录调控网络,推动精准医学与癌症研究的发展。
供稿人:顾卜铭 清华大学生命学院21级博士生
王新铭 清华大学生命学院22级博士生
燕文杰 清华大学生命学院23级博士生