当前位置: 首页 公众版首页 > 新闻中心 > 综合新闻 > 正文

综合新闻

MED-X研究院数字医学研究所在Genome Biology发表重要研究成果

发布时间:2023-12-13   文章来源:MEDX研究院-数字医学研究所    作者:赵焕焕   责任编辑:王美英   (点击:)

基因组测序已经成为了生物医学研究必不可少的工具,通过对样本基因组水平精准分析可以更加深刻的解析肿瘤、遗传病等各类疾病的发病原因和微观机制,有助于寻找更加有效的干预控制手段。然而,在实际研究中,不同的测序平台、实验室环境或分析方法产生的基因组变异结果往往存在“批次效应”。这种“批次效应”对基因组重复区域变异、复杂类型变异和低频变异的影响更为显著,严重影响基因检测结果的可信度。在过去的几十年中,Genome in a Bottle(GIAB)、Sequencing Quality Control和Illumina Platinum Genomes等机构已经建立了许多变异基准和基因组标准物质。这些资源对规范优化基因组变异检测做出了显著贡献。然而,大多数这些研究主要覆盖简单的变异类型和简单的非重复区域,对于复杂事件和区域(例如重复区域)缺乏完整覆盖。

2023年12月4日,西安交通大学第一附属医院数字医学研究所叶凯教授团队联合院内肝胆外科和中国计量科学研究院在国际著名基因组学期刊《Genome Biology》(IF=12.3)上发表题为“Haplotype-resolved assemblies and variant benchmark of a Chinese Quartet”的研究论文,西安交通大学第一附属医院为第一完成单位。该研究对中华家系1号标准物质进行包括Illumina,MGI,PacBio和Oxford Nanopore Technology等在内的多平台测序。项目首先利用长度长测序技术对标准物质基因组进行单体型水平组装,组装结果达到了近似端粒到端粒水平,组装连续性高于当前常用的参考基因组GRCh38。研究人员接着对高质量单体型水平的组装序列和多平台测序数据进行分析,建立了一个高质量变异基准集。由于使用了高质量组装序列识别变异,该基准集覆盖了更多的复杂重复区域。最终的基准集包含3962453个单核苷酸变异(SNVs)、886648个插入缺失(<50 bp)、9726个大片段缺失(≥50 bp)、15,600个大片段插入(≥50 bp)、40个倒置、31个复杂结构变异和68个新生变异。同时,项目还利用高质量组装和高精度长度长测序技术对人类主要组织相容性复合体(major histocompatibility complex,MHC)区域进行了精准的解析。最后,项目研究了不同测序深度对组装质量和变异检测性能的影响,为基因组学研究中的测序实验设计提供了参考。

与近似纯合的完全葡萄胎样本相比,本项目对二倍体基因组的单体型组装更具有挑战。尽管如此,项目的单体型组装中有76%的染色体臂实现了无缺口组装。由于项目选取了具有两个生物学重复的标准物质进行了研究,有效减少组学实验和数据分析过程中引入的随机误差。此外,多平台测序和多策略数据分析有助于过滤变异基准集构建过程中的系统误差。

本项目所用的“中华家系1号”标准物质已经获得了国家市场监督管理总局颁发的8项国家一级标准物质证书(GBW 099000-GBW 099007)。该研究发布的变异基准集为“中华家系1号”标准物质提供了基因组变异水平的“标准答案”。“中华家系1号”标准物质和本研究对应的变异基准集为基因组变异分析过程提供了更加全面准确的“标尺”与“砝码”,有助于进一步规范临床基因组学相关的科学研究的开展

本项目相关研究得到了国家自然科学基金,科技部重点研发专项的资助。研究所涉及的标准物质均已获得国家人类遗传资源管理部门批准,相关数据开放获取已在国家人类遗传资源管理部门备案。

原文地址:https://doi.org/10.1186/s13059-023-03116-3

地址:陕西·西安市雁塔西路277号     邮编:710061

Copyright(c) 西安交通大学第一附属医院   陕ICP备12009712号-3号   技术支持:网络信息部