EN
资讯中心 新闻中心 华大基因自主研发的GSA算法技术文章发表在BMC Bioinformatics

华大基因自主研发的GSA算法技术文章发表在BMC Bioinformatics

日期:2021.11.24

浏览次数:583

今日,华大基因在BMC Bioinformatics上发表了自主研发的GSA(Genomic Scar Analysis)算法技术文章(GSA: an independent development algorithm for calling copy number and detecting homologous recombination deficiency (HRD) from target capture sequencing , DOI 10.1186/s12859-021-04487-9),该文章系统性地阐述了华大基因这款基于东亚人群高频SNP位点特征设计的靶向捕获Panel,以及自主研发的GSA算法。该算法的核心点在于树状递归分段模块、肿瘤纯度和倍性矫正模块,并基于临床样本的BRCA双突变特征,确定了本方法的生物学阈值为30分。



随着奥拉帕利、尼拉帕利等PARP抑制剂药物临床试验数据不断公布,筛选PARP抑制剂获益人群的生物标志物也从胚系BRCA突变、体系BRCA突变扩大到了同源重组修复缺陷检测。已有多项临床试验证实,相比于只检测BRCA,同源重组修复缺陷检测能够发现更多PARP抑制剂受益人群。同源重组修复检测主要是通过评估杂合性缺失(LOH)、端粒等位基因不平衡(TAI)和大区段重组异常(LST)得到的“基因组瘢痕”状态,并结合包含BRCA1/2在内的HRR通路基因变异检测,进行综合评估。

华大基因自主研发的华然迪系列产品,就是采用了这套核心的GSA(Genomic Scar Analysis)算法。它从同源重组修复缺陷导致“基因组瘢痕”这一现象出发,通过定制化模拟全基因组特征位点的Panel,检测杂合性缺失(LOH)、端粒等位基因不平衡(TAI)、大区段重组异常(LST),并加入了纯度和倍性矫正的算法模块,综合分析基因组的不稳定状态,使得检测结果更能反映真实的同源重组修复状态。

接下来,跟随小编一览文章核心内容:

01 基于靶向捕获方法的基因组不稳定性评估的Panel设计原则:SNP位点的密度和均匀程度

由于HRD评分需要衡量整个基因组的不稳定性状态,SNP位点的选择应能代表整个基因组。WES芯片具有足够数量的SNP位点,但均一性欠佳;常规Pan-Cancer芯片中SNP位点的数量和均匀程度,大多聚焦于肿瘤驱动基因的编码区,均无法满足HRD的分析需求。华大基因基于东亚人群的高频SNP位点设计了一款HRD靶向捕获Panel,SNP位点均匀分布于整个基因组上。


图1:SNP array、HRD panel、WES、Pan cancer四种检测方法的位点覆盖均匀性比较

02 树状递归分段算法和离群点去除算法可高效、准确地预测染色体各个片段的基因型

基因型是否判断准确,主要取决于BAF和拷贝数之间是否符合逻辑关系。将GSA算法预测的基因型结果与PureCN和ASCAT两个软件的预测结果进行了对比,GSA算法可以准确地给出符合逻辑关系的基因型并且添加了离群点去除的算法,减少离群点对基因型判断结果的影响。


图2:用于基因型推断的BAF与拷贝数的对应关系(以2号染色体为例)

03 基于FFPE样本特性的肿瘤细胞纯度和染色体倍性矫正

用于肿瘤基因检测的样本常为石蜡包埋样本,其肿瘤纯度不尽相同;从195例临床样本的倍性值的分布范围(1.41-4.07)可以看出,在真实世界中异倍性的样本占比较大。因此,在计算HRD分值时考虑肿瘤纯度和异倍性的影响是十分必要的,但这一矫正算法也有相应的最低检测限,通过细胞系真实混样和临床样本模拟混样的检测结果可知,当肿瘤纯度高于20%时,GSA算法可准确的去除检测样本的肿瘤细胞纯度和异倍性的影响。

04 基于以上的算法优化,以SNP Array作为对比方法,HRD Score检测一致性可达到0.98

作为基因组瘢痕检测方法的金标准,Affymetrix OncoScan Assay是一种基于SNP Array技术的检测产品,可实现50-300kb的CNV和LOH的检测,但由于其需要特殊的检测设备,便利性较差,成本较高。经过优化,华大基因HRD Panel与SNP Array检测方法计算得到的HRD Score的一致性可达到0.98。



图3:HRD Score及各检测指标与对比方法Affymetrix OncoScan™ Assay的一致性比较

05 GSA算法的阈值如何确定?

基于195例临床样本,采用ROC曲线的方法,以BRCA-Deficiency样本为阳性集合,以BRCA野生型样本为阴性集合,以达到95%的灵敏性为目标,确定了本方法的生物学阈值为30分,最终ROC面积为88.3%,灵敏度为95.2%。



图4:用于HRD Score生物学阈值确定的ROC曲线

华然迪®只为提供精准的同源重组修复检测方案

华大基因基于中国人群的遗传多态性数据,自主设计了一个能够覆盖约十万个单核苷酸多态性(SNP)位点的panel,在确保纳入的SNP位点与中国人群一致的同时,又能有效覆盖整个基因组;并自主开发HRD score核心算法(GSA)。同时考虑到HRR胚系信息对患者及其亲属遗传风险的重要性,以及免疫治疗方面的重要性,推出了能够满足不同需求的一站式检测方案——华然迪®同源重组修复(HRD)检测系列产品,只为提供一个全面的科学的检测产品,为患者带来更多的获益。


上一篇:开启肿瘤精准诊疗新篇章!郴州市第一人民医院&华大基因共建肿瘤基因分子诊断中心 下一篇:Signatera (MRD) 检测用于泛癌免疫治疗监测纳入美国政府Medicare医保

CopyrightⒸ BGI 2022 版权所有 深圳华大基因股份有限公司 all rights reserved.  粤ICP备16021117号

收藏本站 法律声明