靶向长读长测序解决复杂结构变异并且发现其
白癜风初期如何治疗 http://pf.39.net/bdfyy/bdfrczy/150920/4698985.html介绍临床和研究中的常规基因检测已经发现了许多罕见遗传病的致病基因并提高诊断率,但是仍有大约一半的孟德尔遗传病病人没有获得诊断。广义上讲,未诊断的患者可以分为两类:1)DNA序列改变或结构变异和临床表型不完全匹配(例如,意义未明变异);和2)常规检测手段,包括全外显子检测(WES),不能发现任何符合表型和遗传模式的候选变异。新的工具和技术提供了一个可能提高诊断率的方法。临床检测技术,例如染色体微阵列(CMA)和WES不能提供人类基因变异的全部类型。结构变异(structuralvariants,SV),例如动态突变、插入、缺失或重排,可能构成了许多未检测到的致病变异,但是这些变异使用现存的短读长测序很难被检测到。长读长测序技术测序天然DNA分子,产生的reads长度为-万个碱基对,同时能够提供DNA甲基化的信息。长读长测序在检测结构变异上的优势已经得到证明。然而,在全基因组范围测序足够的长读长测序成本仍旧昂贵,使得比较短读长测序和长读长测序的研究仍旧具有挑战性,并延缓了其在临床上的应用。现在的技术允许通过PCR富集或者Cas9介导的靶向分离对特定基因组范围进行长读长测序(靶向长读长测序targetedlong-readsequencing[T-LRS])。但是这种方法会移除一些关键信息,例如DNA的甲基化状态,这需要时间来进行设计优化。并且这种方法只适合相对适度的基因组靶点。为了克服这些限制,作者提供了一种算法来通过OxfordNanoporeTechnologies(ONT)技术对天然DNA进行选择和测序。这种方法,即ReadUntil,它根据设定的目标序列接受或拒绝DNA分子进行测序,并且可以实时控制。作者通过检测已知的致病性结构变异(例如拷贝数变异(CNV),动态突变和易位)来验证使用ReadUntil的靶向长读长测序的敏感度和特异度。样本来自临床检测发现结构变异的33个患者。在6/7个有复杂结构重排的病人中,靶向长读长测序对突变有更具价值的分辨率,并且改变了1个病人的临床管理。有9个病人已知或怀疑为常染色体隐性遗传或X连锁的孟德尔遗传病,但是临床检测只有1个(n=7)或者没有(n=2)致病性变异。靶向长读长测序在这9个病人中找到了7个人的可能致病变异。此研究的结果表明,靶向长读长测序作为临床检测具有潜在的额外价值,可以经济有效的评估复杂结构变异,或者发现高优先级候选基因中的致病性变异。结果使用ReadUntil的靶向长读长测序可以快速选择并且实时发现候选基因组区域的致病性变异。作者使用这种方法直接测序了37个人(33个患者和4个亲代)的DNA,样本有血液,唾液和细胞系。其中11个病人有已知的致病CNV或易位,6个病人有已知的致病性动态突变,7个病人有已知的复杂重排,9个病人已知或怀疑为常染色体隐性遗传或X连锁的孟德尔遗传病,但是临床检测只有1个(n=7)或者没有(n=2)致病性变异。靶向长读长测序检测已知致病结构变异11个病人有已知的致病CNV或易位(通过染色体微阵列(CMA)、核型分析或短读长测序发现)。这部分病人包括常见的孤独症和发育落后相关重复出现缺失(chr15q11.3,16p11.2,22q11.1和1q21.1)。作者对每个病人进行单细胞流的靶向区域(1-33Mb)进行了10-62x的测序。在所有的11个病人的期望区域中都发现了断裂点。在4/11个病例中,靶向长读长测序提供了断裂点区域的额外信息,阐明了一个串联方式的复制,并且发现了一个既往未知的不平衡易位。对缺失区域的正常同源染色体序列进行评估,未发现致病或可能致病的变异,与这些结构变异的显性效应一致。靶向长读长测序检测已知动态突变和甲基化状态之后,作者检测了6个携带已知动态突变的患者,包括脊髓小脑共济失调、Friedreich’s共济失调,脆性X和Baratela-Scott综合征。后两种动态突变使用标准测序尤其难以检测,因为它们的长度和高GC含量。通常检测动态突变和甲基化需要耗时的Southernblot和甲基化敏感酶。作者对携带FMR1,FXN,ATXN3,ATXN8OS或XYLT1动态突变的6个病人进行了最低8x的测序。在每一个样本中都检测到了致病性重复扩增,至少有1个read横跨了整个重复范围,可以更准确的评估等位基因的大小。同时也能检测扩增等位基因的精确序列。在一些例子中,尤其是从细胞系中采集的DNA,扩增的长度比预期更加多变。例如在一个杂合FXN扩增的细胞系中,优势等位基因有-个重复单位,作者的基于序列的估计发现了-个重复单位。这个结果与以前的研究一致,即细胞系或体细胞嵌合的重复扩增长度不稳定。XYLT1基因5’UTR区的GGC重复最近被证明通过甲基化和转录沉默导致Baratela-Scott综合征。来自这个研究的两个受累家系的靶向长读长测序使得作者可以利用一次检测同时测定重复扩增长度,序列GC含量和甲基化。比较每个人的read长度和甲基化发现,先证者母亲的一些前突变单体型的reads被甲基化了,提示她的一部分细胞(但不是全部)抑制了这个扩增。这样,对天然DNA的靶向长读长测序就提供了分别检测动态突变和甲基化不能提供的细节。有趣的是,从一个细胞系中检测到的FMR1基因的CGG重复提示这个疾病位点没有被甲基化,尽管它有大约个拷贝。这个发现和一项最近观察到的结果一致,即脆性X的突变等位基因在重复-个拷贝之间时甲基化不能稳定维持,如果这个等位基因是母源的,可能提示患者的表型较轻。靶向长读长测序同时检测动态突变和甲基化状态XYLT1基因5’UTR区的GGC重复最近被证明通过甲基化和转录沉默导致Baratela-Scott综合征。(A)Baratela-Scott综合征家系的Southernblot证明先证者在两个KpnI酶限制位点之间的区域GGC扩增。母亲携带一个前突变等位基因和一个野生型等位基因。父亲携带两个野生型等位基因。(B)靶向长读长测序检测到的片段长度和Southernblot一致。(C)先证者的GGC重复造成5’UTR区和1号外显子甲基化。红色reads为甲基化DNA。(D)GCC重复单体型的测序结果,PacBioCLR测序结果和Southernblot以及Nanopore测序结果一致。靶向长读长测序可以进一步分析复杂结构重排的特征为了验证靶向长读长测序的额外诊断价值,作者对7个CMA或核型分析提示复杂重排的病人进行检测。作者提出靶向长读长测序可以在这些病人中发现额外临床信息的假设,之后对15-Mb大小的靶向基因组区域进行7-39x测序。作者发现了精确的重复或缺失断裂点。在另外3个人中发现了额外的CNV(重排或易位)。例如在患者S,CMA发现了3个chr6上的不连续的缺失,跨越5Mb的范围。已知缺失附近的15Mb的长读长测序还发现了2个额外的缺失和1个额外的与缺失无关的重排。这个发现提供了新的候选基因,例如IPCEF1和CNKSR3(下图A)。作者在其他受累个体发现了更广泛的染色体差异。例如S,临床检测发现多个缺失和易位。为了进一步评估这些差异,作者使用1个细胞对74Mb的靶区域进行~27x的测序。但是结果提示重排在目标区域之外。所以测序了第2个细胞,测序了额外的77Mb。靶向长读长测序总共发现了11个易位,13个染色体间重组和6个缺失,这些位点都是有价值的,直接影响了12个基因,其中11个位点在临床检测中没有被报告。所有的断裂点都经过了低覆盖度PacBioHiFi全基因组测序验证(下图B)。在被结构变异破坏的12个基因中,有2个基因可能与常染色体显性遗传致心律失常性右心室发育不良(CTNNA3)和胸主动脉瘤(PRKG1)相关——这是2个临床发现。因此这名患者被转诊到心内科进行评估和心率监测。与患者S相似,患者S也在临床检测中发现多个结构变异。靶向长读长测序发现2个额外的缺失、5个重排和6个先前未检测到的易位。这些结构变异使得7个基因断裂,只有2个是根据之前的临床检测报告的。靶向长读长测序发现标准临床检测没有发现的结构变异(A)S患者的靶向长读长测序结果发现CMA没有发现的2个缺失和1个重排(倒位)。下面的“地铁图”表现了每一个区域是怎样连接并重建新的DNA序列和基因顺序的。(B)S患者的临床CMA结果发现chr4和chr14有3个缺失,核型分析显示chr2,4,10和14之间存在复杂易位。靶向长读长测序发现了11个易位,13个染色体间重组和6个缺失,直接影响12个基因。靶向长读长测序检测到常染色体隐性遗传或X连锁的孟德尔遗传病中未发现的变异有9个病人已知或怀疑为常染色体隐性遗传或X连锁的孟德尔遗传病,但是临床检测只有1个(n=7)或者没有(n=2)致病性变异。作者对他们进行了靶向长读长测序,在7个病人中的4个发现了致病/可能致病变异,1个病人发现了一个意义未明变异(VUS),2个病人没有第二个候选变异。在2个怀疑X连锁疾病的患者中找到了1个致病变异和一个VUS。新发现的变异包括缺失,移动元件插入,倒位,动态突变和预测影响剪接的内含子变异。2个病人被怀疑为隐性遗传病,分别是患者S(肾单位肾痨,HPHP4)和病人S(颅骨外胚层发育不良,WDR19)。测序发现他们在已知致病变异的反式位置存在影响剪接的罕见内含子变异(上图A)。作者通过PCR在S病人的成纤维细胞中验证了异常剪接。病人S患有Hermansky-Pudlak综合征,只有一个遗传自父亲的无义变异。靶向长读长测序在他的母源单倍型上发现了一个bp的缺失,这个缺失没有被CMA或WES检测到。这个缺失横跨整个外显子3,造成移码(上图B)。病人S患有Alstr?m综合征,只有一个无义变异,作者发现了在20号外显子有一个WES没有检测到的Alu重复移动元件插入(上图C)。病人S经生化检测确诊为Lesch-Nyhan综合征,靶向长读长测序发现HPRT1基因的3号内含子有一个bp的缺失,侧翼reads分析发现一个17Mb的染色体臂内倒位(上图D)。病人S是Stargardt病患者,WGS和ABCA4靶向测序没有发现,作者检测到了一个bp的复合逆转录转座因子插入,该插入由AluJ(SINE)和部分L2a、L2c、L2d2和L1HS(LINEs)组成。SpliceAI预测这影响了ABCA41号外显子的剪接(上图E)。最后,作者使用靶向长读长测序分析了一个DMD家系(X-link)。靶向长读长测序在先证者的DMD基因没有发现致病的单核苷酸变异,但是结构变异分析发现了内含子区有一个AGAA重复扩增(上图F)。患者的母亲也携带这个动态突变,健康哥哥没有这个动态突变。作者使用ExpansionHunter对~个短读长基因组进行分析,发现携带个或更多AGAA重复扩增的有72人,估计人群等位基因频率为0.4%。值得注意的是,71(98.6%)个携带长动态突变的人均为女性。讨论本文中作者证明了使用ReadUntil在ONT平台进行靶向长读长测序可以被用于检测临床出现的变异,例如单核苷酸变异,拷贝数变异(CNVs),动态突变和甲基化异常。因为可以通过计算定义目标区域,这项技术非常灵活,可以用来检测基因组的任何区域而不需要设计特定的实验。同时靶向长读长测序还能解决长读长测序在临床应用的一大阻碍——花费过高,将成本降到与短读长测序WGS相近。靶向长读长测序在临床上的应用范围包括筛选现有技术无法提供精确的基因诊断,发掘结构变异断裂点序列的细节,以及评估动态突变。张梦娜zmn