七座桥TM

基于工作流
为下一代
测序数据

将人类参考基因组表示为线性单倍体DNA序列,在尝试合并人类种群的已知遗传多样性时提出了限制. 这导致了基于图的引用的发展, 能够自然地表示所有的多态性, 包括插入, 删除, 结构变异.

七座桥伯爵™Suite包括用于下一代测序(NGS)数据二次分析的生物信息学工作流程和工具, 基于泛基因组图参考. 这些工具能够以更高的精度调用变量,而不会影响速度或成本. 伯爵™使用标准的基因组数据格式(FASTA, VCF, FASTQ, BAM, 补习, 床上), 确保与现有工作流的兼容性. 所有七桥伯爵™工作流程都在CWL 1中指定.0,确保跨各种计算环境的可移植性. 

七座桥梁伯爵™实现: 

  • 通过使用由数百万个体组成的特定人群基因组图进行大规模人口研究
  • 通过使用个性化基因组图和家族基因组图来精确分析个体基因组 新创 基因突变检测
  • 罕见病研究通过使用包含与疾病相关的突变的策展图

 

七桥伯爵™套件包括: 

工作流

  • 伯爵™种系变异检测工作流-使用包含来自世界各地许多人群遗传信息的泛基因组图. 工作流接受FASTQ中的输入读取, 补习或BAM格式, 以BAM或补习格式生成基于图形的对齐, 并以VCF格式输出各种调用. 在这篇博文中, k8彩乐园官方免费下载讨论了与其他线性或基于图形的方法相比,k8彩乐园官方免费下载的泛基因组方法的一些基本优势.
  • 伯爵™扩展种系变异检测工作流-利用一个祖先意识的基因组图(i.e. 一个特定于人口的参考),以增加对由图表参考所代表的人口的敏感性. 工作流还包含下游补充部分,用于合并和注释所有变量,并输出单个多样本VCF文件. 祖先意识的方法构成了针对目标人群研究的量身定制的方法. 在k8彩乐园官方免费下载最近的博客文章和预印本中,可以找到对非洲人口展示这种方法好处的结果.

图的引用

  • 伯爵™泛基因组参考-包含小变异(snp和INDELs长度可达数十个碱基对)以及较大的结构变异, 哪些通常难以从短读测序数据中识别. 因此, 图引用提供了一种方法,既可以准确地检测结构变化,也可以减少虚假的变量调用.
  • 伯爵™混合美国参考-策展从一套8,000个样本来自不同的公共数据库,涵盖了整个基因组. 从PacBio HiFi reads中获得的特定人群的结构变异增强了该图.
  • 伯爵™非洲参考-策展从一套超过20,从涵盖全基因组的各种公共数据库中收集的000个样本. 从PacBio HiFi reads中获得的特定人群的结构变异增强了该图.
  • 伯爵™东亚参考-从一套超过3,从涵盖全基因组的各种公共数据库中收集的000个样本. 从PacBio HiFi reads中获得的特定人群的结构变异增强了该图.
  • 伯爵™欧洲参考-策展从一套超过34,从涵盖全基因组的各种公共数据库中收集的000个样本. 从PacBio HiFi reads中获得的特定人群的结构变异增强了该图.
  • 伯爵™南亚参考-从一套大约3,从涵盖全基因组的各种公共数据库中收集的000个样本. 从PacBio HiFi reads中获得的特定人群的结构变异增强了该图.

服务

  • 伯爵™构建服务-由生物信息学方法和服务组成,能够构建具有代表性和准确的基因组图参考. 这种定制图形的预期用例可以从泛基因组和人口研究到个性化或疾病相关的应用.

工具

  • 伯爵™校准器-映射样本读取对照基因组图参考, 隐含地考虑到每个位点上有许多交替的单倍型, 从而使参考偏差最小化.
  • 伯爵™变体调用器-支持snp和indel的集成调用, 以及基因组图中存在的结构变异.
  • 伯爵™Stats -计算特定于图的对齐度量,并测量读对齐中图引用的利用率, 除了标准指标,如覆盖率, 地图上未标明的, 多映射读计数和不正确的对齐.
  • 伯爵™基因组查看器-一个基因组查看器,可以可视化图引用和对图引用边缘的对齐.

 

基因组图谱是一种功能强大的基因组数据结构

七座桥伯爵™Suite利用先进的数据结构生成有向无环图,从根本上重新思考了基因组变异数据的表示方式. 不同于标准线性引用, 这种结构利用来自整个种群的信息,以前所未有的准确性来描述遗传变异. 图结构具有从每一个新的序列个体中学习的潜力, 这意味着基于图表的参考可以随着每一个额外的基因组而改进. 更好的是, 这种改进只增加了很小的文件大小, 允许在种群规模上进行基因组分析.

伯爵™Pan Genome Reference将来自种群的基因组数据组织成基于边缘的序列变异图. 在这样的图表中, 边是主要的数据载体元素,可选单倍型表示为通过图的不同路径. 线性参考程序集构成图主干, 并且附加的变量被添加为图形中的新边. 一个更长的基因组单倍型可以通过通过图的路径和连接(子)序列所包含的访问边获得. k8彩乐园官方免费下载称这种结构为基因组图.

图谱基因组参考既可以包含小的变异(snp和indels长度可达几十个碱基对),也可以包含较大的结构变异, 使用短读测序技术通常难以识别哪些基因. 因此, 图引用提供了一个框架,既可以准确地检测结构变化,又可以减少调用小变量时的错误率.

找出如何构建更好的参考基因组

 

图结构支持精确的变量调用 

七座桥伯爵™套件实现了精确的变体调用-确定样本中存在的基因组变体集的过程. 目前最先进的变体调用是基于在假定变体周围区域映射的读取的局部重组. 这种方法显著提高了变体调用的准确性,但受到重组区域大小选择的限制, 以及预期组装的contig的大小. 如果这些值设置得太小,可能会漏掉变量. 如果这些值设置得太大,在计算上就会出现问题.

使用伯爵™可以缓解这些问题, 部分对齐于已知变体边的As读取允许更好地自适应选择必要的重组窗口,因为来自图引用的边包含关于其大小的信息. 此外, 伯爵™为图中出现的变量调用提供了完全不同的范式, 序列和位置信息是已知的, 因此,可以直接对照图进行基因分型.

伯爵™Aligner利用泛基因组图谱结构, 通过添加一组已知变异的参考基因组来创建, 显著降低参考偏差的影响. 图谱基因组包含了来自各种来源的变体, 包括1,000基因组计划和西蒙斯基因组多样性计划. 通过保留所有的变体信息, 伯爵™比线性替代品更好地对齐, 导致更准确的变体调用.

了解有关将读数对齐到参考图的详细信息

资源

 

 

k8彩乐园官方免费下载

友情链接: 1 2 3 4 5 6 7 8 9 10