联系我们

188bet博金宝官方网站安捷伦实验室推出计算生物学和信息学生物分析测量

2010年3月8日

由安捷188bet博金宝官方网站伦科技首席技术官Darlene J.S. Solomon与安捷伦实验室研发负责人Annette Adler、Laurakay Bruhn、Robert Kincaid、Allan Kuchinsky、Nick Sampas和Anya Tsalenko合作

简介

计算生物学和信息学对于安捷伦实验室的生物研究至关重要。188bet博金宝官方网站一个很好的例子是安捷伦基于寡核苷酸阵列的CGH (aCGH) DNA微阵列平台的开188bet博金宝官方网站发——从最初的工作、原始数据、可视化和结果集成到未来的发展方向。

188bet博金宝官方网站安捷伦DNA芯片

微阵列的特性

作为安捷伦发展最快的188bet博金宝官方网站测量解决方案之一,与正常细胞相比,aCGH微阵列可以识别癌细胞中多个和缺失的染色体片段。在正常的人类基因组中,每个染色体都有两个副本,但癌症基因组通常在拷贝数上有多个变化,染色体和染色体片段的重排。这些1 × 3英寸的玻璃微阵列载玻片还可以识别正常个体之间的拷贝数变化(CNVs)1.CNVs是导致人类遗传变异的基因组结构变异的普遍形式2

计算生物学与信息学

计算生物学和信息学的重要性是相对较新的。直到20世纪90年代初,生物学研究人员主要一次研究一两个基因,通常在他们的整个职业生涯中都是如此。像微阵列这样的高通量技术现在使生物学家能够在一次实验中研究数十万个DNA片段。在大约10年的时间里,该领域已经从一次研究一个基因发展到同时研究所有基因。每个人类细胞大约有30亿碱基对核苷酸,包括大约2.5万个基因,大小从几千到200多万碱基对不等。分析这些几乎无限量的数据需要一个计算核心。

研究人员使用计算生物学来解决计算机科学、应用数学和计算机模拟技术等学科的生物学问题。该领域的专业包括生物建模、生物信息学、数学生物学、计算基因组学、分子建模、蛋白质结构预测、结构基因组学、计算生物化学和生物物理学。

其他研究人员专注于信息学,以构建软件工具,支持科学家在生命科学实验中设计、进行和协作,以及搜索、存储和与数据交互。信息学涉及可视化、人机设计、协同系统、信号分析、性能优化、数据库设计、网络和系统架构等重大挑战。该领域需要计算机科学、人工智能、认知科学、信息科学和社会科学各个子领域的技能。

计算生物学和信息学在开发算法和计算机程序所需的计算创造力和专业知识领域共同工作。算法是一种解决问题的详细方法,由计算机将遵循的有限指令序列实现。计算机程序是执行指令的文本——用特定计算机语言写成的书面指令。对于研究人员来说,它需要特殊的艺术和深厚的生物学和计算知识(1)来概括在计算机化的生物实验中需要发生什么,以便正确顺序中的每个离散步骤将导致预期的结果;(2)创造性地将该序列翻译成计算机语言,以便正确地执行步骤。

开发初始微阵列平台

在20世纪90年代早期,安捷伦的研究人188bet博金宝官方网站员(当时是惠普实验室的一部分)开始初步研究DNA微阵列平台,使研究人员能够通过分析整个基因组的数据来测量基因表达。1990年,美国启动了人类基因组计划,需要大量的计算核心专业知识来确定许多基因的序列和边界。实验室的计算专家开发了一个复杂的过程,以当时已知的22000个基因为目标,并选择信息量最大的60个碱基探针。

该团队创建了算法和计算机程序来指导合成DNA探针的生成。起初,人们只知道基因组序列。为了弄清楚在微阵列表面上探针的长度最好,他们进行了计算机模拟和经验测量。阵列上的所有探针都必须在相同的条件下,如相同的温度,形成稳定的双链互补DNA链的杂交体,具有良好的特异性和敏感性。他们基于理论上可以预测的东西,用计算机模拟计算了每个探针的不同指标,比如热力学熔化温度、结合能、内部结构以及每个探针在整个基因组上可能结合的位置数量。

为了测试该模型,该团队使用X染色体衍生序列的比率度量进行了实验。因为男性有一个副本,女性有两个副本,他们知道理论上的男女比例应该是X染色体上的一半。他们生成了跨越X染色体的探针,测量了男性和女性样本,并为给出最接近理论比值的探针分配了最高分。

然后,他们将实验测量结果与计算机模拟结果进行了比较,以了解如何最好地预测实验数据。他们利用这些发现构建了一个计算机模型,用于构建基因组其余部分的探针。

主要数据

每个安捷伦188bet博金宝官方网站微阵列都包含一排排的DNA探针,用于测试测试样本中特定DNA序列与参考样本的丰度。这种丰度是用激光探测微阵列时微阵列光斑的颜色来测量的。计算小组开发了设计微阵列的流程,通过构建核苷酸片段来创建载玻片上的探针,并解释由激光扫描阵列产生的结果。

这些来自微阵列实验的直接结果被认为是原始数据,它们需要复杂的软件来解释。新的生物学见解来自于一个敏感而准确的平台和一个分析数据的好方法的结合,以理解实验实际测量的含义。用于分析的计算工具与微阵列并行开发。团队构建数据分析和可视化所需的工具,并将其中一些工具转换为软件供客户使用。

aCGH/CNV微阵列平台的研究进展

当安捷伦在188bet博金宝官方网站2000年推出第一批DNA微阵列时,实验室的研究人员正在研究该平台的增强功能。通过与领先的研究人员合作,他们了解到,对改变和缺失的基因组片段进行更高分辨率的测量,对于理解这些变异如何与不同人群的疾病易感性和治疗反应相关至关重要。

188bet博金宝官方网站安捷伦实验室研究了该公司的微阵列平台测量这些自然变化的方法。推进一个技术平台通常是一个循环的过程,因为最初的结果会提出问题:如果我们调整探针会怎样?如果我们改进算法或切换到更快的计算技术会怎样?

aCGH/CNV平台的开发是一个跨学科项目,它选择了数万个最有效长度的探针,可以跨越人类基因组中的所有基因,并精确测量染色体一小段的增益或损失。第一个aCGH阵列设计3.有四万个特征,最近的设计在一个阵列上有多达一百万个特征。这项工作需要分子生物学家进行化学工作,计算专家设计微阵列,每个人都要分析数据。该团队还与外部合作者、思想领袖和其他感兴趣的各方进行了交谈,以了解这个新应用程序最重要的客户需求。

该团队成功开发了一种专门的微阵列平台,利用总基因组DNA克服了以前阻碍癌症和其他疾病比较基因组研究的几个科学障碍。aCGH的成果包括更好的探头设计,改进的像差调用算法,以及从探头中挑出越来越精细细节的能力。每张幻灯片包含多达100万个特征,每个特征包含数百万个探针,这些探针由计算机在每个特征上照射数百次激光进行分析。

可视化

与第一批微阵列一样,aCGH/CNV没有商业上可用的计算或可视化软件工具来提供如何修改平台或以对全球科学界有意义的方式分析数据的方法。因此,该团队开发了分析原始数据的方法4

下面的一种方法包括可视化工具,供研究人员显示和分析来自aCGH/CNV实验的主要数据。

17号染色体的光学显微镜视图

17号染色体的aCGH视图

左边的显微镜视图,先前的技术水平,是光谱核型的一部分5结肠癌细胞系的图像显示,它有3个17号染色体副本,其中缺失的一块用绿色表示。

右图为新的aCGH测量方法开发的视图显示了相同的结肠癌细胞系样本以及其他几个癌细胞系缺失了相同的染色体片段。图像的左面板显示了安捷伦aCGH平台的CGH测量结果,沿着所有人类染色体的图片绘制。188bet博金宝官方网站中间的面板显示了17号染色体的扩展视图,显示了这些癌细胞系中17号染色体上存在的拷贝数畸变。右边的面板显示了沿着17号染色体的单个基因的进一步放大视图。

集成

研究人员经常需要比较从高通量平台获得的信息和理解,例如来自其他实验的aCHG数据集。因此,生物学研究正变得更加合作,因为科学家们试图整合来自多个来源的信息,并将其置于生物学背景下,以便在全球范围内共享知识。例如,基因表达数据与蛋白质-蛋白质相互作用网络的集成可以揭示潜在控制疾病进展的途径。与基因变异数据的整合可能有助于确定哪些人最有可能对特定疗法产生反应。

最近有一个鼓励信息共享的集成工具是Cytoscape。Cytoscape是一个开源的生物信息学软件平台,它使研究人员能够可视化分子相互作用网络,并将这些相互作用与实验数据和来自其他来源的数据(如途径数据库和科学文献)集成起来。把数据放在生物学背景下有助于理解基因、蛋白质和其他参与生物过程的分子之间的相互作用。Cytoscape使用户能够查询生物网络,以获得计算模型;以及查看、操作和分析他们的数据以获得生物学上的洞察力。

利用Cytoscape框架,安捷伦实验室与使用aCGH微阵列的188bet博金宝官方网站外部合作伙伴合作,研究遗传、功能基因组和生物信息学数据的集成,以实现复杂疾病的系统生物学方法6.他们专注于一种复杂的遗传疾病,精神分裂症,以发现新的候选基因和生物学途径,以帮助诊断和治疗。研究小组发现,系统生物学方法为发现与环境变量共同作用产生复杂疾病状态的主要和次要影响基因提供了重要的希望。

为了探索生物途径之间的关系和说明共同的基因,研究人员使用了Cytoscape框架,安捷伦文献搜索工具(可作为Cytoscape -的免费插件)188bet博金宝官方网站www.cytoscape.org)、蛋白质-蛋白质互动数据库及通路资源。他们从从一组疾病相关查询中检索到的大约450,000 PubMed摘要中生成了一个基于文献的关联网络,并对其进行了处理,以确定5400个基因中大约39,000个生物分子关联。网络可视化有助于识别生物网络中的关键相互作用路径和可能成为治疗靶点的连接点。

癌症基因组图谱计划描述癌症中的分子变化是整合来自多个来源的数据的另一个例子。这项由国家癌症研究所和国家人类基因组研究所领导的合作努力,已经证明了使用综合基因组策略的可行性。科学家们正在开发新的数据,与全世界的研究人员共享,并开发创新的生物信息学工具和技术,以更高的精度和效率研究癌症。研究结果已经在影响治疗;研究人员报告称,胶质母细胞瘤(脑癌的一种形式)患者的基因改变与对一种常用治疗药物的耐药性有关。

首尔国立大学的一个国际研究团队使用定制设计的安捷188bet博金宝官方网站伦aCGH阵列,发现当来自高分辨率aCGH实验的数据与全基因组DNA测序数据相结合时,可以为给定个体的基因组获得更准确的CNVs注释。

aCGH结果

尽管许多癌症生物学家最初怀疑微阵列是否能够研究染色体变异,但他们现在表示,安捷伦的aCGH阵列是一项重大的技术进步,能够实现更高分辨率的基因组扫描,并能够探索一个全新的生物学层面。188bet博金宝官方网站它还提供了在不同人群的多个个体中绘制人类基因组中存在的CNVs的机会。这项研究是一个快速发展的领域,因为基因组DNA的增加或损失越来越多地与某些遗传相关疾病和发育障碍联系在一起,如癌症、自闭症和帕金森症。使用aCGH微阵列的研究实例包括:

  • 美国国家癌症研究所使用安捷伦的微阵列解决方案来加速寻找控制癌症的方法188bet博金宝官方网站。
  • 墨尔本Peter MacCallum癌症中心的研究人员使用安捷伦微阵列来更好地了解间皮瘤,间皮瘤是一种在胸部、腹腔和心脏周188bet博金宝官方网站围发现的癌症,通常是由接触石棉引起的。
  • 威康基金会病例控制联盟已经标准化了世界上最大的人类基因组拷贝数变异研究,该研究采用安捷伦微阵列,以确定结核病、冠心病、糖尿病、类风湿性关节炎、克罗恩病、双相情感障碍、多发性硬化症、乳腺癌和高血压等疾病的遗传变异。188bet博金宝官方网站
  • 使用安捷伦C188bet博金宝官方网站GH微阵列,贝勒医学院的研究人员发现了一种新的机制,通过这种机制,基因组拷贝数变化或易位在细胞分裂过程中发生

展望未来

安捷伦实验室的研究人员继续与思188bet博金宝官方网站想领袖合作,整合不同的数据集,并在推进生物科学的前沿做出贡献。例如,安捷伦实验室正在与加188bet博金宝官方网站州大学旧金山分校(UCSF)的研究人员合作。

其中一个项目是将Cytoscape和GenMAPP(基因图谱注释器和路径分析器),使生物学家能够在直观、易于使用和易于计算分析的生物学背景下查看实验数据。GeneMAPP是UCSF设计和支持的一个计算机应用程序,它提供了一个强大的建模环境,可以保持生物学家熟悉的教科书路径图的丰富注释视角。这项合作致力于综合两种不同的生物网络观点的优势:(1)分子生物学家认为直观的注释通路图;(2)抽象的,来自高通量数据的图表,适合大规模网络分析。

(1)通路图对生物学家来说是直观的,具有丰富的注释,提供了关于空间和时间关系的生物学背景和视觉线索7

(2)大型计算机生成的网络,就像这个基因-蛋白质关联网络,有助于计算分析,但很难从整体上直观地解释。它们通常被称为“毛球”8

与UCSF合作的第二个项目涉及开发支持基于社区的蛋白质结构功能链接数据库注释的计算工具。

安捷伦实验室的另一个积极研究领域是可视化。188bet博金宝官方网站改进可视化工具的工作涉及到一个叫做可视化分析的新兴领域。lEEE,一个领先的电气工程师和计算机科学家的专业组织,定义视觉分析作为“由高度交互的视觉界面支持的分析推理科学”。人们使用可视化分析工具和技术将信息合成为知识;从大量的、动态的、经常相互冲突的数据中获得洞察力;发现预期,发现意外;提供及时的、合理的、可理解的评估;并就评估结果进行有效沟通,以便采取行动。”这门跨学科的科学包括统计学、数学、知识表示、管理和发现技术、认知和感知科学、决策科学等。

尽管所有的科学都在提高利用计算和信息学收集和分析信息的能力,但仍需要新的工具来分析大量、复杂、不完整和不确定的全球信息。IEEE认识到这一挑战,并于2006年成立了视觉分析、科学与技术研讨会。它侧重于在太平洋西北国家实验室的领导下开发的可视化分析的研发议程,以确定未来专注于可视化分析工具的研发项目的方向和优先事项。

最后,安捷伦实验室的计算生物学家正在研究如何进行“联合分析”或真正整合大量不同类型188bet博金宝官方网站的数据,以深入了解细胞机制和过程。这方面的一个例子是aCGH数据与转录分析数据的联合分析,以了解特定的染色体畸变如何影响基因表达。188bet博金宝官方网站安捷伦实验室过去曾在这一领域开展过工作,安捷伦试图为那些需要解决两种或两种以上数据类型的海量问题的客户提供帮助,他们不知道如何将这些数据类型结合到生物学或临床研究中。

安捷伦实验室的研究人员将继续通188bet博金宝官方网站过多学科研究来推进计算生物学和信息学,以回答不断出现的新的和日益复杂的生物学问题。


脚注

  1. 佩里,G.H.;Ben-Dor, a;Tsalenko, a;sampa:;Rodriguez-Revenga l;Tran漫画;雅伯,a;斯坦因费尔德,即;曾荫权,p;山田,附加说明; Park, H.S.; Kim, J-I.; Seo, J-S; Yakhini, Z.; Laderman, S.; Bruhn, L.; and Lee, C. "The Fine-Scale and Complex Architecture of Human Copy-Number Variation."人类遗传学杂志82, 2008年3月:1-11。DOI: 10.1016 / j.ajhg.2007.12.010。
    http://www.ajhg.org/ajhg/fulltext/s0002 - 9297 (08) 00077 - 3
  2. 基德,J.M.;库珀,通用;多纳休,W.F.;海登,H.S.;sampa:;坟墓,t;汉森:;爱尔兰人,b;Alkan c;Antonacci f; Haugen, E.; Zerr, T.; Yamada, N.A.; Tsang, P.; Newman, T.L.; Tüzün, E.; Cheng, Z.; Ebling, H.M.; Tusneem, N.; David, R.; Gillett, W.; Phelps, K.A.; Weaver, M.; Saranga, D.; Brand, A.; Tao, W.; Gustafson, E.; McKernan, K.; Chen, L.; Malig, M.; Smith, J.D.; Korn, J.M.; McCarroll, S.A.; Altshuler, D.A.; Peiffer, D.A.; Dorschner, M.; Stamatoyannopoulos, J.; Schwartz, D.; Nickerson, D.A.; Mullikin, J.C.; Wilson, R.K.; Bruhn, L.; Olson, M.V.; Kaul, R.; Smith D.R.; and Eichler, E.E. “Mapping and Sequencing of Structural Variation from Eight Human Genomes.”自然453, 2008年5月1日:56-64。DOI: 10.1038 / nature06862http://www.nature.com/nature/journal/v453/n7191/abs/nature06862.html
  3. 巴雷特,M.T.;雅伯,a;Ben-Dor, a;sampa:;利普森,d;金凯,r;曾荫权,p;咖喱,b;贝尔德,k;Meltzer,注:; Yakhini, Z.; Bruhn, L.; and Laderman, S. "Comparative Genomic Hybridization Using Oligonucleotide Microarrays and Total Genomic DNA,"美国国家科学院院刊11, 2004年12月10日:17765-17770。
  4. 金凯,r;Ben-Dor, a;和Yakhini, Z。基于阵列的比较基因组杂交的探索性可视化信息可视化4, 2005: 176-190。
  5. 光谱核型分析是用荧光染料将每个不同的染色体染色。
  6. 米德尔顿,f;罗斯诺夫,c;Vailaya, a;Kuchinsky, a;帕托,c;在复杂疾病的系统生物学方法中集成遗传、功能基因组和生物信息学数据:应用于精神分裂症。“在分子生物学方法,神经信息学, Humana出版社,ISBN13: 978-1-58829-720-4, 2007年7月。
  7. 皮科,.r;负责人、t;van Iersel, m.p.;Hanspers k;康克林,b.r.;Evelo, C.(2008)。Wikipathways:为人民编辑路径。PLoS Biology, 6(7):e184+。PMID: 18651794
  8. Kuchinsky, A.和Vailaya, A.从结肠炎文献中提取的计算机生成的基因-蛋白质关联网络188bet博金宝官方网站安捷伦文献搜索工具188bet博金宝官方网站安捷伦实验室

更多专题报道