目录

专题译述

生物信息学在癌症研究中的应用

特约编辑:谢兆辉、焦传珍

癌症是一种由遗传和表观遗传改变而引起的疾病。随着各种“组学”技术的进展,癌症的研究正在经历一场革命。后基因组学时代的生物技术进展使分子生物学家得以较为精细地研究DNA(基因组学)、mRNA(转录组学)和蛋白质(蛋白质组学),试图在完整背景下描述癌症的技术革新为研究者获得更多有用的资料,并在新途径下去研究及整合提供了机遇。虽然存在一定的实际困难,但很多的方案正在开发中,目的是整合关于实例的信息、方案和其它不同来源的资料,以鉴定出重要的趋势和方法,最终找到治疗或诊断癌症的新途径。下一期《生命奥秘》将讨论癌症治疗方法的革命,重点放在生物信息学方面,并进一步讨论如何分析各种组学信息,和它们的应用如何改变了癌症的治疗方法。

生物信息学的多学科本质

特约编辑:谢兆辉、焦传珍

在过去的几十年间,生物医学经历了一场重要的变革。一些技术革新,如高通量测序技术已经容许人们在整个基因组水平上研究细胞、组织和完整生物个体的各种分子,也使得生物医学的资料倍增。通过开发特殊的计算机程序和开发旨在组织和分析这些生物学知识的技术方法,使其将获得的全部信息转化成有用知识时所遇到的挑战正在被逐步克服。

癌症生物信息学

特约编辑:谢兆辉、焦传珍

癌症是由于一些遗传改变和表观遗传改变而导致的疾病,在它最简单的形式中,癌症是一种由于一个细胞基因组变化而导致的遗传性疾病。这种遗传改变包括点突变、插入突变、缺失突变和染色体易位等。这些基因的变化可以导致细胞和组织生长异常,这就是肿瘤的表型特征。虽然控制癌症发生的分子机制研究一直是过去50年来研究的重点,其中包括使用了很多分子生物学手段的研究,但对人类癌症的发生机制还了解不多。尽管在细胞转化基础上,人们已经了解了许多分子遗传学和表观遗传学改变,但导致肿瘤表型的复杂过程才刚刚开始被人们理解。目前,遗传学上,癌症的基础研究正经历着一场变革。

大规模研究癌症的方法

特约编辑:谢兆辉、焦传珍

几十年来,传统方法对癌症的研究是首先选择一些癌症基因、基因组区域或蛋白质,然后将它们与健康组织或健康细胞进行比较。然而,随着大规模数据的产生和分析技术的来临,研究癌症的模式正在发生变化。基因组学、转录组学、蛋白质组学和生物信息学的应用,让人们得以测试大量的新假说,从而促进了癌症研究的发展。例如,这些大规模技术的应用,扩大了与特定类型癌症发展相关的遗传变异的可检测数量,并能够整合分子特点从而预测癌症和治疗反应。图2显示了生物信息学、基因组学、转录组学和蛋白质组学结合在一起研究癌症、预断病情的模型。

大规模研究癌症的技术及其应用

特约编辑:谢兆辉、焦传珍

如前所述,大规模研究对现代生物学研究的发展至关重要。然而,这些方法,如基因组学、转录组学和蛋白质组学的存在,是因为实验技术产生和开发了大量的资料,如DNA测序技术、微阵列技术、基因表达序列分析技术(SAGE)和质谱技术等。这些技术也促进了生物信息学的发展。值得注意的是,所有的这些技术原来几乎都主要用于对癌症的研究。下面将描述这些技术及其是如何用于生物研究的。

各种“组学”信息的整合

特约编辑:谢兆辉、焦传珍

正如以前指出的那样,在基因组学、转录组学和蛋白质组学方面的进展为生物学家提供了大量要处理的数据。然而,这些数据大多来自不同的平台或存储在不同的数据库中,数据整合是非常不容易的,甚至是不可行的。鉴于此,人们希望形成一个生物信息学的特定领域,以便解决这些很重要的问题,这就是“整合基因组学”。

临床生物信息学

特约编辑:谢兆辉、焦传珍

临床生物信息学的目的是应用生物信息学知识和技术来帮助诊断、治疗、预防和控制疾病,以及发展化学的、结构的和生化的方法来应用于临床研究。癌症研究中,在癌症发生的不同阶段,如起始、持续和发展时期,生物信息学工具被用于检测几种癌症的生物标记。根据NCI的解释:生物标记的定义是细胞的、生化的、分子的(遗传的和表观遗传的)改变。有了生物标记,一个正常的、异常的或简单的生物学过程就可以被识别或监测。生物标记可以通过生物媒介,如组织、细胞或流体来衡量,也可用于评估癌症的早期诊断、风险、癌症分类和预断癌症病情。

癌症生物信息学及其流行病学的计算机信息发掘

特约编辑:谢兆辉、焦传珍

高通量技术,如基因芯片技术在公共领域已经产生大量的基因组和蛋白质组学数据。许多调查和临床结果数据,如美国国家癌症登记、监督、流行病学最终结果(National Cancer Registry, the Surveillance, Epidemiology and End-Results, SEER)资料库也是可以利用的。一长串与健康相关的数据库链接可以在以下网站找到:http://www.ehdp.com/。这些数据库有时空的差异,如不同的设计频率和不同的空间级别,如洲、国家、邮政编码和平方公里等等。如何发掘这些材料,并提取有用的信息是一项艰巨的任务。该任务把不同领域的研究人员集合在一起,鼓励癌症相关的计算机资料的发掘。

展望

特约编辑:谢兆辉、焦传珍

癌症作为一种表观遗传失调,可以由不同的遗传和蛋白质谱来描述,这与癌症的发生和进展相联系。一些修饰,如基因组改变的表达模式、基因组失稳和体细胞突变,可以被用来区分正常细胞和癌细胞,并且这些知识可以专门应用于诊断和治疗癌细胞。在这种情况下,生物信息学方法不仅是一个生物标记识别的重要工具,而且也促进了对整个肿瘤发展进程的理解。