
| 出版日期:2002-09-23 总期号:530 本年期号:35 |
|
IT与生命的螺旋双链
应用系统编室 从望远镜到显微镜 我们总是希望把目光投得更远些,也总是希望把眼睛瞪得更大些,望远镜帮我们解决了前一个问题,显微镜帮我们解决了后一个问题。生物工程、分子工程、基因工程……以及最近越来越热的高频词—生物信息学,这些越来越细小的扑面而来的新技术,在显微镜的放大下闯入了我们的视野。还记得卢卡斯《星战前传》的新篇《克隆大战》影片结尾那铺天盖地令人目瞪口呆的克隆战士吗?《星战》和高科技的克隆扯上关系,不得不说是一个创意,而克隆所属的我们大多数人所陌生的生物信息学本身,将带给我们电影以外像科幻片一样的生活— 历史上第一次不再需要农民和土地,食品和衣物将由室内的大型细菌培养槽获得;“复制”逐渐取代“生殖”,克隆的动物和人已习以为常;人们可以得到自己详细的遗传读本,从而可以远眺自己的生物学未来,以过去根本不可能的方式预测和计划自己的生活;父母可以选用体外的人造子宫生育后代;人类胚胎期的基因修饰,不仅可以纠正后代的致死性遗传疾患,而且可以提高他们性格、行为、智力和体格等方面的遗传素质……这一切,将是生物信息学为我们谱写的奥妙的生活前景,它比科幻片更具有奇思妙想。 生物信息学的来由 人们可能不禁要问,生物信息学(Bioinformatics)这一名词是从何而来的呢?这还要从头说起。 八十年代末期,联合国生物信息学专家林华安博士认识到将计算机科学与生物学结合起来的重要意义,开始留意要为这一领域构思一个合适的名称。起初,他使用的是“CompBio”,之后,又将其更改为兼具法国风情的“bioinformatique”,不久,他便进一步把它改为“bio-informatics(或bio/informatics)”。但由于当时的电子邮件系统与今日不同,该名称中的-或/符号经常会引起许多系统问题,于是林博士将其去除,今天我们所看到的“bioinformatics”就正式诞生了,林博士也因此赢得了“生物信息学之父”的美誉。 生物信息学就其萌生而言,是一门相当古老的学科,早在计算机初创期的1956年在美国田纳西州的Gatlinburg召开过首次“生物学中的信息理论讨论会”;而就其发展而言,却是一门相当年轻的学科,因为继20余年的沉默之后,伴随着计算机技术的迅猛发展,它才得以获得自身的大发展。无论从理论上来讲还是从现实情况来看,生物信息学的实质就是利用计算机科学和网络技术来解决生命科学的问题。生物信息学已经悄然渗透到生命科学的每一个角落,以至人们在意识到它的存在之前就已经离不开它了! 现在,基因学与包括基因学在内的生物信息学如果没有IT的支持就根本无法发展。为了获得几乎是无限长的ATGCCGCAGTC……碱基链信息,科学家们运用了超级计算机。2000年2月,人类的DNA碱基排列(人类染色体组)基本破译完毕,IT技术功不可没! 做未来的主人翁 DNA分子双螺旋结构的发现人之一、美国生物化学家詹姆斯·沃森评论说:“现在我们拥有了人类生命的说明书。”这话听起来跟“我们拥有了电视机的说明书”区别不大—“有了说明书”,是不是就可以照着说明书拆开来看一看、修理修理?下一步生物学家要做的事差不多就是这样。 试想一下,若干年后生物信息学的广泛应用,世界上还会有肥胖或塌鼻子、小眼睛的人存在吗?如果将来的父母可以为孩子订制“遗传性状”,以天下父母心,将来哪一个男孩不会是俊男、哪一个女孩不会是靓女?外貌是一方面,智商、情商、免疫力等内在指标自然也“精益求精”。“人类基因组计划”的进展和宣传似乎一夜之间让人类像神一样的主宰自己。 在生物制药方面,美国麻省理工学院伍德海德研究中心负责人的兰德说:“基因信息现在正推动着生物制药革命。破译人类基因组给我们带来了打开这个星球上最有价值的图书馆的钥匙,但我们现在阅读这些信息还处在非常初级的水平。下一代生命科学家的工作将是把信息从这些图谱中挤出来。” 中国科学院院士张春霆在对生命信息学的展望与建议中提到,预测生物信息学的未来主要就是要预测他对生物学的发展将带来什么样的根本性的突破。这种预测是十分困难的,甚至几乎不可能。但是人类科学研究史表明,科学数据的大量积累将导致重大的科学规律的发现。 1953年DNA分子微妙的双螺旋结构模型的发现,开启了解释生命科学的新领域 。IT技术的引入,为生命科学提供了新的手段和工具,而生命科学的飞速发展同时也对IT技术提出更高的要求。这两者的关系,恰恰就像DNA分子的双螺旋结构一样,互相依存、绵延上升。IT技术与生命科学构筑出的美丽的螺旋双链,将把生命科学带入一个更新的境界。 生命因IT而美丽 千百年来,人类一直没有停止对自身生命的探索。从神农遍尝“百草”到历代帝王炼制“长生不老药”,人类在生命表象的旋涡里一直停留了数千年。直到19世纪细胞学说的创立,才把生命的研究层次推进到了细胞领域。如何从更深层次破解生命奥秘、把握生命本质、控制生老病死是人类始终不变的梦想。随着2000年人类基因组测序的初步完成,以及水稻、牛、羊等其它生物基因组计划的全面实施,人类对生命的认识又跨越到分子阶段。生命科学的发展,使我们急需借助新的技术在分子阶段研究各种生命现象。IT技术恰逢其时。生命科学包括基因、制药、临床医疗等方面的研究将因IT技术而显得更加深邃、美丽。 揭开基因之迷 在英国著名的生物研究机构——桑格中心,有关人类基因组的数据已经达到22万亿字节,是世界上首屈一指的美国国会图书馆藏书内容的两倍多。除了人类基因组测序的初步完成,水稻、牛、羊等其它生物基因组计划也已经全面实施,分子生物信息数据正以爆炸性速度增长。 而要真正读懂这些基因,揭示所有基因编码所代表的信息,必须破译浩如烟海的数据。显然传统的生物学研究模式已经不能适应。我们必须借助于信息技术和信息学手段,构建各种类型的专业数据库,必须开发新一代计算机软件,对这些数据进行存储、管理、加工,并把它变成具有明确意义的生物信息。通过对生物信息的查询、搜索、比较、分析,我们可以从中获取基因编码、基因调控、核酸和蛋白质结构功能及其相互关系等理性知识。 目前,已经建立的生物信息数据库种类繁多,这些数据库的数据量大,更新速度快,应用面广,通常需要高性能的计算机硬件、大容量的磁盘空间和专门的数据库管理系统支撑。例如,欧洲生物信息学研究所用Oracle数据库管理、维护核酸数据库EMBL。而基因组数据库GDB的管理、运行则基于Sybase数据库系统。只有像Oracle、Sybase这样的大型商业数据库才能满足数以亿计的生物信息的增长。 推动制药革命 新药研究和开发是一项耗资巨大的工程。过去,每一种新药从研发到投入市场平均需要10~15年,耗费数十亿美元。而现在,信息技术为药物研究设计提供了崭新的研究思路和手段,已经在新药设计的各个环节,如初始阶段、筛选及药物设计,以及新药开发阶段发挥越来越重要的作用。利用强大的计算工具,新药开发平均费用降为8亿美元,时间则缩短为原来的1/10。 新药研究的初始阶段包括信息搜集、初步调研、模型构建等,主要任务是为新药研究提供信息资料和研究思路。这个环节需要处理大量信息。在信息技术出现以前,大量信息来源于文献调研和研究人员的相互交流,而随着计算机及互联网的广泛应用,数据库、网络等已经成为传播信息资源的主要方式,药物研究者利用各种信息工具,通过网络访问世界各地的生物信息资源库,为查询和搜集信息提供了极大的便利。据悉,信息工具可能使这个阶段所耗费的时间从几年缩短为几个月。 传统药物研究中,可供筛选的化合物数量有限,新药发现的速度很慢,耗资巨大,成功率也很低。计算功能强大的超级计算机在筛选及药物设计中的应用,给药物发现带来了新的机遇。特别是虚拟高通量筛选技术(High Throughput Virtual Screening, HTVS)—一种并行分子对接(Parallel Molecualr Docking)技术的发展,使药物分子设计无论是速度还是成功率均有了突飞猛进的提高。 制药需要进行筛选,一般随机筛选的效率是十万分之几到万分之几,而计算机虚拟筛选的效率是5%到25%。人类基因组测序完成后,基因组研究在未来的10-20年内将会发现5000个以上应用筛选的新靶标,相应有1600多万个化合物是发现新药的宝库。如果要筛选这1600万个化合物,按传统的高通量筛选方法,大约需要32亿美元,花费10多年的时间;而采用虚拟高通量筛选技术,用计算机进行筛选,所需的时间为1年,整个筛选过程需要花费不过几千美元。因此,与传统随机筛选相比,计算机虚拟筛选的效率提高几百至几千倍,时间比为1/10,所化的经费比可能为几千/几亿,如表所示。 助力临床医疗 信息技术为推动医学进步也带来了空前机遇。通过对人类基因组图谱的初步分析,科学家们已初步确定了30种致病基因,而随着下一步对人体各种致病基因展开全面大搜索,以及对各种基因功能及基因之间相互作用了解的加深,科学家们将在分子水平上深入了解疾病的根本发病机理,为各种疾病的诊断、防治提供有力武器。 举个例子:X医院的临床医生John在无法查清自己负责的儿科患者的病因时,立刻将人体组织的细胞发送至Hartwell中心。该中心使用定序器和并列超级计算机分析出患病细胞的DNA,并将获得的数据交给John,John把有关数据输送进医院的临床医疗系统,系统自动诊断,并提供给患者一种个性化的治疗方法。
近日,我国也研制成功了多肿瘤蛋白芯片检测系统,该系统可同时检测12种肿瘤标志物,若患者怀疑自己与癌沾了边,去抽一次血,就可以发现自己是否得癌。该系统引入了芯片集成概念,一盒检测芯片可同时供48人检测。 计算机及网络的高速发展,为生物学研究和发展开创了一个新时代。借助信息技术的研究成果,通过对人类基因图谱中功能基因信息的全面解读,一些危害人类生命的重大疾病可望得到彻底治愈,人类的生老病死机制有望在分子水平上得到揭示。 网络时代生物科学研究的模式,在很大程度、很多方面已经不同于传统的生物学研究模式。高通量、大规模、整体性、系统性是其突出的特点。可以预言,没有计算机的生物学是不完整的生物学。但基因、制药、临床医疗只是整个生命科学研究领域中的一小部分,环境、生态等宏观生物学,以及行为、感觉、记忆、语言、思维、情绪等更加复杂的生命过程的秘密,还等着我们去揭开。揭示这些复杂生命现象的背后,需要更大规模、更大运算的计算机系统的支持。未来的生物技术和信息技术必将相互促进、相互攀升,为我们展示一个更加美好的明天。(应用系统编室) IT能推动生命科学走多远? 生命科学领域海量的信息促成了一个新的合作时代的到来。信息量之大,以至于仅靠医药、生物企业单枪匹马很难行得通,因此,专家指出,生命科学需要与信息技术联姻,希望通过“联姻”,帮助医药、生物技术公司从数据中获得潜在的商业信息。 在生命科学领域的研究中,IT一直起着催化剂的作用,而且随着研究和应用的深入,所扮演的角色越来越重要。计算机在生命科学领域的应用主要包括高性能计算、数据集成与管理、存储管理、咨询服务、知识管理、协作技术和电子商务解决方案领域等。例如,高性能计算为客户提供处理和分析大量基因组和蛋白质数据的能力,帮助解决一些在我们这个时代所面临的最复杂的医学挑战,包括癌症和心脏疾病的治疗;数据集成和管理帮助管理海量的基因组和蛋白质组数据,而且研究人员的发现必须实时共享信息和资源才能有所突破。 “新奶酪”的诱惑 对许多IT公司而言,生命科学领域不仅是一片尚待开发的“处女地”,更是寻求业务突破、利润增长点的“新奶酪”。 来自权威市场研究机构的报告验证了这一点。权威市场研究机构的报告显示:生物信息技术市场将在今后几年内以每年24%的速度递增,到2006年全球市场需求将达到380亿美元,而且这种需求的迅猛增长将至少持续10年。报告进一步解释说,在生物信息技术中,存储系统需求最大,到2006年,在存储系统方面的投资将达到118亿美元。导致这一需求主要是后基因组时代的数据量以及数据的复杂性。其次是高性能服务器,由于生物技术产业的重心将由基因组转向蛋白质组学、系统生物和分子对接技术等领域,计算机负荷将大大增加,因此服务器将成为需要大量投资的基础设施。到2005年,对巨型计算机的需求将以每年39%的速度递增,市场空间将接近2000年世界大型机销量;此外,网络接入和网络服务的费用也将分别以每年35%和33%的速度递增。 IBM公司也乐观地估计与生命科学有关的信息技术市场将在今年达到35亿美元,到2003年达到90亿美元。 从生命科学公司传来的消息更是让准备在生命科学领域有所作为的IT厂商兴奋不已:为了解决处理数据所需的庞大计算能力的问题,世界上最大的12家生命科学公司已经把近10%的科研预算用于信息技术投资,而且这个比例可能还将不断增长。 所有这些数字在传达着同样一个信息,生物科学与信息技术之间的协作将会前所未有的紧密,其间孕育的无限商机不容IT企业小觑。 寻找开门的钥匙 生物信息学市场是一块令所有IT厂商垂涎的“肥肉”。特别是人类基因草图绘制完毕就象打开了阿里巴巴宝藏的大门,以基因技术为核心的生命科学市场吸引着越来越多的淘金者。这里面不乏有象 IBM、SGI、SUN、HP等跨国IT公司,也有象曙光、联想这样的国内IT厂商,因为人们知道,人类基因组草图仅仅是读出了“生命之书”,而要真正读懂它,揭示所有基因编码所代表的信息,还必须破译浩如烟海的数据。 在生命科学领域拓展已经成为IT厂商新的利润增长点。 IBM称,生命科学是IBM公司发展战略中的新兴市场之一。2001年度,IBM生命科学部门依靠用于基因和蛋白质研究的高端服务器的销售使收入超额118%。到目前为止,IBM已经投资3亿多美元用于生物信息学市场,其中,1亿美元用来制造一台计算机—深蓝基因(BlueGene),它的速度将是打败国际象棋大师卡斯帕罗夫的深蓝计算机的1000倍,可以深入了解蛋白叠加结构的构造原理。IBM政府事业部黄秀萍介绍说,在IBM重点增加投资的七大产业中,生命科学是其中之一.为此,IBM专门成立了生命科学部门,提供包括高性能计算、数据集成和管理、存储管理、咨询服务、知识管理、协作技术和电子商务解决方案的全面技术,并已经与多家基因组、蛋白组研究的开拓者和生物信息学工具提供商签订了合作协议。目前,IBM正在与许多著名生物科技公司和制药公司合作,解决他们在信息科技方面的需求。IBM希望生命科学到2004年能为IBM带来超过400亿美元的市场机会。 在生命科学研究领域里,SGI已有15年以上的经验, 为这一领域里的高性能计算提供了中坚的计算技术,在3D分子模型、计算化学和分子生物学、生物信息学和基因学的的计算和高级可视化方面提供了解决方案和工具,同时SGI不断利用自己在高性能运算和图形方面的优势,致力于生命科学研究高级算法的开发,并将探索研究为医疗科学引进三维可视化世界。SGI的专家介绍,SGI为生命科学和化学领域的应用提供的解决方案包括服务器、可视化工作站和存储环境, 让生物工程学家、化学家们以业界领先的性能运行各种应用。SGI的技术在中国的生命科学和化学领域的研究里也有很多的应用实例,如吉林大学理论化学国家重点实验室、中国科学院国家基因研究中心、中科院上海材料医学研究所等。上海生命科学及生物技术研究院生物信息中心创建的公众DNA数据库也是建立在SGI的高性能服务器系统上。 提起在生命科学领域中的作为,原康柏公司不可不表。原康柏公司是被选为人类基因草图绘制的三个重要参与者塞莱拉公司、Sanger中心、怀特研究院的主要IT合作伙伴,Alpha Server成为人类基因工程的关键设施之一。为了巩固在生命科学领域的领导地位,原康柏不断加大在基因、生物信息及相关市场的投入,并加大与生命科学公司的合作,促进生命科学公司在发明创造方面的快速增长。原康柏公司对于生命科学领域的重视在与惠普合并后继续得到加强。近日从惠普传来消息,为进军生物信息科技市场,惠普宣布向两家公司提供跨行业投资。 更值得欣慰的是,作为我国高性能计算的主要厂商之一,曙光公司已经进军生命科学领域,与华大基因中心联合组建了国内第一家生物信息学联合实验室,向华大基因提供包括曙光天潮2000、曙光3000超级计算机和超级服务器。在曙光的鼎立帮助下,华大基因中心在水稻基因研究等领域得到突破性的进展。 其实,IT公司所盯住的还远不止这些近期利益。以基因研究为基础的生物经济可能在新世纪里成为新经济的重要组成部分,对此人们已经达成共识。根据以往的经验,率先进入市场的公司大多能够成为行业标准的制定者,这些行业标准往往意味着巨大的经济利益。 IT技术无疑为生命科学的发展提供了新的手段,但IT技术对生命科学的运用还处在试验阶段,到产业化的运用还有不远的距离,而且IT技术在生命科学领域的运用依赖于生命科学的自身发展,两者完美的结合尚需时日。(应用系统编室) 大事记 ◆ 1990年10月,被誉为生命科学“阿波罗登月计划”的国际人类基因组计划启动。经过美、英、日、法、德和中国科学家的艰苦努力,2000年6月26日,人类基因组工作草图终于完成。 ◆ 1999年12月,IBM公司耗资一亿美元制造一台比“深蓝”快一千倍的超大型计算机,取名为“蓝色基因”。“蓝色基因”拥有100万个处理器,计算能力达到1千万亿次浮点结果。蓝色基因计算机可以对生命的基本过程和疾病过程有更加准确的了解,还可以用来设计和制造新的药物,把化学和生物试验过程减少到最低程度。 ◆ 2000年12月,国家863计划的重大成果——曙光3000超级服务器研制成功,其运算速度最高可达每秒4000亿次左右。不久,两台曙光3000就被分别安装到了北京华大基因研究中心和杭州华大基因研究中心。此前,北京华大基因研究中心引进了运算速度达1000多亿次的曙光2000超级服务器,初步建成了基因组信息学平台,承担了人类基因组计划1%项目。 ◆ 2002年9月,在我国召开的首届国际水稻大会上,我国水稻基因研究专家宣布:世界首张水稻全基因组基因芯片已在我国问世。水稻全基因组基因芯片是通过对今年4月完成的“水稻基因框架图”进行序列分析和基因预测,使用克隆方法将5.5万个基因片段按特定的排列方式制成的玻璃芯片。这是世界上首张水稻全基因组基因芯片。 关键词 1、生物信息学(Bioinformatics)是生物学与计算机科学以及应用数学等学科相互交叉而形成的一门新兴学科。它通过对生物学实验数据的获取、加工、存储、检索与分析,进而达到揭示这些数据所蕴含的生物学意义的目的。在推动生物信息学发展的各种动力中,人类基因组计划(HGP)和生物医药工业是其中的两个主要力量。 2、生物芯片是八十年代末发展起来的一种新技术,它是将生命科学研究中所涉及的许多分析步骤,利用微电子、微机械、化学技术、物理技术、计算机技术,使样品检测、分析过程连续化、集成化、微型化。生物芯片主要包括:芯片实验室、基因芯片、蛋白芯片等。 3、人类基因组计划是由美、英、日、德、法、中六国参与的人类文明史上最伟大的科学创举之一。其核心内容是测定人基因组的全部DNA序列,从而获得人类全面认识自我最重要的生物学信息。2000年6月26日,六国相继宣布人类基因组工作框架图完成。随着人类基因组计划工作框架图的完成,其对人类社会巨大的科学和经济意义已清晰显现。她所倡导的“全球合作、免费共享”的人类基因组计划精神已成为自然科学史上国际合作的楷模。世界各国也因此受益无限。 4、分子计算机的运行靠的是分子晶体可以吸收以电荷形式存在的信息,并以更有效的方式进行组织排列。凭借着分子纳米级的尺寸,分子计算机的体积将剧减。此外,分子计算机还可大大减少耗电量,并能更长期地存储大量数据。 |
||||||||||||||||||||||||||||||