星期二, 二月 06, 2007

网格计算

URL:http://edu.qiji.cn/eprint/abs/1612.html

网格计算:新的希望


作者:柯南
注释:《三思科学》电子杂志,2004年春季合刊,2004年6月1日

摘要/内容:

如果沃卓斯基兄弟不是在十多年以前,而是在几年前开始电影Matrix的策划,那么他们也许会用Grid这个更时髦的名字。

我轻轻移动了一下鼠标,打断了它那无休止的计算,开始本文的写作。作为一台个人电脑的完全拥有者,我却心甘情愿的把电脑一半以上的使用时间交给了大洋彼岸的一个研究机构,用于在茫茫的无线电波噪音海洋中寻找另一个文明发出的声音。在这个地球上还有几百万人和我的遭遇相同。

你应该知道我在说什么。只要稍微有一点上网的经验,你或许就能接触到它:SETI@Home,一个由全世界数百万计算机用户共同完成的科学项目,同时也是一种新型计算机组织形式的雏形。

积沙成塔

一些热衷于搜寻地外文明的科学家认为,宇宙中的其他文明可能通过无线电信号表明自己的存在。每天,位于波多黎各的阿雷西博射电望远镜都会接受到大量来自宇宙深处的无线电信号。但是要从这些信号中剔除来自地球的无线电干扰,找到最有可能的地外文明信号,需要最先进的超级计算机一刻不停的运转。很显然,科学家没有那么多经费。1999年5月,加州大学伯克利分校的科学家们发布了一个新的屏幕保护程序SETI@Home(在家搜寻地外文明)。作为一个屏幕保护程序,它看上去并不十分讨人喜欢。但是它所担负的主要目的却十分重要:利用个人电脑用户闲置的计算机时间,为搜寻地外文明工作。

尽管个人电脑的进化速度快得让人吃惊,超级计算机同样也在进化。选择前者而不是后者处理天文数字一般的无线电信号数据,看上去有点不可思议。但是科学家早已发现,大多数个人电脑在大多数时间都处于闲置的状态。一台电脑闲置的计算能力对于科学家而言可能是微不足道的,但是如果把计算能力乘以500万呢?


SETI@home



这就是今天的SETI@Home。将近500万注册用户贡献出的计算能力之和相当于世界上最快的超级计算机之一——每秒67万亿次浮点运算。从1999年开始,SETI@Home程序被运行的时间总计超过180万年。目前,SETI@Home是世界上最大、也是最著名的互联网分布式计算项目。尽管迄今为止SETI@Home还没有找到任何地外文明的迹象,它的成功在方法上证明了一种新的计算方式——网格计算(Grid Computing)——是有可能成功的。

超级挑战

SETI@Home的成功激励着一些后来者的加入。如今,在互联网上已经出现了许多类似的分布式计算项目。例如用屏幕保护程序筛选针对天花或者艾滋病的药物,或者计算某些蛋白质可能的折叠结构。但是,所有这些项目所面临的挑战都比不上欧洲核子研究中心(CERN)的科学家所面临的。

在瑞士的日内瓦,CERN的科学家正在建立世界上规模最大的粒子对撞机——大型强子对撞机(LHC)。这个周长27公里的环形庞然大物可以把质子加速到接近光速,然后让它们迎面相撞。

科学家希望在2007年建成的这台对撞机揭示出物质更深层次的秘密。但是这台超级对撞机既是粒子物理学家的美梦,也是计算机专家的噩梦:如果大型强子对撞机开始工作,那么就会从对撞机的探测器中涌出数以拍字节的数据。如果说“拍字节”(10的15次方字节)这样的概念比较抽象的话,那么它相当于填满数百个主流个人电脑的硬盘。

没有什么单独的计算机能从容不迫的处理、储存大型强子对撞机产生的数据,更不要说让超过40多个国家和地区的科学家共享这些数据。CERN的科学家考虑使用一种新的计算机组织形式——网格计算。


大型强子对撞机(LHC)效果图



从2000年开始,CERN的科学家着手建立这样一个和大型强子对撞机一样庞大的计算机系统。大型强子对撞机的计算网格类似于SETI@Home的做法,但是前者就不仅仅是一般个人电脑用户的消遣了。连接在这个计算网格上的计算机既有粒子物理学家的个人电脑,也有许多国家和地区研究机构的超级计算机。大型强子对撞机产生的天文数字数据会分布储存在这些计算机中,而不是某一台计算机单独负责存储数据。而这些数据的分析计算也是由网格中的所有计算机协作完成的。
  
计算机的“电网”

一旦CERN的这个计算网格开始工作,使用它的科学家将不会感到他所面对的是成千上万联网的计算机,而是一台虚拟的超级计算机。使用者不用关心数据储存在哪里,又是在哪里被分析和处理的。只要在一台联入计算网格的计算机上输入想要查找或者计算的内容,在很短时间内网格就会把结果返回给使用者。

这就是网格计算。网格(Grid)在英语中可以指输电网。1990年代中期,美国阿冈国家实验室的一位科学家伊恩·福斯特(Ian Foster)最先把网格这个词从从输电网扩展到了计算机领域。

在福斯特看来,计算机组成的网格类似于输电网:当我们使用电器的时候,从来没有关心电力来自哪个发电厂,以及经过了什么电压变换。我们只是简单的把电器插入墙壁上的电源插座。然而隐藏在插座后面的则是许多发电厂和把它们连接在一起的输电线路。计算机网格模仿了输电网。当你把一台电脑接入计算机网格的时候,就相当于寻求使用计算机网格的“计算力”。你不用关心数据是由什么计算机储存和计算的,正如你并不关心电源插座后面的故事。

网格计算就如同建立计算机的输电网。一个发电厂多余的发电能力可以通过输电网传送给远方的城市用户,一台计算机多余的计算能力远可以通过计算网格,让远方的用户加以利用。正如加州大学伯克利分校的科学家所做的那样。他们只是把由射电望远镜接收到的信号简单的放在一台专门的计算机上(相当于给电器接上电源),然后就会有数一般万计的个人电脑(相当于发电厂)把这些数据分而治之(SETI@Home)。


网格计算



感受到网格巨大威力的不仅仅是科学家,从IBM到SUN这样的信息技术公司,都把目光和资金投向了这个正在兴起的概念。例如,IBM已经投资数十亿美元用于网格计算的研发。而各种专门从事网格计算的公司,也正在雨后春笋般地冒出来。

当然,作为一种正在兴起的概念,网格并非已经完美无缺。计算机科学家面临的挑战包括,如何让不同型号、使用不同软件的计算机在同一个网格中协同作战;如何防止网格中病毒和黑客的威胁,等等。

20多年以前,CERN的一位计算机专家为了让互联网更容易使用,发明了划时代的万维网(WWW)技术。20多年过去了,现在我们把WWW一种普通的技术。也许有一天,计算机网格就像电网一样,会成为我们生活中最平淡无奇的组成部分之一。

“网络就是计算机”的概念似乎已经落后了,网格才是。

量子密码技术


更加安全的量子密码技术
URL:http://edu.qiji.cn/eprint/abs/2344.html

作者:碧雪
注释:字数 3116 yy440@sina.com 264000 山东烟台新海阳西街79 刘晓荻

摘要/内容:

在IBM的华生实验里,量子计算领域的创始者之一班奈特根据量子力学的原理,正在发明一种新的加密技术——量子密码技术,这一技术将使未来的密码使用更安全。

在这个实验里,他们让光子在一个昵称为“马莎阿姨的棺材”的光密盒里走了30厘米。光子振荡(偏振化)的方向,代表一连串量子位里的0与1。量子位构成密码的“钥匙”,可以对信息加密或解密。窃听者之所以刺探不到钥匙,是由于海森堡的测不准原理——这是量子物理的基础之一,当我们在测量量子态的某个性质时,会使另一个性质受到扰动。在量子密码系统里,任何窃取者在偷看光子束时都会更动到它,而被发送者或接收者察觉。原则上,这种技术可以做出无法破解的秘密钥匙。

从班奈特办公桌上的临时设计一直发展至今,量子密码技术已经有了长足的进展。现在美国国防安全署或联邦准备银行已经可以向两家小公司购买量子密码系统,而且未来还会有更多的产品。这种加密的新方法结合了量子力学与信息论,成了量子信息科学的第一个主要商品。未来,从这个领域诞生的终极技术可能是量子计算机,它将具有超强的译码能力,而要避免密码遭破解的唯一方法,可能得用上量子密码技术。

现代的密码专家所遇到的挑战是,如何让发送者与接收者共同拥有一把钥匙,并保证不会外流。我们通常用一种称为“公钥加密”(public-key cryptography)的方法发送“秘密钥匙”(简称密钥或私钥),对传送的信息加密或解密。这种技术之所以安全,是因为应用了因数分解[注1]或其它困难的数学问题。要计算两个大质数的乘积很容易,但要将乘积分解回质数却极为困难。目前在公开金钥加密法中,最常用到的RSA密码算法,就是应用因数分解的原理。在发送与接收者之间传递的秘密信息,是以“公开钥匙”(简称公钥)加密,这个公钥是一个很大的数,例如408508091(实际上用的数会远大于此)。数据只能以接收者握有的密钥解开,这把密钥是公钥的两个因素,而在这个例子里就是18313与22307。

由于破解“公钥加密”很困难,因此在未来10年甚至更久,密钥的安全性仍旧很高。但是随着量子信息时代的来临(尤其是量子计算机可以快速算出吓人的高难度因素分解)可能预示了RSA及其它密码技术终将失效。英国布里斯托大学电子及电机工程系教授瑞若堤说:“如果量子计算机成真,一切都会不一样。”

量子密码术和“公钥加密”的差别在于,前者在量子计算机出现后仍然牢不可破。要在两端传递量子加密钥匙,其中一种方法就是以激光发出单一光子,光子会以两种模式中的其中一种偏振。光子的第一种偏振方向是垂直或平行(直线模式);第二种则是与垂直呈45度角(对角模式)。不管是哪一种模式,光子的不同指向分别代表0或1这两个数字。依惯例,密码学者通常称发送者为艾丽斯(Alice),她以直线或对角随机模式送出光子,发射出一串位。至于接收者则称为鲍伯(Bob),他也随机决定以两种模式之一来量测射入的位。根据海森堡的测不准原理,他只能以一种模式来测量位,而不能用两种。只有当鲍伯与艾丽斯选用相同的模式时,位的指向才能保证是正确的,不会影响原来的数值。

在传送之后,鲍伯与艾丽斯互相联络,这时不需要保密,鲍伯告诉对方他是用哪种模式接收个别光子。不过他并没有说明各个光子的位是0或1。接着艾丽斯告诉鲍伯他哪些模式的测量方式是正确的。他们会删除没有以正确模式观测的光子,而以正确模式所观测出来的光子便成为钥匙,用以输入算法来对信息加密或解密。

如果有人(称为伊芙,Eve)想拦截这道光子流,由于海森堡原理的关系,她无法两种模式都测。如果她以错误的模式进行测量,即使她将位依照测到的结果重传给鲍伯,都一定会有误差。艾丽斯与鲍伯可以选择性地比较一些位,并检查错误,来侦测是否有窃听者。

从2003年起,瑞士日内瓦的id Quantique公司以及美国纽约市的神奇量子科技公司(MagiQ),都发表了可以传送量子密钥的商品,传送距离超过在班奈特实验里的30厘米。还有美国NEC公司的产品,它传送了150公里远,创下纪录,并在今年初上市。除此之外,IBM、富士通以及东芝等也正在加紧研发。

这些上市的产品,借着一条光纤便可将钥匙传送到几十公里以外的地方。神奇量子科技的产品每个售价7—10万美元。在1999年时创立了神奇量子科技、曾任华尔街量化交易员的葛尔方评论道:“少数顾客正在测试、使用这个系统,不过还未在任何网络上广为配置。”

有些政府及金融机构担心,如果把今天所截获的加密信息存放10年以上,到时候量子计算机就会解开它。美国洛色拉摩斯国家实验室的量子密码研究员休斯,提到一些其它必须长时间保密的信息:人口普查的原始数据、可口可乐的配方,或是商用卫星的指令。量子密码系统的其它可能客户,还包括了提供客户超机密服务的电信业者。

目前,想将量子密码技术放到实际网络上(而非点对点联系)的首次尝试,已经开始在进行。美国国防高等研究计划署资助了一个计划,连接六个网络节点,涵盖麻州剑桥的哈佛大学、波士顿大学,以及BBN科技公司(这家公司在建立因特网上曾扮演关键角色)。密钥通过专用的连结发送,然后将加密过的信息,通过因特网传送出去。BBN负责这项计划的艾略特说:“这可是第一次在实验室外连续操作量子密码网络。”这个网络传送的是一般非机密网络信息,目的只是用来证实这个技术确实可行。艾略特表示:“我想与这里唯一有关的机密,就是哪儿有停车位。”2004年秋天,日内瓦的因特网服务供货商Deckpoint,与id Quantique共同展示了一个网络,可以将日内瓦内的好几个服务器数据备份到10公里外的站台,并通过量子加密网络,频繁地发送新钥匙。

现在的量子密码术仅限在地区性的网络上。这项技术的威力在于,任何人只要刺探钥匙的传送,都一定会更动到钥匙。但这也意味着,我们没办法借着网络设备将携有量子钥匙的讯号放大,然后继续传输到下一个中继器。光学放大器会破坏量子位。

为了扩张连结范围,研究人员正在尝试以光纤之外的媒介传送量子钥匙。科学家爬到山巅(在那样的高度下,大气的干扰可以减到最小),想证明通过大气来发送量子钥匙是可行的。洛色拉摩斯国家实验室在2002年所做的一个实验,建造出一个10公里远的连结。同年,英国法恩堡的QinetiQ,与德国慕尼黑的卢特维格–麦西米连大学合作,在阿尔卑斯山南边两个距离23公里的山顶间做了另一个实验。他们进一步改良技术,例如使用较大的望远镜来侦测、用较佳的滤镜以及抗反射镀膜,希望由此建造出一个系统,收发距离1000公里以上的讯号,这样的距离足以到达低轨道卫星。一个卫星网络便可以涵盖全球。(欧洲太空总署正展开一项计划,要做地面对卫星的实验。欧盟在2004年4月也发起一项计划,要在通讯网路间发展量子密码技术,部分的原因是为了不让梯队系统(Echelon)窃听—这个系统负责截收电子信息,供美、英以及其它国家的情报机构使用。)

密码专家希望最终能够发展出某种形式的量子中继器(quantum repeater),它本质上就是量子计算机的一种基本型式,可以克服距离的限制。中继器能运作,靠的是爱因斯坦著名的“幽灵般的超距作用”(spukhafte Fernwirkungen)。在2004年8月19日的《自然》里,奥地利维也纳实验物理研究院的柴林格和同事发表了中继器的初步成果,他们在多瑙河底的下水道里拉了一条光纤缆线,两端则放置了“纠缠”(entangled)的光子。测量其中一个光子的偏振状态(水平或是垂直等),会使另一端的光子立即产生一模一样的偏振方向。

纠缠的存在让爱因斯坦心里发毛,但是柴林格和他的研究小组利用纠缠的两个光子间的联系特性,将第三个光子的信息远距传输了600米、跨过多瑙河。这样的传送系统可以通过多重中继器而扩展,因此钥匙里的量子位可以越陌度阡、横跨大陆或海洋。要让这件事成真,需发展出奥妙的组件,例如可以实际储存量子位、而不会损坏位的量子内存,然后再将位传送到下一个连结。曾帮忙创设id Quantique、也曾做过远距缠结实验的日内瓦大学教授吉辛(Nicolas Gisin)说:“这些仍在初步阶段,都还在物理实验室里面尝试。”

[注1]因数分解:把一个数分解成两个或更多的除1外的整数相乘的过程。

打破遗传定律的植物


URL:http://edu.qiji.cn/eprint/abs/2389.html
科学家发现打破遗传定律的植物


作者:曹丽君

摘要/内容:

新华社电 美国科学家在3月24日出版的英国《自然》杂志上报告说,他们在实验中发现一种植物能够改写从父(母)处继承的一些遗传代码,而与祖父(母)本的DNA片段(脱氧核糖核酸)达成统一,这显然打破了科学家一直遵循的遗传定律。

早在19世纪,奥地利科学家孟德尔便提出,决定生物体特征的基因在细胞中成对存在,一个来自父本,一个来自母本,这便是目前仍然指导各种科学研究的遗传定律。不过,美国珀杜大学科学家的最新研究似乎与之背道而驰。

该大学科学家报告说,他们对一种名为拟南芥的植物进行了研究,这种植物两个基因复本上的HOTHEAD基因都出现变异,因此其花瓣和其他花器官不正常的绞合在一起。按照遗传定律,拟南芥的后代也应该具备这种不正常的特征。但是,科学家发现,在一些情况下,拟南芥后代中大约10%具有正常的花器官。

科学家利用基因排序法证明,这些正常的拟南芥后代对HOTHEAD基因的一个或者两个DNA复本都进行了改写,将父(母)不正常的基因片段改写成与祖父(母)一致的正常片段。研究人员又对这些植物其他大量的基因进行了研究,发现这种植物将DNA片段改写为祖先形式的情况频繁发生。

研究人员认为,发生这种“基因倒退”现象最可能的原因是,植物细胞中含有一些此前未被发现的RNA(核糖核酸)分子,这些分子可以作为DNA片段的后备复本。作为矫正一些基因突变的模本,这些RNA分子与DNA一道被遗传到花粉或种子中,在特殊的情况下便对基因进行改写。

他们认为,类似的“基因倒退”现象可能也出现在人身上。在一些罕见病例中,一些孩子遗传了致病的变异基因,却表现出很微弱的疾病症状,原因可能就是,其细胞中的变异基因被改写为正常的、健康的形式。

相关网址:http://www.nature.com/news/2005/050321/full/050321-8.html

星系的一天


作者:摘自 STScI Shea 译

摘要/内容:

就像摄影师面对一大群人随意按动快门一样,NASA的哈勃空间望远镜拍摄了这张包含了许多星系的照片。在拍摄这张照片时,哈勃空间望远镜的高新巡天相机并没有对准任何一个特定的目标。它只是在拍摄天空中一片典型的区域,而此时哈勃空间望远镜的红外相机正在拍摄附近一个星系富集区中的一个目标。

这张星系混杂的照片拍摄于2003年9月,包括了一个黄色的旋涡星系(右下角),可能由于碰撞它的旋臂伸展了出来;一个年轻的蓝色星暴星系(顶部);以及几个小一些的红色星系。

但是外形最奇特的是出现在照片中央呈现出蓝色弧状的星系--它是一种光学幻像。这条蓝色的弧线是一个遥远星系的引力透镜像。这一现象是由于遥远星系的光线被前方的天体弯曲所造成的。在这个引力透镜中,前景天体是一个距离地球60亿光年的红色椭圆星系。红色预示了这是一个包含年老、低温恒星的星系。

在引力透镜中呈现出蓝色弧线的遥远星系距离地球100亿光年。这个星系形成于大爆炸之后仅仅几十亿年间,当时宇宙的年龄大约是现在的1/4。蓝色预示了这是一个包含高温、年轻恒星的星系。

因为宇宙中充满了星系,天空中到处都能看到引力透镜。所以来自遥远星系的光不可能不受其他星系的影响而在宇宙中自由传播,这就像是步行穿过拥挤的机场一样。在太空中,遥远星系的光会穿过其前方的星系,如果前方星系的质量足够大,引力就会使得光线弯曲。

在这张照片中出现的长弧形通常出现在巨大的星系团中,因为星系团聚集了巨大的质量。但是像这样出现在单独星系的周围却是很少见的。因为要出现引力透镜,星系之间几乎要在一直线上。

引力透镜为我们提供了星系的重要信息。它们是非常独特而且有效的直接测定星系中质量(包括暗物质)的方法。星系并不仅仅是由恒星、气体和尘埃组成,看不见的暗物质占了星系的绝大部分质量。对这个新发现的系统J033238-275653的研究发表在《天体物理学报通信》上。这一研究以及类似的观测使得天文学家可以第一次直接测量明亮的近距星系的质量。

版权:NASA,ESA,J. Blakeslee和H. Ford(约翰·霍普金斯大学)。
相关网址:http://www.hjsm.net/astro/