你好,游客 登录
背景:
阅读新闻

横跨50国的LCG网格分析宇宙起源

[日期:2010-03-31] 来源:  作者: [字体: ]

 

 

 

欧洲核子研究中心(CERN)3月30日宣布,跨越日内瓦市郊瑞士法国边界的大型强子对撞机(Large Hadron Collider,简称LHC)上,总能量为7万亿电子伏特的两个束流对撞,在发生两次故障后最终获得成功。这是世界上目前能量最高的对撞。

  此次对撞实验首次向媒体开放48小时。中国科学院高能物理所CMS(紧凑缪子线圈)实验远程控制中心通过网络向媒体直播了对撞实验过程。

  “此次对撞成功,标志着LHC的物理研究的开始,标志着一个激动人心的粒子物理新时代的到来。”中国科学院高能物理研究所粒子天体物理中心研究员陈国明说。

  据悉,对撞的两个束流,每个束流带两个束团,每个束团由50亿个质子组成,每个质子的能量为3.5万亿电子伏特。质子的速度是光速的99.999995%(比光速慢亿分之五)。按计划,本次运行后4个月内,每个束团的质子数将上升到800亿个。

  北京时间30日下午3点左右,正当记者们在高能所CMS实验远程控制中心聚精会神地观看对撞实验时,CERN传来消息:由于对撞机保护装置导致束流意外丢失,对撞未能如期实现。研究人员不得不继续对机器进行调试。

  陈国明介绍,2008年的LHC实验失败,发生爆炸事故,在其后的一年多时间,CERN对LHC进行了检修和调整,并增加了保护装置。此次束流丢失正是此保护装置所致。

  不过,CERN研究人员随即表示,这是他们意料之中的事情:“我们已经等了20年,可以再耐心等一会。”几个小时后,CERN研究人员想要再次进行对撞,又一次发生了故障。不过,功夫不负有心人,经过进一步调试后,北京时间30日晚上7点零6分,总能量为7万亿电子伏特的两个束流对撞成功。

  “做科学实验,尤其是在能量这么高的机器上开展实验,是一件非常有挑战性的事情,不会像开party一样,客人一来就可以看到庆祝的时刻。”高能所所长陈和生向记者介绍,“LHC是世界上能量最高的机器,非常复杂,在调试过程中,由于束流丢失未能如期实现对撞,并不意味此次对撞实验失败。北京正负电子对撞机在调试过程中也经常出现束流丢失的情况,这是调试过程中碰见的正常状况。”

  欧洲核子研究中心将连续运行LHC 18到24个月,以便为LHC上面的各个实验提供足够的数据来进行物理研究。这一阶段的运行过后,LHC将关机进行彻底修理,为14TeV对撞作准备。

  欧洲核子中心的所长Heuer说,两年的连续运行是一个离谱的要求,但这个努力是值得的,这可以补偿前次失败所失去的时间,使物理学家们可以有机会做出他们的成果。

  LHC:将开启粒子物理时代

  陈和生介绍,LHC是世界上最大的大型强子对撞机,建在周长为27公里的环形隧道里。隧道埋在地下50到175米处。LHC的设计目标是对撞两个反向回旋的质子束流。质子束流的总能量最高能达到14万亿电子伏特。

  LHC的隧道里安放了4个探测器CMS(紧凑缪子线圈)、ATLAS(超环面仪器)、LHCb(底夸克探测器)和ALICE(大型离子对撞机)。科学家们期望在能量为数万亿电子伏特的质子对撞中发现有意义的新物理,例如难以捉摸的黑格斯粒子,它是一种理论上预言的能解释其他粒子质量起源的新粒子和组成暗物质的粒子,而这些暗物质构成了宇宙的大部分物质。但LHC的科学家们并不期待在第一天就发现新的粒子,因为科学研究是一个长时间的过程。

  CMS和ATLAS两个实验的物理目标是寻找黑格斯、额外维度和宇宙神秘的暗物质。4个探测器中ATLAS体积最大,能占半个巴黎圣母院。CMS大小只有ATLAS的1/6,但重量是ATLAS的1.8倍,它使用的铁比埃菲尔铁塔还多。它采用圆柱形超导电缆线圈,可产生4万高斯的磁场,相当于地球磁场的10万倍。

  LHCb实验将有助于人们了解为什么宇宙中反物质不可思议地缺少。它通过研究一种称为“底夸克”的粒子,专门对物质和反物质之间的微妙差异展开调查。

  在这4个实验中,3个是质子对撞实验,只有ALICE是重离子对撞实验。LHC将让铅离子进行对撞,在实验室条件下重建“大爆炸”之后的宇宙初期形态,撞击时产生的高温是太阳内部温度的10万倍。物理学家希望看到的是,质子和中子会在这种高温条件下“熔化”,并释放被胶子束缚的夸克。ALICE获得的数据将允许物理学家研究夸克—胶子等离子体的性质和状态。

  建造LHC的设想是在上世纪80年代初提出的,有人设想利用当时还在计划中的大型正负电子对撞机27公里长的隧道建造能量更高的对撞机。1984年在瑞士洛桑召开的学术讨论会上成立了几个工作组去研究质子对撞中的物理学。1994年2月,欧洲核子中心理事会批准了这一计划。1995年,LHC的技术设计报告被公布。1998年4月,土木工程开工。

  中国:积极贡献力量

  据悉,有来自约40个国家大约3000名科学家参加了CMS和ATLAS实验。

  中国是参加CMS实验的40多个国家之一,有4家科研单位参与CMS实验。其中,中国科学院高能物理研究所和北京大学组成的CMS中国组成功建造了1/3的端部缪子探测部阴极条室和阻性板室,并参与拟定了CMS技术设计报告。中国科学院上海硅酸盐研究所向CMS提供了核心探测材料——用于电磁量能器的5000余根自主研制的钨酸铅(PWO)闪烁晶体。中国科技大学参与了电磁量能器的研制。CMS中国合作组在高能所建立了CMS实验远程控制中心,与CERN和美国费米实验室一起轮班承担CMS实验的一部分实时控制工作。

  ATLAS中国组包括中国科学院高能物理研究所、山东大学、中国科技大学和南京大学四个单位。对ATLAS实验的缪子探测器和电磁能量器的设计和建造作出了重要贡献。

  目前,CMS和ATLAS实验的中国科学家正积极参与探测器日常运行值班和非常复杂的模拟数据分析,为用即将获取的实验数据发现包括黑格斯在内的新粒子和新物理作准备。

  高能所的计算中心建立了LHC数据分析的网格平台,有2500个CPU,加入全球LHC的实验数据分析网格,为中国物理学家和世界各国的物理学家服务。

 

LHC网格:为地球上最大的科学设施存储和分析数据

大型强子对撞机(Large Hadron Collider ,LHC)粒子加速器致力于革新我们对于宇宙的认识。世界范围的LHC计算网格(LCG)项目为整个使用LHC的高能物理社区提供了数据存储与分析的基础设施。

启动于2003的LCG,目的是将分布在全世界数以百计的数据中心的成千上万的计算机整合起来,形成一个全球化的计算资源,对LHC所收集的海量数据进行存储和分析。据估计LHC每年将产生15 petabytes(1500万gigabytes)的数据。这等于一年要填满170万张双层DVD盘片!全世界数以千计的科学家需要访问和分析这些数据,所以CERN与33个不同国家的机构展开合作来运营LCG。

LHC实验产生的数据将分布到全世界,同时在CERN用磁带保有一份主备份。经过初始处理,这些数据将分发到十一个大型计算中心——包括加拿大、法国、德国、意大利、荷兰、北欧、西班牙、台北、英国,以及位于美国的两个站点——这些中心拥有足够的海量存储以支持大容积的数据片段,同时能对计算网格提供昼夜不停的支持。

这些所谓的“一级”中心将为超过120个的“二级”中心提供数据以用于专门的分析任务。科学家们可以在本国访问LHC的数据,通过本地计算集群甚至是个人PC。

LHC计算网格由三个“层级”构成,共有32个国家正式参与其中:

  • Tier-0为一个主站:CERN计算中心。所有数据都将通过这一中央枢纽,但它只提供总共不到20%计算能力。
  • Tier-1由十一个站点构成,位于加拿大、法国、德国、意大利、荷兰、北欧、西班牙、台北、英国,还有位于美国的两个站点。
  • Tier-2由超过140个站点构成,聚集成38个联邦,覆盖了澳大利亚、比利时、加拿大、中国、捷克、丹麦、爱沙尼亚、芬兰、法国、德国、匈牙利、意大利、印度、以色列、日本、韩国、荷兰、挪威、巴基斯坦、波兰、葡萄牙、罗马尼亚、俄罗斯、斯洛文利亚、西班牙、瑞典、瑞士、中国台北、土耳其、英国、乌克兰,以及美国。Tier-2站点将提供LHC数据处理所需能力的50%。

如若LHC加速器以理想的方式运行,那么需要为全世界超过500所研究机构和大学的近5000名参与到LHC的实验的科学家提供对实验数据的访问。除此以外,在LHC预计超过15年的生命周期里,所有的数据都须是可用的。

出于经济和技术的众多理由,都强烈需求一个分布式架构

作出采用分布式计算的方式来管理LHC数据的首要考虑还是金钱。在1999年,当LHC数据分析计算系统设计工作开始的时候,就很快认识到了其所需求的计算能力远远超出了CERN的资助能力。另一方面,大多数LHC的合作实验和院校都有国家级或地区级计算设施的使用权。明显的一个问题就是:这些设施能整合起来为LHC提供一个统一的计算服务吗?高速发展的广域网——能力和容量的增长伴随着成本的显著降低——使之看似可行。从那时起,LHC计算网格的发展路线就确定了。

在LHC计算网格的研发过程中,分布式系统的许多附加优势开始显现:

  • 不同的站点能保有数据的多份拷贝,保证了所有参与其中的科学家都能访问,独立于地理位置。
  • 允许多个计算中心的闲置能力得到最优化的使用,提升了效率。
  • 在多个时区都拥有计算中心使昼夜不停的监控易如反掌并保证了可靠的专业支持。
  • 不存在单点失效。
  • 维护和升级的成本是分散的,因为单个机构负责资助本地的计算资源并保有相应责任,与此同时仍然对全球化的目标作出了贡献。
  • 独立掌控资源鼓励了计算和分析的新兴手段。
  • 所谓的“人才流失”,研究员不得不离开本土以获取资源,当资源从他们桌面即可获取时,这一现象被大大地减少了。
  • 系统只需简易重新配置即可应对新的挑战,使其能随着LHC的生命周期动态的演进,能力不断成长,以满足每年采集数据增加引起的需求上升。
  • 对于在什么地点以及怎样扩充未来的计算资源留出了足够的灵活性。
  • 允许社区享用新技术带来的提升的易用性,成本效益或能源效率。

整体项目的规模给LCG团队带来了一些有趣的挑战

  • 管理需要在网格间可靠传输的庞大数据
  • 掌管每个站点的存储空间。
  • 跟踪9000名物理学家分析数据所产生的几千万的文件。
  • 保证足够的网络带宽:主站点之间用光纤链接,而最远程的站点也需要可靠的链接。
  • 保证大量独立站点之间的安全同时最小化官僚作风,确保认证用户易于访问。
  • 维护多个站点安装的软件版本一致连贯。
  • 处理异构的硬件。
  • 提供会计机制,基于不同级别的需求和对基础设施的贡献,保证公平的访问。

对于如此巨大的分布系统来说,安全同样是个重要的挑战。据“每日电讯”报道,9月10日,当第一束粒子环绕粒子加速器呼啸而过时,来自希腊的黑客曾获取了CERN中一台LHC计算系统的片刻权限

在CERN,运营着这个庞然大物的机构,科学家们担心黑客们一旦得手将会做什么,因为他们离控制这一机器中一个庞大探测器的计算机系统仅“一步之遥”。这是个重达12500吨的磁体,长近21米,宽高15米。

如果他们进入到第二道计算机网络,他们可以关掉这大型探测器的一部分。内部人士说:“就算没人捣乱要让它们工作起来都够困难了。”

攻击造成的后果是,在写这篇文章的时候,公众仍然无法访问cmsmon.cern.ch这一站点。

驱动LCG的操作系统是Scientific Linux发行版。它是来自Fermilab(费米国家实验室)、CERN,以及世界上许多实验室和高等院校的结晶:

LHC计算网格(LCG)由分布在世界各地的近40000个数据处理CPU构成。除其它的软件外,参与进来的MAC和PC将会加载CERN定制的Scientific Linux(现在版本是Scientific Linux CERN 4)。

如果没有强劲的软件运行其上,拥有这样一个强大的网格也毫无意义。所以LCG开发者向导为所有开发和修改LCG代码的人员提供了技术信息,并解释了满足生产要求的开发过程:

软件开发过程可被分解为几个简单的步骤。
  • 在CVS创建一个新模块。
  • 编写代码和文档。
  • 彻底地测试代码。
  • 在CVS分支树里标记这一模块。
  • 联系系统构建经理将你的模块加到构建模块清单里。
  • 确保自动构建成功地创建了软件包。
  • 彻底地测试软件包。
  • 向LCG提交自动构建的软件包。
  • 修正集成和验收流程中发现的缺陷。

API是使用C/C++,Java以及Perl开发的,文档化使用了Doxygen、Javadoc或POD。网格中用到的其它软件包括:

  • The Berkeley Database Information Index (BDII)
  • gLite,用于构建网格应用的框架
  • Xen,虚拟机监控器
  • Glue 2,一个抽象的信息模型,通过模式进行表达并独立于信息系统实现
  • Gridview,一个监控和可视化工具,为LCG的诸多方面的功能提供高层次的视图(基于Java,PHP和Oracle 10g)

网格计算并不是回应LHC挑战的唯一答案,一些场合下志愿计算也大有用武之地。具体而言,志愿计算非常适合需要大量计算能力而只需相对很少数据传输的任务。2004年,CERN的IT部门饶有兴致地对SETI@home等志愿计算项目所用到的技术展开了评估。最终的努力化作了LHC@home这样一个结果,这一项目帮助用户将其机器的空闲时间贡献出来,为物理学家开发和探索粒子加速器添砖加瓦。它用到了BOINC这一志愿计算和桌面网格计算的软件平台。

请查阅InfoQ获取关于网格计算架构的更多信息。

查看英文原文:LHC网格:为地球上最大的科学设施存储和分析数据

 

推荐 打印 | 录入: | 阅读:
相关新闻      
本文评论   
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款