你好,游客 登录
背景:
阅读新闻

中国云计算大会现场直播

[日期:2010-05-22] 来源:CSDN  作者: [字体: ]
CSDN直播小组:今天是第二届中国云计算大会第二天,CSDN直播小组正在大会现场为您做现场图文直播,敬请收看。 云存储虚拟化分论坛 嘉宾:华中科技大学计算机学院院长金海 内容:从网格计算到云计算 金老师:大 家好,我今天给大家主要讲一下云计算。说到语音计算大家比较喜欢,现在没有非常权威的专家说,语音计算是什么样的定义,虚拟的资源把它变成一种服务,这就 叫做语音计算,从这个定音本身来看,你可以看出,语音计算它的本质是什么呢?我们比较一下网络计算,我们就给出语音计算这几个本质。    第一,语音计算并不强调资源,首先在构建领域资源的时候,它是由机构来进行构件,就是它自己的一个语音计算平台。语音计算是以现在从这几年比较热的虚拟经 济。WAS上面各种包括视频共享网站,等等各种它都有很多的商业应用。对语音计算来说,并不强调某一个语音计算中心我需要非常强大的超级计算机,座谈早上 李院士在报告当中就说得非常清楚,语音计算是以普通的服务器械集群,作为它的一个基本共享单元。通过大量的分散在各个地方的这种服务器集群,来完成它的服 务。所以从我们在整个计算机体系结构这个角度来看,有分故事系统的一种集中的管理。它需要把这些资源分布在各个地方。    另外,它是采用是普通服务器集群,分在各个不同地方,因此是一种松耦合环境下的处理,就是在松耦合环境下做海量处理的处理方式,变成一种环境,这是语音计算的一个本质。     说到虚拟化这是语音计算的一个基础的基础,大家谈语音计算跟网络计算,在技术层面上有甚么最基础的差异,虚拟化怎么来定义,因为很早就有虚拟化,虚拟化本 身就是把底层物理设和上层的操作化,或者上层的软件进行分离的一种去耦合技术,各个层面做各个层面的工作,大家不要捆绑在一起,它希望能够把它进行去耦 合,目的就是为了实现信息资源的利用效率和灵活性的最大化。    大家也知道,在语音计算出来之前,我们大量集群的时候,它的利用率其实是非常低的,其原因就在于各个机器都采用单一的集群,比如E—mail服务器,每个 服务器它的峰值是不一样的,因此会带来整个系统利用率非常不均衡,平均利用率会非常低。我们采用虚拟化技术以后,就可以把这些资源整合在一台机器上,或者 相邻的一些机器上,来提高它的利用效率和灵活性的最大化,这就是虚拟化的基础。    说起虚拟化,本来昨天还想公布,我们CSDN这本杂志,网上评的语音计算十大事件,我们就没有公布。后来追诉虚拟化历史是可以追溯到1959年,ifip 这个组织大家很多人都不知道,这几年这个组织影响力比较小,对ifip这个组织部知道,其实ifip这是非常老的组织,是1959年在奥地利的维也纳成立 的一个叫国际信息化联合组织,这个组织它有一个非常大的会议,就是是全世界计算机大会,成立于2000年的时候这个大会是在中国举行,当时国家主席江泽民 亲自到场。当时1959年成立ifip的时候,有一篇文章就是再讲。这片文章就是后来虚拟化的基础,一也是操作系统的一个基础,当时是因为资源不够,所以 采用共识的方法用一个CPU的资源,当时虚拟化是这种目的,但是现在虚拟化是因为我们资源太多了,这么多的资源怎么样有效的利用这个虚拟化资源,这是虚拟 化最早的一个历史。    前面简单的介绍一下我个人对网格计算和云计算简单一个认识和一个体会,这几年大家在讲云计算的时候,很多人都会问网格计算和云计算有甚么好处。下面给大家 介绍973项目,计算系统虚拟化与方法研究的这个973项目。具体关于项目的详细信息,以及包括项目的研究进展和研究成果,都可以在这个网站上获得,这个 网站大家可以去访问。    我们整个973项目一个基本的思路就是以用户为中心构建虚拟化计算系统。这里面包括三个部分:    一、任务执行环境实现虚拟化,这是第一个层面,就是保证任务在执行环境所需要各种资源的力度是可变的。我们大家知道如果不采用虚拟化的技术,整个机器是以 机器为单位为大家提供计算资源,我们希望能够在以和为单位来给大家提供资源,无论是单机还是多机,这是任务执行环境的虚拟化。    二、资源使用环境的虚拟化,希望能够保证各种资源能够透明、高效的使用。     三、用户操作环境方面的虚拟化。就是说怎么样来提高用户操作环境的灵活性和自动配置的能力,这里面更多是强调整个三个层面可以看出,任务执行环境的虚拟 化,是指从硬件这个层面来实现虚拟化的各种机制,资源使用环境虚拟化是在从软件这个层面怎么来透明使用各种不同的异购软件,其实这就是异购资源透明高效的 使用。    从用户操作环境的虚拟化,主要是用来从用户这个层面,也就是我们后面会讲到的,怎么提高用户操作环境的灵活性和自动配置能力。    整个项目分成8个具体课题。     课题1:叫做计算系统虚拟化基础理论模型和体系结构研究,主要是从基础理论方面来研究,包括怎么在不同异购平台上,运行未经修改的代码,这里面牵扯到翻译 的问题,怎么样去解决这个问题?可能是一个非常重要的问题,因为我们国家也自己研制很多国产CPU,原来在原来产品的平台上,可以用的软件,因为很多软件 我们并不一定都有它的代码,我怎么能够在新的平台上,我们国产CPU平台上,能够应用这个程序。所以这里面我们提这方面研究工作,而且在做,这个工作主要 是国防科技大学在完成的,因为他们是在做这个结构方面的研究包括动态二翻译的模块放主板上面,通过一个专门的模块来加速动态二体系翻译,这是他们研究的。     课题2:单计算系统内的资源虚拟化方法。这里面主要就是类似于有点像虚拟经济研究,在单个上面怎么实现虚拟化,这个是北京大学在研究。虚拟机能够感知地层 的OS,并且样来进行协同以后,能够实现下面的动态的管理。比如说大家知道,因为中间加了一层虚拟机以后,上面的OS基本上无法控制底下的设备,两者怎么 进行协同,比如说我们去年是发表了一篇文章,就是通过两者的协同,来对底下的这些各种管理模块进行管理,从而达到上层OS同样能够实现节能的功能,以前一 个操作系统可以完成这个工作,但是现在是两个操作系统,中间加一个虚拟机,这个是在虚拟化里面要做的工作。    课题3:清华大学在完成,多计算系统,这个多计算系统是指在一个系统里面,而不是不同的节点,我们以前称之为网络虚拟化,在多个计算系统里面怎么来实现虚 拟化。在这里面有不同的系统,当我需要4个和的时候,我是在一个机器里面选4个和?还是各选两个和?这个需要根据当时的情况来做。    课题4:虚拟计算系统普适化运行环境。我是不是可以不用各种软件,软件都在云端比如我们现在讲SARS,我们这里面做普适化的运行环境研究。     课题5:虚拟计算的安全可性机制研究。大家知道虚拟机可以有效的隔离每一个不同的虚拟机,因为它相当于,尽管在一个CPU上面,但是我可以认为是单独一个 不同的独立的资源,资源之间怎么能够有效的隔离,从而使得某一个和,上面装的操作系统被攻击掉以后,或者坏掉以后,不会影响其他的和,虚拟机制能够正常运 行工作,所以能够提供一些安全可信的机制来研究。    课题6:虚拟计算系统评测理论与方法。因为我们大家知道,我如果在一个高性能计算机上,高性能计算机上面其实用虚拟机的并不多,它的性能会下降,但是某种 程度上提供了高性能计算机在计算中心里面的灵活性,所以怎么样来评测它,如果我装上虚拟机以后怎么评测它?怎么衡量它?高性能计算机能够接收这些信息,是 浙江大学在做评测。    课题7:我怎么在高效能计算机上去用虚拟化技术。其实在美国都不用虚拟化,因为他有一个大型任务,一个大的能够吃满,但是在我们国家这种高性能计算机环境 下,基本上这个大的机器吃满的情况不可能,它可能要有很多高性能的任务,同时在大的计算机上运行,这时间需要提供不同的环境,这需要有虚拟机的支持。那怎 么样设计一个轻量级的虚拟机,使得在高效能计算机能力仍然能够发挥高性能的能力,提高整个计算机利用效率,这就是高效能计算机上面怎么用虚拟化技术来做这 些工作。这个课题是神威计算机在做这个事情。    课题8:虚拟化仿真应用。昨天李院士用到的,原来在网络平台上去做,现在随着多和的出现以后,怎么在仿真虚拟化平台上做仿真,比如说机器的仿真,武器的仿真。这是我们8个课题,这是航天部二院做课题8。     7和8在应用层面上 ,这就是我们大概的一个对应关系。1、2、3、5主要是解决任务执行环境怎么来实现动态构建和资源环境的高效透明使用,一个是从硬面环境,一个从软面环 境,怎么来实现软件的使用。课题4从用户操作环境的虚拟化,6、7、8主要做性能评测、理论验证和应用示范的一些研究工作,这是我们的课题任务。     我们这个研究团队分散在全国,我们有6个高等院校,两个研究所共同来承担我们的任务,一共有8个单位。下面重点给大家介绍一下,我们在桌面虚拟化的研究工 作,这个研究工作在实验室部署,而且我们跟两家企业在合作,一个在移动平台做合作,另外桌面平台上做合作,我想把这个工作的结果大家展示一下。    桌面虚拟化是语音计算落一的一个非常好的手段,就是怎么能够动态的吸引用户的需求的变化,为用户提供一个高效、安全、易用语音资源的桌面虚拟化所需要做的工作。这里面要这么几件事情。    1、按需动态的构建虚拟化的桌面环境。    2、与客户端现有操作系统没有任何差别的,就是无缝的实现人机接口。    3、实现计算资源和数据资源的远程部署和安全可信。    4、动态调配云中计算资源。   这就是桌面虚拟化面临的几个问题。    我们实验室做了一套系统,做了一个语音计算的用户桌面,这个用户桌面的几个图。左边的图体系框架,我下面会给大家介绍。右边是在实验室做测试的时候,可以看到个人工作环境,会把你的工作环境弹出来。这里面有这几项技术能够实现:    1、云中异购资源的聚合与共享。    2、工作环境的个性化定制。    3、工作环境的保存与恢复。    4、工作环境的在线迁移。    5、移动环境的虚拟接入。    6、本地环境的协同访问。这也是非常重要的,在这里面大家知道有很多Data surver,各种不同的用户端,包括PC,或者透明计算的PDA等等,都可以在上面来使用。    这里面有几页我跳过去,因为后面有几个演示。    一、这里面牵扯到大量的部署和用户环境的保存和恢复,因此一切多个虚拟机的断点保护,多个虚拟机之间怎么来协同保护和恢复,多个虚拟机的一个端面保护,这里面有一些内容包括我们现在正在做的事情和已经取得的成果,我们这里面就列出来,就不再仔细讲了。     二、还有一个刚才讲到的,本地资源有效利用。这里面我们做了一个非常重要的工作,这个工作是什么?因为牵扯到云安全,昨天李院士专门讲到云安全实际上是信 任和被信任的一个关系。我们为了防止现代大家还解决不了的问题,我们就做了敏感数据,比如我们这个桌面,桌面上已经没有这个软件,这个软件是装在云端,这 个桌面怎么让远端的应用软件能够知道桌面的数据,是他的一个部分,这样就有一种访问进行。比如现在插进来以后,它可以通过某种方式,让远端服务器下面应用 软件知道桌面的数据,通过对桌面数据访问,仿佛这个数据在远端,实际上是协同访问,并不是把数据拷过去,让远端程序能够知道这个数据,但是数据并不拷贝, 这样能够有效保证用户在使用云端资源的时候,能够把一些涉密的资源放在自己这里。    三、虚拟机的全生命周期管理,怎么去管理?虚拟机使用的时候不是使用一次,可能是好几天一直持续的使用,怎么在全生命周期里面,对它进行保护和管理。这是 全生命周期的管理问题,这里有很多细节,不再讲了。这里面是我们系统做出来以后实际应用的一个效果,实际上我们可以看到上面有两个应用,一个是word, 一个是interet,这两个东西装在云端,是两个不同操作系统做支持,这是在应用程序服务中心里面来实现,本身将来的客户端非常的轻,不需要装操作系 统,但可以应用不同操作系统上面不同的软件。    下面我给大家演示,用户桌面操作的流程。    1、一开始比如可以选择,这是我们自己在做实验验证时候做的一些事情,比如可以去选择几个软件,现在选择几个软件,选择完以后,它就会在后台去配置所需要 的硬性环境,配置完了以后,比如说你在windows,这里面可以看到你定制的程序表,可以选择任何一个程序,比如说选择world得等之类,可以从后台 的服务打开,这就可以看到你的程序。大家知道像google这之类的都有很多条,这些条都定制好的条,当然可以按照你的方式来定制,这样可以应用后台操作 系统的任何软件,只要后台提供服务部署,就可以用这个软件,也可以对它进行修改,比如现在再增加一个,增加完了以后,他重新进行配置vizta,配置完以 后,就可以有这个软件在上面,当然可以删除。这样免除你安装软件,每次换机器都安装软件,或者换一台机器不一定有软件,这就是我们在桌面虚拟化做的事情。 这是一个具体的应用部署。    2、另外就是应用。比如我可以存很多历史数据,这里面给的一个测试的界面。比如一个人在不同地点不断切换他的工作环境,这里面就记录了他近十次工作环境的 一个列表,比如说可以去恢复那一天我运行的工作环境的情况,我把这一天的所有的保存的断点,就是工作环境的断点把它恢复出来,恢复完了以后这就是那一天恢 复出来的结果。然后让你是不是重新起哪一天的工作环境?你说yes,他就会调出来,你退出工作环境所保存三个应用程序的情况,甚至你的光标放在什么地方, 他都会保存在那个地方,这样的话,下面可以继续工作。工作完以后,可以继续保存。比如你再保存一次,你是不是保存这个运行环境?你说yes,它就会继续保 存。这样多产生一个使用的列表。    这个工作现在在我们实验室也在做大部分的测试,我们也希望能够通过跟合作伙伴的合作,能够把这件事情真正的大规模的环境下能够做更多的测试。     总结一下,我们可以说虚拟化技术现在已经成为云计算等各种新型计算模式,因为我们大家都叫云计算,也不知道过几年以后还会有甚么样的新计算,所以我们就叫 做云计算等新型计算模型的一个基础。但是还有很多基础性问题没有解决,所以我们国家在973项目项目当中专门做基础理论研究,当然我们做了很多工作,有一 点偏工程性,这个工程化的工作也产生了很多实际应用系统。同时我们面向国家重大战略需求,解决计算设施的重大基础性问题,比如说在高效能计算机上,怎么实 现轻量级的虚拟,我们希望我们研究成果能够提供一些虚拟研究和产业发展做一些贡献。    最后做一个宣传,我们在2008年的时候,出版国家第一本关于虚拟化领域的学术专著,这是8个学校老师一起写的一本书《计算系统虚拟化——原理与应用》, 分别从指令级虚拟化,虚拟化方法,到用户怎么使用,包括安全可信、性能评测以及两个应用方面我们都做详细的综述以及我们研究工作的一个基本的成果在里面都 有,如果大家有兴趣可以看一下。    另外对虚拟研究的老师和同学,我们也对最大的软件Xen,我们做了代码的分析,这也是我们这个国家第一本关于Xen虚拟的原代码分析,包括每一个共享页, 授权表,内存虚拟化、CPU虚拟化,设备虚拟化,访问控制虚拟化,写了一本分析书,如果大家以前开发虚拟机,对Xen有兴趣可以参考这本书。    我的报告,就到这里,谢谢大家。    提问:刚才您提到数据安全问题,说数据用U盘存在本地可以保证数据的安全。 金 老师:它是处理本地数据,但是并没有把本地数据拷贝过去。我们传输的时候,大家知道桌面虚拟化有一个软件,四节的软件,它是以图象的方式,因为这样传输对 带宽要求非常高,我们采用方式并不是图像传过来,我们是把操作代码传输过来以后在这里进行重现,因为操作代码传过来的时候,在本地进行数据处理,所以它的 数据并没有完全传过去,这是我们做的一个技术细节。    主持人:谢谢。因为时间的关系,下面还有问题的话,可以在底下找金教授讨论。下面有请第二位嘉宾,华为塞门铁克公司存储产品线总监范瑞琪先生。    范瑞琪:金 教授刚才的眼睑非常的精彩,感谢大会能给我这样一个机会,让大家分享一下。这在理念和应用方面的一些实践。这几天听了很多很多在云上面的演讲,这方面大家 的认识高度的趋同。云是从专业化走向共有化,从专业化走向了大众化,这是一个大家达成的共识。云应该具有的特征通过虚拟化能够提供多种多样的业务,使得提 供多业务成为一种可能性。所有的业务是并存的,但是同时又安全和独特。   特征1是具有虚拟化,特征2是具有分布化,第三方面是按需可度 量的。客户对于计算资源、存储资源,渲染资源都会分配给你,但是同时要对你技术记叙,这一块对于可运营提供一个支撑。当然还有其他的特征,这三个特征共同 的构成了,私有云、公有云和混合云的表现形式,三个特征权重会不同。例如私有云里面更加强调虚拟化,在公有云里面是按需可度量,因为可能会有不同业务,对 度量收费的需求可能不会那么高,   华赛云战略探索之路,我们08年在华赛发布了云优化节点、试点分布式云存储系统,我们通过试点,能够在云来能 够成为云基础架构的领导者。包括云优化的节点,还有分布式的云存储系统,VIS6000和N8000和HDP这些产品都已经上市。09年我们在世界电信日 这一天,中国移动一个很大项目上限,这个效果非常好。8月份的云的安全信誉评估体系发布,10月份时候symantec在全球同步发布上市。   华赛云应用效果可喜的是:   1、提升系统成熟度。采用云技术、极大的缩短系统稳定期,针对传统的相关IT资源服务交付时间从超过1月缩短到3天。   2、实现快速部署能力。云基础架构实现全面的自动化部署能力和自动恢复。   3、提升可靠性。基于分布式构架基本消除单点,业务恢复从小时级提升至分钟级,关键业务系统可靠性可以达到99.99%。   4、绿色节能。用户维护的人力成本等等,使用云系统之后可以打幅度的压缩。高度集装箱能效率小于1.25   5、资源利用率提升。无论是计算资源还是存储资源使用虚拟化整合之后,资源利用率大部分时间我们的CPU其实是闲置的,整合在一起之后,由原来10%提升到55%以上,有效节约了用户的投资,并且规模也大,效益也会越来越显著。    业界会提出这样的一些问题,华赛对云的理解是什么?从哪个地方开始着手进行发力?华赛谈云谈了两年了?在云上面的目标是什么?从黄金80年代开始,从最 早的主机时代,到后来进入PC,进入这样一个互联网时代,到2000年之后,尤其是本轮经济危机之后开始进入数字洪水的泛数据时代,信息无处不在的时代, 是否以前的方式还合适?华赛在其中有什么样的作为?我们试图回答这样问题。其实在前面我们也讲到,我们的目标是很明确的,我们希望通过为客户跟伙伴提供多 业务云的阶段方面,提供端到端的云基础架构解决方案,我们致力于成为云基础架构的领导者,多业务承载性、安全可靠、灵活可扩展,以及可运营、可管理,还包 括了与合作伙伴的共赢。在今天我们跟大家能够分享的是,我们提出了关于我们在多业务员的战略,我们称之为4+1的落地策略。   我们对泛业务云的 基础解释。从业务资源、安全资源还是网络资源,可以分为不同的结点,加上这些结点,加快网络资源之后,可以抽象成统一的一个对象资源池,一些虚荣器的概 念。再往上抽象成统一的虚拟容器进行不同管理,存储大家是比较熟悉,推不同的业务应用,可能要重新分成两支。   1、在这这个模型中的结构层,我们会采用标准化接口,无论是NFS的一些协议,我们都会系统中得到非常好的支撑。最上面一层就是使得用户感知能够更好的面向应用。   2、再往下一层解析,可能就包括更加详细,更加丰富的云技术架构的基础体体系。无论基础设备层、协议接口层、平台软件层、应用接口层里面都有非常重要的工作。这么多年来,我们在这些关键技术上,做了非常努力的尝试,在很多控制点上也获得了突破。   接下来看一看业界提出的问题,前面讲到华赛的目标是什么?我们提出多业务云的概念,这个是怎么落地的?这样的架构客户都需要吗?大家都说我们现在的应用不好,都是烟囱式的应用,你的云非常好,怎么让烟囱式来进行应用,能够到传说中非常好的云上面去,这是很重要的问题。   我们试图面向客户的应用提出4+1的模型,来回答上述的问题。   1、提出了关于企业数据概念,所有的基础必须有一个基本企业数据更新,通过构建统一的资源池,实现各类数据统一管理和异购整合,并且有一个简化统一管理,这是所有工作的前提,成为企业数据。   2、对数据的安全、数据生命周期的管理有要求。云化企业数据中心如何进行保护,通过容灾备份和安全防护体系的建设,实现数据和业务的安全。   3、面向内部客户、外部客户和合作伙伴,提供各种各样的服务,这也是我们尝试回答的问题。希望构建一个海量空间,提供低成本的数据平台,对外对内能够提供增值服务运营。   4、我们始终不能够摆脱的就是整个数据中心的一个接口,接口这个层面,我们把它称之为媒体,针对媒体资源集中存储及共享的特殊需求,构建海量高效的媒体分发及存储平台。   在这四朵云之下都有共同的诉求,快速部署、集中交付、模块化拓展,这就是4+1,通过企业数据云、业务保护云、增值服务云以及媒体共享云,再加上云交付模块,我们能够用用户提供端到端的云基础架构解决方案,满足不同企业,不同的需求。   接下来我会跟大家进行一些案例的分享,因为前面可能会偏重理论多一些,我们看一下实际的应用。这里列出三个场景。    场景1:首先看第一个场景:用户的需求可能挑战性比较高,要建设结构化为主的高数据中心。这涉及到多个场景,多套IT系统在应用,比如我们做得重庆移动 的一个项目,高性能计算的一些项目,重庆移动的这个项目我们成功的进行了云化整合。当时整合了一共26套IT系统,涉及到5个厂家不同品牌的小集服务器以 及网络资源,整个资源利用率能够从原本的不足15%提升到了67%,然后用户在每个IT系统中剩余的那些空间被有效的挖掘出来,用户实现了统一管理,不会 说我在做一个IT系统的应用,我需要通过厂家的垂直一套网管系统,再去分配系统,再做一些安全跟网络端口的配置,在一套网管系统之上,就可以对不同厂家所 有的系统进行配置和管理,这是我们针对结构化数据进行异构的云化整合。   场景2:大家比较熟悉的阿里巴巴,淘宝做的一个事例。在这个系统中,用 户提出了非常高的一个要求,因为淘宝内部它有非常大量的,但是每个文件非常小,这样一种非结构化的数据为主的一种数据挖掘业务,我们在这里是一个分析平 台。数据量有三亿个小文件左右,以传统方式写一下目录,所有文件列出来,可能几个小时才能把这些文件列出来。我们通过提供一个集群化的文件管理系统,这个 架构并且是按照需求可以拓展的,能够满足小文件的高并发,这里集群架构会成为一个关键点。同时并不是客户所有时间都在进行数据挖掘跟经营分析有时候忙,有 时候闲,这里面有分机存储功能。   另外我们在上面有一些系统是面向文件来提供服务访问,有一些是面向块来提供访问的,它整个分析系统对文件要求入口会很多,整个系统在云上面,无论是NFS、ISCSI和FC等应用方面提供不同的应用平台。    场景3:中国移动139社区为例,中移动称之为超级邮箱,超级邮箱项目从上线开始,这个项目的部署在广州,上线之初其实中移动心中也不是非常有把握,他 也在嘀咕这个事情,上线之后到底有多少客户,他给我们沟通之后,我们上一套云系统,上去之后,先上两个模块,在5.17之后的一个月,用户的规模迅速的膨 胀到50万,它会觉得这个系统不够用了,如果说用传统的一套存储计算系统上去,可能这就会很麻烦,扩容的时候会很糟糕。我们就给他马上再用四个模块串在一 起之后,我们会看到整个系统还是一个文化独立的、整合的一套系统。   截止今天为止,这个系统是在不断的扩容,整个中移动139超级邮箱已经有2600万用户,都在安全稳定的运行,整个运行过程中没有一起故障,没有一起事故,这是给我们,给用户一个极大的信心。详细的技术细节我就不跟大家来展开了。    第二,业务保护云方面的一些案例的专项,今天的发布主要是在国内来做,我们举的例子会偏国内多一些,包括某省的一些社保项目,某市的一个规划局的项目, 企业数据中心,它云化之后如何进行灾备建设,提供业务连续性。这里面有一个很关键的关健词,能够提供业界最先进的I/O级别容灾备份,一旦发现异常或者有 故障发生,数据丢失,只是在网线上发生丢失,其他的不会有什么问题。   同时,我们针对客户的一些要求跟业务保护不仅仅是容灾备份,还有安全防护方面的要求,结合华赛这么多年的经验,我们可以提供集中杀毒、流量清洗和流量分析等安全服务,这是我们独到的优势。这里面包括电信方面的流量控制。    第三,场景是增值服务云这方面给大家做一个分享。前面讲过我们企业数据云已经建好了,数据安全性和业务连续性也得到很好的保证,这时候客户的心思,能不 能再做一些更多的服务,或者说一开始上来,我就直接奔着增值服务来的,以某省高新区客户为例,他提出来构建海量空间、低成本的数据平台。   高新 区这方面有更多行政的要求,有上级主管的要求,有政绩方面的要求,他也希望能够给在高新园区的企业提供增值的业务运营能力,运营涉及到运行、维护、计费、 论证,还包括一些批发转售这样一些行为模式。通过提供一个低成本的架构,低成本会成为一个很重要的竞争力,因为作为高新区而言不可能一下子买非常贵的存储 系统。我们在上层做了很多可运营一些功能,使得这个云能够被整个高新区掌握,能够透明可视,并且提供给园区内所有的客户。   下一步会给大家透露一下,除了几个省独特会建设他们自己的增值服务云之后,还希望把各个高新区孤立的云能够有效结合在一起,有可能会看到全国各个高新区之间的云实际上是互相交叉的,会构成一朵更大的云。   除了前面讲得自己企业的内控、流量清晰的服务之外,还可以提供安全方面的服务。这方面就包括我们在Cloudstor云存储解决方案,安全增值运营方案,这些在安全方面的增值服务。   第四,关于媒体共享。这里面举了三个例子。    1、中国移动的音乐基地,比如他的彩信会放在江苏基地,包括它的彩铃放在四川基地,你去下载一首歌的时候,其实并不知道这首歌是位于四川的那个音乐基地 下载下来的。在每周无论是快男还是超女比的时候,整个云系统要承受非常大的一个业务量的冲击,无论你支持你的偶像是李宇春也好,还是周笔畅也好,其实你的 很多服务都是云化的,在座每一位都是实实在在成为云业务的使用者。中移动这个项目上了很长时间,目前在整个系统当中,中移动还是很注重版权,一块购买了 300万歌曲,全部是正版的,仅歌曲就将近1亿多个文件,及上其他运营支撑系统,整个系统能支撑两亿个文件,这也需要集群架构来支持。   2、在 媒体上会经常看到视频监控这一块的云化。传统的方案来讲及如果说你想支持上千个摄象头的视频采集业务需求是很困难的。本次世博会前端数据采集头规模会更 大,世博会如果没有记错的话,一万两千个高清摄象头,同时在运行监控整个世博会的安保,这个成本会非常高,周期也会非常长。整个世博会视频监控系统,背后 存储系统也是用我们华赛的云化解决方案,目前正在为世博会提供优异的服务。   3、流媒体加速和低成本媒体分发存储平台。这个是跟业务和内容无关 的,我们在一些运营商,一些客户那里得到了很好的一个实践。以新加坡这个客户为例,我们新加坡这个运营商部署业务之后,客户整个下载时间,等待时间总分钟 级下降到秒级,很多很难访问的网站,通过部署ICache之后可以得到一个很有效的加速。   这个地方给大家分享了四朵云,包括前面讲到整个基本的数据业务,后面提及了媒体共享,这是我们的四朵云。    最后无论我们的增值服务云、媒体共享云、业务保护云还是企业数据云,客户非常喜欢的一点快速部署,模块化交付。因为云的弹性度非常大,如果我们构建一朵 云,十个人工作组可以弹性扩展到十万人的大企业,这样一个云说给客户听,客户也是不信的。我们自己去做也是非常痛苦的,不可能做出这样的一个系统出来。实 际我们在里面还是建立一些模型,包括一些小的云模块,中等规模的一些云模块,以及集装箱式的云模块,每个系统都变得非常可控,项目边界又非常的清楚。   最大集装箱是数据中心为例,假设美国用户提供20G在线云储空间,我们可以支撑5万用户,这样一个数据讲出来之后应该是非常清晰,并且是非常可信的。同样在中等规模模块里面,可以提供一切多少计算能力,多少存储能力,多少安全能力,多少网络能力,也是非常清晰可信的。    华为赛门铁克再介绍一下,我们母公司是华为,在电信领域取得一定的成绩。赛门铁克在IT业界有非常好的口碑和品牌,一个明确的案例就是财富1000 强,99%的客户都使用赛门铁克的产品,赛门铁克在安全存储领域又是非常多年的积累。华赛到今天为止有4033名员工,其中一半以上都是研发人员。我们希 望通过持续的艰苦奋斗和创新,我们希望能够在安全跟存储领域,能够有所作为。   我们的客户,一方面通过大家熟悉的,通过华为这条线,我们和很多客户提供完整云化的IT解决方案,同时我们也开始通过赛门铁克在另外一些区域,我们进行了一些拓展,主要是在北美和欧洲,面临一些企业,同时华赛自己也在努力拓展自己的合作伙伴,拓展自己的业务规模。    整个材料基本上分享到这里,我们前面讲了一些理念,明确了我们自己在云上面的一些定位和战略目标,分享了一些成功的案例。我们提出了4+1这样一个概 念,所有的这些东西离不开我们自己的努力,离不开客户对我们的支持,以及我们合作伙伴对我们的帮助。我们希望今天我们讲得是4+1,明年如果有机会还站在 这里,我们希望能够给大家分享更多的成功案例,能够在更多的商业场合得到云业务的应用。今天的分享就到这里,谢谢大家。 提问:我想问一下,您这里看到的是解决方案是模块化的,现在对于客户来说最重要的一个保护线的投资,以前存储的保护怎么解决? 范瑞琦:跟一些客户交流,客户也提得很明确,两个字依旧。一些异购和虚拟化整合,并简单是说我们给它提供一些模块的东西,让你从一个旧世界迁移到一个新世界来,需要一些关键的技术点有了解和掌握,核心的东西就是关于整个异购整合这一块,简单回答就是这样。 主持人:谢谢范瑞琦先生。下面请EMC卓越研发集团市场开发总监蔡礼洪先生。 蔡礼洪:谢 谢,刚才金教授和范总都讲得很精彩,自我介绍一下,我叫蔡礼洪,是来自EMC的。我今天看了一下这个会场布置,云计算肯定离不开两个最主要的元素,一个就 是存储,一个就是虚拟化,我也很骄傲很荣幸的向各位报告一下EMC正好很巧在这两个领域都是龙头老大。EMC产品线有两百多条,今天也不可能给大家很仔细 的讲我们的产品。我今天想向各位报告的既不是我们产品,也不是我们销售的案例,我想给大家讲讲我们EMC在云计算,在云存储方面的一些想法还有一些解决方 案。   我想问一下,今天在座的人数完全超乎了我的意外,昨天上午李院士的演讲,在座各位有谁听过的?大概有一半。昨天上午我也是很认真的,基本上整个上午的演讲,我就觉得李院士的演讲讲得非常精彩。    我要讲得话题是十年一浪潮,回过头看看30年、40年IT的发展历程。70年代到80年代都是以主机这样一个时代,这个时代不是我本人亲历的。80到 90我那时候在上学,那时候是PC慢慢成为一个主流。我还记得那时候,我们整个系只有一台PC,这台PC还是大家要排队才能用得上。万万想不到的是,到了 今天影响互联网,90年代互联网的发展,今天大家都在谈论云计算这样一个时代。昨天我也是走了一圈,大家都问云计算到底跟过去的传统计算,云存储跟过去的 存储有什么不一样?你们作为厂商,在你们产品里面做了什么新的改进?加入了一些什么新的产品?使得你的产品可以称作云存储的产品。   我想跟大家分享一下,看看08、09年经济大衰退,从房价、工作、就业机会、财产全部都是受损的。今天房价的是美国房价不是中国房价,更加不是北京房价,这短短一年的时间,信息量增加62%,我待会儿给大家分享一下,我说得这些东西是有原因的。    2006年到2010年的信息量,每年以60%的增长,到了2010年应该是到一个ZB,去年09年是0.8个ZB这样的数据量,为什么会有这么大的数 据量增长?这些数据量的增长对于在座各位,对我们厂商的挑战是什么?一个ZB是什么样的概念呢?昨天我看到中移动主题演讲里面,也讲到今天的数据信息量是 怎么样的一种情况,这个信息的爆炸是怎么引起的?为什么会有这么多信息?大家可以看到信息的来源,包括影像,包括带宽,刚刚华赛范总也讲到视频,我们最近 接的一个单子有一个要求,每一秒钟视频数据量是2个ZB,这样一个量来存储这些数据,对存储的要求非常高。   在座的各位举一下手,有谁没有偷过 菜的?真有这么多。在座各位有谁不知道凤姐的?只有一个。为什么呢?其实我们今天生活在这个互联网的时代里面,我们每个人其实都参与了这些信息的增长,那 么当然今天的互联网里面有很多,你说他的数据,他的信息是否是那么重要,那么有意义的,不见得。但是我想说的是,今天我演讲的话题是“生活在云端 ”,EMC在个人信息管理存储方面,也推出了我们自己的产品,也推出了我们自己的服务,我待会儿会给大家讲一下。   个人的信息包括在开心网个人 网页上面,手机、数码相机、笔记本有的开网店,有的购物,其实每个人都是在互联网里面留下了自己的轨迹,这些轨迹在座的各位不知道,这是不可以随意删除 的。今天的数据世界里面,我想给大家分享这样一个数据,70%的数据是由个人产生的,刚刚我讲的有意义、无意义的信息,这些信息是由EMC厂商这样的设备 去保管、管理,去存储起来。   我自己见证了IT互联网的爆炸,参与了大公司的发展,包括IBM等很多,正好这些年我在IT行业里面跟这些公司要 么给他们打工过,要么给他们做过合作伙伴,都知道他们的发展。云计算今天为什么这么热?这么多人关注云计算,其实除了媒体的关注,除了政府的关注以外,我 觉得还是有它的现实意义,有它的原因。最主要的原因,站在我们EMC的角度来看,今天IT基础架构实在是太复杂了,包括像昨天有一个客户跑来跟我说,我今 天有一万台桌面装备电脑,我如何去管理?我如何解决我的安全问题?我今天有四十个不同的应用在我的手上去管理,认为一个升级,认为一个补丁,都会可能造成 这个应用出状况也好,不能上线也好。   我想说得就是,我原来工作的上一家公司是卖IT技术架构管理软件,他的生意是非常好,假如在座各位是做 IT管理,做应用管理的,你们都知道,今天IT的应用是非常的敏感,一点点的修改就会产生意想不到的效果。我也想跟在座各位说,我今天站在这里演讲,楼下 EMC有一个展台,我希望大家今天有空下去看一下我们的展台。我说这个例子是什么呢?今天我在这里演讲,我们的同事来做演示,我们的后台是下了死命令的, 就是后台IT一定要有人值班的,今天是礼拜六,如果我们后台演示有什么状况,有人在后面能够很快的恢复。   我们希望明天的云计算,能够在IT的基础架构上,让大家的日子过得更好一点,让大家的管理更简单,更平顺一点。    什么是云计算?云计算你说它简单也简单,你说它复杂也复杂。因为今天凡是IT的应用,只要是通过互联网,只要是面向广大的内部用户也好,外部用户也好, 都可以称作我是云计算,我是云应用。我的建议就是,我们不必要九纠结于它的科学定义,关键是看看能不能给用户带来更有意义的应用。我关注的是这个云计算我 作为IT从业人员,我作为行业的人员,他能够给我的管理带来更便捷、更方便的解决方案。   大家今天都谈云计算了,今天我的IT计划里面,所有的 设备,所有的应用都全部丢了,这是不可能的。包括我刚刚举例的,我有一万台装备电脑,我是希望通过云计算,通过虚拟化,能够给我提供一个更好的业绩方案。 今天的数据中心毕竟还是大家比较习惯,比较能够相信,我的应用,我的数据都是在本地,都是在我的机房里面,我看得见、摸得着,所以我比较放心。   云计算令人比较兴奋的事有那么几点:灵活、动态、按需、高效。假如我们一天增长到150万的用户,我怎么样去快速增加服务器的数量。    云计算的两个方向,一个是往私有云方向走,昨天EMC范总也讲了,我们EMC在私有云方面推出了我们的一些落地解决方案。公有云,作为一个服务,很荣幸 的向各位报告,我们EMC在公有云这块也有落地的解决方案。公有云这一块,昨天李院士也讲到,一个是应用,我在云里面给大家提供这个应用,最出名的就是 Saas,平台比较出名的就是像google,Paas,作为基础设施这些运营商,电信也好、移动也好提供云备份的解决方案。包括EMC在给云备份的解决 方案。   云计算在我们EMC角度来看,是有三大要素,大家要关注:   1、需要有虚拟基础。这里面主要是虚拟化,要有资源。   2、前端是Web2.0的体验,后端还要有周期管理、搜索和备份。   3、信息安全问题,安全、可靠、可信赖的服务。   接下来我想给大家讲三个EMC落地的解决方案:    1、针对个人中小企业的云备份。这备份本身就有存储的功能,但是备份跟存储网盘还是有区别的,备份首先是加密、增量还有就是自动备份功能。我们希望能够 把大家的信息能够保护起来,比如你的手机可能会丢,可能会淘汰,可能会换,那有了我们这个服务,就希望能够给大家更方便、更便捷的管理个人信息。这个服务 在中国的落地,昨天你们都看到了,就是跟中国电信的一个合作,叫做e云,e云是我们EMC提供这个技术设备,由中国电信去运营,这个服务到今天为止已经有 非常多的用户。   我们这个服务比较成功的案例,去年年初的时候,纽约的飞机撞了鸟,然后迫降在水上,大家可能有时候会想,为什么需要云备份?为什么本地备份不可以?我说不是不可以,而是说碰到这种情况的话,你的本地备份也救不了你,飞机泡在水里面,电脑也就泡了。   2、EMC落地的产品,叫做Atmos,这是EMC去年推出的产品,它是针对web2.0的应用,提供海量、低成本,容易实施的这样一个解决方案。这个产品在美国也是受到了很多公司追捧。    3、我们EMC推出的叫做vBlock,这个是跟三家公司合作,推出来的端到端的解决方案。它是解决了在座各位对计算虚拟化、网络,还有存储方方面面的 需求,用了这个vBlock,有很多你的计算也好、存储也好,从性能,从性价比方面能够体现出云计算、云存储的这样一个优势。   我不知道今天是 应该多讲点产品,还是多讲讲业界的发展,因为原来我没有预见到有这么多人来,否则的话我会多讲讲产品。最后想说信息技术是一浪高过一浪,最后这一个浪潮就 是今天我们看到的,就是云计算的浪潮、信息海浪、爆炸的增长,不管在座各位是作为个人、用户、消费者的角度去看云计算,还是从专业人士角度去看,我相信这 里面都是有很多机会,包括在云计算平台上面开发我的应用,包括昨天我听中国电信他们要推出新云计划,要扶持中小企业这些创业公司,我怎么样在你的平台上面 用你的计算,用你的存储,可以去开发一些比较好的应用。包括我刚才讲得偷菜,在座的各位也是有创意有闯劲的,云计算可能也是一个机遇。   希望在 不远的将来能够看到、听到,有人在云的基础上面有非常好的应用,面向消费者也好、个人也好,中小企业也好,甚至面向大企业也好,能够开发出一些他们能用得 上,提高他们效率的这些应用,包括我刚才讲得怎么样利用现有的资源,现有的这些IT资源,不是说我把这些旧的资源全部抛掉,然后去搭建一个新的环境,今天 我不知道是否抛砖引玉,让大家去想一些事情。今天就讲这么多。    提问:我们知道云备份在国外进步非常高,在中国还是处于一个市场的引导期。我想问一个问题,在中国现在这种环境下,除了从技术层面克服客户对云备份安全的一个担忧,如何从市场营销层面,或者从其他层面排除这个客户对数据安全或者隐私的一个顾虑、担忧?    蔡礼洪:这个问题问得非常好,数据只要不是在的本地上面,我总是担心。怎么样去克服用户对云存储、云备份我信息的隐私也好、安全也好的担心呢?我个人的观点是有几方面:   1、你作为提供服务的企业角度来讲,不论是从技术上面,保证你的技术,别人要用的时候不要出这种状况,别人要备份的时候,不要说我这个网络是连不上,别人要恢复的时候,不要说我的连接出了问题。    2、作为运营商的角度来讲,如何保证你的管理系统,整个公司的自我约束,你要能够有一套比较行之有效的自我约束的措施,否则你会发现尽管你的服务,从技 术,从产品角度来讲是非常可靠的,但是如果你的这些系统管理员,这些公司管理服务的人,他不够专业的话,对信誉的打击是非常大的。   3、希望政 府能够约束运营商也好、技术提供厂商也好,站在政府角度来看,希望政府能够约束,如果政府不约束,这个路会比较容易走弯路。我相信在国外相对而言,诚信系 统比较好一点,他这种服务能够走在前面。在中国从目前我们运营的角度来看,个人用户也好,企业用户也好,目前对我们服务用户的体验还是比较认可的,我不能 说100%的肯定你这个东西是百万分之一都不会有闪失的,站在我们厂商的角度来讲,我们绝对是有信心的。这个服务国外也运营了四年多,有非常多的付费用 户,目前来看没有出现过比较大的状况。 提问:今年美国纽约的世博会上,国外一些企业提出企业云是不等于私有云的,我刚才看包括在华赛范总做报告的时候,并没有明确的区分,这个企业人混合云、私有云、公有云是一个什么样的层次?EMC的定位是一个什么样的层次?    蔡礼洪:现 在看看媒体的报道也好,看一些相关资料也好,都在谈到私有云、公有云、混合云这样一个说法。EMC在私有云这一块,做了很多的投入,为什么会这样子?大家 想想作为一个大型企业,像中国移动,中国银行这种企业,用到云存储、云计算的灵活、低成本,然后按需,需要多少就用多少,然后又能够保护到企业的信息,对 我隐私的保护。你把这个云放在防火墙里面,这可能是企业不能能够接受的一个解决方案。   为什么会在私有云这块做这么大的投入呢?这种大企业,包 括我们EMC自己,我们全球有四万个员工,他有很多应用是面向自己的员工,包括内部的这些人力资源,包括报销,包括供应商管理,这些应用我其实不需要对外 公布,在我的防火墙外面挂出去的,我就在我的内部里面利用这些云存储、云计算的优势,来搭建一个成本比较能够控制的,然后我的管理比较简单,比较灵活的这 样一个环境。    主持人:谢谢蔡总。下面是武汉大学软件国家重点实验室主任应时教授的报告“云计算时代的软件开发技术及其应用”。    应时:大 家早上好。我今天的这个报告题目是“云计算时代的软件开发技术及其应用”。我是来自武汉大学的软件国家重点实验室,我介绍一下云计算时代的软件,云计算时 代软件的开发技术,云计算时代软片开发技术的创新与发展,然后介绍一下我们现在的一些思考和从事的一些工作,然后再做小结。在现有云计算计算体系当中,怎 么去开发企业级的应用,这个话题是涉及的比较少,所以我今天就这个话题来做一个简单的演讲,介绍一下我们在这个方面做得一些思考和探索。   云计 算大家都知道,是以服务的方式动态拓展,并且是对虚拟化方式为用户提供各种各样的服务。云计算时代的软件是在运行的云平台上及并且是有在线租赁的形式,是 按照用量和使用规模可伸缩性的去占有资源,以保证它的性能,而且是按需要、个性化定制的这样一些特性软件,所以应该来讲云计算时代的软件,它应该有很鲜明 的技术特征。   我们怎么去开发具有这样一些特征的软件?实际上只有真正具有这样特征的软件,我们才可以把它称之为云软件。同样因为有了这样一些 技术,我们可以做更多、更好的系统开发,是不是又可以再进一步促进应用需求的扩充扩展,这是讲到技术和发展的相互促进。实际上云计算一切给我们从事软件行 业的人员来讲,应该是开辟了了一个工作的空间。   云计算的使用方式:   1、将计算损和存储的资源以服务的方式来计费。有了云计算,就可以按需求获取海量的IT资源,可以更快的开发自己的业务系统。    2、大家经常看到一些云计算的图,云计算的体系非常简要分成三层,有Saas、Paas、Iaas,这三层都涉及到云技术的各个方面,对每一层来讲它最 核心的技术,我们认为是这样的,Iass层资源虚拟化是最核心的,Paas是提供平台可伸缩化,Saas提供服务多租赁化的技术特征。让人振奋的许多云计 算的特性主要是靠软件技术来实现的,背后提供特征的支撑是在我们开发的软件系统,比如像虚拟化,虚拟化这种特性必须要有需求化变换的软件来实现,否则的 话,无线和有限的东西是没法把它衔接起来。所有的软件必须在某一台机器,每一台设备上来运行,不管中间经历多少变化,最后都落脚到这个地方。我们要有软件 系统去做这种转换的东西。软件技术将在云计算时代开发出令人惊讶的应用系统,并且会促进技术的发展。   3、大家看到这个是每个层次里面具体的服务内容,它本身都是有相应的软件技术来实现,而且它同时为它的上层和直接纬终端用户提供服务。    现在目前已经有了很多云计算的软件实例。最早比如Google的搜索引擎,是全球最著名的云计算事例,它的数据都是放在数据中心里面。另外还有一个值得 一提的是,因为前面Google可以看到是一个多用的平台,但是Salesforce做了一个很大的创新,使得云计算软件开发有更多的强项。 Salesforce在1999年的时候,就首先创新以在线租赁的模式,应该来讲是一个创新。这里面功能的删减,用户个性化定制等等,这都是很有特色的地 方。用户只需按月付租用费就可以使用CRM的服务,它的所有软件和数据都是在Salesforce的平台上。   这样一些基础平体和应用软件的开发,使我们逐步感觉到云计算软件,基于云计算技术体系还是有不同的特点。Gartner预计,到2010年企业30%的软件应用将通过服务来提供。    4、云计算时代软件的新变化,它具有什么特征?应该怎么开发?我们应该有甚么样的技术,以及现有技术是否充分完备,是不是需要进一步的研究,而且需要进 一步的去应用等等,这些都是我们软件从业者在云计算时代里面应该去考虑的问题。下面我们看一看云计算时代软件有哪些新变化?   (1)用户只需要实用软件,而不是用自己去运行软件。因为软件始终在数据中心里面运行,不需要管理软件,他只要注册、客户化、应用就可以了。    (2)有一个重要的概念性变化,云计算实际上是一个在线多租赁的方式来使用,所以用户概念是一个租户的概念。现在软件是在网上提供服务,一个软件的版本 的单个实例可以为成千上万的用户服务。以前我们不得不做多个版本的东西,现在我们只做一个实例,这也是一个非常大的变化。这个大的变化,在使用上给我们带 来很多方便,但是大家想想我们的东西都是人做出来的,都是在险业技术体系下积累起来的,这就需要做工作,需要关心原来没有关心的问题,去使用原来没有使用 的一些技术手段,去做这个软件开发。   (3)网站从Web信息发布平台变成Web应用软件运行平台,变成系统托管平台,变成多租户的软件服务平 台。软件资源的维护,这些工作要把它作为非主流的业务包出去进行托管。当然在托管的时候,所谓托管服务的企业,它是对一个用户企业做了一套服务体系,包括 它的软硬件提供服务,不管这个软件是不是同一个产品,它都是一个对一个来做的。   现在一个很重要的就是,对于托管技术进一步的发展,能不能更高效,更简单,特别是我们讲得如果这个软件版本多了,管理手段更加复杂,能不能变成一个版本,一个多租户的服务平台,这也是云计算时代的第三变化。    (4)软件运行在因特网上的共享数据中心里面,而不是应用在自有的服务器和计算机上面,这也是云计算时代必须具备的特征。当然可以根据自己特定的需求, 不一定都这样去做,但是我们讲从概念上来讲,云计算时代的软件,它的软件一定是放在共享的数据中心,至于把这个数据中心变成私有的,还是安全设施不让访 问,那是另外一回事。   (5)应对用量变化手段,从制作网络镜像手工增删资源,到系统和平台的自动伸缩,这也是现在云计算时代的软件,必须具备 的特征。大家都知道我们做网站,这个网站的应用量大怎么办?那再加一台服务器,全国性的服务网站,如果这个不行,再找另外一个地方加服务器等等,这都是手 工的去建立这样一些东西。云计算处于一个海量资源,而且因特网连接起来,在这样一个基础上,必须对硬件和软件资源,有基于服务和自动化的手段。在软件运行 的时候,它可以自由的去伸缩。   (6)现在云计算软件非常强调个性化的定制。同一个软件的同一个版本的东西,但是用户可以根据需要,做一些许可 的这样一些定制。这个定制是一个好东西,但是大家想定制越方便,那么对我们软件本身基础的结构,和它所依赖开发技术的要求是非常高的,只要做过大型软件开 发和工程项目实践技能都知道,一个软件去定制,不是你想定制什么就能定制什么的,所以这个定制的东西对用户来讲是一个好的要求,但是从技术从工程可能性来 讲,它一定是有限度的。比如目前对同一个软件系统,它的服务化和它的领域工程和产品线,如果做得很好的合,那就挑选所需要的服务,然后对用户界面进行定 制,这些实际上在现有技术和工程范畴里面,应该是可行的,我们进行这方面的功能服务模块的选择,组合过程的指定,用户界面的定制,这都是云计算时代必须具 备的。   (7)快速开发。快速开发是软件工程里面很古老的一个话题,随着我们的技术水平,特别随着现在的资源水平和产品线的技术的发展,快速开发应该讲水平是越来越高,而且现在有一个云计算,应该来讲特别有资源共享,有符合标准的服务可以集成,快速开发将更加有效。    所以我们讲,这是我们总结出来关于云计算时代软件的新变化,这也是非常重要的,我们怎么去看待什么是云计算时代的软件,那么就是有这样一些特征才行。下 面的话题就是,要有这样新的技术特征的东西,我们应该有甚么相应的技术手段去做?做了哪些成果?我们要理智的去看待现有研发成果,到底在技术体系的本质上 面,到底做得是什么?它的本质是什么?它的局限性在哪里?现在我们面临的问题是什么?我们就要认真的去思考,这就是我下面接着要讲的第二部分内容。    我们报告关心的主题是云计算时代软件需要新的开发技术,软件工程师也需要使用云计算时代的软件开发技术去提高开发能力。大家都知道,作为软件工程来讲, 不断的提高软件的生产能力和管理水平,这是软件工程师永远追求的目标,因为我们面临用户的需求是不断的扩张,而且时刻面临着做更难更复杂性的开发要求,这 个软件工程师不断提高自己的生产能力。云计算我们做软件开发不要忘了自己,我们也要有云计算的技术,我们软件公司要把开发作为服务,开发作为服务应该以什 么样的形式来提供我们使用,我们往下面讲。   这是我们报告关注的主题,大家看到这个图也见过,语音计算技术的主体结构,它的层次。我们关注的话 题是这一部分,主要关注的是“云计算模式下的软件开发与设计技术”。如何开发运营和维护那些为最终用户,或者一般用户提供的云服务的软件系统,这里面包括 了系统软件、工具软件和应用软件等各种软件。   二、云计算时代的分布并行编程技术。   1、云计算是在分布式计算、并行计算和网格计算 的基础上,经一系列技术的创新和融合而形成的。云计算是一个很大的统称,这里面既体现它的核心价值,不可替代、不可或缺的这样一些技术内容,同时也可以结 合其他资源,使得云计算更强。所以它的是一个非常庞大的IT技术的统称。   目前,在云计算平台种衣剂云计算平台应用润间的开发都使用了分布式并 行编程的技术。分布式并行编程技术,在计算机里面并不是特别新的东西,当年只有局域网的情况下提到这个话题,随着几十年的发展,虽然分布式并行编程技术举 步维艰,并没有革命性的大突破,但是它的进步还是有目共睹,而且确实技术可以让我们去做很多事情。   2、云计算时代的分布并行编程技术介绍三方 面:分布并行数据处理技术,分布式文件系统,分布式数据库。我们开发各方面应用的时候,首当其冲的是做高性能计算,高性能计算逐步扩充数据处理,包括大规 模海量的数据处理,其次要把技术发展成为,一定能够做企业级的业务应用技或者是某个团体的,某个组织的业务应约,做这样的开发。软件技术也是这样一步步在 走,今天仔细总结和审视现在目前已经有的云计算时代的软件开发技术,看到它的道路发展模式是完全一样的,我们来看看这里面分布式并行数据处理方面的东西。 按照高性能计算,包括网格,包括云计算,这个非常大的程序运行,都是在云计算里面看到很多。   我们来看看分布式的一些编程的东西。大家都知道 Mab/Reduce用于大规模数据并行处理,它的数据量非常大,在成百上千个CPU并行处理,这也是我们讲得,它有很多很鲜明的时代特征,在这个时代, 问题摆在我们的面前,我们就要考虑如何做大规模的数据处理和并行编程设计的开发。Mab/Reduce简化了数据编程模式,以前在我们单机上面,像文件处 理基本上跟这个是一样的,实际上是提供了一个海量数据的处理,它跟编程模式是一样的。把多个数据源的东西,把它简单处理,安排在不同数据源同一个关键子来 规避起来。这里面有多个结点进行分布式并发数据归并,这样一个数据变换。在变换过程之前和之后,你可以根据应用要求,再加上自己所需要数据的处理机制,这 里面主要讲得是海量数据的变换,大规模分布海量数据的编程格式,这是它的基本原理。   3、Google提出文件系统。当时Google推出搜索引擎也是一个革命性的,让我们很多人很惊讶。IT从业人员来讲,在惊讶之后马上就要去学习,它有一些什么核心技术,我们应该怎么去开发,这是我们需要去学习的。    在Google设计文件系统的时候,如何在廉价,而且相对补可靠的计算机上对巨量数据进行存储,当然要构造符合这个要求的一些存储和它相应的文件和数据 系统。这里面为什么要重新设计呢?因为文件比较大,都在100M以上,通过为几个GB,文件通常需要频繁的追加,用流方式读取,高吞吐量等方面都进行了优 化。   背后采用的理念就是文件用块存储,拷贝多个备份,负责协调和保存元数据,在我们刚开始已经有了分布式并行数据处理的时候,这个元素概念还 是没有的,这需要相关的技术融合起来,形成新的技术体系,这样就更加有利。云计算在各方面的技术,都是按照这个模式来做的。它提供所谓定制化的API,给 应用变成的人去使用。再一个就是它没有无数据缓存。   4、讲到Big Toble的设计理念,面向网页的数据发布及搜索和浏览等特定处理的需要,演化数据管理系统的设计,并提高性能。它是面向网页数据发布搜索浏览特定处理器 需要的技术,这种技术还是有相对的局限性。光有数据处理并不能编出来程序,而且它不支持关联,不支持SQL的查询,网页数据对搜索服务来讲对数据的管理一 致性要求并不高。实际上我们这个地方就可以看到一个总结,现有的技术还是相对来讲比较单一。目前有发展趋势的就是Google提出的APP引擎,这种平台 容易维护,自动的伸缩这样工作。   5、Force的在线服务,提供一个基础的开发平台的提供商。做了一个有意义的工作就是做了在线“超市”,符 合开发的软件,都可以进行一个集成,这个集成的软件有云计算的特征。提供一个开发人员和用户共享软件和数据的社区。它一方面可以进行共享,把开发的平台通 过云计算的方式公开出来。另外,不同厂商之间进行交互和集成,这样的开发工具是非常重要的。现在有的厂商经常号称,做得东西开发性很强,但是真正做到完全 性的开发那还是很难的,还要有基础设施和编制手段的保障。   6、技术评价方面,已有的编程主要面向特定。   三、云计算时代软件开发应该考虑的一些问题。   1、基于SOA和的Saas模式。2、多租赁的特征。3、自由伸缩这是必须考虑的问题。    云计算时代的设计软件,我们更多要满足云计算技术特征这样一些任务的设计完成,按照以前讲得有更多关注软件系统的质量属性,高性能、伸缩性、并发性、分 布性、安全性和容错性等等,这是我们软件工程面临的难题和挑战。到了语音计算时代成了不可回避的问题,如何去实现这样一些属性,需要新的技术和方法。    2、多租赁特性是一套软件的一个版本,为多个用户服务,要支撑用户的界面、业务逻辑和数据等方面个性化需求。支持不同租户之间的数据配置和隔离,要保证 每个租户数据的安全和隐私。我们从完成软件工程的方法体系,所需要的技术,我们现有的软件技术开发显然是不充分的,当然我们可以针对特定问题,设定解决方 案,但是这不是最终一个好的解决方案。   四、武汉大学国家重点实验室,我们开始了这方面的研究,目前在做一个高考智能择校的推荐系统,这个系统 非常好,它能够很好体现云计算的特征。它的适用性是“突爆性”的,这个方面我们做了一些工作。我们核心的开发基于云计算的高考服务中心的设计,我们搭建自 己的实验平台。   五、最后给大家小结一下,软件是IT系统的灵魂。人类创造出软件开发技术不会随着IT技术的发展而失去作用或降低作用性,它是我们在新的IT环境中开发更大规模、更复杂、更创新的应用软件系统的有力武器。    软件开发技术不但会跟随IT技术的发展而变化,而且它自己也出不断的发展过程中,新的软件开发技术将提高人类开发软件系统的能力。有了云计算可以做更多 的事情,但是你的学习和负担会更重,需要提高业务能力,所以我们讲云计算为人类使用更大、更复杂的软件系统。比如流动人口服务、中小企业的社会服务,这样 一些复杂的系统开发,都需要有更好的技术。   云计算的服务需要创新和发展,云计算的分布并发编程和数据库技术的现状,提供API支持和简单的工 具支持,欠缺编程模式的开发框架和方法学体系,适用于较简单的海量数据高效处理,欠缺对复杂关系的数据处理能力。在云平台中,对于开发大规模复杂的企业应 用系统而言,是不充分的,这是现状。   做过大型软件开发的人,把你用的十八般武艺都想全的话,大家看到我们左边是主要常规的开发软件使用的工具 和方式,现在我们可以看到在云计算时代,相应的框架和方法学是没有的,所以这需要我们科研界和产业界共同合作去研究,去开发,去应用,去实施,而且强调一 个最佳的业务实践。   另外我们从纯粹数据这方面来看,我们从理论框架到开发框架,到底层数据成熟机制。大家不要低估理论体系的作用,它的理论体系是非常重要的,把很多东西都说清楚了。   最后的结束语,云服务软件系统的开发技术,需要创新、发展和积累。云服务软件系统的开发技术将提高人类的生产能力,满足开发更大规模,更复杂软件系统的社会需求,这是我的报告,谢谢大家。 主持人:下面请大家提问。 提问:应 老师刚才介绍云计算的开发技术,我判断主要是集中在服务器端,刚才最后两页应老师也举了一些开发的例子,云利用的前端。我想了解我们做任何一个系统都是要 关注用户体验的,比如说用户的GUI这一块我们都是比较重视的。我想的是,云计算如果来做GUI做用户体验这一块,需要朝哪个方向扩展?不同的终端环境来 做一个扩展,当前的技术是否足够?如果我们想针对云计算这个方向来做拓展,需要朝哪些可能的方向努力?谢谢。    应时:刚 才我已经讲了,像GUI跟其他的开发都是一样的,我们首先要明确,真的要把它做成一个纯粹的真正云计算的东西,这所有的东西应该服务器端。包括应用开发工 具开发出来的界面的运行,也是在云端服务器里面,它显示的东西也是可以看到的。如果是单独纯粹的云计算,你可以想想你的机器除了能上网之外,什么事情都做 不了,当然它同样有客户服务器模式的软件,必须有这种编程问题。   在云计算时代,界面的开发应该不是特别大的问题,只是一些定制工作比较麻烦一点。运营厂商的一些平台去解决,你的显示中断是不同类型的,怎么样和一个统一服务接口去交互,这是需要去的。现在终端连接不上去,云计算谁也不会用的。    主持人:谢谢应教授。下一位中科院计算所的何清研究员,给带来“基于云计算的海量数据挖掘”    何清:各位上午好,我报告的题目是“基于云计算的海量数据挖掘”。这个题目是前一段在中国移动的实践,以及后来有关机遇与计算挖掘的研究来做出的。首先我谈一下海量数据挖掘的背景,就是由于云计算的兴起。    1、有关于云计算实际上在上一届会议上,以及在这一次会议上,大家所引用的这个定义,都是在动态的变化着。但是作为一个研究的对象,它的发起实际上是从 企业发起的,作为一个研究的对象,需要给它一定的定义,我这里所列出的是,李院士昨天给大家的定义。我给的定义可能还有一个连接词,实际上云计算按照讨 论,是一种基于互联网、大众参与的计算模式,其计算资源包括计算能力、存储能力伸缩、且被虚拟化的,而且以服务的方式提供,这是一个基本的目前的一个认 识。   下面这些是在不同角度对它进行的解释。基于云的数据挖掘这件事情,在我们中国开始来做是有中国移动他们发起做云计算平台开始,到09年的11月,我们中科院计算所就在跟中国移动合作,就开发出了进行数据挖掘的平台。    2、云计算的兴起实际上带来了很多的机遇,中小企业购买昂贵IT设备的成本降低了,服务器、硬件、PC这些销售都带来了很大的机遇。对于我们搞软件的提 供是最好的机会,就是说提供一种新的技术服务,就是云服务,这时候对于用户来说,它不需要购买硬件,也无需开发软件,他就可以得到云计算的服务,并能在线 实施一些监控。   云计算的应用,在国外我列举这几个比较也代表性的应用,下面我在实践过程当中,也可以讲到我们和中国移动所进行的实践。    数据软件发展的历程,我结合其他资料划分成5代,到现在基于云计算的并行数据挖掘的方式,应该算作第5代。第1代就是单独算法,单个系统,单个机器,而 且是向量数据。第2代和数据库结合起来,有多个算法。第3代跟预测模型更多去集成起来,而且它支持了外部数据、半结构化的数据,应该说这种情况下是一种网 络化计算。第4代是分布式数据挖掘,这种情况是在2000年到2005年左右,所做的一件事情。基本上是基于网格计算的概念,来做多个算法,分布在多个节 点上的方式。   第5代,就是现在基于云计算的并行数据挖掘与服务的模式,它的同一个算法可以分布在多个节点上,多个算法之间是并行的,多个资源实行按需分配,而且分布式计算模型采用云计算模式,数据也就是用DFS。    编程跟模式,它采用了Map/reduce这种方式,在NIPS2006这篇文章里面所发表的,是用Map/reduce编程完成了很多基于学习的方 法,用到实际的时候,也就是数据挖掘算法的并行化,这是一项非常有重要意义的工作。目前基于hadoop的数据挖掘工作,这个项目致力于数据挖掘并行化, 以计算方式来做数据挖掘来参与项目。   为什么要用云计算的方式来处理海量数据进行挖掘呢?从需求来讲,首先说我们所处理的数据是海量的,我们以 往都期望用高性能机或者是更大规模的计算设备来做这件事情。海量数据实际上我们要从中搞到理解的知识,大规模的数据挖掘是我们追求的目标,并且事实上互联 网上的数据增长也特别快,数据挖掘的任务远比搜索任务要复杂。在这种海数据具体挖掘当中的目标,还有一些要求,导致了我们在挖掘过程当中需要有很好的开发 环境和应用环境。这种情况下,基于云计算的方式是比较合适的。   从外部特征来看,基于云计算我们来做低成本分布式并行计算环境,这个所带来的好 处,对数据挖掘来说,中小企业的数据处理成本大大的降低。大企业云计算平台对某些数据,并不再依存于大型能机。另外一个开发方便,屏蔽掉了底层。为什么用 云计算平台来做数据挖掘呢?在并行化条件下,我们利用原有设备有大规模数据处理的提高,另外可以方便增加结点,它的容错性都是比较强的。   用云计算来做数据挖掘的话有没有问题呢?是有很多的问题。首先从第一方面来说:   1、用云计算来做,实际上带来了数据挖掘需求,个性化需求和多样和需求的增加。因为我们的数据挖掘基于云计算来做,最后要发展成的是一种云服务模式,而这种服务必然就面临着个性化和多样化这种要求。   2、在做的过程当中,还真是数据所带来的问题是比较多的,首先它的量来说,就是说TB级和PB级这种企业数据,需要我来处置。另外高维的,有噪声的,还有就是动态的数据,也是需要我们来处理的。   问题与挑战:    1、基于云计算来做数据挖掘算法的并行应存在一些挑战。什么样的算法来做目前的数据挖掘,这是一个首要的问题,并不是所有算法拿来就能完成目前的任务, 我们需要选择合适的算法,并采取适当的并行策略,然后才能提高并行效率。因此算法的设计变得非常重要,参数的调节也变得必不可少,而且参数的调节直接影响 最终的结果。这是问题和挑战方面的。   2、另一方面的问题和挑战,就是不确定性。数据挖掘当中有很多不确定性,之所以说数据挖掘,实际上就是克 服不确定性给我们所带来的影响。首先我们数据挖掘任务的描述具有不确定性,数据采集和预处理也是带有很多的不确定性,采集哪些数据,不采集哪些?预处理的 力度有多大?具体的操作是采用什么样的预处理操作,都是有很多的问题。   3、数据挖掘的方法和结果有不确定性,哪些是吻合你的目标的?这需要你在做数据挖掘过程当中,把不确定性给确定下来。    4、挖掘结果的评价也是不确定的。因为每一个用户所关注的最终的挖掘目标不一样,这就导致了对挖掘结果的评价,它也有不确定性。而且从研究的角度,实际 上有很多的评价方式,也给出了很多的评价度量,这要根据你数据的分布,你最终要达到的挖掘目标,根据这些来评判你的数据挖掘是否是有效的。    5、软件、服务可信方面的问题与挑战。将来在云计算这种环境下来做数据挖掘,就导致了数据挖掘云服务这个软件的可信性问题变得比较突出。首先服务的正确性 是第一个问题,是不是没有不当的,不正确的系统的状态,这就是服务的正确性要关注的,另外还有服务的安全性,就是不要有灾难性的后果。还有就是服务的质 量,服务质量有可用、可靠和高性能这三个方面来度量。隐私安全,就是不允许未授权的访问。   有关于可信安全方面还有三方面:   (1) 隐私数据的保护,目前来看隐私数据的保护是数据挖掘、推广,或者是数据挖掘与服务模式推广的一个瓶颈,如果解决不好隐私数据的保护保护,中小企业不可能接 受你的数据挖掘与服务,必须解决这个问题。但是解决这个问题是不是说就像一般的信息安全那样,所有信息都加密,这是不一定的,要做适当的隐私数据保护。   (2)过程安全。你的模型与需求要有一支性,算法要可检验,过程对用户可控、可视,挖掘结果对用户来说是可理解的,当然对于其他用户来说,它就是很难理解,因为这一点跟隐私数据保护要结合起来做。   (3)公共安全问题。这是李院士所谈到的一个观点,云计算安全的本质是信任管理然,也就是说要把信任管理做好,然后有数据挖掘的服务,相对来说这个安全问题、信任问题就解决的比较好。   对于上面的问题,我总结一些对策:   1、基础建设方面,要建设数据挖掘云服务的平台。要根据个性化和多样化而谈,在云服务平台上,专业人士可以提供服务,大众和各种组织成为服务的受益方,而且这个平台要按领域、行业来构建,这样流程就比较顺。   2、数据挖掘云服务还是要依赖于虚拟化技术,要计算资源,要自主分配和调度,也就是说虚拟化技术是数据挖掘云服务技术的支撑。   3、需求方面,要想应对个性化、多样化需求,我觉得必须要大众参与,有了大众的参与个性化和多样化的需求就能够更好的得到满足。   4、可信性方面,算法要通用,要可查,可调,可视。   5、安全方面,隐私数据最后是有客户在自己的平台终端,可以加密来保护,可以有一些安全措施。    下面我介绍云数据挖掘的一些实践,主要是讲我们在中国移动所做的一些工作,这是08年年底我们做得PDMiner的一个体系架构。我们进行了预处理,数 据的初期转换等这些事情。往下就是并行数据挖掘,这里面就集成了几个算法,之后是用户界面,用户可以来定制任务,完成它的目标。我们现在所做的ETL的组 建,ETL是要把数据加进去,这是一个数据,节点要增加,而且多个任务工作流之间可以相互不干预,在这一节点同时启动,可以处理失败的节点,具有高浓缩能 力,开发架构,算法可依配置在加载到平台上。   (图)这是两幅图,一个是ETL的实验图,这在开发过程当中,所给出的一个图。ETL的加速比大家可以看出,它是线形的,拓展方面都是比较好的。这实验结果的均类算法,这个算法各方面都是比较好的。   跟商用软件来比较精度达到了,从结果上来说跟商用软件有结果的情况下,是可以达到一致的结果。当然有些商用软件受到数据量的限制,还没有结果,这个我就没有办法比较。中国移动数据挖掘分析支撑工具,是对体系结构的一个描述。    已完成工作按照中移动,王院长去年大会上所谈到的,就是说用1/6的成本实现了6倍的性能。近期我们开展的工作就是面向外国做了一个云计算的数据挖掘服 务系统。这个系统我们实际上是基于原来后台的系统,开发了一个Web界面,提供云计算的并行数据挖掘与服务模式。从一个示意图来看,前台、后台之间的一个 交流流程示意图。这是前后台系统关系的逻辑图,按照这个架构,我们开发了面向Web的WPDminer这个系统。   我给大家演示一下播放工具。    这有四部分,有数据管理、任务管理、用户管理和系统的使用介绍,我们可以上传文件,察看文件做这些操作。现在我们做一个上传文件,有关任务管理的模块, 我们可以创建一个数据管理任务,我们把算法技术一个预处理的转换功能。把它的输入输出参数设定好,把平台的数据都配置好,按照工作流的方式可以再添加另外 一个任务,同样的去配置参数。配置完成以后,我们对新创建的任务去执行,在执行过程当中,我们对Map/reduce的进程时间是可视的,大家可以看到这 个过程。这就是刚刚完成的任务,可以在日志文件里头都可以查看到。 这是一种模式,就是说数据挖掘要用云服务的模式来提供。   下面我来给大家介绍最后一点,未来的走向。基于云计算的数据挖掘,未来走向呈现了什么状况?数据挖掘与服务将会兴起,有服务的提供者,也有大众和各种企业组织他们的服务受益方,还有数据挖掘研究来讲不会受到计算环境的影响,数据挖掘应用范围将大大拓宽。   数据挖掘将和物联网结合起来做,而且基于云计算的云计算在物联网上不可缺少,高可信的云计算的挖掘和服务是未来的一个参考方向。   谢谢大家。    主持人:请大家提问。我有一个问题,刚才演示挖掘的是什么?最后显示的这个挖掘的结果。    何清:用户挖掘提交任务,看到这个在执行过程当中,这个数据是数据处理的一个储蓄,只是储蓄之间的一个交换,没有做可答的,大家要等好长时间。    主持人:谢谢。 云计算行业应用与创新分论坛 刘鹏:欢迎大家光临第二届中国云计算大会第二个分论坛,咱们这个分论坛的主题是云计算行业应用与创新分论坛。今天将有五位嘉宾在这里做报告!先请第一位吕卫锋副主任来为我们做报告,大家欢迎! 吕卫锋:好, 很高兴今天有这个机会跟云计算的各位同仁介绍一下我们中国科技资源共享网的服务于创新的情况。我是北航软件开发管理的吕卫锋,这次我代表国家科技信息平台 介绍科技资源共享网的情况。我今天想跟大家介绍一下,我们国家的中国科技资源共享网的建设情况以及运行服务情况,以及这次来想跟云计算同仁一块探讨它在云 计算创新工作设想。希望云计算朋友们更多关心我们国家科技资源能力的建设,和科技平台能力建设。   为什么讨论这个问题呢我们大家知道,我们国家 现在建立自主的创新型国家,自主创新型国家战略主体就是科技创新人员。这些人员的科技研究和创新,传统的科研方式大家都知道,写论文,在CS里做实验,参 加这种会议的讨论,研讨,然后通过各种各样的科技团队的协作完成科技创新的工作。实际上随着信息技术的不断延伸和发展,我们科研方式不断发生变化,我们科 技创新活动已经变成一种跨学科的,任何科技创新不再是一个纯粹一个科技创新,第二个跨组织的,我们现在大型科技创新活动,一定是各种各样单位,进行协作共 享完成的。还有跨地域,现在各种各样科技创新,不再局限于一个国家、一个地方,这种跨学科、跨地域、跨组织的科技创新合作需要信息手段促进学科的交叉。这 方面我们需要有广泛互联的网络,有各种各样科研设备的共享,以及有各种各样信息计算的服务。现在各种各样的生物科学数据,包括各种各样气象计算都需要有计 算中心支持。我们整个科技创新的活动创新中,我们需要把每个人科技创新的工作跟同仁们进行交互和较量。这样才能进行触及,所以进入二十一世纪我们科研方式 发生变化,这种科研方式需要和广泛互联网络结合。   我们资源科技共享网是要达到开放、面向科技工作者资源共享,我们需要促进科技资源的共享,这 种科技资源包括科学数据,科学成果,科学仪器,通过这种共享我们优化我们国家的科研基础设施。我们科研基础设施,各种各样的科研单位有各种各样的大型设 备,如何使科学仪器按广泛的科学人员进行使用,也是一个广泛共享的问题,我们要促进我们国家科技基础人力的建设的提高,还要促进相互学习交流。这是我们科 技共享网的一个想法和理念。   作为科技的信息化,也是国际的发展趋势。早在2001年英国提出e-Science计划。我们国家呢,科技部在 04年05年启动了国家科技技术平台的建设,建设一个国家的科技资源的一个战略设施个共享设施,以及服务设施。通过这几年的建设,我们已经建设出来了一个 可持续发展的跨行业的,跨部门的,跨地域的一站式科技专业门户网站,这就是中国科技资源共享网,全国的各种各样科技资源数据,包括科学数据,包括各种各样 的仪器设备,我们进行了汇集和整理。同时大家可以进行搜索和检索,可以进行资源的共享和利用。目前这个平台为广大的科技人员进行使用。这个科技共享网的定 位,首先第一个科技基础条件资源信息回教中心,也是资源共享服务的平台,也是合理布局决策支持系统,也是发布和成果展示的窗口,也是资源动态监控和管理的 工具,和国内外相关资源合作交流的枢纽。所以我们现在这个网站拥有一个丰富的科技资源信息。   这个科技资源共享网在去年9月份由科技部领导和财 政部领导,共同开通科技资源共享网。到现在为止科技资源共享网整个运行情况跟大家汇报一下,现在科技资源共享网整合了30个专业门户专业资源,20多个平 台,30多个地方平台的资源。科技平台涉及材料、农业、海洋,现在涉及到部门是国务院37个部门数据,500多个国家重点工程中心的数据,目前涵盖了全国 31个地方平台,200多个生物种子资源,目前形成了资源数据库28类,提供了六大类各种各样的特色服务,数据量超过1000TB。大家可以上网访问。    整个科技资源共享网这个系统下面有科技文献的资源,自然科技的资源,科学数据的资源。我们通过统一的一个规范和标准,进行汇交和集成。同时提供了海量数 据的组织管理,并且可以进行统一的身份认证。一个用户注册以后,可以在科学共享网各个子平台进行浏览,现在提供服务的功能,包括信息发布,资源导航,信息 检索,以及各个子平台进行评估监测。我们现在应用的是应用集成,我们通过四到五年的建设,建立了分布式的资源共享服务群,这个存储的中心,目前放在我们的 北航,我们现在正在跟运营商,跟中国移动探讨,在中国移动能不能提供云计算平台。把我们科技资源向公众提供服务,这个科技资源建设是公益性的建设。底层站 点有40多个国家平台资源,各个专业平台,林业、农业、生物、海洋包括气象。还有20多个行业资源,还有31个地省市地方资源平台占领。我们科技共享网服 务情况跟大家介绍一下,我们科技共享网是去年年底开始正式运行服务,以及未来的扩充。目前的提供是4个服务:   第一个是跨平台跨领域的数据文献仪器的搜索和导航,   第二位网络协同和远程操作,   第三体工队科技资源建设和服务情况的评估监测,   第四,专题热点服务。    我们可以通过科技资源共享网可以查询转基因水稻检测情况,可以在科普数据库里,在科技资源网里寻找跟转基因有关系的各种各样的信息,可以查详细信息,是 谁拥有?谁能做转基因稻米的检测,它的专业网站是什么,可以直接跟他联系。以及转基因相关论文,科技文献可以进行跨领域、跨平台跨行业的检索。这种检索可 以简单举个例子,比如检测县一体的DNA的检索,这种服务我们在科技共享网查询,可以找到在这方面的检测哪个单位可以检测,这个仪器如何使用,可以通过网 上共享和服务。这是通过大型科学仪器来进行申请仪器的使用和服务。这是我们目前科技资源为广大资源者提供服务。   我们科技文献的子平台,因为我 们科技文献子平台,我们国内的文献都可以查询,国外的可以通过科技引擎来查询。我们同时还可以干什么呢?由于我们的科技工作者来自不同地域,我们更关心, 比如在山东,更关心在山东的科技工作人员的情况,我们可以基于地图的搜索引擎进行查询和服务。包括一些科技文献,包括科技成果进行协同和服务。我们在仪器 设备共享服务方面,我们做了创新,我们很多大型仪器设备,比如离子探针测定我们的地址设施的连带,这种设施在国际上也很少,通过我们网络的科技资源平台, 把北京的二次离子探针进行远程共享。我们建成全球的离子探针的共享服务,通过这个共享服务给国内工作者提供时时的检测。人不需要出差,不需要进行实验,而 且服务的价格很便宜,这是整个客源共享协同的一个范例。   包括电子显微设施,也是一个很重要的设施。通过专家系统和共享,我们建立了一个全国性 的共享服务设施。还有天文望远镜的观测,天文望远镜在国内也是大型的科学仪器,科学家在检测和服务的时候,可以透过网上申请望远镜的申请,可以进行仪器申 请,协同的观测。这是我们在天文望远镜整个设施的操控进行远程控制。同时呢,我们科技资源共享网开通以后,科技资源的整合不断地提高,我们围绕社会科技热 点问题,包括农村医疗体系建设,建专题的资源库,把各种各样的科技文献,相关资料收集到科技资源共享网。   同时对加盟的站点,包括几十个子专业 平台,和科技资源站进行时时的监测。我们目前的科技资源整合和建设,建设完以后各种各样的资源和平台,分布在网站和机房。我们监测机房带宽、数据更新怎么 样?这是面临最大的挑战,所以我们要有运行服务的监测,对每一个站点,几点钟运行情况怎么样,服务情况怎么样进行监测。同时整个用户访问情况,进行评价。 要根据用户开放共享服务的情况,对每一个专业平台进行评估,促进它的科技资源的开放和共享服务。这是目前的一个统计情况。这是科技资源共享网目前的运行和 服务建设情况。   为什么这一次到云计算大会平台上交流科技资源共享网,以后随着科技资源共享网的开通、运营服务我们面临诸多挑战,最重要的挑战 就是用户访问量。由于科技资源共享网开通以后,包括科技共享的门户,包括专业平台,注册用户超过100万。同时我们平台访问量超过,每天访问量100万 次,科技资源共享网的访问量每天超过10万次。我们现在不能跟一些大的公共服务网站比,这种更多的不是简单资源的论坛,需要操作仪器,科研的协同设施。科 研网上交流更深入,而且要进行视频会议。我们现在科技资源存储分布在60多个子平台。我们现在需要通过一个统一的云设施进行建设,所以我们现在每一个专业 子平台单独维护的费用很高。   还有作为我们资源单位,我们农业科研研究所,我们种子科研研究所关心并不是信息化技术,更多关心资源如何对老百姓 服务。所以这就是我们需要用云计算模型进行运用和服务的创新。这是目前的想法,这方面希望建立一个科技资源的共享,通过跟网络电信运营商,和云计算软件开 发上和服务商共同建立科技共享网。同时我们要把我们目前分散在各个地方的科技资源数据集中起来,形成大规模易购的数据存储,这是希望做的第二点。    云服务有一个规划,我们这个规划希望我们这次到云计算大会学习,希望跟云计算大会领导性的企业共同探讨,怎么把国家的资源建好。这就是我们的一个情况, 希望通过云模型的运用为广大用户提供高效使用,我们与运营商、资源单位合作,共同打造我们国家的科技资源共享服务。谢谢大家!    刘鹏:我们给大家一个问题的机会,请问大家对吕教授的演讲有没有提问? 提问:吕主任好,我想问一下作为医疗卫生系统,在咱们资源共享网上现在如果访问有没有权限?医疗卫生普通的用户或者网民。 吕卫锋:可以,目前大部分科技资源都是为普通用户完全是开放的,由中国医学科学院有数据子平台。 提问:注册就可以吗? 吕卫锋:有一部分需要费用但是目前医学科学数据基本上广泛地推广,公益性的服务,目前是,可以到网上查。谢谢大家!    刘鹏:再 次感谢吕教授精彩演讲!我们刚才就是已经看到了北航在科技资源共享网里面做了大量工作,这个工作我们感觉意义非常大,因为能给做到跨单位,跨地域跨系统的 共享,不仅有数据库资源,有文献资源,有专家资源等等,这样做到对于促进我们国家科技水平非常有意义。我们前面做了这个工作,我们云计算准备怎么做,这样 非常客观非常好的表达方式,我们考虑大家比较关注的到底什么是云计算,因为现在可能我们发现了有很多种不同的说法,到底什么是云,什么不是云,我们大家有 的人讲公有云是云,私有云不是云。还有有人说支持虚拟化叫云,不支持虚拟化不叫云,但是Google不支持虚拟化,但是我们都认为Google是云。现在 有很多操作中心叫云计算中心,云计算兴起是很显然的,所以很多人打着云计算的旗号要么转眼球,要么圈钱,到底什么是云?这里提出判断云计算参考标准,什么 是云?我们用滤网滤掉,用户使用的资源在网络里,而不是在用户端这一边。所以这个就是区别是不是云的标准?第二点就是应用的服务能力,具有跟踪以上的可伸 缩性,这个是什么意思?如果资源结点服务能力不够,但是网络流量上来,这时候在一分钟几分钟之内,能动态伸缩我的能力。我们现在有很多IDC说我也是云计 算,如果伸缩你的能力可以,5个小时之后能得到。网络流量是不可预期的,怎么可能等5个小时,那是人在配制系统。我们5倍是非常保守的计算,中国移动是5 到7倍的提升,这个是规模不大的情况下,我们5倍是保守的说法。   PC,第一关过不了,是用户资源在客户端所以不是云,Web网站不是云,广告 联盟,把很多广告联在一起也不具有伸缩性,没有应用的需求,点广告的人非常少,没有伸缩性也不是云,超级计算中心,性价比不好,超级计算机都是很昂贵的, 在性价比上面也没有很强的优势。这些我们都认为不是算云,看看算是云的比如在线的Office,如果能提供规模化用户,这种算是云,现在在大家看到的百 会,还有Google的DOC也是。提供给用户一个月使用成本是几十块钱,这个远远优于我们使用传统模式,像亚马逊租用机器的服务,所以这种性价比也非常 好,也是云。还有Paas,还有云安全,这种比如360安全卫士,提供给用户完全免费的服务,也证明是云。所以我们今天在座的几位演讲嘉宾都会介绍他们的 云计算计算,我们可以听听他们是不是真的云,经过我们分析,这个论坛这几个系统都是非常漂亮的云计算系统,下面是太湖云计算中心陆建豪主任!    陆建豪:我们从08年5月开始做!云计算做什么,当时我跟我们团队说,如果云计算是一个法宝我们就工作辛苦一点。如果说我们工作辛苦点实现这个云计算的价值!今天非常荣幸,我们有两年的实践,跟大家汇报,我们这个务就是电子商务,B2C云计算服务。    说起云计算,我们经过两年多的研究,了解云计算从中国历史看,三国演义从分到合,从我们角度来说,我们发明了PC机,发明了主机这是集中的时代。随着 PC,随着英特尔,随着微软,这也是信息技术普及的阶段,分散以后到了现在阶段,我们互联网普及,在这种情况下,一个很自然的趋势,就是我们可以在一个集 中的地方集中信息处理,当然是集中化,规模化,做标准化自动化,我们现在处从分到集中的时代。分带来很多问题,我们系统利用效率非常低,CPU利用效率在 15%,根据统计CPU利用效率在10%到20%之间。第二管理层,分散系统带来击极大的管理成本,信息安全要管理维护,简单地说今天买一个电视机,为了 看电视机还要花比电视机更贵的钱,可能这个电视机本身有问题。第三是能耗,我们分散的系统尽管利用效率非常低,这个能耗增加比例是比所有的成本,我们以前 的IT时代是奢侈的IT时代,我们有IT资源才能得到IT服务。加上物联网,根据物联网的统计,以后平均每个人拥有30个终端,产生海量数据对IT整个需 求超过前所未有的。   什么是云计算?我们可以从传统技术的发明可以看云计算是什么?历史上跟云计算进行相识的就是汽车流水性的发明,今天云计算 也是这样。我们云计算可以在10分钟之内今天把一台服务器从网络、操作系统应用提供服务,从这个里面可以看到,云计算对我们将来的工业的一个影响,以前从 手工装配汽车到流水线生产。我想云计算本身带来的技术上的创新,必然提高效率,这是所有的流水线生产都会带来的效益,快速响应提高服务,我们私有云的价值 主要来自技术的创新。同时云计算是商业模式的创新,这个商业模式今天的地位跟电信移动都一样,电信移动提供通信服务,我们提供是云计算服务。从原来拥有这 个资产才能享受资源,到按需提供服务。刚刚吕院长说的很好,成本太大,这个影响我们厂商如何提升这个服务,从原来的消费者要自己买东西到整合,到最后我做 一个消费者我是来消费这样一个服务。我们相信这个服务的新的商业模式,对客户更有价值,对厂商也更有价值。   这是我们个人的一个体会,可能我们 IT工业本身需要再工业化的工作,这个可能是云计算这个形式出现。所有云计算的价值离不开规模,离不开标准化自动化。怎么来理解?这个是我们的理解,从水 厂电厂这个理论说说,规模效应,打开管道可以用水和电,今天上网可能运用到信息和服务,我们相信每个地方都有云计算服务。同时从水厂电厂可以看到云计算工 业本身将来的一个趋势。我们也有一个出租车、私家车理论,从私家车来说每天开3到4个小时也是私家车利用效率,但是出租车80%的利用,我们相信云计算跟 出租车发展一样,需要时间,会从最合适的领域开始。我们认为在B2C电子商务这块,我们认为杀手级的应用。这两种方式长期共存,不可能一夜之间所有的信息 会发生。云计算是提供信息服务,有输入、处理、输出,可能有多种多样的信息工厂。   大家对话题比较感兴趣的,云计算跟SaaS有什么关 系,Saas对然间资源的最佳利用。如果定义在只是硬件层管理,加上SaaS等于广义的云计算,SaaS在云计算硬件平台上是对IT的最佳利益。云计算与 物联网有什么关系?物联网强调最终的用户端,最后通过网络需要信息处理,海量的数据,时时处理,云计算可以说是物联网的最佳神经中枢。公共云和私有云,公 共云是出租车,私有云是市政府内部的一个车队。   我们公司简单介绍一下,主要的业务就是说,天下没有难做的IT,如果对一些大的组织,你们需要 自己购买这个IT资源再来服务,我们提供很好的云计算为基础的基础架构,使将来的管理非常有效率。作为公共云,作为消费者来说,最终用户不需要自己投资, 自己管理,自己集成,直接使用在线服务的方式。   电子商务占零售总额的1%到2%这个之间,在美国达到6%。这个是一个比较,B2C是井喷时 代,B2C有自己的厂家,有自己的官网,在美国B2C的业务占整个电子商务的50%,中国在10%到20%之间。现在我们做B2C是怎么做的?我们做 C2C,用C2C的平台做B2C的生意,简单地说,C2C是一个大卖场,厂家放了一个探头在里面,当这个厂家达到销售量的时候,平台不能满足信誉、安全、 品牌,这些不是C2C平台所能提供的。最近可以看到淘宝网前20家要离开,开物理店的时候,作为一个品牌商家一定有自己的商店,我们看一下,当你做到一定 销售的时候,你会走出去开自己的店,同时从市场要求来说,市场的需求对我们将来的电子商务的需求有很大的特征要求,这些品牌店有自己的销售方式,自己的客 户,这个可能是电子商务的发展趋势。现在以人为本,这个电子商务也是以人为本,有动态的购买体验,有多渠道线下互动。要有高可靠性,对IT要求相当高。    怎么做?看传统的连锁店怎么开的,北京的国贸商城,有中央空调,保安,这里面是LV的专门店,关心的是自己的生意关心的自己核心业务,关心是品牌销售, 对基础设施采用租赁的方式。我想将来所有的行业发展都会遵守这样的方式,从某种意义上说我们B2C就是做了B2C的房地产业,我们提供信息安全。在我们开 物理店的时候,非常关心地点,可能在行业的云计算服务当中,我们可能最重要的是这个行业的解决软件服务。我们这个软件根据IBM十几年的国外的经验结合中 国实际情况开发的。我们太湖云计算提供的以云计算硬件架构为基础的一个平台服务。我们采用的商业模式是收入分成,我们客户到这个平台上不需要花任何钱,就 可以开专门店,根据收入,在网上成交的金额采用收成的方式。   这是我们第一个客户,是七匹狼,这是他们最近做的一个广告,他们关心做七匹狼品牌 的销售,产品销售,不需要关心这个店后面的硬件、软件、维护。我想这个价值非常明显,提供了高端的电子商务一站式解决方案,共享风险,能够快速进入市场。 今天七匹狼在北京开一个连锁店,不会造一个房地产开七匹狼店,他关心的是产品销售。我们通过打造一个私有的,完全有政府控制采用云计算架构的统一界面,政 府花了更少的钱做了应该做的事情,我们厂家提供了私有云的平台,这个是我们服务的产业。我们跟大家在汇报的另外一个事情,我们正在跟无锡超算中心合作,超 级计算不具有快速配制的能力,通过我们技术,用我们市场跟他们合作,使他们IT资源不单合作超级计算,也能做一般信息技术的服务。   我们现在也 在打造这样一个产业链,从基础到云计算平台,到行业解决方案,希望打造电子商务的价值链。最后是预测,我们相信将来是这样的情况,请我们工程师上来。在终 端这方面,能够带来很好企业的设备,我们今天带来的是iPod,我们能够在iPod做很多销售,网上的采购,当中是无线物联网,我们相信所有的后台都在云 计算机里产生。   谢谢,我们相信B2C的电子商务,云计算时代已经来临,能够提供更好的商务,我们现在进入腾云驾雾,这个务是电子商务!谢谢大家!    刘鹏:我们下面陆总的报告非常精彩而且非常深入,我们下面留出两个提问的机会给大家,请问大家有没有什么问题?    提问:陆总问一下,七匹狼现在营业情况怎么样? 陆建豪:6月份会在平台上线。 提问:我想咨询一下,假如有七匹狼有八匹狼如何解决个性化问题? 陆建豪:我 刚才讲了,我们做云计算服务,一定看行业解决方案,这边特别强调,我相信软件本身不是特别复杂,B2C非常重要,非常有竞争力,现在提供的在美国一直是最 高端的,IBM在这一块有十几年的经验,比如促销工具有40几种,可以随意组合,这样满足厂家不同需要,我们允许他们有这样的一部分。就像买电器一样,可 能只能用到15%到20%的功能,但是里面的功能足够。 刘鹏:太 湖云计算是我们国家第一个云计算中心,也是第一个商务云计算中心。太湖滨湖区政府引入了IBM,这件事情非常超前,这个角度来看,我觉得他们非常有胆识, 无锡是中国的物联网中心,是感知中国的中心。我们大家还在酝酿之中的事情,他们已经做好了,现在陆总他们根据云计算中心,根据超算中心做更多的事情,做电 子商务,做B2C这样的业务,我们祝愿陆总能够取得更大的成功,谢谢,   下面有请赛科云港高瑞董事长做报告!    高瑞:各位来宾大家好,我是高瑞,今天非常高兴在这边跟你们一起分享我们对云计算的一些想法跟一些示范案例。今天先分享一下我们对云计算的看法,很快介绍一下公司,这样对你们可能会有帮助。第三个,在云计算这边的示范案例有一些帮助,最后总结。    云计算是IT产业的第三次革命,这个革命两个字不是随便可以用的。什么是革命,就是革了别人的命,我过去二十几年在美国IT产业亲身经历过革命,看到前 两次的革命带来的机会跟杀伤力。二十年前的时候,在Gartner,是全世界属一属二的公司。二十年前Gartner是很大的公司,思科是很小的公司,可 是现在Gartner不存在了。我做IT行业做了几十年,云计算是把IT产业从头到脚整个改变过来,很多人觉得云计算基本上只是一个市场上的宣传工具,让 他们可以卖更多的硬件和软件,这是错误的想法。你去他们数据库里,看不到传统的设备,也看到现在市面上卖的集成软件,因为这是一个革命,革命就是什么东西 从头来。不是在已有的层面上重新整合,那就不叫革命了。第一次计算机革命造就了微软和英特尔,第二次造就了百度和Google,所有昨天有几个记者跟我 说,说这个不知道是真是假,我觉得是应该发生。如果大厂商没有定位会被淘汰,像Gartner一样没人听说过,云计算是什么,大家很清楚,不多讲了。   云计算是不是这样说?以前都在井里打水,现在不用了,有自来水公司了,这个水质,也就是云计算的安全太重要了。你云计算提供服务,能不能给客户保证服务品质,如果不能客户宁愿自己打水,不敢用你的。为什么是革命?从硬件软件重新产生新一代的产品,才能保证。    2010年十大技术趋势,云计算排名第一,2012预测80%企业会使用云计算服务。同时预测2014年超过三分之一的企业网上运用在云计算上,在未来 15到20年云计算影响整个IT行业的关键技术。20年以后我们在这边讲,什么公司有没有人听过,可能没有人听过,今天觉得很大的公司,可能20年以后在 座没有人听过这个公司。这是IT产业有趣的地方,随时提供机会,同时预测这四年在中国云计算产生1.1亿的市场合成。Google每年采购是600亿美 元,现在是16亿,差不多四十分之一,工程公司降低耗能,这个其实都是很典型,不是什么秘密。   第二个好处,大幅提升企业的效率跟促进已经发展,因为以前很多中小型公司没有钱买很贵的软件,所以阻止了他们进程,你不需要买一大堆服务器,也不需要买一大堆昂贵软件,只要能上网就能提供服务。    第三最重要的,因为云计算新的云服务,创造新的商业模式。譬如软件销售,经过渠道再卖给企业,以后不是这样。以后这种软件基本上经过云服务的运营商提供 服务,这个改变了整个产业软件产业结构。包括零终端,大家基本上是一个小盒子,里面没有CPU,也没有磁盘,这个对PC这个产业的改变有多大。所以这个是 一个很大的机会。   很快介绍一下赛科信息,赛科是CipherMax的一个子公司。我们是第一个在交换机上进行加密,磁盘加密,很完整的一个软 件。同时也有很成熟的数据安全的整套解决方案,包括磁盘加密跟管理,所以交换机跟安全都是领先的定位。同时帮国内做了第四代飞机整套的航空光线的交换机的 测试系统,所以基本上有云计算非常核心的产品和技术,让我们很快提供云计算的产品。   CipherMax有很多产品经过认证,这是我们全球的一 些客户。目前我们总公司在武汉,在北京有销售,分公司销售和商务,上海是研发和服务,美国是研发和经销商。基本上面有四块,第一块是存储,在安全方面有存 储架构机,包括磁盘磁带,怎么保护磁盘磁带的加密。这是最核心的东西,跟测试系统,待会讲一下。在存储方面,有智能交换机,在数据交换我们可以进行数据加 密,有很多方式,我们也有存储管理软件。安全产品方面,有这种完整的加密机,也包括密要管理软件,现在都在使用。   云计算这边,我们基本上我们 的目标是把国内的这些数据中心,企业,或者IT数据中心云化。云终端跟数据产品,让他们能够提供云计算服务,包括弹性计算,数据备份,或者是服务。基本上 我们解决方案,就是包括终端的产品,移动终端,也包括数据中心的成立,基本上是一整套的系统。一开始这个解决方案,是适合私有云跟公有云,目前看国内应该 从私有云做起,一般企业对数据还是比较敏感,所以他们从私有云做起,各方面更成熟到公有云。基本上我们数据中心的产品分成几层。后面更详细介绍这个,这个 是新的硬件,基本可以看到这里面最关键的就是把服务器网络跟存储整个在一个机柜里,以前现有的数据中心,可以看到存储服务器基本上从不同的厂商,他们之间 没有关系。可是在这个云计算时代,这个之间是有关系的,服务器的资源,网络资源跟存储资源之间关系非常密切。所以怎么把资源整合起来,虚拟化是很重要的事 情。第二层就是基础软件层,后面会更详细介绍一下,怎么对硬件管理,包括资源的虚拟化,包括对安全的处理。在硬件软件平台上,搭建了一个开发平台,让大家 可以很容易地在这个平台上开发出基础设施服务的软件。如果有人能够提供硬件软件平台,跟开发平台,国内如果有人可能两三个月做出来,基本上提供的是 ADS。我这边想要谈一点就是说国内现在很多人,大家讲云计算是软件的应用,我觉得观念不对。我们今天做一个超级商场,你第一步基础设施一定做好,你基础 设施不稳固,停车场设计的不好,电梯各方面不对,你商场怎么可能蓬勃发展,你上面商店做的再好,今天断电明天段天客人也不来。基本第一步把基本架构做好, 这个平台搭的很坚固,上面才可以发展。像刚才介绍B2C的平台,这些可以很容易很快在平台上发展。   第一个金融云,安全是第一个考量,数据安 全,网络安全,包括数据存储非常高对系统构架也是非常复杂,组织服务器种类非常多,设备网络跨地区分布。软件应用非常复杂,有不同软件平台,并且有非常多 的供应商跟集成商。这些推金融的云的挑战,同时也是机会。金融是最保守的行业,如果做进去这个行业机会就很大了。我们看银行系统怎么变革,第一是PC单 机,90年开始有PC服务器,96年有IT系统架构,到目前第四代以客户为核心的层,有业务平台。我们看银行系统未来走向已经发展到客户为中心,全面的客 户试点。前台接受信息,所有的信息在后面集中出来,这个跟云计算架构是非常吻合的概念,产品工厂要形成,很快提供新的服务,怎么很快提供新的政治业务,这 是很重要的。怎么精简核心,创新业务,介绍核心影响。   我们感觉云计算可以迅速帮助银行达到目标。我们看一下构架,包括数据中心,有不同的业 务,基本上金融云提供三个层面,也是三个阶段的实施,不可能把全部数据中心换掉,云计算虽然是一个革命,但是革命不是发生在一个晚上,是一步一步做的。云 终端现在很多银行系统有PC,PC常常需要维修,有时候中毒,有时候软件要升级,有时候有安全考量,或者从PC上QQ,跟朋友聊天,这存在一个问题。怎么 把这些PC换成零终端,里面没有CPU,最大的好处就是节能,就是PC的话,一个两百瓦,零终端是5瓦。整个运作事实上在数据中心上运作。   第二个层面怎么优化数据中心,经过硬件管理跟虚拟管理,安全管理把硬件软件优化,优化好处就是降低运营成本。因为服务器的效率提高了,多了很多资源,开始提供一些服务给其他的银行。所以等于数据中心从一个成本中心变成一个利润中心。   第三个层面全面实施金融私有云,包括整个硬件平台软件平台,开发平台,可以很快开发新的云计算应用。所以等于是在最大的后台数据中心高效能的灵活运用。   更细节讨论一下在支行和分行有零终端,基本上每个系统运作在数据中心来做的。这样的话避免基本上要去支行分行管理硬件软件,分级,中病毒啊做这些事情。       怎么优化数据中心的软件,因为一般的数据中心,他们觉得硬件还不想换,也不太随便换。没关系现在从软件,因为CPS可以运作在现有的硬件上,所以现在使 用CPS基础平台运作。包括四块:第一个你这些资源要能管理,才能把使用率提高。第二层做虚拟管理,怎么把服务器虚拟化,怎么把存储虚拟化,这样基本上不 会有分散了,怎么把网络虚拟化,怎么把桌面虚拟化,这个桌面虚拟化基本支持刚才说的零终端第三个层面怎么安全管理,确保你存储方面的安全,网络跟服务器方 面的安全,跟这方面的密要管理,第四基本上云的管理软件,怎么样很迅速地整合其他各个功能,这个就是说,一步一步地来帮金融这些数据中心,帮他们优化。    第二个就是说当他们需要采购新的硬件的时候,让赛科的云计算系统搭建新一代硬件平台。硬件平台基于一个新的架构,基本上目前的架构,服务器、网络存储器 分开,自己有自己的管理软件,新一代云计算系统,基本上电源是中央控制的,这样子可以达到迅速用这个硬件,马上效应就是节能。我们估计达到30%到50% 的节能,这个对数据中心是非常重要的。数据中心最大最大的成本就是耗能,看很多数据中心一天80万到100万,这是用电量,这是很重要的。你用新的云计算 系统,一年之内不到一年节省的钱不止你买系统的钱。这个系统里面包括服务器,存储网络,跟交换机,硬件加密设备,全部在一起的。你可以看到我们前面基础软 件事实上可以搭建在新的CCS上面,搭建在CCS上整个成本化更加明显了。   数据中心优化的好处,就是低成本,设备成本降低了。分开买服务器, 网络存储可能是三分之一到四分之一的成本。更重要的是电力成本,因为这个电力是每天都要支付的,所以这个也是,低维修成本。因为基本上一个机柜里,所有的 硬件软件都整合起来了,不像今天服务器坏掉了,不同厂商要找不同厂商,因为硬件软件的整合,提供了更高的服务性。同时资源管理、安全管理、服务管理。今天 数据中心这三个硬件软件没有问题,在云计算时代这个不可能没有关系。所以你可以基于随时需要你服务器的资源,你网络资源,跟存储资源很快结合,这个是今天 的软硬件达不到的。达不到的话没有办法,可以说有云计算系统云计算平台可以提供,可是云计算是基于今天的软硬件,达不到当云计算有海量存储海量计算的时候 有需求是达不到的。   云计算要发生安全是最关键的,如果数据不安全,没有人用计算。赛科基本做法对数据进行加密,这个密钥只有客户有,密钥只有 我有,对数据中心来说你资料是加密里,所以他也看不到,只有你看得到。这个非常完整的密钥,不然密钥丢掉怎么办?丢掉数据就没了,所以对密钥要求非常高。    第三,就是整个金融云,一个非常完整的金融私有云的一个搭建。我们知道说层面123这个过程需要时间,快的话需要一年时间,慢的话需要两年时间。这个是 做很扎实的基础工作。当然这个金融云也存在它的问题和挑战,第一个问题银行对新系统的技术引进,因为银行对这个安全非常高,他们要看到很成功的试点跟管理 层的决心。第二业务连续性的安全,跟IT人员重新安排上,也要有很好的解决方案。这个私有问题和挑战不是不可能解决的事情。   软件外包开发云。 我这边举一个客户的例子,基本上现在很多国内的软件公司,和外包公司,在国内有很多点。比如这个公司有四个软件园,在国内不同的地方,有数据中心,培训中 心,客户中心,目前这些软件园全部用PC,可能一个软件园有三五百个PC,加起来有好几千个PC分布在各地。软件园分布在不同地方,PC维修采购成本很 高,有时候软件要升级,维修人员到各个地方维修升级。数据安全的保证也是一个问题,另外一个问题就是数据中心资源共享也是一个挑战,就是说这个软件园现在 目前没有项目,可能有几百个PC在那没用,别的软件园不可能用他的PC,所以资源共享不是很高。第三数据中心如何提供新的增值业务,他们有一些客户,数据 中心很好,各方面的要求都很好,可是怎么提供新的增值业务增加收入这是想要解决的问题。   基本上提供解决方案,第一个让所有的软件园提供中心提 供零终端,PC就是一个小盒子,所有的运作都在数据中心,虚拟机上面,这样提高安全性跟资源管理能力,这跟客户是非常好的事情。给客户看的时候,客户非常 放心,因为所有的工程师运作的时候,数据中心都可以看到,不可能说插一个USB进去把数据下载,这不可能。也降低电力耗能,所以降低整个采购跟维修的成 本。   目前的话在60%的节约,第二在数据中心,终端这部分,在数据中心用赛科基础软件,降低数据中心的运营成本,跟提高安全。第一步先把服务 器虚拟化,虚拟化以后,基本上你就很灵活地可以运用,因为可以把虚拟机,虚拟化以后,可以把虚拟机集中在几个服务器上,其他服务器不用的时候可以把它当下 来,这样可以节省电源。同时降低设备采购跟维修的成本,并且对这个数据进行加密,保护了数据。   第三个最重要的,利用率提高多出很多资源,可以 为他们客户提高新的服务。比如说提供一个软件开发服务,基于新的,因为有数据中心,已经有客户,基于这些提供一个开发平台,委托客户开发一些软件。另外一 个客户如果需要计算能力,可以帮他们提供弹性计算,弹性存储,一旦把云计算中心云化以后,可以节能降低成本。   政务云,也有一个数据中心,分散 在国内三个地方。面临的问题就是提供一个网站,这些企业上网,要申报什么东西经过这个网站来做。怎么把一些服务一些软件应用经过服务的模式提供给他们客 户,因为他们客户是存在的,第二怎么提高新的增值业务,增加收入。同时也是一样的问题,数据中心成本很高,电力一天25万左右。怎么降低电力消耗,降低设 备采购跟维修,服务器存储资源利用率太低,这是很典型数据中心面临的问题。怎么云化?基本还是从软件开始做起,基本上用技术平台软件,可以把服务器虚拟 化,存储虚拟化,提高服务器的利用率,同时降低电力的消耗,同时也降低设备采购跟维修的成本,并且对数据进行加密。下一步我们CCS,这个硬件,硬件进入 要基于客户采购时间,跟采购经费,现有的设备需要被淘汰的时候,进新一代的云时代的硬件平台。   为客户提供新的服务,怎么提供一个政务跟商务服 务平台,以后所有的应用软件经过服务的方式服务。为客户提供弹性存储。很快总结一下,就是说云计算是个人电脑第三次IT革命。为什么叫革命,我个人感觉从 硬件、软件、产业模式会重新起来,重新建设。这个需要时间的,不会瞬间发生,可是这个已经发生了,所以很多企业,不管是IT供应商,或者做软件的,大家不 要忽视了云计算带来的机会跟杀伤力。如果不重新定位,非常可能被淘汰。这个产业革命跟前两次革命一样,会大幅度提高金融效率,会创造新的产业链,商业模 式,跟新兴的企业。比如软件,零终端对PC产业的影响,有提到销售渠道,软件销售渠道,以后集成商可能要重新定位。因为以后这些软件不经过这个渠道来做销 售了,软件商可能找数据中心,在数据中心开始提供服务,提供服务客户用多少付多少钱,软件商跟数据中心做利润分成,可能变成这样一种模式。包括硬件设备, 以后企业慢慢变成从私有云变成公有云,这个是一个在IT产业基础的变革。   我们也看到,这些市场预期,15到20年成为整个影响IT产业关键性 技术。从案例可以显示,对硬件管理,在预算允许情况下,有了硬件平台,软件平台,开发平台,做应用软件非常容易。未来最大的机会在云计算其实是应用软件, 可是如果平台不稳固,上面应用软件没办法做的很好。为什么云计算是产业革命,现在是第一步,第一步要搭平台,可是未来5年10年以后,主要的机会在应用软 件。那时候三五个人有一个很好的方法,不像今天要买设备、买硬件,买开发软件,好不容易开发出来找客户找渠道,也许你这个软件很好,可是你折腾了半天,可 能你的商业模式或者渠道找的不对,生意做不起来。以后不是这样,如果有很好的想法,找到一个数据中心愿意帮你推,可能一下做起来了。像国美电器这样的例 子,今天做了很好的电器,我要卖这个电器,可能得找商店,今天找国美,几百个店同时销售,这样带动所有的产业运营创新。同时创新的过程会把很多公司淘汰 掉,新的模式下,存在的公司不具备竞争条件。   所以我们觉得说,云计算我个人感觉一定会发生的,现在就是说你是要相信它会发生还是怀疑?IT产 业不会等人。赛科我们的目标不是提供One Size Fits All,我们的目的就是研发一个适合客户的解决方案,我们觉得这样才能很有系统帮助企业云化。我们觉得是我们在做的事情,云计算太大了,不是一个公司可以 做的,我们希望有一些合作伙伴一起做这个事情,所以有兴趣可以跟我们联络,网站上有一些信息可以看一下。谢谢!    刘鹏:留出两个提问的时间,请问对高总的精彩演讲有没有什么问题?    提问:感谢高总分享你的经验和解决方案,我的问题是关于金融云、软件外包云,和政务云的一些解决思路,请问有没有一些比较成功的案例跟大家分心一下? 高瑞:这 些项目在进行当中,基本上我想,因为有些涉及企业的私密性,我今天只讲这个架构。就是说这些项目我们在完成以后呢,如果经得客户同意可以进更细节,如果有 兴趣可以私底下谈谈,有一些涉及客户机密的事情不能在公开场合谈,私下场合也不能谈。所以就是说这个云计算不是一次性,就卖这个东西给你,是长期的过程。 提问:在金融业,对这个非常严格,赛科在这方面有基础。 高瑞:我 们现在为什么提到赛科,基本上这个金融云跟银行做这个事情,我们是以项目来做,基本上由项目经理跟客户一起做下来。基于客户的需要把这个做下来,一步一步 实施。那营业模式,当一步一步实施以后这个变成我们客户,以后客户基本上硬件软件架构就是从这个渠道来提供,就是这样的一个模式。我们公司有对银行业务非 常熟悉的人,我们觉得金融云跟软件开发云应用层面不一样,要求也不一样,不可能有人提供一个One Size Fits All。需要从成本中心产生新的业务,这是要解决的问题,我们现在是一起解决这个问题,当然解决问题以后,基本上把数据中心云化了,云化了以后,以后新的 应用软件在这个平台上发生,事实上在搭平台。我们就国内上百个数据中心,已经很多数据中心,这些数据中心做的非常好,有很好的设施,各方面的网速各方面都 很好,可是缺的就是没有增值业务。现在就是先帮他们解决这个问题。 刘鹏:让 我们一起热烈地掌声感谢高总给我们做的精彩演讲!我们在座的大多数人都很关心云计算到底有什么用?在你们自己应用里到底跟云计算怎么结合?有些报告是介绍 他们已经做出的成功应用,有的报告介绍正在实施的,还有可能是一个设想,但是这些东西,对你自己而言,可能有些很有参考价值,比如在座的,随便抽一个人, 这位江总他原来做智能建筑的,如果从IT角度是传统行业,传统行业,在他的应用里和云计算结合起来,现在把云计算物联网节能减排三个事情,在他的行业里结 合起来做了很漂亮的应用,请他简单介绍一下。 江我:非 常感谢给我这个机会介绍一下我的经验。首先介绍一下我的背景,我的背景做智能建筑能源管理的。我是用云计算搭建管理和控制平台,利用物联网的技术,把遍在 全国各地的传感器利用云计算平台进行统计平台,所有的内容,所有目标实现一个监测加控制实现目的。所以这是我利用云计算技术跟物联网技术做的这个事情,这 个经验跟大家共享。 刘鹏:把所有的传感数据采集下来,利用云计算进行处理,跟用户提供个性化管理截面。这样可以大大提升管理的效率,同时对楼的能耗控制。我们考虑今天的演讲时间比较紧凑,我们不休息了,下面请鸿蒙的郑总演讲!    郑世宝:各 位来宾,媒体界的朋友们,广大的科技者,感谢你们来聆听我的发言!我的发言题目叫从生命看云计算,整体论对还原论。人类没有停止对生命现象的探索,无论是 科学还是神学的思维方式都不能揭示生命的本质。长期以来积累的相关知识对另外一个命题加深研究的这个研究有现实意义。怎么从生命看云计算,是所有的研究者 思考解决复杂的方案。云计算是解决复杂问题,云计算有它的奥妙。现在是互联网时代,互联网进入云计算时代,鸿蒙做了初步探索,最大的意义在于从全新视角告 诉人们如何理解云计算,使每个人的价值更大。这是一个一加一大于二的时代,这是一个共赢分享的时代,这是一个竞争合作的时代。我们每个人,都去分享云计算 对大家带来的价值吧!   这里面有一个云计算的模型,这个模型是我们创意的开始,我们今天就是说,主要谈的是我们鸿蒙在制造云计算产品的过程中间它的思维和创意。而不是具体谈产品信息。    一、生命和云计算的概念。生命,我这里拿来做一个对比,生命有一些组成和结构,这个组成和结构最后形成复杂的现象,这个复杂现象会带来整个生命系统的。 从生命看云计算,我们分析出云计算有这样的定义和特征,这个云计算我这里边引用中国云计算专家委员会委员的一个定义云计算是以应用为目的,通过互联网把必 要的大量硬件和软件按照一定的结构体系连接起来。并虽应用需求的变化不断调整结构体系建立的一个内耗最小,供销最大的虚拟资源服务中心。这里边有很多关健 词,比如硬件、软件、虚拟化技术问题。   二、整体论和还原论思维方式对云计算的影响。我们研究一个复杂的事情,一定要注意思想认识要有高度,如果思想没有高度我们看待问题是局部的,可能会把方向搞错。如果方向搞错了我们研究时间、精力、金钱都会浪费掉。这里面举了三个案例。   1、盲人摸象,我不用叙述这个故事的过程,这里面有一个结论,无论赞成还是反对的,他们说法都对。但是问题在哪?就是他们描述的局部表象,没有从本质上进行描述。    2、细菌的组成。刚才说到生命现象,最基本的组成是细胞,比较就是说最小的生命体基本上是细菌,细菌有的是单细胞组成,还有多细胞组织。这里边主要提的 是引言案例引过来的。一个生物学生命体由完全平常的原子组成,看到这点很重要,我们生命是复杂现象,生命是基础的生命,包括复杂生命,都是由原子组成,从 环境中获得新的物质。并排出用不到的物质,这些原子不停地在一些实物体中进进出出,生命是一种累加现象。   3、一张照片。由我们最早看到印刷品 的照片,报刊上的印刷品照片,都是基本类似我们图示的照片,后来这个点越来越细,现在大家看到这个照片不是这种模样了。如果金融系统采用云计算方向时候, 最小区域性的金融系统类似小点,全球金融系统功效大于局部系统功效的总和。这样理解对复杂系统的软件开发也好处。   刚才说三个案例主要对下面的演讲提供一些理论素材。    三、首个云计算应用网站平台问世的现实意义。云计算自2006年提出来,其受关注的程度大大超出了人们的想象。我们做了有益尝试,从昨天很多专家学者谈 了云计算的应用和特征,这里面就专家学者探讨云计算的应用和特征,包括刚才刘教授说几个判断标准,这些都对我们认识云计算有非常重要的现实意义的。我们这 里面做了一个结构图,这个结构图,现在是我们鸿蒙网站平台基础结构,这个基础结构呢,从图上可以看出,鸿蒙按照行政区域划分,由中国省、市、县、乡镇、村 网站系统组织,每个云网站系统又按照行业分类方式有很多行业网站系统构成。每个行业网站包含多个功能系统,每个网站系统独立运行,彼此之间相互联系,形成 有利的整体。   计算机专家从鸿蒙云计算应用网站平台,看到由很平常的服务器操作系统和功能软件组成的。认识到这点也很重要,这些东西和传统的没 有区别,云计算是整体的累加效果。我们前面举了三个案例,说明从局部到整体一个质的飞跃,因为量变到一定程度会产生质变。我们现在描述云计算是质变的过 程,这里面有图示,这就是我们现在建立区域门户网站的构成。这个构成区域门户网站是按照中国行政区划,建立区域门户网站,这样供各个阶层的使用者使用。这 里面构成自由统一的系统,又可以分成无数个可以变化的。这是一个图示,是鸿蒙网站系统的门户,行业门户的构成,我们现在是按照热门的行业,也就是说,有信 息资源运用的构建适应社会需求变化。我们随着社会需求变化构建不同的行业,这样用吕教授其中一个标准,就是弹性可变的,随时增加或俭省这样的行业。云计算 网站是一个整体,系统之间具有联系,数据具有关联性,比如一个村里面发布的信息,同时属于上级的行政区域,这种方式彻底已经了信息孤岛问题。这是我们就是 说,这张图显示构建区域门户,和行业门户之见的相互关键,也就是说,区域门户网站和行业门户网站之间,是独立运行的,独立使用的。但是行业门户网站的信 息,也可以归为它所属的区域。这样形成区域和行业一个统一体。   这是我们另外一个为企业搭建的一个生意通平台。这个平台构建是基本上像我们在座 的人员可以用这样的系统进行云网站的搭建,因为不需要多少专业知识。我们只需要一些互联网的简单操作,就可以搭建自己的网站。也就是说我们自己建一个个性 化的网站,包括中小企业,要建一个自己的个性化的房展,通过我们的平台,可以自由搭建。他们运用他们很少量互联网的知识可以搭建自己所需求的网站,这样可 以在这个平台上任意搭建无数个网站系统。   鸿蒙网的推广应用模式有以下社会意义:   1、观念的改变。   2、信息平衡。   3、社会公共信息资源重新分配。   4、提供大量的直接或间接就业创业机会。   5、由于采用结构化方式对网站系统以及数据信息进行管理,因此大大减少了服务器的数量,提高了系统效率。   四、鸿蒙网的云计算特征。作为中国首个云计算应用平台,鸿蒙网有以下特征:    1:采用虚拟化技术按照行业进行划分,搭建独个系统,每个系统有独个用户,从而形成独系统独用户。比如说河北鸿蒙网是一个系统,都是独立的,现在已经搭 建了60000个系统,其中行业里面是将近100万个。而中国鸿蒙网包含多个行业网站平台,每个网站平台有多个用户,从而形成比较复杂的云中云系统。我们 这个图示比较形象地研究云的组合。   2、云网站平台里的数据按照其物理属性进行描述,因此数据是连通的。比如一个村里的数据,同时属于上级行政区域,所以在鸿蒙云计算网站平台里,不存在信息“孤岛”问题。   3、鸿蒙网云中的系统可以根据需要任意动态增加或减少。比如增加或减少“电脑信息网”等。   4、鸿蒙网云中的数据可以无限增加。而数据的增加只是服务器数量的增加,系统提取数据的速度不受影响。    这里面我们有一个信息遗传技术,这个技术使我们物理节点之间迅速找到,这样会在信息数量越来越庞大的信息数位。昨天有一些大公司的发言,他们说到信息数 据的增加,是越来越庞大。这个庞大的数量是超乎我们现在的想象,这样的数据将来会带来问题,我们数据使用的效率随着数据量的增加会大大降低。这样技术会使 这样的问题不成问题了。   五、鸿蒙网的云计算商业模式。一个大型系统需要多系统多用户,就是说多系统需要更多的用户支撑,这里面举了电网的案 例,大家很熟悉电网,全国系统由各个分系统完成,由全国电网提供电源的服务。如果跟现在物联网,现在云计算这些架构技术,如果是融合起来,这样我相信中国 的电网系统,就可以是一个大云系统。所以说通过电网系统的现实案例,我们就不难描绘和理解,我们下面这个模式。鸿蒙网是一个云计算应用平台,其目的为运营 商提供虚拟性的公共性管理平台,云计算应用网站平台,具有一些创的商业模式。   1多层次营销管理。   2系统化,规范化的运作模式。   3社区化个性服务。   4多级别的信息监控机制。   5品牌共建,品牌价值共同享受。     6每个网站平台运营商可以发展该平台所管辖范围内的企业用户。    我们本人可以达到这样的网站系统,可以去经营,经营的成果在你的管辖区域里,你是全部享用,同时像信息资源的使用,还有很多的附带的商业价值。比如说一 个门户性,除了信息的享用和平台的使用以外,可以在大量的信息资源,都能够在这个平台上使用的时候,我们知道附带价值可以大大提高。我们可以挖掘附带价值 和事业资源,这样我们可以做商业广告。   鸿蒙网云计算服务全中国。现在我们做的是整个一个中国按行政区划做的。   六、关于云计算的几 点思考。作为中国首个云计算应用网站平台,鸿蒙网打破了日前全球停留在争炒云计算概念的局面。今年这个大会现在实际上已经没有争炒的局面了,我们已经在谈 应用,谈需求的变化,和带来社会价值的应用,这样呢,我们大家冷静下来,去谈应用的时候,我们来发布这样的产品的信息,能够让更多的人去理解,但是我们这 里面只是提供一个示范作用。我们这个是不是云计算,由各位专家和学者去评判,我们相信这种示范作用,对推动未来云计算的发展具有一定的积极意义!   我的发言就结束了!谢谢大家!    刘鹏:由于时间原因,有一个提问的时间!    提问:我想请问一下鸿蒙云计算网络系统对于用户的安全性是怎么保障的?谢谢!    郑世宝:这 个我刚才提到了我们系统启动一个监控机制,这个监控机制呢,不光是一个管理机制,我们这里面整个从技术结构上解决安全问题,不是说靠事后的管理安全。管理 安全当然也很重要,比如说有些我们学者也提出来,这个信息可能防病毒或者通过其他的结构系统有预防机制,但是信息平台系统发布,信息管理,比如说某一个非 法信息的判断,这样也是属于安全问题。但是这些安全问题一方面通过系统机制解决,另外一个靠人工管理解决。因为我们这个平台是分布给各个运营商去使用,通 过运营商和我们共同管理来解决。    刘鹏:谢 谢郑总的精彩演讲,郑总的角度跟普通人的思维模式角度不一样,他是站在哲学角度讲应用的。我简单介绍一下,他的平台,是不是云计算我们暂且不论,但是运营 模式很独特,就是目前互联网有大量网站,这些网站会发布大量新闻,发布各种各样的东西在上面,只要加盟到鸿蒙的网站里面。你在发布一个新闻的时候,这个新 闻关于北京云计算,你会填两个关键字上去,在鸿蒙这个网站根据关键字汇集起来,比如是西城区什么事情,将来可以访问他的,比如想访问北京网站,北京网站把 所有以前人家发布的与北京网站相关的全部汇集成一个门户,所以呢这个门户呢,分成很多级,比如说一个街道可能有一个门户,现在已经能够构造出600万个门 户,这个门户卖给愿意经营这个门户的人。卖的价格很便宜,你可以买个门户,昨天晚上就买了两个门户,为什么,实在是忍不住了,我说中国卖掉没有,好我买中 国了,云计算卖掉没?没卖地我买云计算,将来你们访问鸿蒙网,你如果关心中国,你会看到那是我的门户,我在上面可以发布我的新闻和广告,这是蛮诱人的一个 东西。我在想是不是云计算,可能有争议,但是有一点已经运转起来了。这是很了不起的,所以我觉得对我们大家是有参考价值的。下一个演讲是期待已久的Yahoo全球研发中心的研究师郑浩,我们知道整个全球云计算Yahoo是使用最多的,是模仿Google的。我们听听这个报告!    郑浩:前面几位精彩的演讲,我今天主要的重点在于Yahoo在云计算上的应用。大概的纲要一开始介绍Yahoo的战略,可以看到Hadoop和Yahoo的定位。后面重点在Yahoo的应用,Hodoop和Yahoo之间的关系。    我们先谈谈云计算对Yahoo的重要性。Yahoo是全球最大的网页之一,目标是为一万个网民服务,这些网民在Yahoo上有很多活动,根据他们最有个 性化,对他们提高。这实际上是互联网的最终目标,我们可以看到对Yahoo最大的挑战是数据的量,Yahoo的资产和平台,Yahoo十多年累计下来的上 百不同的资产平台,里面数据量达到上百个数据量,用户可以看到是上亿的用户,存储对象上亿。Yahoo emile的用户这是对我们很大的挑战。    Yahoo怎么使用云计算平台。如果按照历史传统云计算平台,我想大家听了好几位讲员的报告,我们的提高在哪里,我们可以很快很有效的处理海量数据。你 可以看到Yahoo在全球十几个国家广泛的产品,还有很多小的数据点,用云计算方法可以有效提高降低我们的花费,很多项目用同样的内容。Yahoo看新闻 个看邮件。另外大规模大规模促进创新和科学研究,我们科学家有时间,有能力很快地做出很多新的产品。开元社区,我们Yahoo跟其他公司不同,我们云计算 是全社区,全社会的一个提高,大家共同提高,我们对开元社区有支持和有合作。   云计算的战略,Yahoo很多数据量是我们私有的数据,在短期时 间内对我们是很重要的一点,我们需要对云计算优化,我们用户遍布全球各地。另外对数据处理和服务的环境,我们希望不管对一般的工程师,还是研究人员,还是 科学家,都能提供很好的数据处。我们核心刚提到,驱动创新,对互联网生死存亡的关键,最后成熟之后将核心技术开源,这是我们Yahoo付出多年的努力,我 们希望跟业界同时共享。   Yahoo云内部架构,这是我的数据,对我们来讲数据是我们的关键。通过我们数据,用云计算的方法为数据服务。我们收 集大量的信息数据放回到中心存储部门,存储部门它的好处让我们能够每天处理大量的数据。对业界的挑战,大家实际上都很了解,在新的时代,海量的数据怎么通 过海量的数据提高我们对产品的要求,对用户的了解。我们发现我们大量优质的数据,积累在很少数人身上。我们从大量数据当中挖掘有用的数据是很大的挑战,数 据量不是问题,关键是什么数据是有用的,怎么在有用的数据找出可以直接运用在产品时候。数据成为当时的竞争,怎么从数据当中提高我们产品。这里面可以用搜 索日志,通过广告点击率,通过社交关系等等等等从里面汲取有用的数据。怎么有效做到这一点是在竞争当中存亡的关。   Hadoop是什么?是文件 系统和并行执行环境,让用户便捷地处理海量数据。Apache软件基金下面的一个开源心目。可以看到这几年合作的发展,07年代只有三个用户,08年已经 很难属了,09和2010年,到明年这一页已经放不下了。这里面可以看到很多大公司和小公司,可以看到对不同阶层公司的影响。这里面国内企业很多,为什么 没有列在上面,我们希望大家能够增加Hadoop的合作关系,能够广泛地推广出来。   Hadoop逐渐成为主流云计算的平台。从海量数据研究到模型到优化,我们进入商业收入主流,就是Hadoop很大的提高。    Yahoo和Hadoop密切关系。Yahoo是Hadoopw最大的用户,最大的测试者,最的贡献者。还有我们发布了YahooHadoop的公开 版,我们贡献了所有在Hadoop为上的工作给Apache软件基金会。我们持续积极地投入到Hadoop开发中。为什么Yahoo是Hadoop最大的 用户,这张图可以看出,硬件规模上升,内部用户也在上升。最大的测试者,Yahoo很大的团队,专门负责测试里面有不同方向的测试。Yahoo最大的贡献 者,里面70%的Patch是Yahoo提供的。为什么Yahoo选择Hadoop,第一是数据规模,每月超过6亿的独立用户,每天产生数十亿的 transaction,PB级别的数据。分析和处理数据非常关键,更低的成本需求,使用低成本的通用硬件,多项目之间共享资源,在大规模集群上快速完成 新的实验,每天需要处理许多硬件故障,Hadoop为这一基础架构可以满足这些需要,当然在Hadoop上有很大的投资,以至于对它的提高。    Yahoo使用Hadoop的时间表,2004年是初版,2006年启动,09年两个超过1000节点的研究集群,08年每天载入数据量达到 10TB,09年12个集群,2010年对公开版提高。Yahoo使用Hadoop的趋势,跟互联网的发展趋势很符合,他们总的节点数量,增加是一个直线 增加,另外一点最后的发展,超过直线增加,对企业的效应带来很大影响。另外总的存储完全超过总的节点数量,存储数量我们的用户。第一个是Yahoo首页, 首页对Yahoo特别重要,如果对首页用户处理,怎么产生企业效应,是对我们公司的效益是直接相关的。这里面举个例子,是右上角,这一块你可以看到,我们 叫FrontPage,这个点击率是很高的,重点一点每天实施性很重要。如果延迟很多的话,对这个应用差别很大。这里面可以看到广告,广告优化有两个方 向,第一对用户体验,如果总是给客户跟他们没有相关的对用户有大的影响,第二广告优化,怎么提高对广告商的效应,所以可以看到用户,每个用户都需要发放最 相关的广告。   另外还有很多其他的应用最上面的应用,这里面图片的应用。最上角中心的位置是首页最关键的位置,这个位置点击率最高,这边放的是 最新新闻,我们新闻根据对用户分析,对新闻利用分析,反应都是按秒计算,你鼠标走过以后可以里面没有的信息显示出来,邮箱使用现在最大的障碍就是垃圾软 件,我不知道大家对垃圾软件数据有没有理解,我们流量有95%有邮件流量是垃圾软件,只有5%是有用户想看的。我们现在能做到把95%的垃圾软件,99% 能删除掉。关于内容的优化,Yahoo是全世界各地收集大量信息的平台,这里面对内容的处理,有对语言的处理,相关性的处理,这都是很重要的。这是利用云 计算平台实现的,首页我想大家可以看到几点,一个是大量的数据,大量的用户,很多不同方面应用。这里面也是用Hadoop构造数据库,可以看到列表有有几 个例子,一个是用Hadoop以前一个是用Hadoop之够的比较,如果每天更新数据不可能,用了Hadoop只要20分钟就可以做出来。另外语言方面, 用Hadoop以前是提高效率,用Hadoop是开放脚本,是代表我们对用户,我们接受到用户的量增加很多,以前是软件的工作人员做,我们很多研究人员直 接可以写脚本做实现。对他们来讲是很大的提高。我们开发的时间,用Hadoop以前是两到三个星期时间,这套系统不可以重复使用,因为专门为这个项目开发 的,用Hadoop以后就两三天,而且这个可以重复使用。这几个比较可以发觉,数据量增加,我们真正的开发量开发能力都成倍地增长。   所以刚刚 提到Yahoo度Hadoop的应用,Yahoo这么大的公司已经实现Hadoop的应用了。我们现在走了第一步叫筋斗云,能够为大量用户提供方便。就是 09年、Yahoo和惠普和英特尔联合发起的。好我刚才从Yahoo云计算的策略到应用,最后和业界共享和学术界共享的方式,这是我报告的结束,我想大家 有问题,可以提问。    提问:问一个问题,和你讲的不太搭,Yahoo和阿里巴巴有合作,你们现在跟阿里巴巴的合作进展怎么样? 郑浩:阿 里巴巴是我们很重要亚洲合作伙伴,Yahoo在中国品牌是阿里巴巴负责运行的,跟阿里巴巴合作对Yahoo企业很重要。从企业上,产品上都有合作,对于在 北京Yahoo的研发中心,我们跟阿里巴巴保持在技术上合作。最重要的关键提供对Yahoo技术的提供,Yahoo核心市场都在做。 提问:你最核心的有结构化,用Hadoop构建结构化数据用的什么方法? 郑浩:Hadoop对Yahoo的应用,实际上有好几个非开源的平台,是应用结构化和非结构化的存储。我们现在的重点在海量数据的处理,像我们内部的平台,其他平台也在讨论,是不是有开源的机会,希望跟业界共享。谢谢! 提问:Google用Hadoop做什么? 郑浩:外 界有很多数据的比较,最关键云计算上一个很大的关键是处理的数据,并不是在于本身的效益,更在于数据处理方式,在性能比较的时候,很多时间你的瓶颈,更多 是你自己实现的数据处理。所以我刚才提到的,我们发现性能提高,在于在云计算这种架构上实现。计算的开发的时间缩短,最后怎么提高运行。Google在 Hadoop的应用,我不能代表Google讲话,可以找Google的工作人员提问。我鼓励大家在云计算上很多新的方法大家可以考虑这个,我觉得有做专 利的潜能,有了专利更能提高云计算的应用。 刘鹏:再 次感谢郑浩架构师的演讲!我们今天的报告到这里简单总结一下,前面讲过判断云计算三个标准,一个标准是它的服务资源到在本级还是在云端,第二可扩展形成到 底是跟踪级还是小时级。科技资源共享云,如果我们把资源共享到这个云上,是要很大的存储空间。赛科云港电子政务云,包括金融云这些能够很充分地共享,可以 很好扩展也是云。包括鸿蒙,大量的网站,上百万这样的网站呈现,需要一个是在云端,另外需要很强的扩展能力,也可以认为他就是一个云,Hadoop是云计 算的鼻祖这个领域是做的很好的。   我们今天这个报告做很好,到这里就结束了!谢谢大家! 云计算核心技术架构分论坛 主持人:大家好,下面有请孟老师做报告。 孟小峰:大家好,很高兴今天来到第二届中国云计算大会给大家做一个交流。   我们从去年开始在关注这样的数据库技术,做了一些初步的探索,今天借这个机会和大家探索。下面是我报告的内容。    首先我们来看信息技术人们总结一下,有这样的一个规律,每15年发生一次重大的计算模式变革,我听专家介绍的,我发现确实很符合这个规律,从50年到 65年大型计算机时代,80年进行个人电脑计算模式时代,对学术界带来新的一场革命,研究新的出现。95年互联网出现到现在又给我们带来很多机会。   今天我们仍然面临重大变革,由于处于初期萌芽,我们无法定义和说清楚到底是什么新的计算模式开始出现,已经隐约在思考这个问题,否则不会像今天这样的场合聚集这么多人,我想每个人看到这个时间点,为了不被历史落下积极的寻求。   这个时候思考问题,像95年思考互联网是模糊不清的,对未来看不透的,但是恰恰这个时候一个机会。    云计算大家从概念上和其他技术比较,这些都不重要,因为他正处在初始的萌芽阶段,如果什么都被人们准确刻划和定义不可能成为新模式出现,我们可以看到存 在一些挑战,就是说能够给人们提供低廉的一种计算资源,尤其是在云计算上至少要聚集几十万,几百万甚至几千万计算机人,我们传统研究分布式数据库,128 节点,这是我们支持最大的。显然这样的几万几百万的规模下,我相信量变到质变存在,我虽然说不清楚,几十几百万万节点出现给我们带来什么挑战,但存在问 题。   最近看到一个例子,我或许对他有所转变,是讲美国一个房地产公司计算一个67万家庭,12年间的房产数据,按照传统的做法去搭自己的平 台,购买自己的软件产品,要做周期和投入是6个月数百万美元的一个开销,但是在云计算初始阶段我们看到带给我们的直接便利,最后这个公司租用亚马逊的弹性 计算云的计算能力,通过强大的数据分析,用3个星期不到5万美元解决了这样的问题。我在想如果我们真的能够构筑这样的计算资源,给人们提供满足他们需要又 如此廉价的服务,我想没有任何人拒绝,一是我愿意探讨这个技术的原由。   简单看我们面对的一个形式是什么样的?信息爆炸大家已经感觉到,IDC 统计每年有57%的数据增长,意味着每18个月数据将被DOBOR(音)一次,我们面对数据量对我们提出严峻挑战,使我们目前数据库技术已经不能应对这些 蜂拥而至的数据的浪潮。在各个领域都呈现严峻的挑战形式,这是为什么人们积极寻找构建新的云存储,云数据库来应付这样海量数据到来。   数据不断从前端向后端聚集,PERVASIVE CUPERTER的普及形成了THIN DEVICE的模式,大部分数据被聚集到了一个中心服务的地带,因此这两项趋势造成我们面临一个巨大的数据集合。   目前数据管理面临挑战性方面包括我们如何去应对不断开展的数据规模,如何提供一种好的可扩展性,如何提供一种好的成本效益的一种服务,如何去支持在这种模式下一种好的容错能力,以及如何有持续研发的机制。这是新的系统面对的,这是传统的不能解决的问题。    未来的数据库,云数据管理系统,我们设想一下应该在这几方面得到很好的体现,在可扩展性和成本效益方面和容错性方面持续的简化能力方面和易于管理方面等 等,更重要的是构造新云数据管理要能支持多种形式的应用,这是一个很复杂的问题,因为每种应用需求都不一样,目前我们在构造云存储是针对某种应用或者某种 情况设置的,显得有局限性,要构造一个在60年代面对企业所推出的RDBMS,必须要考虑对多种应用的支持,这是很难的问题。   为了继续这样的 一个研究,我们做的BENCHMARK有全面性,我们看到雅虎一个小组做了对现有的云数据库系统的一个分析评测,和我们相比很有限。目前来看,在云数据管 理上出现的一些技术,大家已经很清楚,主要是有一些企业,由于内部面临刚才我们呈现的这样一个海量数据管理问题,限制了DBMS不能支持,根据他们业务情 况和需要构造了一些我认为是专属的一些所谓的DBMS的雏形,像60年代初数据库技术没有出现的时候,第一个数据系统是一个文件存储系统,在对数据管理方 面做了一些能力的加强,目前这个情况大致可以类比当时30、40年前的情况。   这些系统如果从划分来看,典型两类,一个是基于Google的一个系统,结构用了储存的方式,此外DYNAMO为主体采用P2P处理结构。    以上这些系统主要应用在如下的一些企业,在构筑自己的一些专有的应用系统。对现有的云数据库系统我们做一个大致的分类,总的来看,目前我们从市面上可以 看到的有开元的,有企业自主开发的,我们认为总的分两类。一类是DFS为基础的,在每个节点上管理数据借助现有的DMS管理,在这上借助云计算平台构建一 个云数据库系统,大致有这样两类。两类中能支持CICO(音)的是这样的集合。   我们为了做系统评测选取以下有代表性的四个系统。前三个系统大家熟悉,HADOOPDB是耶鲁大学一个研究小组开发的一个系统,是基于MYCICO基础上。    下面简单给大家介绍这方面情况,HBASE是基于HDFS做存储,是不支持CICO(音)的,目前HBASE应用很广泛,在雅虎等等领域得到应用,可以 做分析型的处理。CASSANDRA是另外一个代表,支持P2P,不支持CICO魏源清:,另外也很红火,独立一支,试图在数据库领域创出另外一派,号称 以他为基础的标志,目前在这些系统上得到很好的应用和体现。   HIVE是支持CICO(音)的。HADOOPDB是基于MYCICO的一个方 式,在节点是靠(音)MYSQL,可以支持CICO。从简单以上几类系统做一个分析看,按这样三个分类,在DFS这得的云数据库方面,他们在以下方面有优 势,在可扩展性,容错性,数据复制等等方面是非常好的,但是这些系统目前不支持CICO。   DBMS这类云数据库系统可以比较容易支持CICO,可以容易利用一些优化方法,但是瓶颈仍然在数据存储上面。此外,在数据复制能力上有限。HADOOPDB结合两种特性的DBMS,总体看似乎是未来趋势,但是性能是一个主要问题,这是目前我们需要积极解决的。    我们做了一个很周密的一个BENCHMARK,看他们的性能对比怎么样,我们的目标是想测不同的存储云存储系统在各种条件下的性能对比情况,以及他们在 各种学院情况下技术差异性。这是我们搭建的一个平台,有20个节点,采用的操作系统是LINX系统,测试系统基本用最新版本,HADOOPDB是一个学者 自己开发的,并不是很完善。   BENCHMARK我们做第一个方面是看各个系统在读写能力的差异,和可扩展性方面的表现,数据集采用的是一个 5G大小的一个DABO(音),有个测试系统有两个系统,主要是想测试主从机构和P2P结构呈现什么优势。这是一个基本结构,HBASE的执行情况,总的 来看,HBASE读的性能要好于写性能,我们在写的方面初始顺序写和正常顺序写方面,初始顺序写的代价很高,之后性能会稳定下来,这是由于他的结构造成 的,这是我们得到的一些基本的一些结论。顺序读很快。   这是HBASE扩展性的表现,在10、15、19个节点,因为有一个节点作为MAST, 我们是看这样的情况下,他们的读写性能的一些表示,总的趋势还是增长的。这条线很奇怪,在5个10个15个节点还好,但是到19个节点,SCAN下降,原 因怎么样,这些结构刚刚得到我们没有做详细分析。这个图和上面一样,是看每一个节点上的性能表现,在5个节点的时候我们看每个节点的量的情况。这是 CASSANDRA的情况,和HBASE比,写性能明显有优势,但读性能相应的要差一些,这是两个系统的根本区别。   这是CASSANDRA的一个能力,在5、10、20个节点性能表现。这方面实验很多,这组实验主要是做测试,他们在CICO支持的能力,我们构筑三个表,测试系统有4个系统。我们看能力表现是什么形式。   这是第一个图,从这里可以看到四个系统读写能力情况,目前来看,我们说在红色这块的性能最好。这是对SELECT的查询,的一个测试情况。这是对GREP查询是一种模糊查询,数据库中是一个LIKE查询,效率比较差。   还有一个有意思的结论,这是一个容错的测试,我们在系统运行过程中,制造一个故障点,看系统重新执行的性能表现,从这个图看CASSANDRA容错能力强,蓝图是正常时间,红图是故障情况下的执行时间。这个测试我们说很困难,我们也是费很大尽做的。    我们介绍我们实验室基于上述分析和考虑,以及对系统对比我们给出一个原形系统架构,我们基本考虑提到的,我们希望设计一个云数据库系统支持多种应用形 式,能够针对分析型的应用,也能够针对流媒体的应用,也能针对频繁访问的WEB2.0的应用,包括需要很强移植性的应用,这样的情况下我们怎么样构筑高效 的可靠的容错的系统。   我们项目目标是要去开发一种新的数据库系统,能够支持下一代的数据存储和管理,可以应用到一些领域上。为此我们设计了一 种叫双核结构的太极,命名为太极系统,主体思想是力图把HBASE和CASSANDRA优势结合起来,构造一个有效的体系能够支持多种应用的一个需要,为 什么用太极,因为很能够反应我们这个思想,太极是阴阳两态能够和谐一致共存。太极更重要体现了由混沌到有序的思想,因此这正是我们要构筑我们的太极DB的 核心理念,整个系统架构很简单,三个层次,在数据存储层,这个侧讯是能够支持CICO语言的。   这是这个结构的具体架构,是对刚才结构的细化,包括了前端的用户接口,可以支持CICO也可以支持一些API,我们架构一个查询处理层,有一些管理。   我们在存储层和查询处理层间构筑了一个统一的执行引擎,使得能够把我们所谓的双核结构有效统一起来,支持CICO语言的执行的需要。   这是一个总体结构,这面我们也有相应的一些管理工具配合整个系统执行,这是我们目前初步有了一个系统,在这个系统里,用户在我们系统里可以支持两种存储结构,用户可以致用用CICO语言使用,这样的数据出来为我们应用开发带来多大的便利。这是一个很长远的目标。    归纳一下我们的工作,就是试图去构造一个更优化的存储的系统来支持数据库的查询技术,最主要是我们能够支持多种应用这里有很多研究问题,包括双核结构如 何共存,怎么样能够有效支持用户应用,需要用户自己选择。在这方面有一个很重要的工作需要开发,一个云模拟环境,我们在实验室里构筑20节点我的实验室构 造不出几万几十万节点环境,真实云计算环境没有几万几十万规模不能谈,如何开发出一个可为大家共用的云模拟平台,能够在20到100节点上开发一个模拟出 几万几十万的一个云仿真系统是非常现实的课题,谁先做出来,企业界和学术界都会为他拍手。   这是我们目前小组开发团队。谢谢大家。 提问:您提到很多数据库,数据库比较大的是ORICOL没有提到,你认为云计算数据库,ORICOL冲击是什么?以前我们很多应用,现在要转到云数据库方面你们有什么建议? 孟小峰:技 术趋势变革是无人能比的,目前我们在云数据库方面研究完全在一种新的平台和新架构,新应用模式上开发,ORCAL是那个时代,找到机会并且开发了这个平 台,ORCAL有能力把握现在一个新的挑战。至于现有的基于传统数据库是不是适用于未来,这需要两方面努力,我们其实在开发系统就想达到这样的目的,使得 原有的应用能够平滑的移植到云平台架构上,为什么我们着力开发一种这种存储能力,能够支持CICO的技术,就是使原有技术能够方便移植。 主持人:谢谢孟教授。下一个报告的讲者是何京翔先生。何博士在夏威夷大学获得博士学位,现在负责英特尔企业级云计算解决方案的宣传和推广,有多年经验,发表多篇学术论文。 何京翔:各位早上好,很高兴今天在这里和大家分享我们英特尔公司在云计算方面的一些框架方面以及我们新的研究方面的思考,大家都知道,英特尔是一个芯片公司,我们其实现在的服务以及产品不光在芯片这级,我们在各个方面,我们现在目标通过英特尔产品端到端云服务提供更好的支持。    我今天讲的主要的有三方面,首先讲一下我们对开放式的平衡的云的看法和想法,以及系统框架方面做的一些工作。然后在数据中心方面和客户端方面具体讲几个 我们现在在做的几个例子,验证英特尔是一个在端到端方面支持云计算,我们已经做了很有价值的工作,同时我最后讲一下,我们在中国的互联网这块,我们怎么样 和中国互联网不同的企业的合作,使得我们对中国市场云计算方面有一个支持。   首先这个大家已经不陌生了,通过昨天一天研讨会,大家已经不陌生了,云计算再不是一个去年或者前年的时候只是一个概念,现在是一个现实,云计算带来的海啸式发展在我们面前展开,有更多用户,更多设备更多数据在不断产生,需要我们现在整个互联网发展往云计算的方向发展。    首先用户方面我们知道现在只有25%的人享受到,还有75%有待发展。我们认为在未来5年左右时间,互联网用户会成长,我们现在3.8亿互联网用户,可 能到2015到8亿左右,同时要满足互联网用户的需求,设备大家可以知道,现在上网的设备已经是多种多样,以及未来几年嵌入设备,无人监控设备都可以变成 上网设备,未来几年中150亿个的设备,现在加上互联网设备只有50亿左右,未来可能要两三倍增长,数据不用说了。   面对这样的云计算发展的爆 发,我们作为英特尔来讲,认为在云计算过程中,现在有一些观点讲,云计算以后,我们的所有的计算全部在云里面,我们认为如果谈到云计算用户的多样性,云计 算应用多样性,从这种角度讲,恐怕未来云计算的模式,客户计算模式不能解决问题,有一些计算需要在云计算中心里做的,有的需要在端,在设备完成,有一个很 好的例子。我们未来消费者是有嵌入式的,有笔记本电脑的,有手机的,有车载系统的,还有家庭电视,这样多种不同的消费设备,就需要我们用不同的方式来提供 服务。这是平衡计算的一个一层意思,未来云计算可能不是仅仅受客户机解决的问题,是需要有不同层次的,不同需求的,按照用户设备处理能力和不同需求提供不 同服务的云计算环节。   还一层意思是服务提供方也是相对平衡的,不是实际有5个或者10个云计算提供商可以解决问题的,需要多样化,总的来讲知道有私有云,公有云等等,有一些企业云会提供企业服务,有的企业把变成云服务,这是这个例子,我们在英特尔能不做的。   数据中心恐怕不是只有几个,分布在不同地区,不同领域和行业,是两边要平衡。我们还看到在不同的数据中心之间,企业的和公有和私有的数据中心,数据不服务不仅仅在一家,是共享的。    基于总体框架这是我们认为未来的云计算是一个平衡的开放的框架能够支持这样的云计算的海啸的爆发发展。对于英特尔有几个比较重要因素最关注的,数据中心 能耗问题,可能未来数据中心需要几个大坝能供这么多数据中心供电,用电是很大费用,现在有的数据中心里面,电费基本是所有费用40%到50%,很大。怎么 样能够节能减排,一定范围提供最大服务。安全性和可靠性方面,安全性是云计算最大障碍之一,怎么样通过英特尔平台支持对安全性和可靠性上提供更好支持,再 一个是从管理性上,怎么样能够有效的便捷管理,有成千上万服务器,管理上,我们空间管理几百服务器管理方法不一样,英特尔提供基本的芯片也好,芯片组也 好,服务器基本框架也好,买服务器的时候不同厂家买,怎么样能够使对基本服务器管理统一化,在不同厂家,服务器管理上有一些共性,怎么样统一管理起来,可 以在管理上有一些便捷有一些通用方法。这是开放式标准一部分,数据中心整个开放式标准还会讲,是不同方面的,怎么样能够大家共同制订一个开放式标准,使得 在构建数据中心时候能够变得更加便捷。这4个主要方面是我们英特尔主要关心的重点。   接着讲从框架讲,我们可以把云计算云端和客户端两 端,我们看到刚才我讲的几个主要的简化,高效,自动管理,开放的标准,安全我们列在不同的方面,其中还有一端要对客户端感知,提供服务的时候需要提供个性 化服务,因为设备不一样,需求不一样,我们要提供服务的时候要能够做到因地制宜,因人制宜,所以对客户要感知,知道客户设备是什么,处理能力是什么,以及 他的网络环境,这些东西都需要知道,提供相应服务。   所有这些东西做到需要一个开放标准和框架,我们现在看到至少有5个方面需要这样的标准,首 先第一个是数据中心本身构建,比如说服务器,存储,网络,需要一些开放的标准,现在已经有一些标准,不是没有标准,在云的环境下需要怎么样使标准更适合云 计算,比如未来可能构建数据中心不是单买服务器,买硬盘,我们可能需要的是买整个CONTINER,在数据中心管理的时候,有一些什么标准接口可以自动的 布置,可以自动分配资源,管理接口需要一些标准,第三点是在用户和管理人员使用的时候,我怎么样去ACCIS(音)这个中心,服务器有IPMI的标准,可 以管理单独服务器,这个标准是否可以管CONTINER,未必。BIDRATION(音)有一些自动联动机制,设施到一些动态感觉,这方面标准,是第二 类,数据中心运算规则这类,我们在不同设备,访问数据中心服务的时候需要一定标准,不能是访问不同的云提供商的时候提供方式不一致。   最后是设备有100多亿的普通设备,我们怎么样提供一个比较相对统一的,或者说规范的一些设备标准,使提供服务的时候告诉你我什么样,在什么位置,有什么能力,我的主人是什么样的,提供相应服务。   这些方面我们标准欠缺的,需要业界一起努力共同往这方面去开发这样的标准,定义这样的标准。   对于英特尔来讲,像我们在PC领域一样,致力于开放式的,促进整个计算行业发展,对于云计算我们更是这样,注重与推行开放的标准,满足端到端的开放式的系统框架。    下面具体介绍一下我们现在一些具体的工作,怎么样支持我们现在刚才讲的开放的端到端的数据中心构建理念。数据中心着重三个方面,和我们客户和产品部门开 发,第一是数据中心优化,这方面英特尔我们自己就是构建数据中心,我们IT部门和我们业界的一些商业合作伙伴在这方面积累很多经验,我们专门有这么一个论 坛,来和用户直接合作,在不同领域里面帮助用户怎么样提高数据中心应用。我们基于一些数据中心开放标准,我们现在一些构建云计算中心的中心不可能全用新服 务器,怎么样过渡,几十年积累的计算资源和技术怎么样平滑转移到云计算,怎么样用开放的标准构建未来的云计算数据中心里。英特尔有一个软件计划,英特尔是 硬件中基础,我们的产品和解决方案需要通过软件传递给我们的客户,我们专门在云计算这方面,云计算有不同解决方案,我们专门成立这样的一个项目,和不同软 件商合作,我们和他们合作,在英特尔平台下做最好配置,做实现。   我们认为大家都可以自己按照自己的需求开发平台的时候,作为这个理念和技术可以广泛应用,我们云计算平台相当于我们帮业界提供一些我们所谓的菜单,让大家构建自己需要的东西。   数据中心优化方面这是其中一个例子,根据英特尔和我们业界一起做的东西。我们有不同方法论,包括比如简单一个例子。    开放式数据中心解决方案,英特尔自己的IT,我们是世界50强企业,我们的IT是世界50强,是世界一流IT团队,我们首先向世界在宣传,我们要先自己 尝试一些东西是不是可行,是不是可以在业界或者说在云计算可行,我们用这么一个环境,我们拿几个样品做,我们用了一些比较通用的一些虚拟环境。考虑现有数 据中心现状,我们在同平台间测试迁移,不同时代迁移,动态资源管理,我们用动态资源管理,50多台机器可以跑400多机器,上面跑了3种东西,做动态资源 分析,可以动态分配。我们现在做到一个控制源在控制平台,可以动态分类运算资源,现在已经可以实现。   这是加拿大一个公司,他的目的和电信厂商 合作提供一个方案,我们和他们合作,构建一个这样一个平台,包括了服务器资源库,是一个解决方案。我们做了几件事,第一件事,把这个方案每一步怎么实施, 第一步把萝卜切多长,这样的菜单,第二步做优化,怎么利用英特尔平台一些新功能,能耗管理做什么优化,英特尔的安全管理上怎么优化,做一个标准的解决方 案,做一个可以动态按照能耗管理,对台资源分配这么一个方式提高服务器密度,资源利用率这样的方式。我们有几步。这不仅仅是一家,这只是一个例子。我们帮 助业界按照不同需求,在英特尔平台上实现。   最后一点,我们不要忘记,云的解决方案是端到端的,NETWORD CLOUD也很重要,在云边界上,这些东西也是云的一部分。我们在网络上怎么加智能,把智能建立在网络里也能够达到平衡概念。    下面专门讲几个客户端例子,不是简单的可以解决的问题。客户端发展有规律,最早PC到现在可管理的PC,到未来职能手机等等,是一个从设备中心到用户为 中心。具体讲我们现在云计算主要面临多样化,我们提供的服务要因地制宜,要在客户端有这样的智能能够告诉我的云这端我的设备是什么,谁用这个设备,以及什 么网络环境下用这个设备,使我们提供服务按照需求提供,最大化的利用现有计算资源,客户端资源。   英特尔在嵌入式部门,专门做了一个方案,怎么在多样客户端环境下,都可以使用这种解决方案,从云计算到物联网,这些达到物联网从人机交互到机机交互这样的互通互联信息实现。   再有一个英特尔在客户端我们有一个MEEGO,做在嵌入式里,可以做在智能手机里,我们基于英特尔的一个平台,加MEEGO对设备提供支持。在芯片级,软件级都有支持。    最后讲在中国市场怎么做,中国的互联网市场有几个主要方面,有百度、腾讯互联网服务商,有电信服务商,有软件提供商,传统的企业,我们在几个方面都有合 作,我们合作方半是多角度战略性合作,合作方式我们有英特尔芯片,然后数据中心优化设计,具体平台优化设计,比如不同服务器,不同的数据中心需要不同服务 器,我们在平台优化有这样的专门的团队和客户协同,我们找不同厂商做个性化服务器,优化能耗管理,软件优化,具体应用软件的时候,和国内互联网厂商合作, 通过软件优化可以使软件提高效率,英特尔我们有专门软件工具和优化方法,条件不变情况下使软件功能提高几倍。最后是客户端这块,怎么对客户端进行优化,使 客户端能够满足云计算环境要求,我们思路是多方位多角度综合的和客户的合作。   英特尔最主要优势,从低端手机嵌入设备到最高端的都有英特尔的产品,可以用一个体系框架,从低端到高端都用云计算,同样框架支持,这是英特尔对云计算最大的支持。 提问:刚才您提到硬件不变,软件可以提升效率好几倍,再说一下怎么做的? 何京翔:英特尔有一些TO,我们有自己的一些COMPALE(音),因为是对英特尔的CPU和环境已经优化的,我们还有TO,帮你分析软件瓶颈在什么地方,通过软件瓶颈分析我们可以帮你,使你解决瓶颈问题,使整个软件最优化在英特尔平台上,达到几倍提高。 提问:我提个问题,现在有一种观点认为,传统数据中心降低不了功耗,用通用处理器和机构,他们认为我们是不是处理器技术应该从通用走向专用?是不是回去依靠专业体系降低功耗,这对英特尔怎么看? 何京翔:英 特尔刚才我讲了体系结构是我们的X86体系结构,但产品多样化,我们从功效角度,虽然都是一个体系结构下,在选择你的数据中心产品的时候可以有多样化,英 特尔可以和你合作,并不认为为了功耗就一定要换体系结构,而恰恰在体系结构内可以按照不同方案设计。英特尔体系结构多样化的,这个体系结构内可以做。 主持人:下面是Ihab Bishara先生,来自Tilera公司,Tilera预算产品营销总监。 Ihab Bishara:我 重点谈三件事情,第一个谈一谈云方面的问题,在云方面,人们面临最大的问题,尤其是发展的问题是什么,并且会谈一谈新解决方案,我们如何解决那些问题,我 们会谈一谈我们如何解决这些问题。最后和大家分享一下我们之后的这些技术,并且这些技术是一些创新并且能够给云计算带来更多价值。   首先,这个 内容是关于什么是云,云的概念很多,我之所以谈这些,我们应该保证对云有共同理解,云对我们来说是一促计算资源,通过网络联系到一起,其实是一种抽象的管 理,能够给你提升非常简单成本模型,不用买数据中心,只需要租一些服务器就可以了,可以使你做的非常有弹性,可以用更少资源实现更多事情,随着企业增长可 以随时调整你的硬件设备,这个是云,云是非常伟大想法,确实现在在云方面有一定的趋势,这页最下面我们现在已经不再用10个或者是100个服务器,我们现 在用的数量达到数千数万,数据中心不断的扩展,所以数据中心有的占几万平米这么大,由于云的供应商成本非常重要,所以买操作的服务器,他们必须考虑他们的 利润,所以优化成本对于云的成功非常重要的,除此之外,由于功耗的限制,所以我们现在的功耗以及足迹,也就是每个计算能力功耗必须要下降,所以只能达到 10或者是5K瓦每个机柜,所以我们可能最多用5到15个。   这些是云现在面临的问题,由于一种解决高性能功耗比是所有公司的投耗问题,在美国和中国所有公司想开发性能功耗比高的数据中心,所以功耗和冷却是成本最高的事情,所以你在资本支出一美元的时候,在功耗和制冷方面消耗一美元,运营成本支出比资本成本高。    这张图显示的是问题是很多厂商面临的问题,很多人可能之前看过这句话,英特尔和AMD没有提供他们需要性能的产品,所以服务器要更便宜,性能更高,能效 要更高,目前的解决方案实际上并没有解决过去网络数据中心面临的问题,所以像Google,亚马逊用的数据中心问题现在都没有解决。   刚才我谈 的是云面临的问题,增长非常快,发展速度会持续上升,但是这种性能功耗比的问题是阻碍进一步发展的主要障碍,我想用爱因斯坦的话,你用创造一个事物的思维 不可能解决这个事物带来的问题,确实这个话一次被一次的验证了,所以在未来几十年中也会如此。所以我们解决的是什么问题?目前的技术就像刚才说了,解决性 能和功效比问题,云计算数据中心没有解决这个问题,他们的核的整合度很低,所以在你的笔记本上使用的核和服务器上是一样的,甚至和PC也是一样的,这种核 组件更多,实际上云并不需要这么多的核,不需要臃肿的结构,而且这样的话会使得你的成本非常高,我们怎么做的?和大家分享我们做的创新工作。Tilera 实际上能够解决我刚才提的所有问题。   首先我们从一张白纸开始设计,想要高能效的核,我们希望所有的是整合到一起的,不希望所有的是分离的,我们希望一个芯片能够提供一种完整的解决方案,更高的整合能力,更低的能耗,可以使用标准的编程模式,不能使用标准编程模式不可能有统一的云。    来解释下,如果你看一看这个标准核,左边这个就是现在的标准核的状况,像X86技术,这个核中只有4%的空间用于真正的计算能力,其他的大家可能用了, 但是大部分时候没有用,但是要为他花钱。所以这个想法非常简单,有这么多没有用的东西,我们应该充分利用这些空间,而不仅仅让他浪费掉,所以我们使用多 核,每个空间单位计算能力增加,这是云最为需要的东西,因为云是非常简单的东西,只要提供更多计算能力性能肯定提高,并且每个单位的功耗的计算能力会增 加,像IO和PCIE,我们提供整合化的解决方案。Tilera由于有这样的想法,从1994年有这个想法,最开始有MIT的一些专家成立这个公司,之后 我们在开发各种不同产品,第三代的处理器实际上可以用到100核,没有任何其他的公司能够做到这点,我们是唯一能够提供100核处理器,集成在一个芯片 上,LINX可以用100核,这是Tilera提供的产品,我们想说如何将100核扩展下去。之后具体谈。   这张图不仅仅是一个展示,我们在楼下展台上有这个实物,我只是给大家看这个图,这个是用1级服务器OEM跑的,在两个服务器上比较,这是一个云的应用,我们之所以进行这样的比较,云应用非常简单,只需要更多计算能力,我们提供这样的解决方案。    另外一个重点,这是一个LINX核,基于我们处理器,64核,里面看起来很空,这个核里没有太多东西,因为所有东西整合一起了,这是为什么我们可以如此 提高我们的容量和能力,在这个核中我们用LAMP,我们同样做的一些开源应用,我们进行编译,在这上可以用非常标准的工具,像C++,所有编程标准组件都 可以用,这个功耗只有40瓦,这可能甚至比一个灯泡能耗还要低。   把所有的整合到一起来看数据中心,如果比较一下,比如说最大的功率只能是 5K,然后看一看服务器,是用X86还是Tilera,比较一下看两个计算能力不一样,差距不是一点,不仅是2、3倍问题,我们在一个机柜中有1万 核,X86有200个,可以算每秒差多少。再看I/O速度,我们的I/0比其他的解决方案快的多,你想象新技术带来的无限可能,你的总体成本会大幅度下 降,并且计算能力大幅度上升,同样功耗前提下做更多事情。看Tilera和X86另外的比较,可以看到这是60的服务器,和100的服务器比较,我们单位 功耗性能更高,我们也节电了。   接下来谈一谈我们如何实现这些东西,这个想法非常简单,但是在这个简单想法中有很多创新,我们最主要两个部分, 是一个完整的核,非常简单,但是非常强大,这个核有缓存,处理器,单核中运用完整的操作系统,我们在这个核中加了一个转换器,这个也是我们在架构中最重要 的东西,能够使得所有的核联系到一起,我们有多层网络,使得我们的扩展性比其他的解决方案要好的多,无论是总线为基础还是其他为基础的,这有64个核联结 到一起,我们称为网格网络,下一代技术中,我们每秒带宽达到200T,可以看到我们的连接和速度非常快,我们这种增长速度不是线性的增长速度,有人问我们 我们的核多强大,你看这张图,看左边这个,是我们Tilera单核的和其他的比较,你可以去网站看具体数字。你可以看我们的性能,我们08年发布性 能,G36我们今年要推的核可能比英特尔更好,这些是非常强大的核,绝对不是小核,虽然体积小,但是功能强大,我们做计算型的机器。   再简单谈其他部分,谈一体化方面的问题,每个芯片实际是一个整合系统,不仅仅有处理能力,有内存控制器,网络I/O,是一个非常完整的芯片,可以直接用他做服务器,我们从一个完整的角度来看这个事情,看如何节约成本提高性能。整个系统整合在一个芯片上。   从技术角度看非常重要一点,缓存有一致性,现在很多的创新都在发展很多核,要做到一点缓存保存一致性,这个做起来不是非常容易,缓存一致性使编程更容易,可以在LINX上可以应用,可以共用内存,使得你现在的软件可以在我们的芯片上很轻易运行,不需要做任何改变。    谈一谈软件方面的事情,大家看一看,我们从公司成立第一天,使命是使我们的东西能够更加普遍化,并且我们在这方面非常成功,我们有非常标准化工具在芯片 上运行,我们融入一些开元的部分,本周我们的整合工作进行非常顺利,很多公司支持我们的工作,C和C++等等,只要想起来的东西,我们的芯片都是支持的。 这样的话使得编程更加容易和标准化,使用环境一样,不用写其他的代码,用原来的代码搬过来可以用。   在右边是标准应用对阵和左边差不多,我们的对阵差不多一样,像虚拟化,上面有操作系统,上面有应用,很多客户在这个整个过程中用C或者C++可以写几百万行代码,在我们芯片上的软件环境你非常熟悉,和你现在使用的没有任何差别。   如果从云的角度看这个事情的话,实际上我们有一个综合的云对阵,从下到上,所有人们编程的时候都可以用,像数据挖掘等等所有这些东西都可以用,这是为什么我们推出这个产品的原因,基于此,一级OEM和ODM服务器将基于我们的产品在未来可以使用。    到目前为止我们已经做的不错了,其实这仅仅是一个起点,我们在08年已经推出了处理器,我刚才给大家分析的是08年数据,今年下半年,我们在今年晚期可 能推出3到16核处理器,性能和之前比翻一番,我们性能是翻番的,在今年4季度会推出,2011年我们的性能可能比之前翻了8倍,这是技术带来的奇迹,我 们之所以能够实现这些目标,是因为我们应用了网格网络,使得其扩展性非常的好,所以不会受到总线或者是其他的限制,我们可以用到几百个核,这样的话我们提 高性能会非常快,我们的架构是允许我们能够实现这一目标的。   GX系统产品我给大家简单介绍一下,解释一下为什么能够翻两倍,我们的芯片的缓存2G或者更高,可以用16到100个核,我们可以用64、100、32个,多少个核都可以,我们的网格网络,我们的每秒带宽达到200T,这使我们的扩展性可以进一步的延伸。    谈专注的市场,我们不可能解决所有问题,我们只是专注于某些问题上像网络应用,像数据挖掘,这是我们关注的市场,还有视频代码转换,还有视频监控,所有 的这些都是我们关注的市场。如果用我们的产品,他们的总体成本,性能功耗比有大幅度提升,我们的产品实际上在基于现有架构有很多优势,我们在未来几十年中 做转换代码的架构将是非常优异的,这样的话我们的产品无论用于视频监控,还是其他的应用,都可以省下很多成本,由于我们有着很强大的计算能力,并且每瓦计 算能力更高,所以我们能够给大家带来更多价值,对于一个公司类似应用这样的话可以给他们省很大成本。这是我们为什么专注这三个市场,现在的服务器性能当然 不错,但是需要扩张的,这是我们需要解决的问题。   总结一下,刚才谈到云和云最大问题,性能功耗比,成本问题,空间问题,这是云面临的最大问题,我们提供的是一个经过事实验证的解决方案,我们的产品在性能功耗比实际是非常高的,并且非常少的应用能够跑在很多服务器上。    最后一点我谈的如何实现这个目标,我谈了一些细节的架构,并且也谈了我们的具体工作,我们1994年以来开始研究,从07年的时候推出我们第一个服务器 产品,现在我们经历了第三代的架构,第三代处理器,并且我们的整体的性能还在不断改善,因为客户在不断的使用不断的部署,所以我们的工作使得多核的性能达 到新高度,我们添加的不是一个两个核,是因为我们使用基础的架构使得我们能够使其性能可以翻出几倍,最后我想说,我们刚刚起步,我们未来10年有非常好的 前景,你是否想节约你的总体应用成本。   谢谢各位。 提问:刚才您比较了X86和你们的CPU在计算能力和功耗区别,能不能比较一下ARM(音)芯片和你们芯片区别,ARM芯片进展也比较快。 Ihab Bishara:我 现在没有看到ARM推出64核芯片你们见到过吗,当然我不是说我比他们聪明,最终问题是扩展性,如何能够扩展到100核,他们现在没有这样的技术,但是我 们有,ARM他们几个核,他们每秒20K速度,他们功效比较高。现在核心技术不是COR怎么样,是把COR有效互联,更有效组成一个CHIP。 提问:您介绍CPU和框架执行效率高关于吞吐量方面怎么提升的,比如磁盘阵列,或者是网络的吞吐量。 Ihab Bishara:谢 谢你的问题,如何改善我们网络和网络吞吐量两问题,你和很多网络数据中心人说,他们谈应用问题,很多应用需要更多带宽和I/O这是平衡问题,GX产品我们 有22G的I/O,这个方面我们没有问题,GX产品中,我们可以最大扩展到300G,这能够进一步扩展,我们有一系列的产品,这使得你能够基于你的需求选 择不同核产品满足不同需求,所以我们的这些产品可以满足所有应用带来的需求。 提问:您的一个芯片中扩展多少核? Ihab Bishara:我们现在遵循摩尔定律,你问我们CTO他们会这么说,但是我只能说这么多。 主持人:下面演讲的是张福波博士。他的题目是云计算技术与架构前瞻。 张福波:各位大家上午好,今天很容幸有这个机会和大家分享一下。   我今天主要三方面简单给大家介绍一下云计算前景,云计算接触国内国外的现状,我们的一些案例,最后介绍一下,不是很细的,云计算的核心技术和将来发展。    看这张图,1979年制造非常767,用的CMD或者CA计算机模拟仿真计算机在空气中的强度,我们知道当计算机介入到这样的分析中主要是为了节省人工 和产品设计,我们看到79年的时候我们用计算机这种能力非常有效。到了2005年787我们称梦幻飞机,美国播音公司把这个计算机所有设计都用模拟,我们 可以了解国内航天航空在CAE这种大规模发展。我们的计算机这种能力对市场发展不是简单递增,是非线性的。   从IDC认为,我们现在计算机无处不在,我们用计算机能力,我们现在需求没有达到峰值。对云计算未来的发展,这是非常大的市场,计算机的市场将来对所有人会扩展到我们各个领域任何部分。    这里提出私有云,核心认为,在构造一个私有云中有4个方面的东西,一个个是可升级的,前面一位提到,在我们网络管理可升级是最重要的,我们不可能把一种 能力浓缩在一台计算机,这涉及到可升级。第二问题是共享,我们知道PLATFORM公司我们致力于资源共享,我们认为我在02年提出IT最重要的退场,退 到中心去,达到最大需求是共享。第三个自动化,计算机规模庞大的时候,管理需要自动化,才能够使用方便利用资源。第四是弹性计算,希望我们这种资源根据他 的需求。前段时间和中国运营商沟通过,我们构造短信平台是平时的10倍,弹性计算避免这样的问题。   这是451CROUP,核心要解决的问题,一个是管理,第二是自动化,第三安全,第四存储。不同调查公司看到的东西有一定不同和相同,我们认为云计算有很多方面,包括弹性、安全都是对的,是为了解决一个问题,就是共享,这是云计算核心地方。    云计算要运用这些层,我们和用户沟通,我们目前还是要相信,我们造不出通用云计算技术解决所有问题,但是将来有可能,我们很难能够让老技术适应云计算, 除非云计算技术改动,我们碰到很多问题,最大代价是老的怎么改造。云计算很大挑战就是原来老的技术如何做,我们发现经常有可能我们做云计算框架满足我们特 殊需求。   说到云计算,我们当初06年接触的时候。第一网格,最终目标是把整个资源整合,共享的化这是最关键的,我们知道网格做很有意思的事 情,云计算把资源卖出去。第二VM,当初最早01年的时候,亚太总经理来见我,叫穷人的工具,我们一台计算机很贵,我们认为现在VM技术价值不单把贵计算 机变成小计算机,真正的价值为应用软件构造一个COMTNNER(音),可以网上跑,做成标准化,我上次去IDC中心,买最好计算机给像阿里巴巴使用,有 的虚拟中解决问题的标准化。第三类像Google,他们有很多资源,面对大量客户,运营商碰到的问题是海量的,他需要技术解决海量问题。Google只是 做搜索引擎,他想做更多事情。   我们把云分两种,一种公共云,还一个私有云,公用云中非常重要的解决方案,上网本,我去了中关村,发现去年几乎 看不到,现在不一样,用户希望我们终端设备越来越强,有了网络之后,可以把内容放到云端,将来发展就是叫网上,我们手机可以不叫手机可以叫上网本。台式电 脑将被淘汰。   我们个人电脑没有操作系统,没有Windows,而在云端,这是将来一个趋势。   DATA BANK,前段时间搞云有一个困惑,数据传输大,将会越来越少。云计算恰恰会降低我们在城域网,或者是互联网数据量。我们相信云计算将会催生太多用户,比如医保,数据银行,包括将来所有的公共政府要做的,有很多机会,包括软件服务。   下面讲私有云,私有云对企业,我们在计算机中,我们现在不提供完全公共计算能力,这种资源对一个企业不够,包括容量问题,安全问题,企业要自己构造,让企业内部所有员工共享,这是一个趋势,这私有云。   IDC我们知道是一个比较重要服务,把这种服务卖给客户,有四大挑战。   1、数据中心复杂,不可能购买一家厂商计算机,不可能购买一种软件。   2、IT成本高,资源占用多,配置峰值资源需求。计算机3到5年会淘汰一字,淘汰不是计算机不能用,而是耗电高。大家知道不是简单钱的问题,IDC曾经统计,我们现在5毛放电上,将来会变化,7毛花电上,电力费用越来越高。   3、系统稳定性,可靠性低。人工服务为主,高成本、低满意度。我们经常碰到这种情况,主机当的时候备机不运作,我们有一个美国一家公司,有300个系统有300个备用系统,非常浪费的。   4、IT传统模式不能适应业务部署速度的需求。如果领导说上星期这个业务需要80天时间,而现在日益激烈竞争,美国公司电信或者移动不能等80天,需要一星期推出市场,因为推出就战略市场,80天以后客户跑到竞争对手那去了。   我们这些运营商们,不是技术领先的,他们是需求领先者,他们有这个需求,我们云计算可以带来好处。   1,资源虚拟化。   2,SOA框架使得IT能对业务需求提供快速部署。   3,一体化管理打破了原来IT烟筒式业务系统管理。   4,消除单点故障造成的稳定、可好性问题。   5,帮助IT投资风险和决策。   6,节能减排。   我们认为实现云计算的困难,我自己参加很多会,我们现在还在争论什么是云计算,太初级了,就是一个共享,就这么简单。我们现在讨论云解决什么问题。   1,没有成熟的产品和方案让运营商有直观的理解。   2,各个厂商都在推、强调自己的云计算概念和产品,像盲人摸象,无法让用户有个全局的认识。   3,现在有关IT系统的改动成本和风险。   4,传统业务系统虚拟化改造。   5,少有成功案例可以借鉴。   6,组织管理和人们的认识需要提高。   我们公司主要做网格计算,云计算,我们今天有一个产品叫ISF,我们很多行业里有很多成功案例,我们在中国有很多经验,降低风险等等东西。   下面讲一下成功案例。这个案例解决方案是把孤岛规避一个。    这是另外一家公司,提供数据挖掘数据分析的,整个计算机也是老式的,有云计算后把底层资源共享,北京用电一样,发电厂的电通过电厂共享,如果把计算机通 过一个调度平台共享,使A不同系统共享相同资源,做到填补。本地资源,当初和我们合作有一个需求,我资源不够用公共云。   这是新加坡的一个案例,主要解决问题是如何用自动化环境,因为面向公共客户,使出租过程基本简单。   还一个欧洲的物理研究机构,他们非常简单,需要大量计算,所以希望把学院资源共享,计算天体物理,高分子计算,搞云就是为了资源共享。   我们说到云计算中有三个服务层次,这是框架,计算机领域中,我们要做的简单,计算机最好理论是简单。如果太复杂不是好方案,简单能懂就好。   上面是调度,我们说实际上云计算核心技术是什么,大家有机会做会发现将来最大挑战是这个,为什么,像北京市交通挑战在于红绿灯交通系统的效益,解决交通拥堵问题,云计算调度是核心技术,不是一层的,服务本身要调度,IP调度。   这是比较复杂的资源调度,一个结果,要考虑到应用服务的逻辑,我们这个客户做的非常先进,这是非常精细化的调度。这是我们要考虑的调度策略满足不同需求。   当我在启动应用的时候要知道跑哪个最有效,软件不是装计算上也装数据中心,因为你不知道哪个最合适,是个动态调动过程。   这是存储集成,云计算中把计算机作为资源,存储可以作为资源,你们需要知道哪个请求为哪个存储,如果竞争者竞争如何分配。   网络集成,非常重要是IP,虚拟IP地址管理和调度。    简单总结,我们能支持多云,前段时间我碰到,他说我有三种业务,不想把三种业务放三个云,领导不高兴,他们的技术,我们可以在云中可以有多云,云之间可 以共享,我们全中国不能造一台发电机,我们有N个,发电厂共享资源,我们也一样。有点复杂。如何进行共享是非常重要的策略。   最后讲PLATFORM,云计算后面是什么,我们也不知道,整合是趋势。PLATFORM产品,从计算机管理到调度,到支持,集群网格和云。   谢谢大家。 主持人:云计算核心技术是虚拟化,有商业有开元的,开元和虚拟选择什么。 张福波:我 不是VM专家,关于开元和商业版的时候我们建议,我们都知道当你买一样东西的时候,你需要保修期,这个情况我们建议买商业版,航天航空都买商业的,关于开 元和商业版的差别很大,第一个商业版软件承诺的,比如这个功能是工作的,就是工作的,因为经过测试,免费版不一定的,要看我们的判断。 提问:您讲了很多云计算的核心体系架构讲很多,比较好,我想问一下,您觉得最核心是哪块? 张福波:调动。我们云计算中,资源各个厂都提供,包括存储、计算机、网络,真正将来碰到问题是调度,调度不行整个系统会瘫痪的,调动引擎核心技术。 主持人:再次感谢张博士。今天最后讲者是杨扬教授,是北京科技大学网络翁信主任,多年从事网络网格领域研究,下面请杨扬教授做报告。 杨扬:各位嘉宾上午好,我今天给大家讲从两个方面分享一下我们对云计算的理解。   第一个我们想要知道云计算究竟给我们带来什么,第二点是我们如何推进云计算的发展。    总如何推进云计算发展中,我们是大学,比起企业来讲多一点我们的责任和任务,也就是说大家追求目标两点,一个是顶天一个是立地,顶天是云计算基础上把共 性一些问题提出来,对他进行研究,使得能达到一种理论创新,另外我们可以通过一些标准这样对云计算的实现指导。第二点我们希望在云计算中,这也是中国大学 里一个特点,我们不简单做研究,应该如何去解决他的实现的一些问题,因为所有的研究是基于实现的需求基础上,这样我们就三个方面给大家分享。第一云计算机 遇与挑战。第二云计算基础架构。第三北京科技大学云计算平台和大家分享技术实现。   云计算到现在已经不是去年一年,去年一年大家还讨论什么是云 计算,今天我认为应该归为几点,一个是社会需求推动,网络发展改善我们生活,现在十几年过去,我们发现在网络最多有各种各样资源购买机器软件平台各种设 备,这种资源没有得到充分利用,冲击数字讲现在利用率不到30%,这个时候一方面资源在浪费,因为负载不均衡造成浪费,企业和政府另一个方面不断购置,带 来巨大成本浪费和能源浪费,对于个人使用者面临硬件和软件不断更新,还有病毒的侵蚀,所以大家针对这些都希望给出一个解决的方法,给出好的解决方案。    我们讲云计算一些众多新技术发展的必然趋势,有了网络大家开始研究几个方面,比如虚拟化技术,如何使得分散计算资源和存储资源变成可分配的虚拟架构,另 外十几年前的网格技术从三个方面给大家提出了一个解决的办法,第一个是我能支持各种各样的现存的硬件和软件接口发现资源所在,这也就是说我们今天云计算的 基础,我同意张博士说的,实际上所有的东西归结一点是共享,以共享为基础,在网格中第二点很重要,有资源发现以后我们可以组建透明资源,如何进行调度和管 理使达到最优化,这是大家追求的目标。第三点在网格中早提到QS提供高质量服务,其他的技术针对面向服务架构,SOA分布式计算,都给我们提供基础,云计 算是众多新技术发展的必然趋势,这种情况下,今天云计算发展不是一条路可寻,我认为关键一点挑战是提出这样的问题,就是如何由需求引导的,在网络环境下各 要素构成的有机体,非常难,给我们无论从研究者角度还是实现者角度来讲都带来一种挑战。   转到云计算产生了一种新的业务模式,所以我们认为一种 业务模式创新,这种业务模式创新是按需租用资源业务模式,实际我们去年提到这点,给我们中国的中小企业甚至个人提供了充分的机会,对这个时候服务变得更简 单和实用,不是在开发一些重量级的,对于硬件也是这样,不再开发大型机器,通过刀片机,软件也是,这是我们的机遇和挑战。   所以云的特征,这方面内容大家讲的很多,有超大规模,前所未有的计算能力,这是我们的理解,虚拟化任意获取服务,高可靠性,通用性,高可扩展性,按需购买,这是我们的理想。    另外一点我们要考虑,这是从97年开始网格方面研究,研究资源调度和管理,这里我们发现所有的东西在向两个方面发展,一个是服务,一个是底层技术,面向 服务我认为随着网络,已经不简单是现在的INTERNET,是动态下的服务组合,我们未来在云计算的时候提出这么一个观点,一切皆服务,这个时候我们如何 把松散的偶合分布服务整合的给用户按需统一服务,最终用户能不能以一种透明的方式,把它输入的数据转化为需要的输出,所以这里我们需要研究的是,在动态性 网络环境下以及柔性服务需求,建立服务应该考虑可信性和可持续性,涉及安全和可持续,随着在云计算中我给大家讲多媒体通信,随着时代发展,一切是由于多媒 体在网络上的推动导致了今天在性能和存储方面的高度的要求,所以这个时候,网络的服务优化策略也是未来要研究的重要方面。   虚拟机和物理机计算 资源整合,我们今天讲云计算不再是打破旧有重新建立,而是在现有基础上如何对资源进行整合,这个非常重要,另外整合过程中,我们说虚拟技术达到了对存储的 共享,可是如何给出优化共享,使容易度达到满足基本需求,这个时候应该支持复杂业务模式下存储资源整合和数据管理。如果我们希望对这些资源能很好的进行调 度和管理,也就是说我们应该按需要按需求,变化的资源供给能力扩展,应该对新的厂商,新的所有的软件要了解接口技术,便于资源发现和整合。   在 这种情况下,刚才我们上一位讲了,我们也认为这样,如何建立按需分配资源池,动态调查是我们面临的科学问题。我们要满足用户需求,我们今天提到的是用户不 需要计算机,而是需要计算资源和能力,这个时候用户不需要软件,而是需要提供的功能和服务,这个时候我们看到云计算与传统IT模式比有非常大的优势,所以 刚才讲了,降低成本,降低能耗,另外提供资源利用率,给出弹性计算和存储能力,灵活定制,用户使用千变万化,这个基础上我们如何根据他的需要,根据特点定 制相应服务,这是说云计算一定要达到的。   这个图已经被大家公认,分三个层次,也给我们一个目标。我们如何通过虚拟,我讲是资源的发现调度和管 理达到能按需,也就是对每个服务使用者,我们给他按需以租赁方式给他,降低成本。PSSA层如何建立这样的平台,有利于开发,这里包括一些开发环境,中间 件,甚至计费都在这个层次。SAA使层是我们国家有巨大空间的领域,我们通过工作,对云计算体系结构理解应该是这样的,也就是网络资源,有的大型设备,或 者能联到网上,甚至不能联上的,我们大学几百万美元设备不一定联,可以用网络服务提交方式,以数据输出方式通过网络传给对,完成了租赁。在网上,我们认为 目前现状有两种,一种物理机,一种虚拟机,如何建立一个资源池,是透明的,并且是可动态调度的,这个时候通过资源调度,服务模板方式给用户,这层是一方面 平台方式进行租赁,另外一方面可以对上层的SAAS提供支持,我们可以对他的ERP,CRM提供服务支持。   这个时候我们认为云计算一个简单的 实现机制是这样的,所有的终端用户,不论是上网本手机智能终端,通过交互接口,在目录中找到服务,我们通过系统管理,通过网络,然后以配置工具这样的一种 服务方式提供给用户计算或者存储资源,或者其他方面的所需要的网络具有的服务,另外有一个统计功能,时刻让用户透明的知道你的服务现状。   这里 我们北京科技大学为一个案例,这个案例中我们认为可以用于其他企业的私有云,这种情况下大家有独特的地方,因为大学大家知道是以教授为核心的种研究和教育 体系,这个时候,所有的教授们拿到课题,自己去购置他的设备,学校每年通过一些工程会拨下一批经费,每年到年底熟悉大学脉搏的人知道,一到年底12月去了 大学,因为什么?在12月底之前要大笔钱要花出去,这种钱基本是胡花出去,我们认为,就是盲目的购置设备,这个时候购置设备后,使设备本身3年可能成为废 品,有的放置了,随着教育资金大幅度提高,老师科研经费大幅度增加,在大学中应该存在比较大的浪费现象。   这个时候,本身有一些需求这种需求, 我们主要在这里针对着是对于科学计算,我们想营造一个科研,我们下一步会面向教学化管理,信息服务是在网络中心。主要的问题是刚才我讲的实际资源重复购 置,大量闲置,利用率低,资源分散管理,每年这个时候学校有一批公用款的时候,给各个学院,看谁发展能抢拿去,拿去实际可能没有好规划,但是购置一些闲置 计算机,这样本身学院体系各不相同,互相没有贯通,不知道哪些设备可以共享,不知道这些东西如何可租用变成可提供服务的方式。所以这里,我们现在高校普遍 存在状况,无法实现有效协作。   我们希望建设的校园的目标,就是如何将分散的资源整合一个资源池,在学校内一个私有云的情况下,分布在各点,各 处不同的计算机整合在一起共用计算资源,把存储整合在一起共用存储资源,以后对学校的发展会产生这样的情况,资金可以统一配置,对各个学院我们提供不是计 算机而是计算能力,分配计算点数,学生享受服务的时候,学校一般建一卡通,我们通过一卡通使用。老师使用大量模拟软件,这种软件一方面使得各个单位不同的 重复购置,另外又使得一些资源在那闲置,这是现在的问题。我们希望把一些软件放到云端,节省每一个科研人员的重复的配置和版本问题,这是我们的目的。    对我们来讲,因为我们北京科技大学从97年,我在法国读书的时候两个方向,一个方向是离散事件理论研究,我出版一本专注,离散事件理论系统及应用,从 97年以来,我们参加了国家的973、863组织负责国家自然资金,我们主要研究重点,包括国家重大计划重点课题是网络资源管理调度,网络环境下管理服务 基础理论研究,经过十几年积累,我们有了这样的实现的基础,所以作这里我们认为他的这种架构应该是这样的,就是对现存的虚拟机物理机整合在资源池上,上面 资源分配引擎实现调度,对上面我们支持一些软件,在这个平台中我们现在部署CRM软件,把第三方软件部署里面,我们可以给管理学院老师或者EMA或者 MBA提供学习平台,这个软件可以实现真实功能,但是在大学中作为非常好的范例,使学生在云端,使用软件过程中学会所需要的课程,其他软件可以达到这个目 的。   这里我们也就说对于目前学校的现有的现状,我们把物理机和虚拟机整合,构建资源池,通过按需服务要求提供给他CPU或者存储,这个时候我 们的界面列出所有的物理机不同类型虚拟机,我们对应用软件和运行操作系统建立影像,建立标准服务模板,我们基础设施可以支持目录管理,这个时候我们以管理 员或者应用经理或者院长或者用户方式开放给大家,可能通过这样的管理,通过注册登陆来实现,按照你的权限和需要的服务。   他的核心技术,刚才张 博士讲的,我们也认为,云计算未来是走向大,如果在一个大的无序空间中,资源调度分配,资源管理成为非常重要的,这点就和我们现在城市交通一个道理,我们 有资源有道有车,没有很好的管理,当扩大的时候,一定给你带来问题。所以我们讲在这里我们认为一定要满足他的资源,在这里要花一定研究精力。    资源调度引擎可以区分配可以预约。刚才我们发现资源分配策略,我们这里应该一样,首先根据各种各样资源分配,我们能对资源进行填满,使服务器利用率最大 化,通过分散策略可以虚拟机使用在最小物理服务器上,这样可以降低物理服务器故障影响,还有基于关联程度分配策略,基于高可靠性分配策略等等,这个时候我 们可以根据用户的优先级别动态分配他的资源,另外一点是可以通过实现绿色策略进行节能优化。   经过这样的构建我们认为我们的云平台这样的门户应该是有关的一些特点。是以应用软件为中心,内置多种应用软件接口,他的好处我们做了尝试,把第方软件可以部署在上面,很快部署在云端,使终端用户可以流畅使用。   通过WEB远程管理应用软件及工作数据,基于角色的权限管理和页面访问控制。可自定义的应用程序参数表单。   这是我们平台界面,几个功能,一个以学院划分,另外可以用功能划分,有云平台管理,虚拟机作用和管理,有系统管理和维护,有系统监控,构成一个完整的云计算,用于校园的系统云平台软件。   我们可以看到,当一个系进去的时候,我们可以提供这样的PAAS的工具,我们称为工具,所有科研工作者不在自己本机装,直接在云端使用。我们有任务数据管理功能,进行图形化交互。   我们设计帐单和计费系统,开发了以实时网络和运营计费,我们还有第三方类似支付宝的系统。    云平台构建监控平台不可少,所有使用IAAS中资源使用情况,我们构建监控平台达到这样的功能,我们可以实时监控网络拓扑,通过图表方式给出使用效果, 我们可以检测CPU,对于新设备可以无缝扩展进去,我们可以监控DSP应用,对UPS进行监控,我们有报表统计分析平台,这个平台我们可以看到图形化方式 全机使用报表。我们可以给出数据统计分析结果。   如果大家有兴趣的话,有时间可以到我们北京科技大学,我们叫多媒体实验室,现在有云计算实验室,希望大家给予参观和指导。   谢谢大家。 提问:我有两个问题,您进入一个学院,有一个工具,有一些工具是可以共享的,还有一些软件由于限制,这种情况怎么实现?第二个问题,刚才你介绍针对计算资源调度和虚拟池化,云计算资源不仅仅是计算,还有存储网络,这个怎么考虑? 杨扬:我 们在部署第三方软件的时候,我们现在和公司做尝试,一个大公司,大公司现在美国一家公司,他认为实现了,通过他们技术人员我们装了2个小时现在可以使用, 另外找另外一家CRM部署里面,有这样的问题,我现在跟第三方软件也在讨论,如果你的架构满足SOA这样的架构,我们现在目前试了几个没有问题,是不是对 有的软件出现问题,主要在以前开发环境是一些什么样的状况。   第二个问题在里有存储资源,存储资源我们目前也在利用一些第三方软件整合,同时我们最近发现一些开元软件,我们做尝试,我们功能达到基本存储共享。   谢谢。 提问:我问一个问题,我看到里面提了一个观点,虚拟机和物机和统一的池化,我想了解一下面,在现在介绍平台里面,对于虚拟机的池化和物机池化管理是统一方式还是分开方式管理? 杨扬:是 这样的,目前是网格计算,从网格来讲应该是支持多种接口,这是我们现在这种软件特点,对虚拟机,扩充的时候可能会有一些问题,现在我们发现在实际中,使用 的往往是虚拟和物理机并存情况,物理机和虚拟机一定有一些标准接口,我们把接口放在统一的资源池中,这个时候我们会看到虚拟机的计算资源,比如CPU,我 们知道物理机的计算资源,上层我们以资源池来解决问题。 提问:咱 们在云实践方面建立自己云平台,不管利用自己的软件和国外软件,一定有很多经验,另外咱们承担了好多课题,包括你介绍的,云计算面临重大科学问题,通过以 前研究,哪些东西解决了,哪些东西还是面临巨大问题需要我们进一步研究的?因为网格计算提了这么多年,虚拟化20年前提出来,服务技术很多年提出来,有哪 些关键或者未来下阶段发展值得我们关注的一些重大科学技术问题或者关键技术。 杨扬:这 个问题比的非常好,这个问题实际是针对我们大学的这些研究者共同的问题,因为从网格来讲,我们发现大学机构实际上每天在想提炼一些共性问题,这个里面我们 做的一些工作又要集中到某些点中,所以这里我们也是不断的通过查询文献去寻找,在面临科学问题中,我提炼出几方面,分两部分,因为一个是面向服务,服务的 不一定是技术,但是要解决的是服务的组合,现在包括工作流,解决服务组合问题。这个时候也就是说把一些松散偶合分布子服务,整合成为用户提供透明按需服 务,这里衍生了服务科学,有大量文章做。   另外一个问题,刚才我们讲网格解决两个重大问题,一个是接口问题,实际这个东西是个技术问题,并不存 在有多大研究,是这样的,在企业之中,如何根据现有的标准,通过软件方式来实现资源发现,另外对于策略,服务的调度策略,这是一直大家在研究的,在研究中 我们认为从目前来讲,很多国际公司也做这方面的工作,包括张博士谈,从网格中,在国际中,应该说很多策略已经都能达到实用,因为这里只有一个问题实现容易 评价难。我们也是一直在这个方面和清华大学计算机系,一直做性能评测方面的研究。   谢谢。 主持人:再次感谢杨老师。上午的报告就到这。
推荐 打印 | 录入: | 阅读:
本文评论   
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款