分布式计算(计算机科学)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中国科学院的定义
在两个或多个软件互相共享信息,这些软件既可以在同一台计算机上运行,也可以在通过网络连接起来的多 台计算机上运行。分布式计算比起其它算法具有以下几个优点:
1、稀有资源可以共享。
2、通过分布式计算可以在多台计算机上平衡计算负载。
3、可以把程序放在最适合运行它的计算机上。
网格计算就是分布式计算的一种。如果某项工作是分布式的,那么,参与这项工作的一定不只是一台计算机, 而是一个计算机网络,这种“蚂蚁搬山”的方式将具有很强的数据处理能力。
BOINC已经成熟,多个项目已经成功运行于BOINC平台之上,如SETI@home,LHC@home等。
安全性
计算机上的 隐私数据
个人计算机 的寿命
您从项目方下载的计算程序,运行在本机,而且可以访问网络,因此,只有可靠的项目方才能保证您计算机 上的隐私数据不会恶意的取走、修改等。
虽然分布式计算的计算程序一般运行在最低优先级,不会对您的日常使用造成影响,但计算程序全负荷运行 时仍会对计算机的各个部件造成一定压力,要了解更多请查看分布式计算对计算机软硬件的影响。
网格计算的实质就是组合与共享资源并确保系统安全。
分布式计算是利用互联网上的计算机的中央处理器的闲置处理能力来解决大型计算问题的一种计算科学。下 面,我们看看它是怎么工作的:
首先,要发现一个需要非常巨大的计算能力才能解决的问题。这类问题一般是跨学科的、极富挑战性的、人类 急待解决的科研课题。其中较为著名的是:基本信息1定义2网格计算
3
工作原理
4 BOINC分布式
计算平台
5 分布式计算在
中国
广义定义
研究如何把一个需要非常巨大的计算能力才能解决的问题分成许多小的部分,然后把这些部分分配给许多计 算机进行处理,最后把这些计算结果综合起来得到最终的结果。
最近的分布式计算项目已经被用于使用世界各地成千上万位志愿者的计算机的闲置计算能力,通过因特网, 可以分析来自外太空的电讯号,寻找隐蔽的黑洞,并探索可能存在的外星智慧生命;可以寻找超过1000万位数字 的梅森质数;也可以寻找并发现对抗艾滋病病毒的更为有效的药物。这些项目都很庞大,需要惊人的计算量,仅 仅由单个的电脑或是个人在一个能让人接受的时间内计算完成是绝不可能的。
Folding@home是一个研究蛋白质折叠,误解,聚合及由此引起的相关疾病的分布式计算工程。它使用联网式 的计算方式和大量的分布式计算能力来模拟蛋白质折叠的过程,并指引我们对由折叠引起的疾病的一系列研究。
意义格局
分布式计算格局
分布式计算与人类
BOINC一统大局
由于现代人类各个课题学科繁多,涉及面广,而分类又细。而当今的每个学科似乎都需要进行大量的计算。 天文学研究组织需要计算机来分析太空脉冲(pulse),星位移动;生物学家需要计算机来模拟蛋白质的折叠 (protein folding)过程;药物学家想要研制克服艾滋病(AIDS)或非典(SARS)的药物;数学家想计算最大 的质数和圆周率的更精确值;经济学家要用计算机分析计算在几万种因素考虑下某个企业/城市/国家的发展方向 从而宏观调控。由此可见,人类未来的科学,时时刻刻离不开计算。而分布式计算(Distributed Computing), 以其独特的优点——便宜、高效而越来越受到社会的**。
那么,一些本身非常复杂的但是却很适合于划分为大量的更小的计算片断的问题被提出来,然后由某个研究 机构通过大量艰辛的工作开发出计算用服务端和客户端。服务端负责将计算问题分成许多小的计算部分,然后把 这些部分分配给许多联网参与计算的计算机进行并行处理,最后将这些计算结果综合起来得到最终的结果。
BOINC是Berkeley Open Infrastructure for Network Computing的简称,即伯克利开放式网络计算平台。
对项目方来说,参加分布式计算的志愿者毕竟不是项目方自己的人员,并不是全体可信任,因此必须引入一 定的冗余计算机制,才能防止计算错误、恶意作弊等。
谢谢观看
为了改变这种杂乱无章的割据,美国加州大学伯克利分校(UC Berkeley)首先提出了建立BOINC的想法。 BOINC的中文全称是伯克利开放式网络计算平台(Berkeley Open Infrastructure for Network Computing), 他能够把许多不同的分布式计算项目联系起来统一管理。并对计算机资源进行统一分配(比方您对研究艾滋病药 物和探索地外文明同时感兴趣,您就可以同时选择两个运行,并设置优先级)。对统计评分系统进行统一管理 (无论你在为哪个项目工作,只要你奉献CPU时间长,就积分高)。有了这样的统一管理,的确给PANDE小组这样 的科学研究机构提供了便利!
据中国互联网信息中心(CNNIC)的统计信息,中文网民人数占世界的比重已经增长到了12%左右,并且还在 快速增长着。这里所说的中文网民是包括大陆、香港、澳门、台湾和海外华人的。
相比于互联网在中国的快速发展,分布式计算在中国却显得发展缓慢。网民的数量并不能客观反映一个国家 信息化程度的高低,参与分布式计算网民的数量或比例,却可以显示出这个国家科学普及的水平。在这方面,目 前欧美国家处于领先。在北欧,几乎一半的电脑参加了分布式计算项目,这比例颇为惊人。而在中国和印度,尽 最新科技不少,在网络普及化进程中也有不错的表现,但是在分布式计算方面仍显得薄弱。让我们来看些例子:
BOINC是不同分布式计算可以共享的分布式计算平台。不同分布式计算项目可以直接使用BOINC的公用上传下 载系统、统计系统等,这样不仅可以发挥各个分布式计算之间的协调性,也能使分布式计算的管理、使用更加方 便易用。
BOINC项目由美国加州大学伯克利分校(ley)主持发起。
BOINC项目由美国国家科学基金会(National Science Foundation)赞助。
分布式计算(计算机科学)
计算机科学
01 基本信息
03 安全性
目录
02 意义格局
分布式计算是一种计算方法,和集中式计算是相对的。
随着计算技术的发展,有些应用需要非常巨大的计算能力才能完成,如果采用集中式计算,需要耗费相当长 的时间来完成。
分布式计算将该应用分解成许多小的部分,分配给多台计算机进行处理。这样可以节约整体计算时间,大大 提高计算效率。
在以前,这些问题都应该由超级计算机来解决。但是,超级计算机的造价和维护非常的昂贵,这不是一个普通 的科研组织所能承受的。随着科学的发展,一种廉价的、高效的、维护方便的计算方法应运而生——分布式计算!
随着计算机的普及,个人电脑开始进入千家万户。与之伴随产生的是电脑的利用问题。越来越多的电脑处于 闲置状态,即使在开机状态下中央处理器的潜力也远远不能被完全利用。我们可以想象,一台家用的计算机将大 多数的时间花费在“等待”上面。即便是使用者实际使用他们的计算机时,处理器依然是寂静的消费,依然是不计 其数的等待(等待输入,但实际上并没有做什么)。互联网的出现,使得连接调用所有这些拥有限制计算资源的计 算机系统成为了现实。
SETI@home是世界上最大的分布式计算项目,在中国也是最参与者最多的分布式计算项目。它通过使用联网 的计算机下载程序分析射电望远镜所收到的讯号,来搜索地球外的生命迹象。
尽管中国在取得了分布式计算领域的进步:国际排名从29上升到了24,但是中国用户完成的计算量,仅相当 于日本用户完成的十分之一,而且日本的网民人数少于中国。想取得进一步的突破,提高网民素质、提高科学普 及化程度无疑是十分重要的。印度和一些中东国家也有相似的问题,而中欧国家做的相对好一些,不少独联体国 家所完成的数据计算量已经超过了俄罗斯联邦的总和。
BOINC有自己的积分系统,因为在BOINC上可以运行的项目千差万别,比如项目A的任务包(Workunit,简称 WU)在某台机器里需要3个小时完成,而项目B的任务包在这台机器里需要30个小时才能完成,显然用WU的数目来 衡量工作量是不可行的;类似的,机器性能也有差别,用CPU时间来衡量工作量更是不行的。积分系统只能通过 一定的算法得到用户实际完成的计算量,这篇文章对BOINC中积分的计算方法进行了说明。
就目前来看,全球的各种分布式计算已有约百种,这些计算大多互无联系、独立管理、独立使用自己的一套 软件。这种分布式计算互相割据的格局很不利于发展的需要。比如,某个生物学研究机构需要利用世界各地志愿 者的计算机来模拟蛋白质折叠的过程,那个生物学研究机构没有分布式计算方面的专业人才,而但是社会上也并 没有任何公司可以提供这样的服务,他们就不得不自己花费大量精力用于开发分布式计算的服务器、客户端。这 样一来,原来可以用于研究生物的时间用在了别的地方。刚才提到的生物学研究机构就是美国斯坦福大学的 PANDE小组。
相关文档
最新文档