跳到主要内容
溢价试验:

索取年度报价

多重人格

溢价

去年年底在德克萨斯州奥斯汀举行的08年超级计算大会上,一个名为“传达计算机”的公司公布了一种新的计算解决方案,引起了很大的骚动。这家新生公司推出了一个名为HC-1的服务器单元,它结合了英特尔至强处理器、商用fpga和一个正在申请专利的架构,作为“混合核心计算”的突破。但是这个装置就像其他加速硬件一样吗,还是有一些炒作的东西?在这种情况下,证据似乎在蛋白质组学布丁中。

加州大学圣迭戈分校计算质谱分析中心的研究人员发现,一台HC-1就拥有足够的处理能力,足以为废除贝奥武夫集群和一组服务器提供足够的论据。在该中心,科学家们的目标之一是挖掘蛋白质组样本以获取意想不到的数据,他们开发了一种软件来识别数据中的重要匹配点——但运行起来恰巧非常费力。

该中心的执行主任努诺·班德拉说:“该软件对生物学家来说很方便,但在计算方面,当然是一项繁重得多的任务,它需要更多的计算时间和体力才能提出这类问题。”“在过去,我们已经证明了这些任务可以在多台机器上并行处理,但我们也注意到,如果使用fpga等方法,它可以以更紧凑、更经济的方式完成,这正是deliver所建议的。”

最初,该中心的软件是为在一台计算机上使用而开发的,但随着一切都变得越来越慢,该团队决定将其转移到计算集群和多个服务器单元上。“但正如你所料,一旦我们开始有能力运行更多的数据,我们也会向它抛出更多的数据。所以在其中一些项目中,即使我们在200台计算机上运行分析,完成数据分析仍然需要大约两个月的时间,”班德拉说。“因此,这款来自deliver的新开发将其速度提高了大约100倍,是我们在一台机器上所能做到的。原则上,如果有几个这样的HC-1装置,我们就可以在更短的时间内完成整个过程。”更具体地说,班德拉和他的同事们发现,一台HC-1可以完成目前八台服务器的工作,消耗的能量相当。

一致性和自定义

与任何闪亮的新高性能计算玩具一样,为了理解这项技术的价值,重要的是要克服所有炒作带来的任何可能的困惑。vwin德赢ac米兰合作毕竟,加州大学欧文分校的计算机科学教授拉杰什·古普塔解释说,任何使用协处理器加速器的供应商都可以自称是“混合核”。考虑到康威的HC-1,古普塔指出:“没有混合动力装置。他们不是芯片制造商,他们使用的是商用部件,所以创新在于系统,也就是系统的架构和软件。”他补充说:“几乎任何使用协处理器加速器的机器制造商都可以自称是‘混合’,所以这个术语没有太多意义。”

在相当长的一段时间里,人们使用fpga作为生命科学领域的加速器或协处理器,并取得了不同程度的成功,包括加速Blast和蛋白质组学软件等。但古普塔表示,康威公司与HC-1机组的区别在于概念和建筑角度。他说:“他们所能做的就是把协处理器放在非常接近CPU的地方,我用一个技术术语来形容它,叫做‘连贯协处理’。”“这里的想法是,内置在FPGA中的协处理器与CPU使用的内存系统模型保持同步。”

在不太迷失于技术细节的情况下,HC-1的突出之处在于,与其他硬件加速器设备不同,该解决方案有一个代码编译器,可以为英特尔处理器和FPGA协处理器生成优化的代码,从而解决了确定代码的哪部分发送到硬件的哪部分的一些头疼问题。换句话说,当编译代码为加速做准备时,在抽取到FPGA的代码部分和通过标准CPU的代码部分之间没有概念上或编程上的区分。HC-1附带的代码优化器和生成器自动识别可以分派给协处理器的代码,以便并行运行以实现加速。这也有助于HC-1的本机操作系统是普通的Linux,它允许与运行在Intel 64上的Linux兼容的应用程序代码在传达的系统上不加修改地运行。

虽然现在判断HC-1将对生物信息学产生何种影响还为时过早,但古普塔说,一个明显的优势是,这个新系统实际上可能能够提供其他硬件加速器制造商无法提供的功能。古普塔说:“机器宣称的性能和交付的性能之间存在着很大的差距,原因是所有已经制造出来的机器都是为一些广泛的应用而制造的。”“这种所谓的定制已经存在于硬件界很长很长一段时间了,但手工制造一台机器是很难的。但是,deliver使定制变得系统化,这是一个优点。”

这种轻松定制代码的能力以软件开发工具包的形式提供,该工具包包含该公司所谓的多重“个性”,这是一种更有趣的描述高度适应性编程指令集的方式,可以通过允许客户使用c++和Fortran等标准语言来定制这些指令集,以支持各种算法。该软件开发工具包使Bandeira的团队能够加速一些软件工具,如InsPecT/MS-Alignment程序,其速度可提高100倍。“对于InsPecT, UCSD…实现了代表应用程序核心的特定‘个性’,”传达计算机公司的产品经理Kirby Collins说。“这需要我们的个性开发套件支持特定的FPGA编程,处理与主机和高性能内存系统的接口,[允许]逻辑设计专注于搜索算法,从而提高生产率和性能。”

随着蛋白质组学社区的计算需求变得越来越高,Bandeira认为,研究人员真的不应该担心为大量的商品cpu的预算需求辩护。“当人们想到购买一种工具,想到与运行该工具相关的所有复杂性时,他们往往忘记了下游分析。现实情况是,没有人有时间手动通过数百万个光谱,所以如果链的最后一步失败了,你真的没有利用你的仪器投资,”他说。“维护所有这些东西所需的技能是如此令人生畏,所以如果可以简化计算分析步骤,不需要实验室维护计算集群——(它们)通常没有这样的装备——这将是一个巨大的优势。”

目前,deliver仍处于部署的预测试阶段,计划在4月份首次发布。Collins表示,随着生命科学数据集的不断增长和预算的不断紧缩,它将成为公司未来重要的应用领域。

扫描

转基因蚊子可防止疟疾传播

研究人员在《科学进展》杂志上报告说,一种基因驱动方法可以用来使蚊子无法传播疟疾。

尽管饮食不同,但肠道微生物群可以让熊长到相似的大小

《科学报告》的研究人员发现,棕熊肠道微生物群的组成使它们即使在吃不同的食物时也能达到相似的大小。

在人类基因组中寻找避风港

在基因组生物学中,研究人员提出了一种新的方法来识别基因组安全港,在那里转基因可以在不影响宿主细胞功能的情况下表达。

重性抑郁症和双相情感障碍之间微妙关系的新数据点

隆德大学的研究人员在《美国医学会精神病学杂志》上发现了重度抑郁症和双相情感障碍的重叠遗传责任。
Baidu
map