Folding@home (FAH或F@h)是一个用于疾病研究的分布式计算项目,它模拟蛋白质折叠、计算药物设计和其他类型的分子动力学。该项目利用了志愿者拥有的数千台个人电脑的闲置处理资源,并且已经在他们的系统上安装了软件。其主要目的是确定蛋白质的折叠机制,即蛋白质到达其最终三维结构的过程,并检查蛋白质错误折叠的原因。这具有重要的学术意义,对阿尔茨海默氏病、亨廷顿氏病、多种癌症以及其他疾病的医学研究具有重要意义。在较小的程度上,Folding@home还试图预测蛋白质的最终结构,并确定其他分子如何与之相互作用,这一研究在药物设计中有一定的应用。Folding @home由斯坦福大学的潘德(Pande)实验室在维贾伊·潘德(Prof. Vijay Pande)教授的指导下开发和运营,并由世界各地的各种科学机构和研究实验室共享。[1]

该项目率先将图形处理单元(GPU)、PlayStation 3s、消息传递接口(用于多核处理器上的计算)和一些SNOY-Xperia智能手机用于分布式计算和科学研究。该项目使用统计模拟方法,这是传统计算方法的一种范式转变。[2]作为客户机-服务器模型网络体系结构的一部分,志愿者机器各自接收模拟(工作单元)的片段并完成它们,随后将其返回到项目的数据库服务器,在那里单元被编译成一个整体模拟。志愿者可以在Folding @home网站上实时查询他们的贡献,这使得志愿者之间产生竞争力,从而鼓励他们长期参与。

Folding @home是世界上最快的计算系统之一,截至2019年6月,其运算速度约为98.7千兆位。[3]其大规模的高性能计算网络使得研究人员能够运行计算高成本的原子级蛋白质折叠模拟,比以前长几千倍。自2000年10月1日成立以来,潘德实验室已经基于Folding @home发表了206篇科学研究论文。[4] 该项目的仿真模拟结果与实验结果非常吻合。[5][3][6]

1 项目意义编辑






2000年至2010年间,蛋白质Folding@home研究的长度增加了四倍,而蛋白质折叠模拟的时间尺度增加了六个数量级。[20] 2002年,Folding@home使用马尔可夫状态模型在几个月的时间里完成了大约一百万个CPU日的模拟,[6]2011年,MSMs并行化了另一个需要总计1000万个CPU小时计算的模拟。[21]2010年1月,Folding@home使用MSMs模拟慢折叠的32残基NTL9蛋白的动力学过程,时间跨度为1.52毫秒,这与实验性折叠速率预测一致,但比以前的预测长一千倍。该模型由许多单独的轨迹组成,每条轨迹都短了两个数量级,为蛋白质的能量景观提供了前所未有的细节。[2][5][22] 2010年,Folding@home研究员格雷戈里·鲍曼(Gregory Bowman)因开发开源MSMBuilder软件和实现理论与实验之间的定量一致而获得美国化学学会颁发的托马斯·库恩范式转换奖(Thomas Kuhn Paradigm Shift Award)。[23][24] 由于他的工作,潘德获得了2012年迈克尔和凯特·巴恩青年研究员奖(Michael and Kate Bárány Award),因为他“开发了定义场和改变场的计算方法来产生蛋白质和核糖核酸折叠的领先理论模型”,[25] 和2006年欧文·西格勒青年研究员奖(Irving Sigal Young Investigator Award),这两项奖“激发了对整体和单分子测量意义的重新审视,使潘德博士在模拟方法学方面做出了开创性贡献。”[26]

2 生物医学研究中的应用实例编辑

蛋白质错误折叠会导致多种疾病,包括阿尔茨海默病、癌症、克罗伊茨费尔特-雅各布病、囊性纤维化、亨廷顿氏病、镰状细胞贫血和二型糖尿病。[9][27][28]艾滋病毒和流感等病毒引起的细胞感染也涉及细胞膜折叠事件。[29]一旦蛋白质错误折叠得到更好的理解,就可以开发出增强细胞调节蛋白质折叠的天然能力的疗法。这种疗法包括使用工程分子来改变给定蛋白质的产量,帮助破坏错误折叠的蛋白质,或帮助折叠过程。[30]计算分子建模和实验分析的结合有可能从根本上塑造分子医学的未来和治疗学的合理设计,[11]例如加快和降低药物发现的成本。[31] Folding@home的前五年的目标是在理解折叠方面取得进展,而当前的目标是理解错误折叠和相关疾病,尤其是阿尔茨海默氏症。[32]


潘德实验室是斯坦福大学的一部分,斯坦福大学是一个非营利实体,不出售Folding@home产生的结果。[36]该项目的大型数据集可免费供其他研究人员索取使用,有些数据集可从Folding@home网站上访问。[37][38]潘德实验室与其他分子动力学系统合作,如的蓝色基因超级计算机,[39] 他们与其他研究人员共享Folding@home的关键软件,因此使Folding@home受益的算法可能有助于其他科学领域。[37]2011年,他们发布了开源哥白尼软件(open-source Copernicus software),该软件基于Folding@home的MSM和其他并行化方法,旨在提高大型计算机集群或超级计算机上分子模拟的效率和规模。[40][41] Folding@home的所有科学发现的摘要在出版后都张贴在Folding@home的网站上。[4]

2.1 阿尔茨海默病


阿尔茨海默病是一种不可治愈的神经退行性疾病,最常影响老年人,占所有痴呆症病例的一半以上。其确切原因尚不清楚,但这种疾病被确定为蛋白质错误折叠疾病。阿尔茨海默病与淀粉样β肽的毒性聚集有关,该聚集是由淀粉样β错误折叠和与其他淀粉样β肽聚集在一起引起的。然后,这些β-淀粉样蛋白聚集成明显更大的老年斑,这是阿尔茨海默病的病理标志。[42][43][44] 由于这些聚集体的异质性,诸如x光结晶学和核磁共振等实验方法很难表征它们的结构。此外,由于β聚集的大小和复杂性,原子模拟在计算上要求很高。[45][46]


2008年12月,Folding@home发现了几种小的候选药物,它们似乎抑制了β-淀粉样聚集体的毒性。[49]2010年,与蛋白质折叠机械中心密切合作,这些药物引线开始在生物组织上测试。[28]2011年,Folding@home完成了几个α-β突变的模拟,这些突变似乎稳定了聚集物的形成,这可能有助于该疾病治疗药物的开发,并极大地有助于β-低聚物的实验核磁共振波谱研究。[46][50] 同年,“Folding@home”开始模拟各种β淀粉样蛋白片段,以确定各种天然酶如何影响β淀粉样蛋白的结构和折叠。[51][52]

2.2 亨廷顿氏病

亨廷顿氏病是一种神经退行性遗传疾病,与蛋白质错误折叠和聚集有关。亨廷顿蛋白氮末端谷氨酰胺氨基酸的过量重复导致聚集,尽管重复的行为还没有完全被理解,但它确实导致了与疾病相关的认知下降。[53]同其他集料一样,很难通过实验确定其结构。[54] 科学家正在使用Folding@home来研究亨廷顿蛋白聚集体的结构,并预测其形成方式,协助合理的药物设计方法来阻止该聚集体的形成。[28]亨廷顿蛋白的N17片段加速了这种聚集,虽然已经提出了几种机制,但其在这一过程中的实质性作用仍大部分未知。[55] Folding@home模拟了这一片段和其他片段,以阐明它们在疾病中的作用。[56]自2008年以来,其针对阿尔茨海默病的药物设计方法已经应用于亨廷顿氏症。[28]

2.3 癌症

一半以上的已知癌症涉及p53突变,p53是一种存在于每个细胞中的肿瘤抑制蛋白,它调节细胞周期,并在脱氧核糖核酸受损时发出细胞死亡信号。p53的特定突变可以破坏这些功能,允许异常细胞不受抑制地继续生长,导致肿瘤的发展。对这些突变的分析有助于解释p53相关癌症的根本原因。[57] 2004年,Folding@home被用于在全原子模拟水中进行p53蛋白二聚体重折叠的第一次分子动力学研究。模拟的结果与实验观察一致,并对以前无法获得的二聚体的再折叠提供了参考。[58]这是第一份来自分布式计算项目的关于癌症的同行评议出版物。[59] 第二年,“Folding@home”提供了一种新的方法来鉴定对特定蛋白质的稳定性有着至关重要的氨基酸,然后用于研究p53的突变。该方法在识别致癌突变方面相当成功,并通过实验测量确定了特定突变的影响。[60]

Folding@home也用于研究蛋白质伴侣,[28]热休克蛋白,在细胞内的极端环境中环境中,通过协助折叠其他蛋白质对细胞的存活发挥重要作用。快速生长的癌细胞依赖于特定的伴侣,一些伴侣在化疗耐药性中起着关键作用。对这些特定伴侣的抑制被视为有效化疗药物或减少癌症扩散的潜在作用模式。[61]潘德实验室希望通过“Folding@home”并与蛋白质折叠机械中心密切合作,找到一种抑制参与癌细胞的伴侣的药物。[62]研究人员也在使用Folding@home来研究其他与癌症相关的分子,如Src激酶和某些形式的植入同源域:一种可能与包括癌症在内的许多疾病有关的大蛋白质。[63][64] 2011年,Folding@home开始模拟小打结蛋白EETI的动力学,这种蛋白可以通过结合癌细胞的表面受体在成像扫描中识别癌症。[65][66]


2.4 成骨不全

成骨不全,被称为脆性骨病,是一种不可治愈的遗传性骨病,可以致命。患有这种疾病的人不能制造功能性结缔组织。这最常见的原因是一型胶原蛋白的突变,[69] 该蛋白具有多种结构功能,是哺乳动物中最丰富的蛋白质。[70]这种突变导致胶原蛋白的三螺旋结构变形,如果不自然破坏,就会导致骨组织异常和弱化。[71]2005年,Folding@home测试了一种新的量子力学方法,这种方法对以前的模拟方法进行了改进,可能对未来胶原蛋白的计算研究有用。[72]尽管研究人员已经使用Folding@home来研究胶原折叠和错误折叠,但与阿尔茨海默氏症和亨廷顿氏症的研究相比,这种兴趣只是一个试点项目。[28]

2.5 病毒

Folding@home正在协助防止流感和艾滋病毒等病毒识别和进入生物细胞的研究。[28]2011年,“Folding@home”开始模拟核糖核酸酶H的动态,核糖核酸酶H是艾滋病毒的一个关键成分,试图设计药物使其失活。[73] Folding@home也被用于研究膜融合,膜融合是病毒感染的重要事件,具有广泛的生物学功能。这种融合涉及病毒融合蛋白的构象变化和蛋白对接,[29]但融合背后的确切分子机制仍大部分未知。[74]聚变事件可能由50多万个原子相互作用数百微秒组成。这种复杂性将典型的计算机模拟限制在几十纳秒内大约一万个原子:相差几个数量级。[48]预测膜融合机制的模型的开发将有助于科学理解如何用抗病毒药物靶向该过程。[75]2006年,科学家应用马尔可夫状态模型和Folding@home网络发现了两条融合途径,并获得了其他的机制上的见解。[48]


2.6 药物设计




3 生物医学研究的潜在应用编辑


3.1 朊病毒疾病



PrPc已从膜上酶促分离并纯化,其结构用结构表征技术如核磁共振波谱和x光结晶学研究。翻译后PrPc在小鼠体内有231个氨基酸(aa)。该分子由一个长达aa残基121的长而非结构化的氨基末端区域和一个结构化的羧基末端结构域组成。[88]这个球状结构域包含两条短片状反平行β链(鼠PrPc中aa 128-130和aa 160-162)和三条α螺旋(螺旋ⅰ:aa 143-153;螺旋二:aa 171至192;螺旋ⅲ:鼠PrPc中的aa 199至226),[89]螺旋ⅱ和ⅲ是反平行取向的,并通过短环连接。它们的结构稳定性由平行于两个成片β链的二硫键支撑。这些α螺旋和β片形成PrPc球状畴的刚性核。[90]

引起PrPSc的疾病是蛋白酶K抗性的和不溶性的。试图从受感染动物的大脑中纯化它总是产生不均匀的混合物和聚集状态,这些不适合核磁共振波谱或x光晶体学的表征。然而,人们普遍认为PrPSc比正常PrPsC含有更高百分比的紧密堆积的β-片,这使得蛋白不溶并对蛋白酶有抗性。使用冷冻电子显微镜技术和基于相似普通蛋白质结构的结构建模技术,已经发现PrPSc在aa 81-95至aa 171区域包含β-片,而羧基末端结构被假定保留,在正常PrPc中保留二硫键连接的α-螺旋构象。这些β片形成平行的左旋β螺旋。[88]三种PrPSc分子被认为形成了一个初级单位,因此为所谓的羊瘙痒病相关原纤维奠定了基础。[91]催化活性取决于颗粒的大小。仅由14-28个PrPc分子组成的PrPSc颗粒显示出最高的传染性和转化率。[92]

尽管纯化和鉴定PrPSc有困难,但是从PrPSc的已知分子结构和使用转基因小鼠和N-末端缺失,[93] 可以推断导致致病PrPSc的蛋白质错误折叠的潜在原因, Folding@home在证实这些方面可能有很大价值。研究发现朊病毒蛋白的一级和二级结构对转化都有重要意义。

朊病毒蛋白基因(PRNP)有20多个突变,已知与人类TSEs的遗传形式相关或直接相关,表明PrPc的某些位置(可能在羧基结构域内)[89] 的单个氨基酸可以影响TSEs的易感性。

PrPc翻译后氨基末端区域由残基23-120组成,这些残基构成全长成熟PrPc氨基序列的近一半。氨基末端区域有两个部分可能影响转化。首先,残基52-90包含八肽重复(5次)区域,其可能影响初始结合(通过八肽重复)以及通过aa 108-124的第二部分的实际转化。[94]高度疏水的AGAAAAGA位于aa残基113和120之间,被描述为推定的聚集位点,[98]尽管该序列需要其侧翼部分形成原纤维聚集体。[95]


PrPc核磁共振结构的其他研究表明,这些残基(~ 108–189)包含大部分折叠结构域,包括β链、前两个α螺旋和连接它们的环/转区,但不包括螺旋ⅲ。[93]PrPC本身的环路/转弯结构中的微小变化在转换中也很重要。[97]在另一项研究中,里克等人(Riek et al)表明,环区上游的两个小β链区充当了PrPc中的环/匝和α螺旋结构向β片构象转化的成核位点。[89]


从PrPc分子之间的相互作用来看,疏水相互作用在β-片的形成中起着至关重要的作用,β-片是PrPc的标志,因为β-片使多肽链片段非常接近。[98]事实上,库兹涅佐夫和拉科夫斯基(Kutznetsov and Rackovsky) [99]表明人类PrPc中促进疾病的突变具有显著增加局部疏水性的统计学趋势。

体外实验表明,错误折叠的动力学有一个初始滞后期,随后是纤维形成的快速生长期。[100] PrPC在最终成为淀粉样原纤维的一部分之前,可能会经历一些部分展开或降解的中间状态。[88]

4 参与模式编辑





Folding@home参与者的另一个重要特征是大部分参与者为男性。[105] 同样在其他分布式项目中也如此。此外,许多参与者是从事基于计算机和技术的工作和职业。[105][109][110]


4.1 性能


2007年9月16日,在很大程度上由于PlayStation 3控制台的参与,Folding@home项目正式达到了比一个本机petaFLOPS(千兆位触发器)更高的持续性能水平,成为第一个这样做的计算系统。[112][113]当时500强最快的超级计算机是BlueGene/L,0.280千兆次。[114]第二年,2008年5月7日,该项目达到了持续的性能水平,高于两个petaFLOPS,[115]随后分别在2008年8月[116][117]和2008年9月28日达到了三个和四个本地petaFLOPS。[118]2009年2月18日,Folding@home实现了五个本地petaFLOPS,[119][120][121]是第一个满足这五个级别的计算项目。[122][123]相比之下,2008年11月最快的超级计算机是IBM的Roadrunner,速度为1.105千兆次。2011年11月10日,Folding@home的性能超过了6个本地petaFLOPS,相当于近8个x86petaFLOPS。[113][124]2013年5月中旬,Folding@home获得了超过7个本机千兆位触发器,相当于14.87个x86千兆位触发器。随后在6月21日,它达到了8个本机千兆位触发器,随后在同年9月9日达到了9个,拥有17.9个x86千兆位触发器。[125]2016年5月11日,Folding@home宣布,它正朝着100 x86千兆位的目标迈进。[126]

4.2 积分




5 软件编辑


5.1 工作单位

工作单元是要求客户处理的蛋白质数据。工作单元是马尔可夫状态模型中状态之间模拟的一部分。志愿者的电脑下载并完全处理完工作单元后,它会返回到Folding@home服务器,然后由该服务器向志愿者发放积分。这个循环会自动重复。[132]所有工作单位都有相关的截止日期,如果超过该截止日期,用户可能无法获得积分,该单位将自动重新颁发给另一个参与者。由于蛋白质折叠是连续发生的,并且许多工作单元是从它们的前身生成的,如果一个工作单元在一段合理的时间后没有返回,这就允许整个模拟过程正常进行。由于这些截止日期,Folding@home的最低系统要求是一个奔腾3 450兆赫的中央处理器与流式SIMD扩展(SSE)。[36] 然而,高性能客户端的工作单元的截止时间比单处理器客户端短得多,因为科学利益的一个主要部分取决于快速完成模拟。[134]

在公开发布之前,工作单元要经历几个质量保证步骤,以防止有问题的步骤完全可用。这些测试阶段包括内部测试、测试和高级测试,直到最终完全发布。[135] Folding@home的工作单元通常只处理一次,除非在处理过程中出现罕见的错误。如果这种情况发生在三个不同的用户身上,设备将自动退出分发。[136][137] Folding@home支持论坛可用于区分问题硬件和坏工作单元引起的问题。[138]

5.2 核心

专门的分子动力学程序,称为“FahCores”,通常缩写为“Cores”,在工作单元上执行计算,作为后台进程。Folding@home的大部分内核都是基于GROOMACS,[132] 这是最快、最流行的分子动力学软件包之一,它主要由手动优化的汇编语言代码和硬件优化组成。[139][140]虽然GROOMACS是开源软件,潘德实验室和GROOMACS开发者之间也有合作,但是Folding@home使用了一个开源许可证来帮助确保数据的有效性。[141]活性较低的内核包括ProtoMol和GREEP。Folding@home使用了AMBER、CPMD、德斯蒙德和TINKER,但这些已经退役,不再服役。[142][143][144]这些核中的一些执行显式溶剂化计算,其中周围的溶剂(通常是水)被逐个原子地模拟;而另一些实施隐式溶剂化方法,其中溶剂被视为数学连续体。[145][146]核心与客户分离,使科学方法能够自动更新,而无需客户更新。内核定期创建计算检查点,这样,如果它们被中断,就可以在启动时从该点恢复工作。[132]

5.3 客户

Folding@home参与者在他们的个人电脑上安装一个客户端程序。用户与客户端交互,客户端在后台管理其他软件组件。通过客户端,用户可以暂停折叠过程、打开事件日志、检查工作进度或查看个人统计数据。[147]计算机客户端以非常低的优先级在后台连续运行,使用空闲的处理能力,因此正常的计算机使用不受影响。[130][36]最大CPU使用量可以通过客户端设置进行调整。[147][148] 客户端连接到Folding@home服务器,检索工作单元,还可以下载适合客户端设置、操作系统和底层硬件架构的内核。处理后,工作单元返回到Folding@home服务器。计算机客户端是为单处理器和多核处理器系统以及图形处理单元量身定制的。每种硬件架构的多样性和强大功能使Folding@home能够及时(在几周或几个月而不是几年内)高效完成多种类型的模拟,这具有重要的科学价值。这些客户一起就允许研究人员研究以前被认为难以采用计算来解决的生物医学问题。[32][132][134]

专业软件开发人员负责Folding@home的大部分代码,包括客户端和服务器端。开发团队包括英伟达、ATI、索尼和大锅开发公司(Cauldron Development)的程序员。[149]客户端只能从官方的Folding@home网站或其商业伙伴处下载,并且只能与Folding@home电脑文件交互。他们将通过斯坦福的Folding@home数据服务器上传和下载数据(通过端口8080,以80作为替代),并使用2048位数字签名验证通信。[36][150] 虽然客户端的图形用户界面是开源的,[151] 但客户端是以安全性和科学完整性为理由的专有软件。[152][153][154]

然而,这种使用专有软件的基本原理是有争议的,因为尽管许可证可以在法律领域追溯执行,但它实际上并不阻止对可执行二进制文件的修改(也称为修补)。同样,纯二进制分发并不能防止恶意修改可执行二进制代码,无论是通过中间人攻击,同时通过互联网下载,[155]还是通过由第三方重新分发二进制代码,这些二进制代码先前已被修改为二进制状态(即打补丁),[156] 或通过反编译译[157] 并在修改后重新编译它们。[158][159]除非二进制文件(和传输通道)已签名,并且接收人/系统能够验证数字签名,在这种情况下,不必要的修改应该是可检测的,但并不总是这样。[160]无论哪种方式,由于在Folding@home的情况下,客户端软件处理的输入数据和输出结果都是数字签名的,[36][150] 因此可以独立于客户端软件本身的完整性来验证工作的完整性。

Folding@home使用Coms软件库进行联网。[132][149] Folding@home于2000年10月1日启动,是首个针对生物分子系统的分布式计算项目。[161]它的第一个客户端是一个屏幕保护程序,它可以在电脑不用时运行。[162][163]2004年,潘德实验室与大卫·安德森( David P. Anderson)合作,在开源BOINC框架上测试一个补充客户端。该客户于2005年4月被发布到封闭测试版;[164]然而,这种方法变得行不通,并于2006年6月被搁置。[165]




Folding@home的第一代图形处理器客户端(GPU1)于2006年10月2日在向公众发布,[165] 其计算速度是基于中央处理器的GROMACS的同类产品的20-30倍。[169]这是通用处理器首次用于分布式计算或主要分子动力学计算。[170][171] GPU1为研究人员提供了开发GPU软件的丰富知识和经验,但由于DirectX编程接口的科学误差,2008年4月10日,它被第二代客户端GPU2所取代。[169][172]继GPU2推出后,GPU1于6月6日正式退役。[169]与GPU1相比,GPU2在科学上更加可靠和高效,运行在ATI和CUDA支持的Nvidia通用处理器上,支持更高级的算法、更大的蛋白质和蛋白质模拟的实时可视化。[173][174]随后,第三代Folding@home的GPU客户端(GPU3)于2010年5月25日发布。虽然与GPU2向后兼容,但GPU3在科学能力上更稳定、高效和灵活,[175]并在OpenCL框架上使用OpenMM。[175][176] 虽然这些GPU3客户端本身不支持操作系统Linux和macOS,但拥有英伟达显卡的Linux用户能够通过Wine软件应用程序运行它们。[177][178] GPU仍然是Folding@home中FLOPS浮点运算的最强大平台。截至2012年11月,GPU客户端占整个项目x86 FLOPS吞吐量的87%。[179]

在Linux下对Nvidia和AMD显卡的本机支持是用FahCore 17引入的,它使用的是OpenCL而不是CUDA。[180]

PlayStation 3

PlayStation 3平台的Life With PlayStation客户端展示了蛋白质被折叠的三维动画。

PlayStation 3s的强大功能。在其成立之初,其主要流式细胞处理器在某些计算方面的速度是个人电脑的20倍,处理能力在Xbox 360等其他系统上是找不到的。[32][181] PS3的高速和高效率为根据阿姆达尔定律( Amdahl's law)进行有价值的优化带来了其他机会,并极大地改变了计算效率和整体精度之间的权衡,允许以很少的额外计算成本使用更复杂的分子模型。[182] 这使得Folding@home能够运行生物医学计算,否则这些计算是不可行的。[183]

PS3客户端是索尼和潘德实验室合作开发的,于2007年3月23日首次作为独立客户端发布。[32][184]它的发布使Folding@home成为第一个使用PS3的分布式计算项目。[185]第二年9月18日,PS3客户端成为了PlayStation推出后的生活频道。[186][187]在推出时,客户端可以执行的计算类型介于中央处理器的灵活性和图形处理器的速度之间。[132] 然而,与运行在个人电脑上的客户端不同,用户在运行Folding@home时无法在PS3上执行其他活动。[183]PS3的统一控制台环境使技术支持变得更加容易,并使Folding@home更加用户友好。[32] PS3还能够将数据快速传输到图形处理器,图形处理器用于当前蛋白质动态的实时原子级可视化。[182]

2012年11月6日,索尼终止了对Folding@home PS3客户端的支持,以及PlayStation Life提供的其他服务。在其五年零七个月的生命周期中,超过1500万用户为Folding@home贡献了超过1亿小时的计算时间,极大地帮助了该项目的疾病研究。在与潘德实验室讨论后,索尼决定终止该应用。潘德认为PlayStation 3客户端是该项目的“游戏改变者”。[188][189][190]


Folding@home可以利用现代多核处理器的并行计算能力。同时使用几个中央处理器内核的能力允许更快地完成完整的模拟。这些中央处理器内核协同工作,完成单个工作单元的速度要比标准的单处理器客户端快得多。这种方法在科学上很有价值,因为它能够在相同的时间内执行更长的仿真轨迹,并且降低了将大型仿真扩展到许多独立处理器的传统性困难。[191] 2007年发表在《分子生物学杂志》上的一篇论文依赖多核处理来模拟绒毛蛋白部分的折叠,其长度大约是单处理器客户端的10倍,与实验折叠速率一致。[192]

2006年11月,第一代对称多处理(SMP)客户端被公开发布用于开放测试,称为SMP1。[165]这些客户端使用消息传递接口(MPI)通信协议进行并行处理,因为当时GROMACS内核不是设计用于多线程的。[134] 这是分布式计算项目第一次使用MPI。[193]虽然客户端在基于Unix的操作系统(如Linux和macOS)中表现良好,但在windows系统下却很麻烦。[191][193]2010年1月24日,第二代SMP客户端和SMP1的后继者SMP2作为开放测试版发布,并以更可靠的基于线程的实现取代复杂的MPI。[129][149]



在Windows 7下运行的V7客户端初始模式的示例图。除了各种控件和用户详细信息外,V7客户端还呈现了工作单元信息,例如它的状态,计算进度,ETA,信用点,ID号和描述。

V7客户端是第七代也是最新一代的Folding@home客户端软件,是对以前的Windows、macOS和Linux操作系统客户端的完全重写和统一。[198][199] 它于2012年3月22日发布。[200]像它的前辈一样,V7可以在后台以非常低的优先级运行Folding@home,允许其他应用程序根据需要使用中央处理器资源。它的设计是为了让新手更容易安装、启动和操作,并为研究人员提供比以前客户更大的科学灵活性。[201] V7使用Trac来管理它的bug票证,这样用户就可以看到它的开发过程并提供反馈。[199]

V7由四个集成元件组成。用户通常与V7的开源图形用户界面交互,名为FAHControl。[151][202]它具有新手、高级和专家用户界面模式,并且能够从一台计算机监控、配置和控制许多远程折叠客户端。FAHControl指导FAHClient,这是一个后端应用程序,它依次管理每个FahClient。每个插槽都可以替代以前不同的Folding@home v6单处理器、SMP或GPU计算机客户端,因为它可以独立下载、处理和上传工作单元。FAHViewer函数以PS3的浏览器为模型,显示当前正在加工的蛋白质的实时三维渲染模型 (如果有的话)。[198][199]

谷歌浏览器(Google Chrome

2014年,谷歌浏览器和谷歌网络浏览器的客户端发布,允许用户在他们的网络浏览器中运行Folding@home。客户端在基于Google Chrome上使用谷歌的本地客户端(NaCl)功能,在用户机器上的沙盒中以接近本地的速度运行Folding@home代码。[203]


2015年7月,一款安卓手机客户端在谷歌播放器上发布,适用于运行安卓4.4 KitKat或更高版本的设备。[204][205]

6 与其他分子模拟器的比较编辑

Rosetta@home是一个面向蛋白质结构预测的分布式计算项目,是最精确的三级结构预测器之一。[206][207] Rosetta软件中的构象状态可用于初始化马尔可夫状态模型,作为Folding@home模拟的起点。[18] 相反,结构预测算法可以从热力学和动力学模型以及蛋白质折叠模拟的取样方面得到改进。[208] 由于Rosetta只试图预测最终折叠状态,而不是折叠如何进行,Rosetta@home和Folding@home是互补的,并解决相当不同的分子问题。[18][209]

安东(Anton )是为分子动力学模拟而建造的专用超级计算机。2011年10月,安东和Folding@home是两个最强大的分子动力学系统。[210] Anton 的独特之处在于它能够产生计算成本高昂的单个超长分子轨道,[211] 例如2010年达到毫秒级的轨道。[212][213] 这些长轨迹可能对某些类型的生化问题特别有帮助。[214][215] 但是,Anton 不使用马尔可夫状态模型进行分析。2011年,潘德实验室从两个100微秒Anton 模拟中构建了一个质谱,并发现了Anton 传统分析中不可见的替代折叠路径。他们得出的结论是,由有限数量的长轨道构建的多管轨迹和由许多短轨道组装的多管轨迹之间没有什么区别。[211]2011年6月,Folding@home开始增加Anton 模拟的采样,以更好地确定其方法与Anton 的方法相比如何。[216][217] 然而,不像Folding@home的较短轨迹更适合分布式计算和其他并行化方法,较长轨迹不需要自适应采样来充分采样蛋白质的相空间。因此,Anton 和Folding@home的模拟方法的结合有可能提供对该空间更彻底的采样。[211]

