Rosetta@home是一个分布式计算项目,用于在伯克利开放式网络计算基础设施(BOINC)平台上进行蛋白质结构预测,由华盛顿大学贝克实验室运行。Rosetta Rosetta@home旨在预测蛋白质-蛋白质对接,并借助平均超过210万亿次(截至2016年7月29日)的约6万台主动志愿计算机来设计新蛋白质[1]。 Foldit是一款Rosetta@Home视频游戏,旨在通过众包方式实现这些目标。尽管该项目的大部分面向基础研究,以提高蛋白质组学方法的准确性和稳健性,RosettaRosetta@home也在疟疾、阿尔茨海默病和其他病理学方面进行应用研究[2]。
像所有BOINC项目一样,Rosetta@home使用志愿者计算机中空闲的计算机处理资源来对单个工作单元进行计算。完成的结果被发送到中央项目服务器,在那里它们被验证并被吸收到项目数据库中。该项目是跨平台的,运行在多种硬件配置上。用户可以在Rosetta@home屏幕保护程序上查看他们个人蛋白质结构预测的进展。
除了与疾病相关的研究之外,Rosetta Rosetta@home网络还是结构生物信息学新方法的测试框架。在Rosetta Rosetta@home的大型多样的志愿者电脑上充分开发并证明稳定后,这些方法被用于其他基于RosettaRosetta的应用,如Rosetta多克和人类蛋白质组折叠项目。Rosetta Rosetta@home开发的新方法的两个特别重要的测试是蛋白质结构预测技术的关键评估(CASP)和相互作用预测的关键评估(CAPRI)实验,这两个实验分别评估蛋白质结构预测和蛋白质-蛋白质对接预测的最新技术。Rosetta@home始终是最重要的停靠预测因子之一,也是现有的最佳三级结构预测因子之一[3]。
Rosetta@home应用程序和BOINC分布式计算平台可用于Windows操作系统、Linux和macOS ,BOINC还在其他几个平台上运行,例如FreeBSD[4]。参与Rosetta Rosetta@home需要一个时钟速度至少为500兆赫的中央处理器、200兆字节的可用磁盘空间、512兆字节的物理内存和互联网连接[5]。截至2016年7月20日,Rosetta迷你应用程序的当前版本为3.73[6]。目前推荐的BOINC程序版本是7.6.22[4]。标准超文本传输协议(HTTP)(端口80)用于用户的BOINC客户端和华盛顿大学的Rosetta Rosetta@home服务器之间的通信;密码交换时使用HTTPS(端口443)。BOINC客户端的远程和本地控制使用端口31416和端口1043,如果它们在防火墙后,可能需要特别解锁[7]。包含单个蛋白质数据的工作单元被从位于华盛顿大学贝克实验室的服务器分配到志愿者的计算机上,然后志愿者的计算机计算指定蛋白质的结构预测。为了避免对给定蛋白质的重复结构预测,每个工作单元都用随机的种子号初始化。这给了每个预测一个沿着蛋白质能量景观的独特下降轨迹[8]。Rosetta Rosetta@home的蛋白质结构预测是给定蛋白质能量格局中全球最小值的近似值。该全局最小值代表蛋白质最有利的构象,即其天然状态。
Rosetta@home图形用户界面(图形用户界面)的一个主要功能是屏幕保护程序,显示当前工作单元在模拟蛋白质折叠过程中的进度。在当前屏幕保护程序的左上角,目标蛋白质在寻找最低能量结构时采用不同的形状(构象)。右边是最近被接受的结构。右上角显示了当前诱饵的最低能量构象;下面是蛋白质的真实或天然结构,如果已经确定的话。屏幕保护程序中包含三个图形。在中间附近,显示了一个可接受模型的热力学自由能图,该图随着可接受模型的变化而波动。被接受的模型的均方根偏差(RMSD)图显示在最右边,该图衡量了被接受的模型与本地模型在结构上的相似程度。在可接受的能量图的右侧和RMSD图的下方,随着模型的逐步完善,这两个函数的结果被用于产生能量与RMSD图[9]。
像所有BOINC项目一样,Rosetta@home在用户计算机的后台运行,在登录主机操作系统的帐户时或之前使用空闲的计算机资源。当其他应用程序需要资源时,该程序从中央处理器中释放资源,这样就不会影响正常的计算机使用。许多程序设置可以通过用户帐户首选项来指定,包括:程序可以使用的最大CPU资源百分比(控制以持续容量运行的计算机的功耗或热量产生)、程序可以运行的时间等等。
运行在Rosetta@home网络上的软件Rosetta用C++重写,以允许比用Fortran编写的原始版本更容易的开发。这个新版本是面向对象的,于2008年2月8日发布[6][10] 。RosettaRosetta代码的开发是由RosettaRosetta公共组织完成的[11]。该软件免费授权给学术界,制药公司付费使用[11]。
随着基因组测序项目的增多,科学家可以推断出许多在细胞内发挥功能的蛋白质的氨基酸序列或一级结构。为了更好地理解蛋白质的功能并帮助合理的药物设计,科学家需要知道蛋白质的三维三级结构。
蛋白质三维结构目前是通过x光结晶学或核磁共振波谱实验确定的。这个过程很慢(可能需要几周甚至几个月才能首次弄清楚如何结晶蛋白质),而且成本很高(大约每种蛋白质10万美元)[12]。不幸的是,新序列的发现速度远远超过了结构确定的速度——在国家生物技术信息中心(NCBI)非冗余蛋白质数据库中现有的740万个蛋白质序列中,只有不到52000个蛋白质的三维结构被解决并储存在蛋白质数据库中,蛋白质数据库是蛋白质结构信息的主要储存库[13]。 RosettaRosetta@home的主要目标之一是以与现有方法相同的准确度预测蛋白质结构,但需要的时间和金钱要少得多。RosettaRosetta@home还开发了一些方法来确定膜蛋白(如G蛋白偶联受体[14]的结构和对接,这些方法很难用传统技术如x光结晶学和核磁共振波谱进行分析,但却代表了现代药物的大多数靶标。
蛋白质结构预测的进展在半年一次的蛋白质结构预测技术关键评估(CASP)实验中进行评估,来自世界各地的研究人员试图从蛋白质的氨基酸序列中推导出蛋白质的结构。在这个有时具有竞争性的实验中,高分群体被认为是蛋白质结构预测的事实上的标准承担者。Rosetta是Rosetta@home的基础程序,自2002年CASP5以来一直在使用。在2004年CASP6实验中,RosettaRosetta在提交的CASP靶T0281模型中首次提出了接近原子水平的分辨率、从头计算蛋白质结构预测,创造了历史[15]。从头建模被认为是蛋白质结构预测的一个特别困难的类别,因为它不使用来自结构同源性的信息,并且必须依赖来自序列同源性的信息和建模蛋白质内的物理相互作用。Rosetta@home自2006年以来一直用于CASP,在CASP7中,它是每一类结构预测的顶级预测因子之一[16][17][18]。这些高质量的预测是由RosettaRosetta@Home志愿者提供的计算能力实现的[19]。计算能力的提高使得Rosetta Rosetta@home能够对构象空间的更多区域(蛋白质可能呈现的形状)进行采样,根据莱文塔尔悖论,预计构象空间将随着蛋白质长度呈指数级增长。
Rosetta@home也用于蛋白质-蛋白质对接预测,它决定了多种复合蛋白质的结构或四级结构。这种蛋白质相互作用影响许多细胞功能,包括抗原抗体和酶抑制剂结合以及细胞进出口。确定这些相互作用对药物设计至关重要。RosettaRosetta用于相互作用预测的临界评估(CAPRI)实验,该实验评估蛋白质对接区的状态,类似于CASP如何测量蛋白质结构预测的进展。Rosetta Rosetta@home项目志愿者提供的计算能力被认为是RosettaRosetta在CAPRI的表现的一个主要因素,它的对接预测是最准确和完整的[20]。
2008年初,RosettaRosetta被用于计算设计一种蛋白质,其功能在自然界中从未被观察到[21]。 这部分是受2004年一篇高调论文的撤回启发,该论文最初描述了一种蛋白质的计算设计,该蛋白质相对于其天然形式具有更高的酶活性[22]。大卫·贝克小组2008年的研究论文描述了蛋白质是如何制造的,该论文引用了Rosetta Rosetta@home提供的计算资源,代表了这种蛋白质设计方法概念的重要证明[21]。 这种蛋白质设计可能在药物发现、绿色化学和生物修复方面有未来的应用[21]。
除了预测蛋白质结构、对接和设计的基础研究之外,Rosetta@home还用于直接疾病相关的研究[23]。大卫·贝克的《Rosetta Rosetta@Home杂志》描述了许多小型研究项目[24]。截至2014年2月,论坛正在更新关于最近出版物的信息和对工作的简短描述[25]。论坛帖子自2016年起不再使用,研究的新闻可以在项目的一般新闻部分找到[26]。
RosettaRosetta软件套件的一个组件,RosettaRosetta设计,用于准确预测淀粉样蛋白的哪些区域最有可能形成淀粉样纤维[27]。通过提取感兴趣蛋白质的六肽(六个氨基酸长的片段),并选择与已知形成六肽的原纤维的结构相似的最低能量匹配,Rosetta设计能够识别出形成原纤维的可能性是随机蛋白质的两倍的肽[28]。Rosetta Rosetta@home在同一项研究中被用来预测淀粉样β蛋白的结构,淀粉样β蛋白是一种纤维形成蛋白,被认为会导致阿尔茨海默病[29]。RosettaRosetta设计的蛋白质已经产生了初步但尚未公布的结果,这些蛋白质可以防止原纤维的形成,尽管还不知道它是否能预防这种疾病[30]。
Rosetta的另一个组成部分,Rosetta多克[31][32][33] ,被用于结合实验方法来模拟构成炭疽毒素的三种蛋白质之间的相互作用——致死因子(LF)、水肿因子(EF)和保护性抗原(PA)。计算机模型准确预测了低频和磷酸之间的对接,有助于确定各自蛋白质的哪些结构域参与低频-磷酸复合物。这一见解最终被用于改进炭疽疫苗的研究[34][35]。
罗赛多克用于模拟抗体(免疫球蛋白G)和由感冒疮病毒,单纯疱疹病毒1 (HSV-1)表达的表面蛋白之间的对接,后者用于降解抗病毒抗体。Rosetta多克预测的蛋白质复合物与特别难以获得的实验模型非常一致,导致研究人员得出结论,对接方法有可能解决x光结晶学在蛋白质-蛋白质界面建模方面的一些问题[36]。
作为比尔及梅林达盖茨基金会1940万美元赠款资助的研究的一部分[37],Rosetta@home已被用于设计多种可能的人类免疫缺陷病毒疫苗[38][39]。
在与全球健康大挑战倡议有关的研究中[40],Rosetta被用于计算设计新的归巢核酸内切酶蛋白,这种蛋白可以消灭冈比亚按蚊或使蚊子无法传播疟疾[41]。 像归巢核酸内切酶一样,能够专门模拟和改变蛋白质-脱氧核糖核酸的相互作用,这使得像Rosetta这样的计算蛋白质设计方法在基因治疗(包括可能的癌症治疗)中发挥了重要作用[23][42]。
Rosetta@home研究人员设计了一种称为新白细胞介素-2/15的白细胞介素-2受体激动剂,它不与受体的α亚单位相互作用。这种免疫信号分子可用于癌症治疗。虽然天然白细胞介素-2因与α亚单位相互作用而中毒,但设计的蛋白质更安全,至少在动物模型中是如此[43]。
最初由贝克实验室在1998年引入,作为结构预测的一种从头开始的方法[44] ,Rosetta后来已经扩展到几个开发流程和不同的服务。Rosetta平台得名于Rosetta石碑,因为它试图破译蛋白质氨基酸序列的结构“意义”[45]。Rosetta首次亮相七年多后,Rosetta@home项目于2005年10月6日发布(即宣布不再测试)[6]。参与Rosetta项目初期开发的许多研究生和其他研究人员后来搬到了其他大学和研究机构,并随后加强了Rosetta项目的不同部分。
Rosetta设计(RosettaDesign),一种基于Rosetta的蛋白质设计计算方法,始于2000年的一项重新设计蛋白质折叠途径的研究[46]。2002年,Rosetta设计被用于设计Top7,一种93个氨基酸长的α/β蛋白质,其整体折叠在自然界中从未有过。Rosetta预测这种新的构象在由x光晶体学确定的结构的1.2 RMSD以内,代表了异常精确的结构预测[47]。 Rosetta和Rosetta设计获得了广泛的认可,因为它们是第一个设计和准确预测这种长度的新蛋白质结构的人,正如2002年在《科学》[48][49] 杂志上发表的描述双重方法的论文所反映的那样,被超过240篇其他科学文章引用[50]。 该项研究的有形产品Top7在2006年10月被评为RCSB·PDB的“月度分子”[51]; Rosetta@home标志展示了其预测晶体结构和x光晶体结构各自核心(残基60–79)的叠加[15]。
布莱恩·库尔曼(Brian Kuhlman),大卫·贝克实验室前博士后研究员,现为[教堂山北卡罗来纳大学副教授[52], 提供Rosetta设计在线服务[53]。
Rosetta多克是在2002年第一次CAPRI实验中作为贝克实验室的蛋白质-蛋白质对接预测算法添加到Rosetta软件套件中的[54]。在该实验中,Rosetta多克对链球菌化脓性外毒素A和T细胞受体β链之间的对接进行了高精度预测,并对猪α-淀粉酶和骆驼抗体之间的复合物进行了中等精度预测。虽然Rosetta多克方法在七种可能的预测中仅做出了两种可以接受的准确预测,但这足以在第一次CAPRI评估中将其列为十九种预测方法中的第七种[54]。
Rosetta多克的开发在随后的CAPRI回合中分成了两个分支,杰弗里·格雷在华盛顿大学为Rosetta多克打下了基础,他在约翰·霍普金斯大学的新职位上继续研究这种方法。贝克实验室的成员在格雷不在时进一步开发了Rosetta多克。这两个版本在侧链建模、诱饵选择和其他方面略有不同[33][55]。尽管存在这些差异,贝克和格雷方法在第二次CAPRI评估中表现良好,分别在30个预测组中排名第五和第七[56]。杰弗里·格雷(Jeffrey Gray)的Rosetta多克服务器是一项免费对接预测服务,供非商业用途[57]。
2006年10月,Rosetta多克被整合到Rosetta@home。该方法仅使用蛋白质骨架,使用快速、粗略的对接模型阶段。随后是缓慢的全原子精细化阶段,其中两种相互作用蛋白质相对于彼此的取向以及蛋白质-蛋白质界面的侧链相互作用被同时优化,以找到最低能量构象[58]。Rosetta@家庭网络提供的计算能力大幅提高,加上主干灵活性和环路建模的修正折叠树表示法,使Rosetta多克在第三次CAPRI评估的63个预测组中排名第六[3][20]。
Rosetta(Rosetta Beta)服务器是贝克实验室为非商业从头计算和比较建模提供的自动化蛋白质结构预测服务[59]。自2002年CASP5以来,它作为自动预测服务器参加了半年一次的CASP实验,在自动服务器预测类别中表现最佳[60]。 Robetta此后参加了CASP6和7的比赛,在这两个项目中,自动化服务器组和人工预测组的表现均优于平均水平[18][61][62]。它还参与CAMEO3D连续评估。
在对CASP6的蛋白质结构建模时,Robetta首先使用BLAST、PSI-BLAST和3D-Jury搜索结构同源物,然后通过将序列与Pfam数据库中的结构家族相匹配,将目标序列解析为其单个结构域,或独立折叠的蛋白质单位。然后,具有结构同源物的结构域遵循“基于模板的模型”(即同源建模)方案。在这里,贝克实验室的内部比对程序,K*sync,产生一组序列同源物,每一个序列同源物都用Rosetta从头方法建模,以产生诱饵(可能的结构)。通过采用由低分辨率Rosetta能量函数确定的最低能量模型来选择最终的结构预测。对于没有检测到结构同源物的区域,遵循从头协议,其中从一组生成的诱饵中选择最低能量模型作为最终预测。然后将这些结构域预测连接在一起,研究蛋白质内的结构域间、三级相互作用。最后,使用蒙特卡罗构象搜索协议对侧链贡献进行建模[63]。
在CAPS8中,Rosetta被扩充以使用Rosetta的高分辨率全原子精细化方法[64], 缺少这种方法被认为是Rosetta不如CAPS7中Rosetta@Home网络精确的主要原因[19]。 在CASP11中,增加了一种通过相关蛋白质残基的共同进化来预测蛋白质接触图的方法,称为GREMLIN,这使得更多的新的成功成为可能[65]。
2008年5月9日,在Rosetta@home用户提出分布式计算程序的交互式版本后,贝克实验室公开发布了Foldit,这是一款基于Rosetta平台的在线蛋白质结构预测游戏[66]。截至2008年9月25日,Foldit拥有超过59,000名注册用户[67]。该游戏给用户提供了一套控制(例如摇动、摆动、重建)来操纵目标蛋白的主链和氨基酸侧链,使其形成更具能量优势的构象。用户可以作为独唱者单独工作,也可以作为进化者集体工作,当他们改进他们的结构预测时,在两个类别下累积点数[68]。用户也可以通过决斗功能单独与其他用户竞争,在决斗功能中,20次移动后能量结构最低的玩家获胜。
有几个分布式计算项目的研究领域与Rosetta@home类似,但研究方法不同:
在所有涉及蛋白质研究的主要分布式计算项目中,Folding@home是唯一一个没有使用BOINC平台的项目[69][70][71]。Rosetta“家”和折叠“家”都研究蛋白质错误折叠疾病,如阿尔茨海默氏病,但折叠“家”做得更多[72][73]。Foldit@home几乎完全使用全原子分子动力学模型来理解蛋白质折叠(或潜在错误折叠,随后聚集导致疾病)的方式和原因[74][75]。换句话说,Folding@home的强项是模拟蛋白质折叠的过程,而Rosetta@home的强项是计算蛋白质设计和预测蛋白质结构和对接。
Rosetta“家”的一些结果被用作一些Foldit@Home项目的基础。Rosetta提供了最有可能的结构,但是还不确定这是不是分子的形式或者它是否可行。Foldit@home然后可以用来验证Rosetta@home的结果,并且可以提供附加的原子级信息,以及分子如何改变形状的细节[75][76]。
这两个项目在计算能力和主机多样性方面也有显著差异[77],Foldit@Home的计算能力几乎是Rosetta“家庭”的108倍[1]。
人类蛋白质组折叠项目(HPF)的第一阶段和第二阶段(世界社区网格的一个子项目)都使用Rosetta程序对各种基因组进行结构和功能注释[78][79]。尽管他现在用它为生物学家创建数据库,但人类蛋白质组折叠项目的首席科学家理查德·博诺(Richard Bonneau)在获得博士学位的同时,积极参与了大卫·贝克实验室Rosetta的最初开发[80]。关于HPF1、HPF2和Rosetta@home之间关系的更多信息,请访问理查德·博诺的网站[81]。
像Rosetta“家”一样,Predictor@Home专门从事蛋白质结构预测[82]。当Rosetta@home使用Rosetta程序进行结构预测时,Predictor@home使用数据断言方法[83]。2009年,Predictor@home关闭。
BOINC上其他与蛋白质相关的分布式计算项目包括:QMC@home, Docking@home, POEM@home、SIMAP和TANPAKU。RALPH@home,Rosetta@home alpha项目,在新的应用程序版本、工作单元和更新进入Rosetta@home之前进行测试,也在BOINC上运行[84]。
Rosetta@home的研究依赖于各个项目成员捐赠的计算能力。截至2014年4月18日,来自150个国家的约26,900名用户是Rosetta@home的活跃成员,他们共同贡献了约66,000台计算机的空闲处理器时间,平均性能超过83万亿次[1]。
用户被授予BOINC学分作为他们贡献的衡量标准。给予每个工作单位的信用是为该工作单位生产的诱饵数量乘以所有计算机主机为该工作单位提交的诱饵的平均索赔信用。该定制系统旨在解决标准BOINC客户端和优化BOINC客户端授予用户的信用之间的显著差异,以及在视窗和Linux操作系统上运行Rosetta@home的用户之间的信用差异[85]。Rosetta@home的每秒中央处理器工作的信贷额度低于大多数其他BOINC项目[86]。就信贷总额而言,Rosetta@home在40多个投资理事会项目中排名第十三[87]。
Rosetta@home用户预测提交给CASP实验的蛋白质结构,其结果在科学出版物中得到认可[19]。在Rosetta@主页上,预测给定工作单位最低能量结构的用户以及他们所属的任何团队都被列为当天的预测者[88]。每天都从创建Rosetta@home档案的用户中随机选择一名每日用户,并将其放在主页上[89]。
^de Zutter W. "Rosetta@home: Credit overview". boincstats.com. Archived from the original on October 7, 2011. Retrieved October 18, 2011..
^"What is Rosetta@home?". Rosetta@home forums. University of Washington. Archived from the original on September 13, 2008. Retrieved September 7, 2008..
^Lensink MF, Méndez R, Wodak SJ (December 2007). "Docking and scoring protein complexes: CAPRI 3rd Edition". Proteins. 69 (4): 704–18. doi:10.1002/prot.21804. PMID 17918726..
^"Download BOINC client software". BOINC. University of California. 2008. Retrieved December 1, 2008..
^"Rosetta@home: Recommended System Requirements". Rosetta@home. University of Washington. 2008. Archived from the original on September 25, 2008. Retrieved October 7, 2008..
^"Rosetta@home: News archive". Rosetta@home. University of Washington. 2016. Retrieved July 20, 2016..
^"Rosetta@home: FAQ (work in progress) (message 10910)". Rosetta@home forums. University of Washington. 2006. Retrieved October 7, 2008..
^Kim DE (2005). "Rosetta@home: Random Seed (message 3155)". Rosetta@home forums. University of Washington. Retrieved October 7, 2008..
^"Rosetta@home: Quick guide to Rosetta and its graphics". Rosetta@home. University of Washington. 2007. Archived from the original on September 24, 2008. Retrieved October 7, 2008..
^Kim DE (2008). "Rosetta@home: Problems with minirosetta version 1.+ (Message 51199)". Rosetta@home forums. University of Washington. Retrieved September 7, 2008..
^"Rosetta Commons". RosettaCommons.org. 2008. Archived from the original on September 15, 2008. Retrieved October 7, 2008..
^Bourne PE, Helge W, eds. (2003). Structural Bioinformatics. Hoboken, NJ: Wiley-Liss. ISBN 978-0-471-20199-1. OCLC 50199108..
^"Yearly Growth of Protein Structures". RCSB Protein Data Bank. 2008. Retrieved November 30, 2008..
^Baker D (2008). "Rosetta@home: David Baker's Rosetta@home journal (message 55893)". Rosetta@home forums. University of Washington. Retrieved October 7, 2008..
^"Rosetta@home: Research Overview". Rosetta@home. University of Washington. 2007. Archived from the original on September 25, 2008. Retrieved October 7, 2008..
^Kopp J, Bordoli L, Battey JN, Kiefer F, Schwede T (2007). "Assessment of CASP7 predictions for template-based modeling targets". Proteins. 69 Suppl 8: 38–56. doi:10.1002/prot.21753. PMID 17894352..
^Read RJ, Chavali G (2007). "Assessment of CASP7 predictions in the high accuracy template-based modeling category". Proteins. 69 Suppl 8: 27–37. doi:10.1002/prot.21662. PMID 17894351..
^Jauch R, Yeo HC, Kolatkar PR, Clarke ND (2007). "Assessment of CASP7 structure predictions for template free targets". Proteins. 69 Suppl 8: 57–67. doi:10.1002/prot.21771. PMID 17894330..
^Das R, Qian B, Raman S, et al. (2007). "Structure prediction for CASP7 targets using extensive all-atom refinement with Rosetta@home". Proteins. 69 Suppl 8: 118–28. doi:10.1002/prot.21636. PMID 17894356..
^Wang C, Schueler-Furman O, Andre I, et al. (December 2007). "RosettaDock in CAPRI rounds 6–12". Proteins. 69 (4): 758–63. doi:10.1002/prot.21684. PMID 17671979..
^Jiang L, Althoff EA, Clemente FR, et al. (March 2008). "De novo computational design of retro-aldol enzymes". Science. 319 (5868): 1387–91. Bibcode:2008Sci...319.1387J. doi:10.1126/science.1152692. PMC 3431203. PMID 18323453..
^Hayden EC (February 13, 2008). "Protein prize up for grabs after retraction". Nature. doi:10.1038/news.2008.569..
^"Disease Related Research". Rosetta@home. University of Washington. 2008. Archived from the original on September 23, 2008. Retrieved October 8, 2008..
^Baker D (2008). "Rosetta@home: David Baker's Rosetta@home journal". Rosetta@home forums. University of Washington. Retrieved September 7, 2008..
^"Rosetta@home Research Updates". Boinc.bakerlab.org. Retrieved 2014-04-18..
^"News archive". Rosetta@home. Retrieved 10 May 2019..
^Kuhlman B, Baker D (September 2000). "Native protein sequences are close to optimal for their structures". Proceedings of the National Academy of Sciences of the United States of America. 97 (19): 10383–88. Bibcode:2000PNAS...9710383K. doi:10.1073/pnas.97.19.10383. PMC 27033. PMID 10984534..
^Thompson MJ, Sievers SA, Karanicolas J, Ivanova MI, Baker D, Eisenberg D (March 2006). "The 3D profile method for identifying fibril-forming segments of proteins". Proceedings of the National Academy of Sciences of the United States of America. 103 (11): 4074–78. Bibcode:2006PNAS..103.4074T. doi:10.1073/pnas.0511295103. PMC 1449648. PMID 16537487..
^Bradley P. "Rosetta@home forum: Amyloid fibril structure prediction". Rosetta@home forums. University of Washington. Retrieved September 7, 2008..
^Baker D. "Rosetta@home forum: Publications on R@H's Alzheimer's work? (message 54681)". Rosetta@home forums. University of Washington. Retrieved October 8, 2008..
^Wang C, Schueler-Furman O, Baker D (May 2005). "Improved side-chain modeling for protein–protein docking". Protein Science. 14 (5): 1328–39. doi:10.1110/ps.041222905. PMC 2253276. PMID 15802647..
^Gray JJ, Moughon S, Wang C, et al. (August 2003). "Protein–protein docking with simultaneous optimization of rigid-body displacement and side-chain conformations". Journal of Molecular Biology. 331 (1): 281–99. doi:10.1016/S0022-2836(03)00670-3. PMID 12875852..
^Schueler-Furman O, Wang C, Baker D (August 2005). "Progress in protein–protein docking: atomic resolution predictions in the CAPRI experiment using RosettaDock with an improved treatment of side-chain flexibility". Proteins. 60 (2): 187–94. doi:10.1002/prot.20556. PMID 15981249..
^Lacy DB, Lin HC, Melnyk RA, et al. (November 2005). "A model of anthrax toxin lethal factor bound to protective antigen". Proceedings of the National Academy of Sciences of the United States of America. 102 (45): 16409–14. Bibcode:2005PNAS..10216409L. doi:10.1073/pnas.0508259102. PMC 1283467. PMID 16251269..
^Albrecht MT, Li H, Williamson ED, et al. (November 2007). "Human monoclonal antibodies against anthrax lethal factor and protective antigen act independently to protect against Bacillus anthracis infection and enhance endogenous immunity to anthrax". Infection and Immunity. 75 (11): 5425–33. doi:10.1128/IAI.00261-07. PMC 2168292. PMID 17646360..
^Sprague ER, Wang C, Baker D, Bjorkman PJ (June 2006). "Crystal structure of the HSV-1 Fc receptor bound to Fc reveals a mechanism for antibody bipolar bridging". PLoS Biology. 4 (6): e148. doi:10.1371/journal.pbio.0040148. PMC 1450327. PMID 16646632..
^Paulson, Tom (July 19, 2006). "Gates Foundation awards $287 million for HIV vaccine research". Seattle Post-Intelligencer. Retrieved September 7, 2008..
^Liu Y, et al. (2007). "Development of IgG1 b12 scaffolds and HIV-1 env-based outer domain immunogens capable of eliciting and detecting IgG1 b12-like antibodies" (PDF). Global HIV Vaccine Enterprise. Archived from the original (PDF) on February 25, 2009. Retrieved September 28, 2008..
^Baker D. "David Baker's Rosetta@home journal archives (message 40756)". Rosetta@home forums. University of Washington. Retrieved September 7, 2008..
^"Homing Endonuclease Genes: New Tools for Mosquito Population Engineering and Control". Grand Challenges in Global Health. Retrieved September 7, 2008..
^Windbichler N, Papathanos PA, Catteruccia F, Ranson H, Burt A, Crisanti A (2007). "Homing endonuclease mediated gene targeting in Anopheles gambiae cells and embryos". Nucleic Acids Research. 35 (17): 5922–33. doi:10.1093/nar/gkm632. PMC 2034484. PMID 17726053..
^Ashworth J, Havranek JJ, Duarte CM, et al. (June 2006). "Computational redesign of endonuclease DNA binding and cleavage specificity". Nature. 441 (7093): 656–59. Bibcode:2006Natur.441..656A. doi:10.1038/nature04818. PMC 2999987. PMID 16738662..
^Silva DA, Yu S, Ulge UY, Spangler JB, Jude KM, Labão-Almeida C, Ali LR, Quijano-Rubio A, Ruterbusch M, Leung I, Biary T, Crowley SJ, Marcos E, Walkey CD, Weitzner BD, Pardo-Avila F, Castellanos J, Carter L, Stewart L, Riddell SR, Pepper M, Bernardes GJ, Dougan M, Garcia KC, Baker D (January 2019). "De novo design of potent and selective mimics of IL-2 and IL-15". Nature. 565 (7738): 186–191. doi:10.1038/s41586-018-0830-7. PMID 30626941..
^Simons KT, Bonneau R, Ruczinski I, Baker D (1999). "Ab initio protein structure prediction of CASP III targets using Rosetta". Proteins. Suppl 3: 171–76. doi:10.1002/(SICI)1097-0134(1999)37:3+<171::AID-PROT21>3.0.CO;2-Z. PMID 10526365..
^"Interview with David Baker". Team Picard Distributed Computing. 2006. Archived from the original on February 18, 2009. Retrieved December 23, 2008..
^Nauli S, Kuhlman B, Baker D (July 2001). "Computer-based redesign of a protein folding pathway". Nature Structural Biology. 8 (7): 602–05. doi:10.1038/89638. PMID 11427890..
^Kuhlman B, Dantas G, Ireton GC, Varani G, Stoddard BL, Baker D (November 2003). "Design of a novel globular protein fold with atomic-level accuracy". Science. 302 (5649): 1364–68. Bibcode:2003Sci...302.1364K. doi:10.1126/science.1089427. PMID 14631033..
^Jones DT (November 2003). "Structural biology. Learning to speak the language of proteins". Science. 302 (5649): 1347–48. doi:10.1126/science.1092492. PMID 14631028..
^von Grotthuss M, Wyrwicz LS, Pas J, Rychlewski L (June 2004). "Predicting protein structures accurately". Science. 304 (5677): 1597–99, author reply 1597–99. doi:10.1126/science.304.5677.1597b. PMID 15192202..
^"Articles citing: Kuhlman et al. (2003) 'Design of a novel globular protein fold with atomic-level accuracy'". ISI Web of Science. Retrieved July 10, 2008..
^"October 2005 molecule of the month: Designer proteins". RCSB Protein Data Bank. Retrieved September 7, 2008..
^"Kuhlman laboratory homepage". Kuhlman Laboratory. University of North Carolina. Retrieved September 7, 2008..
^"RosettaDesign web server". Kuhlman Laboratory. University of North Carolina. Retrieved September 7, 2008..
^Gray JJ, Moughon SE, Kortemme T, et al. (July 2003). "Protein–protein docking predictions for the CAPRI experiment". Proteins. 52 (1): 118–22. CiteSeerX 10.1.1.80.9354. doi:10.1002/prot.10384. PMID 12784377..
^Daily MD, Masica D, Sivasubramanian A, Somarouthu S, Gray JJ (2005). "CAPRI rounds 3–5 reveal promising successes and future challenges for RosettaDock". Proteins. 60 (2): 181–86. CiteSeerX 10.1.1.521.9981. doi:10.1002/prot.20555. PMID 15981262. Archived from the original on 2012-06-30..
^Méndez R, Leplae R, Lensink MF, Wodak SJ (2005). "Assessment of CAPRI predictions in rounds 3–5 shows progress in docking procedures". Proteins. 60 (2): 150–69. doi:10.1002/prot.20551. PMID 15981261. Archived from the original on 2012-06-30..
^"RosettaDock server". Gray laboratory. Johns Hopkins University. Retrieved September 7, 2008..
^"Protein–protein docking at Rosetta@home". Rosetta@home forums. University of Washington. Retrieved September 7, 2008..
^"Robetta web server". Baker laboratory. University of Washington. Retrieved May 7, 2019..
^Aloy P, Stark A, Hadley C, Russell RB (2003). "Predictions without templates: new folds, secondary structure, and contacts in CASP5". Proteins. 53 Suppl 6: 436–56. doi:10.1002/prot.10546. PMID 14579333..
^Tress M, Ezkurdia I, Graña O, López G, Valencia A (2005). "Assessment of predictions submitted for the CASP6 comparative modeling category". Proteins. 61 Suppl 7: 27–45. doi:10.1002/prot.20720. PMID 16187345..
^Battey JN, Kopp J, Bordoli L, Read RJ, Clarke ND, Schwede T (2007). "Automated server predictions in CASP7". Proteins. 69 Suppl 8: 68–82. doi:10.1002/prot.21761. PMID 17894354..
^Chivian D, Kim DE, Malmström L, Schonbrun J, Rohl CA, Baker D (2005). "Prediction of CASP6 structures using automated Robetta protocols". Proteins. 61 Suppl 7: 157–66. doi:10.1002/prot.20733. PMID 16187358..
^Baker D. "David Baker's Rosetta@home journal, message 52902". Rosetta@home forums. University of Washington. Retrieved September 7, 2008..
^Ovchinnikov, S; Kim, DE; Wang, RY; Liu, Y; DiMaio, F; Baker, D (September 2016). "Improved de novo structure prediction in CASP11 by incorporating coevolution information into Rosetta". Proteins. 84 Suppl 1: 67–75. doi:10.1002/prot.24974. PMID 26677056..
^Baker D. "David Baker's Rosetta@home journal (message 52963)". Rosetta@home forums. University of Washington. Retrieved September 16, 2008..
^"Foldit forums: How many users does Foldit have? Etc. (message 2)". University of Washington. Retrieved September 27, 2008..
^"Foldit: Frequently Asked Questions". fold.it. University of Washington. Retrieved September 19, 2008..
^"Project list – BOINC". University of California. Retrieved September 8, 2008..
^Pande Group (2010). "High Performance FAQ". Stanford University. Archived from the original (FAQ) on September 21, 2012. Retrieved September 19, 2011..
^7im (April 2, 2010). "Re: Answers to: Reasons for not using F@H". Retrieved 2011-09-19..
^Vijay Pande (August 5, 2011). "Results page updated – new key result published in our work in Alzheimer's Disease". Retrieved 2011-09-19..
^Pande Group. "Folding@home Diseases Studied FAQ". Stanford University. Archived from the original (FAQ) on October 11, 2007. Retrieved September 12, 2011..
^Vijay Pande (September 26, 2007). "How FAH works: Molecular dynamics". Retrieved 2011-09-10..
^tjlane (June 9, 2011). "Re: Course grained Protein folding in under 10 minutes". Retrieved 2011-09-19..
^jmn (July 29, 2011). "Rosetta@home and Folding@home: additional projects". Retrieved 2011-09-19..
^Pande Group. "Client Statistics by OS". Stanford University. Retrieved 2011-10-18..
^Malmström L, Riffle M, Strauss CE, et al. (April 2007). "Superfamily assignments for the yeast proteome through integration of structure prediction with the gene ontology". PLoS Biology. 5 (4): e76. doi:10.1371/journal.pbio.0050076. PMC 1828141. PMID 17373854..
^Bonneau R (2006). "World Community Grid Message Board Posts: HPF -> HPF2 transition". Bonneau Lab, New York University. Retrieved September 7, 2008..
^"List of Richard Bonneau's publications". Bonneau Lab, New York University. Archived from the original on July 7, 2008. Retrieved September 7, 2008..
^Bonneau R. "World Community Grid Message Board Posts". Bonneau Lab, New York University. Archived from the original on July 4, 2008. Retrieved September 7, 2008..
^"Predictor@home: Developing new application areas for P@H". The Brooks Research Group. Retrieved September 7, 2008.[失效连结].
^Carrillo-Tripp M (2007). "dTASSER". The Scripps Research Institute. Archived from the original on July 6, 2007. Retrieved September 7, 2008..
^"RALPH@home website". RALPH@home forums. University of Washington. Retrieved September 7, 2008..
^"Rosetta@home: The new credit system explained". Rosetta@home forums. University of Washington. 2006. Retrieved October 8, 2008..
^"BOINCstats: Project Credit Comparison". boincstats.com. 2008. Archived from the original on September 13, 2008. Retrieved October 8, 2008..
^"Credit divided over projects". boincstats.com. Retrieved February 19, 2015..
^"Rosetta@home: Predictor of the day archive". Rosetta@home. University of Washington. 2008. Archived from the original on September 24, 2008. Retrieved October 8, 2008..
^"Rosetta@home: Protein Folding, Design, and Docking". Rosetta@home. University of Washington. 2008. Retrieved October 8, 2008..
暂无