程序员

准备好迎接蛋白设计的时代了吗?--RoseTTAFold实操

作者:admin 2021-07-23 我要评论

作为学术界的fast follow,RoseTTAfold以其占用的资源有限以及预测蛋白复合物而占据了一定的优势。 当然其安装也不需要docker,为一些非root用户提供了方便之处...

在说正事之前,我要推荐一个福利:你还在原价购买阿里云、腾讯云、华为云服务器吗?那太亏啦!来这里,新购、升级、续费都打折,能够为您省60%的钱呢!2核4G企业级云服务器低至69元/年,点击进去看看吧>>>)

作为学术界的fast follow,RoseTTAfold以其占用的资源有限以及预测蛋白复合物而占据了一定的优势。

当然其安装也不需要docker,为一些非root用户提供了方便之处,而且说不定CASP15就进化完全体了。

顺便提一句AlphaFold2的A100好像4万 - 7万。

步骤以及相关的坑:

1. 下载RosettaFold

 git clone https://github.com/RosettaCommons/RoseTTAFold.git
 cd RoseTTAFold

2. 下载各种文件

 # 权重文件
 wget https://files.ipd.uw.edu/pub/RoseTTAFold/weights.tar.gz
 tar xfz weights.tar.gz
 # 下载序列以及相关的结构文件
 # uniref30 [46G]
 wget http://wwwuser.gwdg.de/~compbiol/uniclust/2020_06/UniRef30_2020_06_hhsuite.tar.gz
 mkdir -p UniRef30_2020_06
 tar xfz UniRef30_2020_06_hhsuite.tar.gz -C ./UniRef30_2020_06

 # BFD [272G] 这个alphafold也有用
 wget https://bfd.mmseqs.com/bfd_metaclust_clu_complete_id30_c90_final_seq.sorted_opt.tar.gz
 mkdir -p bfd
 tar xfz bfd_metaclust_clu_complete_id30_c90_final_seq.sorted_opt.tar.gz -C ./bfd

 # 结构模版 [over 100G]
 wget https://files.ipd.uw.edu/pub/RoseTTAFold/pdb100_2021Mar03.tar.gz
 tar xfz pdb100_2021Mar03.tar.gz
 # for CASP14 benchmarks, we used this one: https://files.ipd.uw.edu/pub/RoseTTAFold/pdb100_2020Mar11.tar.gz

3. 使用conda安装相关的环境

 # create conda environment for RoseTTAFold
 #   NVIDIA driver == cuda11,进行如下操作
 conda env create -f RoseTTAFold-linux.yml
 #   NVIDIA driver == cuda10 ,进行如下操作
 conda env create -f RoseTTAFold-linux-cu101.yml
 # 如果你使用pyrosetta进行如下操作
 conda env create -f folding-linux.yml

4. 直接运行

正如你所看到到直接运行即可,把一切交给计算机

 ../run_e2e_ver.sh input.fa .

5. 结果

输出文件夹:

结果蛋白:

后记

  1. RoseTTAfold 有两种模式,他也可以预测复合物结构,但是我目前没跑,过段时间看看
  2. 你可以使用run_e2e_ver.sh 也可以使用run_pyrosetta_ver.sh,如果你选择后者,那么请注意
    • 获取Pyrosetta相关软件下载license,并将其安装在conda的folding环境中
    • 运行install_dependencies.sh,为Pyrosetta安装相关的第三方软件
  3. GPU还是CPU ?,well,如果你想运行CPU,请按照我的提示进行操作
    • RoseTTAFold/network/predict_e2e.py 找到这个文件
    • 找到这一句 def __init__(self, model_dir=None, device="cuda:0"): ,并将其替换为def __init__(self, model_dir=None,device="cpu"):

4. 运行中遇见了segmentation fault?

  • 首先,使用conda卸载掉RoseTTAFold中的hhsuite
  • 然后重新下载一个并将其放到环境变量中
wget https://github.com/soedinglab/hh-suite/releases/download/v3.2.0/hhsuite-3.2.0-AVX2-Linux.tar.gz --no-check-certificate
tar xvfz hhsuite-3.2.0-AVX2-Linux.tar.gz

相关链接:

  1. github:https://github.com/RosettaCommons/RoseTTAFold
  2. gitee:https://gitee.com/zerodesigner/RoseTTAFold
  3. pyrosetta:https://www.pyrosetta.org/
  4. Conda:https://docs.conda.io/en/latest/miniconda.html
  5. Hhsuite:https://github.com/RosettaCommons/RoseTTAFold/issues/2
  6. RosettaFold: M Baek, et al., Accurate prediction of protein structures and interactions using a 3-track network, bioRxiv (2021)

版权声明:本文转载自网络,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。本站转载出于传播更多优秀技术知识之目的,如有侵权请联系QQ/微信:153890879删除

相关文章
  • 准备好迎接蛋白设计的时代了吗?--Rose

    准备好迎接蛋白设计的时代了吗?--Rose

  • Java项目实现消息推送到团队微信,让项

    Java项目实现消息推送到团队微信,让项

  • JSP连接Access数据库

    JSP连接Access数据库

  • Jsp连接Access数据库(不通过建立ODBC数

    Jsp连接Access数据库(不通过建立ODBC数

腾讯云代理商
精彩导读
海外云服务器
热门资讯
腾讯云代理商