写这个是因为每次用的时候发现都忘记了,甚至不知道网页在哪,每次都要在一堆链接中反复点击,宛如蒙特卡洛模拟,有时候甚至还找不到想要的网站。因此我现在就把使用modeller补全缺失残基的网页放在这里。
我们以4GNX为例进行补全。首先4GNX在PDB中是个二聚体结构,我们只需要其中的一半的信息,所以我们删除了X,Y,Z和L链,改文件命名为4gnx_half.pdb
。之后我们需要得到pdb中的序列信息。但是modeller只会得到存在的残基的序列。对于中间缺失的残基,虽然pdb文件的REMARK 465
中记录了缺失的残基序号和类型,pdb文件中的SEQRES
也记录了生物分子的序列信息,但是modeller并不会帮你从pdb中提取出来在序列上补充上,因为modeller认为这部分信息是不可靠的。并且有的经过处理的pdb甚至会丢失这些信息。
我们可以使用一下代码提取pdb文件中的序列信息:
1 | from modeller import * |