PDB (文件格式)

维基百科,自由的百科全书
PDB
扩展名
.pdb, .ent, .brk
互联网媒体类型
chemical/x-pdb
格式类型化学文件格式

PDB文件格式(PDB为蛋白质数据库英语名称“Protein Data Bank”缩写),顾名思义是一种由蛋白质数据库最先采纳,用于储存蛋白质三维结构的文件格式。这种文件格式详细记录了 蛋白质中每个原子的坐标信息、蛋白质二级结构信息,以及原子之间的相互作用等信息,同时附有简要的蛋白质的名称与生物学性质信息。

历史

1976年,研究人员认为应该有一种人类可直接阅读的保存蛋白数据文件,将这种文件上传到数据库中将会有利于研究人员相互交流不同蛋白质的结构信息,因此发明了PDB文件格式。PDB文件固定有80列,这是因为当时早期电脑的打孔卡最多只支持在一行打80个孔[1]。此后,PDB文件经过了一些调整,截至2011年7月,最新的PDB格式版本是3.30[2]

例子

以下是一个人工合成的多肽的PDB文件:

HEADER    EXTRACELLULAR MATRIX                    22-JAN-98   1A3I
TITLE     X-RAY CRYSTALLOGRAPHIC DETERMINATION OF A COLLAGEN-LIKE
TITLE    2 PEPTIDE WITH THE REPEATING SEQUENCE (PRO-PRO-GLY)
...
EXPDTA    X-RAY DIFFRACTION
AUTHOR    R.Z.KRAMER,L.VITAGLIANO,J.BELLA,R.BERISIO,L.MAZZARELLA,
AUTHOR   2 B.BRODSKY,A.ZAGARI,H.M.BERMAN
...
REMARK 350 BIOMOLECULE: 1
REMARK 350 APPLY THE FOLLOWING TO CHAINS: A, B, C
REMARK 350   BIOMT1   1  1.000000  0.000000  0.000000        0.00000
REMARK 350   BIOMT2   1  0.000000  1.000000  0.000000        0.00000
...
SEQRES   1 A    9  PRO PRO GLY PRO PRO GLY PRO PRO GLY
SEQRES   1 B    6  PRO PRO GLY PRO PRO GLY
SEQRES   1 C    6  PRO PRO GLY PRO PRO GLY
...
ATOM      1  N   PRO A   1       8.316  21.206  21.530  1.00 17.44           N
ATOM      2  CA  PRO A   1       7.608  20.729  20.336  1.00 17.44           C
ATOM      3  C   PRO A   1       8.487  20.707  19.092  1.00 17.44           C
ATOM      4  O   PRO A   1       9.466  21.457  19.005  1.00 17.44           O
ATOM      5  CB  PRO A   1       6.460  21.723  20.211  1.00 22.26           C
...
HETATM  130  C   ACY   401       3.682  22.541  11.236  1.00 21.19           C
HETATM  131  O   ACY   401       2.807  23.097  10.553  1.00 21.19           O
HETATM  132  OXT ACY   401       4.306  23.101  12.291  1.00 21.19           O
...

参见

参考资料

  1. ^ Berman, Helen M. "The protein data bank: a historical perspective." Acta Crystallographica Section A 64.1 (2007): 88-95.
  2. ^ Atomic Coordinate Entry Format Version 3.3. wwPDB. July 2011 [2023-06-08]. (原始内容存档于2015-01-24).