CIFフォーマットを確認した
VALの場合 (冒頭から一部を省略して抜粋)
data_VAL # _chem_comp.id VAL _chem_comp.name VALINE _chem_comp.type "L-PEPTIDE LINKING" _chem_comp.pdbx_type ATOMP _chem_comp.formula "C5 H11 N O2" _chem_comp.mon_nstd_parent_comp_id ? _chem_comp.pdbx_synonyms ? _chem_comp.pdbx_formal_charge 0 _chem_comp.pdbx_initial_date 1999-07-08 (略) # loop_ _chem_comp_atom.comp_id _chem_comp_atom.atom_id _chem_comp_atom.alt_atom_id _chem_comp_atom.type_symbol _chem_comp_atom.charge _chem_comp_atom.pdbx_align _chem_comp_atom.pdbx_aromatic_flag _chem_comp_atom.pdbx_leaving_atom_flag _chem_comp_atom.pdbx_stereo_config _chem_comp_atom.model_Cartn_x _chem_comp_atom.model_Cartn_y _chem_comp_atom.model_Cartn_z _chem_comp_atom.pdbx_model_Cartn_x_ideal _chem_comp_atom.pdbx_model_Cartn_y_ideal _chem_comp_atom.pdbx_model_Cartn_z_ideal _chem_comp_atom.pdbx_component_atom_id _chem_comp_atom.pdbx_component_comp_id _chem_comp_atom.pdbx_ordinal VAL N N N 0 1 N N N 11.009 2.661 48.464 1.564 -0.642 0.454 N VAL 1 VAL CA CA C 0 1 N N S 10.415 3.985 48.550 0.145 -0.698 0.079 CA VAL 2 VAL C C C 0 1 N N N 10.002 4.429 49.975 -0.037 -0.093 -1.288 C VAL 3 VAL O O O 0 1 N N N 9.312 3.707 50.680 0.703 0.784 -1.664 O VAL 4 VAL CB CB C 0 1 N N N 9.230 4.107 47.566 -0.682 0.086 1.098 CB VAL 5 VAL CG1 CG1 C 0 1 N N N 8.585 5.457 47.708 -0.497 -0.528 2.487 CG1 VAL 6 VAL CG2 CG2 C 0 1 N N N 9.689 3.877 46.132 -0.218 1.543 1.119 CG2 VAL 7 VAL OXT OXT O 0 1 N Y N 10.377 5.639 50.362 -1.022 -0.529 -2.089 OXT VAL 8 VAL H H H 0 1 N N N 11.281 2.368 47.525 1.825 0.332 0.455 H VAL 9 VAL H2 HN2 H 0 1 N Y N 10.386 1.968 48.881 1.624 -0.959 1.410 H2 VAL 10 VAL HA HA H 0 1 N N N 11.226 4.692 48.259 -0.186 -1.736 0.064 HA VAL 11 VAL HB HB H 0 1 N N N 8.478 3.321 47.813 -1.736 0.044 0.820 HB VAL 12 VAL HG11 1HG1 H 0 0 N N N 7.729 5.545 46.997 -1.087 0.031 3.214 HG11 VAL 13 VAL HG12 2HG1 H 0 0 N N N 8.279 5.666 48.759 -0.828 -1.566 2.472 HG12 VAL 14 VAL HG13 3HG1 H 0 0 N N N 9.319 6.287 47.584 0.555 -0.486 2.765 HG13 VAL 15 VAL HG21 1HG2 H 0 0 N N N 8.833 3.965 45.421 0.835 1.585 1.397 HG21 VAL 16 VAL HG22 2HG2 H 0 0 N N N 10.527 4.557 45.853 -0.350 1.981 0.130 HG22 VAL 17 VAL HG23 3HG2 H 0 0 N N N 10.218 2.902 46.020 -0.808 2.103 1.845 HG23 VAL 18 VAL HXT HXT H 0 1 N Y N 10.123 5.911 51.236 -1.139 -0.140 -2.967 HXT VAL 19 #
こんな感じ。
CIF (Crystallographic Information Framework)を基に拡張されたmmCIF (macromolecular CIF)は、ファイルの冒頭が data_xxxxx で始まる。記述される項目名は _カテゴリ名.アイテム名 として定義されている。該当する項目のデータ数が1の場合は、"項目名 値" の形式で記述する (例: _chem_comp.*)。データ数が複数である場合は、まとめて記述したい項目名一式 (例: _chem_comp_atom.*) に続いてデータを空白や改行で区切って記述する。さらに、これらの項目名一式を適用する範囲を定義するため、項目名一式の前に loop_ を記述する。各カテゴリの末尾には # を記述する。
以上のルールに従って上記のデータを読むと、HG11と1HG1の違いについては
- HG11 -- _chem_comp_atom.atom_id
- 1HG1 -- _chem_comp_atom.alt_atom_id
となる。
_chem_comp_atom.atom_id
The value of _chem_comp_atom.atom_id must uniquely identify each atom in each monomer in the CHEM_COMP_ATOM list.
The atom identifiers need not be unique over all atoms in the data block; they need only be unique for each atom in a component.
Note that this item need not be a number; it can be any unique identifier.
_chem_comp_atom.alt_atom_id
An alternative identifier for the atom. This data item would be used in cases where alternative nomenclatures exist for labelling atoms in a group.
ちなみに、_chem_comp_atom.atom_idは、PDB format Ver.3以降で使用されている原子名, alt_atom_idはPDB format Ver. 2.3以前で使用されていた原子名である。