各種プログラム使用方法

処理の手順  

  1. 反射ファイルの準備
  2. スクリプトの準備
  3. SOLVEで位相を決定する
  4. RESOLVEでモデルを組む

利用できる反射ファイルのフォーマット  

  1. HKL2000の.scaファイル
  2. MTZファイル
  3. XSCALEのアウトプットファイル
  4. フリーフォーマットのものも可

反射ファイルの準備  

HKL2000->SOLVEという黄金パターンは相性が良い。どっちもアメリカ生まれだから???

スクリプトの準備  

3波長MADの基本スクリプト  

パラメータ部分の設定を状況に合わせて書き換えればSOLVEが実行されるはずです。
SOLVEを実行するコマンドにsedを使っていますが、これは"!"以降のコメントに日本語を使っているためSOLVEの出力が乱れることがあるためです(出力のほんの初めの部分だけなので気にしなくてもいいかもしれませんが)。問題がなさそうならsedを通さなくてもいいと思います。

SADの基本スクリプト  

異常分散シグナルの値  

f', f"(エフプライム、エフダブルプライム)を求めてみましょう。そもそも f', f"はなんですか?というのはおいといて。
とりあえずプログラムを走らせることを優先します。
f', f"を求める方法は私が知る限り3通りあります。

文献値を引っ張ってくる  

測定した波長と自分のタンパクに含まれている重原子種とを佐々木テーブルを参照して、f', f"を求めることができます。
文献値を参照する場合の注意点として、「測定した波長を厳密にはわからない」、ということがあります。特に放射光施設を使ってデータ収集をした場合、エネルギー校正(モノクロメータの結晶の角度と出射X線が合っているか?)の状態によっては、制御ソフトウェアで示された波長と実際の波長に差があることがあるようです(もちろん無いように施設の人は全力を尽くしてはいますが、様々な要因がありますので)。この場合、佐々木テーブルを参照するときの波長が間違っている可能性があるわけで、最悪誤ったf', f"の値を使うことになってしまうこともあるようです。そのため、SOLVEではf', f"の値を精密化してくれるようです。
そんなこともあり、f', f"の値が位相決定に影響することもあります。

CROSSECを利用する  

CCP4パッケージのCROSSECというプログラムを利用します。このプログラムは佐々木テーブルを拡張したような使い方が出来ます。
慣れればコマンドラインからの使用も可能です(はっぴ〜☆Scriptingでは、核種と波長から簡単に求めるスクリプトを紹介しています)。

XAFSスペクトルの解析  

データを測定する際に取得したXAFSスペクトルを解析することにより実験的なf', f"を求めます。
スペクトル解析にはCHOOCHを利用するか、制御プログラムが出力してくれた値を使います(PFのUGUIはCHOOCHによる解析値を出してくれます)。ただ、この値が文献値よりもいいのかどうかはやってみないとわかりません・・・

HKL2000の.scaファイル  

HKL2000でのスケーリング  

位相決定にはバイフット対の反射は別々に記録されていることが必須
HKL2000のスケーリングの際に、anomalousscale anomalousラジオボタンにチェックを入れて反射ファイルを出力する。
viなどのテキストエディタで.scaファイルの中身をチェックしてみると分かりますが、バイフット対のある反射にはI(+)/I(-)のどちらも強度が掲載されるようになります。
SOLVEに.scaファイルを入力する場合には以下のno merge original indexを入力することをお奨めします(local scalingの恩恵を受けることができるので)。

SCALEPACKでSOLVE用のUNMERGEDデータを出力する
SOLVEインプット用の.scaファイルを作る際、HKL2000で観測された反射をマージするのではなくそのまま出力しておくことで、SOLVEのlocal scalingが利用可能になります。

  • HKL2000 for Manias/マージせずに反射ファイルを作りたい?

このlocal scalingは特にMADデータの処理の際に有効な方法なのでMADでデータ収集をした人は試してみるといいでしょう。
.scaファイルを見て、ヘッダ部分にラウエ対称のマトリクスが表示されていれば成功。(no merge original indexではない場合には空間群と格子定数のみのヘッダ)

SOLVE に.SCAファイルを読み込ませるコマンド  

以下のキーワードを使用する

readdenzo          -- DENZOつまりHKL2000フォーマットの指定
unmerged           -- Mergeしていない
read_intensities   -- 強度を読む。Fじゃない
rawmadfile foo.sca -- ファイル名の指定

SCALAから  

SCALAから読み込む場合にはMTZファイルの名前とカラムの名前を入力する必要がある
キーワードとして以下を使用

hklin foo.mtz
labin FPH1=F SIGFPH1=SIGF DPH1=DANO SIGDPH1=SIGDANO

ResolveによるDensity Modification  

DMのみ行う  

他の方法で解析していたMTZを使ってRESOLVEでDMしながらモデル構築する場合。

MTZファイルを準備する  

位相、Figure of Merit、(ヘンドリクソン-ラットマン係数)があるファイルを作る。

一般的なsolve.mtzのカラム(CCP4-MTZDUMPの結果)  

 From solve.mtz Col Sort    Min    Max    Num      %     Mean     Mean   Resolution   Type Column
 num order               Missing complete          abs.   Low    High       label
  1 NONE     0       9      0  100.00      4.3      4.3  19.12   3.50   H  H
  2 NONE     0       5      0  100.00      1.4      1.4  19.12   3.50   H  K
  3 NONE     0      40      0  100.00     15.4     15.4  19.12   3.50   H  L
  4 NONE   12.7   746.3     0  100.00   105.56   105.56  19.12   3.50   F  FP
  5 NONE    0.3    10.2     0  100.00     0.83     0.83  19.12   3.50   Q  SIGFP
  6 NONE    0.0   359.6     0  100.00   163.79   163.79  19.12   3.50   P  PHIB
  7 NONE  0.000   1.000     0  100.00    0.708    0.708  19.12   3.50   W  FOM
  8 NONE -295.2   421.2     0  100.00     0.99     6.82  19.12   3.50   A  HLA
  9 NONE -138.6   270.2     0  100.00     0.72     4.98  19.12   3.50   A  HLB
 10 NONE  -39.5    14.9     0  100.00    -0.34     0.91  19.12   3.50   A  HLC
 11 NONE  -19.5    12.1     0  100.00    -0.07     0.70  19.12   3.50   A  HLD
  1. Phase=PHIB
  2. FOM=Figure of merit
  3. HLA=Hendrickson-lattmann coefficient A
  4. HLB=Hendrickson-lattmann coefficient B
  5. HLC=Hendrickson-lattmann coefficient C
  6. HLD=Hendrickson-lattmann coefficient D

HLA/HLB/HLC/HLDはFOMがあれば計算可能。CCP4iの「Phase」関連のファイルいじりで出来るはず。

RESOLVE用インプットファイル  

入力カラムの指定

LABIN FP=Fnative PHIB=PHIB FOM=FOM (HLA=HLA HLB=HLB HLC=HLC HLD=HLD)

ここでは上記のCCP4-CADの操作でもともとのデータと位相情報を足し合わせたMTZファイルを準備した後、そのカラムの名前を指定しています。
このとき()内の係数はあっても無くても良いようです。
分解能はres_startにて開始分解能を指定。

resolve<<EOD|tee resolve.log
LABIN FP=Fnative SIGFP=SIGFP PHIB=PHIB FOM=FOM HLA=HLA HLB=HLB HLC=HLC HLD=HLD
res_start 3.5
solvent_content 0.35            ! your solvent content goes here.
resolution 20 2.9               ! resolution limit.
EOD

File名の指定  

デフォルトではRESOLVEはsolve.mtzを読み込むことになっているが、もちろん入力MTZファイルの名前を指定することも可能である。

hklin solve_yarinaoshi.mtz

とするとsolve_yarinaoshi.mtzと言うファイルを読み込んでくれる。内容は F PHI FOMがあれば少なくとも走るようである。

Sequence fileについて  

シークエンスファイル名  

seq_file foo.seq

とする。

フォーマット  

  1. 1文字表記の1次配列
  2. 1行に80文字まで
  3. チェインの終了コードは>>>

出力PDBファイルについて  

RESOLVEはモデルと共にHETATMコード(PDB座標中、ATOMではなくHETATMによって始まる行)に重原子座標(SOLVE ha.pdbの情報)を出力。

 モデル構築のオプション  

色々とできるみたい(あんまりいじっても・・・)  

no_build構築しないコース
build_only構築しかしないコース
build_outside_model既にあるPDBに新たなモデルを足していくコース
assemble_only入力されたPDBをつなげるだけコース

計算のスピードや緻密さの指定(あんまりいじっても・・・)  

superquick_buildできるだけ早くグリッドが荒い。フラグメントサーチ。
quick_build標準プロトコル。普通に早い特になし
aggressive_buildアグレッシブにモデルを置く推奨しない(作るなよ)
thorough_buildじっくり構築別にquick_buildより良いのが出るとは限らない
conservative_buildひかえめにやる特になし

その他1  

resolve_build script  

SOLVE, RESOLVE, REFMAC5を利用したモデル構築スクリプト

ただし相当時間がかかる模様でございます。

便利  

重要な注意事項  

解けないデータ  

エッジとリモートの2波長MADもSOLVE/RESOLVEやってみてください。
少し人生が変わって見えるかも。
参考文献: Acta Cryst D59, 315-322 Ana Gonzalez@SSRL

添付ファイル: filesolve_mad.csh 2502件 [詳細] filesolve_sad.csh 2483件 [詳細]