質問  

最近、みんなツイン、ツインと言っているようにちまたではツインがはやっている様子。
データセットがうまいことリファインメントができず、Free-R/R factorが下がらないとこういう議論になるよね。
でも、結局は気が狂いそうなくらい空間群に対して可能性のある限りのツインリファインメントをやってみるわけだけど、経験上、ものすごく時間を食うにも関わらず劇的な改善は見られないような気がする。
単に私の興味からくるものなんだけど実際にツインなデータってどのくらいの割合であるの?

 

で、もし結晶の見かけがよく、回折イメージ上での反射のわれはなくて、分解能も高くて、反射のプレディクションもよくあってて、スケーリングも良い統計値で、溶媒含量もリーズナブルで、もっともらしい構造の解が出て、R/Rfが高い、ってなったらどの程度の頻度で「ツインだ!」と断定するのでしょう?

回答  

その1  

上記のような現象は merohedral twinでおきうる問題です。空間群が trigonal/ hexagonal/ tetragonal 結晶であれば考えるように私は生徒に教えています。
ツインである確率はわかりませんが、Prof. George Sheldrickの論文によれば低分子の場合は上記の高い対称をもつ空間群では20%くらいは(merohedral)ツインだということを書いていたような気がします。
では、タンパク結晶ではなぜその割合ではないのでしょうか?

 

もちろん、ツインリファインメントは骨が折れる仕事でやることが増えますが、"man twinning"はいつも啓発的な読み物だ(意味不明;アメリカンジョークか?)。

その2  

このリファレンスが良いよ
Lebedev AA, Vagin AA, Murshudov GN.
'Intensity statistics in twinned crystals with examples from the PDB'
Acta Crystallogr D Biol Crystallogr. 2006 Jan; 62 (Pt 1):83-95. Epub 2005 Dec 14.

その3  

高いR-factorにはたくさんの理由がある。で、ツインはそのうちの一つである。
もし回折強度が美しいツインにぶちあたる可能性があるとしたらそれは格子定数が許せば、の話。
trigonal, tetragonal, cubic cellsである。
他にも monoclinic で a軸とc軸がほぼ同じ長さとか、betaがおよそ90°とか。
けれど、それは強度の統計値を見れば分かる(TRUNCATE: Moments and Cumulative intensities/SFCHECK:アウトプットファイル)ものだよ。特にSFCHECKは可能なツインをテスト計算に基づいて教えてくれる(へぇ)。
なので、こういうケースだったら高いR-factorの原因はツインだ、というのは簡単に分かるように思います・・・。
ま、驚くべきことにほんの少しツインな結晶(あるいはツインデータのごく一部)はマップのクヲリティーをそないに下げないらしいんやけどね。

その4  

っていうか、対称が低い空間群でも格子が重なるケースがあるんちゃう?
上の人の答えを拡張すると、自分が経験したあれなんやけど格子定数が 3c cos(beta)=-a という関係を持っているデータがあったわけよ。このケースやと回折強度がほんまにきれいではないんやけど単結晶に見える、という。
これは"reticular pseudomerohedry across the ab-plane with a twin index of 3"と呼ばれるものやねん。この場合、h, k, (-l-2h)/3の反射がh, k, (-l-2h)/3に重なってしまう。だからツインは驚くくらい一般的なもんやで。

その5  

CCP4をフルで入れると mmtbx.xtriageというのが入るんやけど(phenix.xtriageと同じ)、こいつ走らせたら基本的なツインチェックはやってくれるよ。他の統計値も計算してくれるし。これやったら時間かからへんで。

実際にやってみた感想(くにを 

コマンドラインで一発、スクリプトを流すだけで強度データの統計値を色々と見積もってくれる。
データ撮ったらこれで一度、チェックしてみるのが良い。

その6  

自分が書いてた論文で苦労していた問題をここで暴露してしまおう。
とても解釈のしやすいマップにモデルをはめこんで構築したわけです(P3121)。でもR-factorは40%くらいで滞ってしまった。空間群を変えて(P31, C2)やってみたが効かず、でもモデルはヨサゲ(観測電子密度によくはまってるし、自分が予想していたフォールディングもしてた)。
けど分解能は2.25Åやったし、強度分布も別にツインではなかったわけやが、SHELXLでツインリファインメントとかやってみた(P31 twin law 1 0 0 -1 -1 0 0 0 -1, basf refined to 0.5009)。
このtwin lawは P3121の二回軸と同じものだった。これをやったとき、R-factorは Free-R/R=32/28になった!猿のようにリファインメントした。

 

で、このリファインメントの方法を「データの質が悪かったから(高いchi**2、モザイシティ、対称で関係付けられる反射どうしの強度差が大きい、スポットがぼやけてる)きっと色んなツイン試験によってツインであるとわからなかったのだろう!」と思っていたわけですよ。
でもそれは間違ってた。
結局、後にきれいな結晶が新しい晶系で出てそれでモデルを構築したところ、モデルにめっちゃ間違いがあった。フレキシブルループ部分の構造がごっつ違ってましたねん。
結局、数ヶ月、数年の結果は二つのパラグラフにまとめられちゃったよ(泣)。ま、え〜経験にはなったけどな。少なくともツインをどう扱うかってのにはなれましたよ。

その8  

もし、既にモデルが構築されているのであれば merohedral twinの可能性を全て試してくれる(もちろん、入力の空間群と結晶格子、それにあわせたツインオペレータによって)プログラムがあるねん。
jiffy と呼ばれているmmtbx.twin_map_utilsのことなんやけど(cctbxにある)。このプログラムは

  1. anisotropic and bulk solvent scaling
  2. ツインフラクション(ツインだとして個々の結晶がどの程度の割合で含まれているか?最大=0.50)計算
  3. ツインフラクションの精密化

をやってくれるよ。 この行程でかなり早くツインの法則について調べることができるし、もしツインだとしたらその割合もおおまかには出してくれる。
もし、空間群の対称性が非常に高い(そしてツインの傾向(twin law)がない)場合は対称を落としてやって同じことをやるくらいはたやすくないか?
今はPHENIXで自動化されていないけれど、cctbxツール群を使って手でやるのも簡単や。分子置換にしてもそう。対称を落とした空間群をアサインして分子置換をやってみるくらいわけないでしょう?
しかし、時々、みんなは混乱するよね。私は過去にSe-SADの良い構造が得られない人があるソフトウェアパッケージではだめで、空間群の対称性がめちゃ低いからやろう、と結論付けたわけや。データを対称の低い空間群でマージすると同じソフトウェアで重原子サイトを見つけて解を見つけることができた。
のだが、この空間群の対称もまた低かった。使用する分解能を変えたこと、他のパッケージを使ったことによって構造が解けたってことよ。間違った空間群は今でもPDBに登録してあるがね・・・。

 

ま、最後に私は可能性のある限り全てをトライしてみて、ありうる解を探すところから始めてみたら?と思う。自動化はいろんなことを便利にはするので将来的にはそんなことも勝手にやってくれるようになるんやろうけどね。

使ってみた感想(くにを 

mmtbx.twin_map_utilsの中であるモジュールを引っ張っているようなんですがそいつが動かないみたい。
ググっても問題が指摘されているようなことはないので今、ペンディングしてまうす。