CODへの結晶構造のデポジット方法 (2016/10/21作成) (2020/05/01更新)

OUOperatingGrant.png

デポジット近況

  • (2020/07/21) いくつかデポジット。総計554個。
  • (2020/05/01) 査読1つ終えたので、AM2013年10号をデポジットした。総計551個。
  • (2020/04/29) AM2013年11-12号をデポジットした。Rwp=28の構造をデポジットするのは止めておいた。査読が2つ来たので、とりあえずはそちらの方を優先。
  • (2020/03/05) lusernaite-(Y)をデポジットした。デポジットした構造の総計526個に。
  • (2020/03/02) kangiteをデポジットしたが、酸素位置はこれでいいのだろうか?
  • (2020/02/29) eosphoriteとbairditeをデポジットした。
  • (2020/02/28) ちょっとした興味から、Al-Si-C-O系の構造を4つデポジットした。
  • (2020/02/12) 稀にCODから取ってきた結晶構造データについて、Vestaで計算させた粉末パターンがおかしい(高角側のピークが極めて弱い)ことがありますが、これはBまたはU値が間違って入力された(Uとして入力すべきなのにB値を入れてしまった)と思われるので、直して、再計算すると正しくなります。なお、VestaはB/Uがデータ自体にない場合には、B=1とするようです。某結晶データベースでBまたはUが入っていない話を聞きましたが、CODでもB/Uがないデータが結構あります。さらにちょっとcifファイルをいくつか見ていて、VESTAが異方性温度因子を読んでないケースがあることを見つけました。ちょっと調べたところ、異方性温度因子が座標より先に来ている場合にそうなるようです。私がCODへデポジットする場合は、B/Uは当然、異方性因子もあった場合はそれも含めて、入力してます。面倒ですが… 時間がなく最近デポジットできていない。
  • (2020/01/17) 前にarXivに置いた原稿からデポジットしたデータを見ていて気づいたが、prepublicationでデポジットすると、座標データ部分が外されるようだ。もし論文になってないデータを入れたい場合は、personal communicationを選択するしかなさそう。また、このarXivのやつをどこか雑誌に出さないといけないということか…
  • (2020/01/12) やっとCODサイトのメインテナンスが終わったので、American Mineralogistからいくつか拾ってデポジットした。terrywallaceite, D置換bruciteの低温測定データ、長石、haiweeite, lucabindiite, cejkaite, karenwebberite, rustumiteなど。総計518個に。
  • (2020/01/08) American Mineralogistに載っているmaruyamaiteの構造がCODになかったことが気になって調べたところ、2013年の途中からAmerican Mineralogistからのデータがほとんど入っていないようです。maruyamaiteはAMCSDにも入ってないが、AMCSDにはもっと最近の論文のデータも入っているので不思議。Physics and Chemistry of Mineralsも最近と古いのがあまり入っていない。ちょっと対応策を考えないと…
  • (2020/01/07) 最近の雑誌から2つcif作成。ただ、CODサイトがメインテナンスしているため、デポジットできなかった。
  • (2019/12/25) maruyamaite(理想組成 K(MgAl2)(Al5Mg)Si6O18(BO3)3O)がなぜかデータベース(COD及びAMCSD)に入ってなかったので、デポジットした。超高圧変成岩に出る、カリウムに富む電気石の一種である。丸山茂徳氏に因む。総計482個。

最近デポジットした構造

  • maruyamaiteの構造。超高圧変成岩中から見つかったカリウムに富む電気石の一種である。名称は丸山茂徳氏に因む。記載及び構造の論文(https://doi.org/10.2138/am-2016-5359 ).
    maruyamaite.png
  • arXivに出したものから2つの構造を示す。これらはZn2SiO4のIII, IV相に対応する高圧相と予想しているもの。圧力を下げる時に転移してしまい、常圧ではIII, IV相になってしまうと考えている。どちらも、Znが4配位席と6配位席の2つの席を持つ。
    arxiv-structures.png

CODとは

  • Crystallography Open Database(COD)は、結晶構造のオープンデータベースであり、biopolymerを除いた、有機および無機結晶を対象としている。現在(2019/03/15)、40.4万件が登録されている。無料で結晶構造データベースを使うことができる。鉱物を扱う者としては、アメリカ鉱物学会等の鉱物構造データベースがCODへ提供されているところが重要な点である。IUCr、ACSの雑誌で出版されたcifデータは自動的に登録されるようになっている。雑誌によってはCODへ結晶構造データのデポジットを推奨するところもある。
  • しかし登録されていない構造データもまだ多い。我々が以前解析して報告したZn2SiO4の2つの結晶構造について、CODで調べたところ、見つからなかった。論文投稿時にcifファイルを要求されたところは大体自動的にCODに入っていた(Acta Cryst., Inorg. Chem., Am. Mineral.など)。入ってなかったのは、cifを要求されない雑誌(今の場合Phys. Chem. Minerals)だった。その2つを自分でデポジットしたことから、他のデータもデポジットするようになった。
  • CODにデータがあることで、元論文が引用される可能性が多少は増えるので、構造解析結果を雑誌に公表されている方で、CODにデータがまだ登録されていない方は、デポジットされるといいと思います。自動的に雑誌側からcifがCODに送られる場合は不要です。
  • 自分のデータでなくても、CODにないデータをボランティアでデポジットすることもできます。Le Bail先生を始め、多くの方がボランティアでデポジットしてます。注意点としては、まず既にCODに存在しないか検索で確認して、余分な手間を省きます。不幸にして重複した場合は、デポジットの時に重複するデータがあると警告が出て来ます。また、既存の有償結晶構造データベースにはほとんどの場合著作権があるので、そのままコピー&ペーストすると問題を生じます。私の場合は、論文からデータを拾ってVestaに入力して、構造をVestaで結晶化学的におかしくないことを確認後、cifファイルを出力させて、cifファイルに雑誌情報などを追加してから、デポジットしてます。Le Bail先生のTwitterを見ると、OCRを使って、デポジットされているようです。
  • デポジットする理由:私の場合は、CODで遊ぶ結晶構造の検索で書いているようにCODを普段使っています。また、CODから作成した粉末回折パターンのデータベースとその検索ソフト(QualX2)も利用してます。その関係で高額なライセンス料を払う必要のない、誰でもが使えるCODにより多くのデータが集まって欲しいとの願いで、デポジットをボランティアで行ってます。また、CODを使って、パーソナルな粉末パターンデータベースを作ることも考えてます。
  • 最近、Fox(実空間結晶構造解析ソフト)にCODの検索機能が付きました。検索した構造をダブルクリックするとCrystalsのところに構造データが入ります。

CODへのcifファイルのデポジット方法

  • cifファイルを準備する:自分の解析データの場合は、構造解析ソフトから出力されるcifファイルを雛形として使う。他人の結晶構造データをデポジットする場合は、例えばVestaからcifファイルを出力させてやればよい。Vestaや構造解析ソフトから出力されたcifファイルには、もちろん掲載雑誌、著者らの情報が入ってないので、それを追加する必要がある。未公表のデータもデポジットできる。以下は追加する雑誌情報部分の例。既存のCODにあるcifファイルを参考に情報を追加すればよい。時々見る別途の追加情報としては、常温常圧測定でない場合で、 _publ_section_titleのところにタイトルの後に追加しているケースがある。正式にはそれら用のタグが用意されている。さらに下の方を参照。
    loop_
    _publ_author_name
    'Liu, X.'
    'Kanzaki, M.'
    'Xue, X.'
    _publ_section_title
    ;
     Crystal structures of Zn2SiO4 III and IV synthesized at 
     6.5-8 GPa and 1,273 K
    ;
    _journal_name_full               'Physics and Chemistry of Minerals'
    _journal_page_first              467
    _journal_page_last               478
    _journal_volume                  40
    _journal_year                    2013
  • デポジットする:cifデータを準備したら、デポジットするサイトへ行き、その画面通りに進む。はじめてデポジットする時は名前、パスワード等を設定する必要がある。デポジットはcifファイル1つ毎か、複数ファイルをzipしたものがupload可能である。uploadされるとvalidationが始まり、エラーが指摘されるので、それをブラウザー上で直して、再度チェックする。エラーがなくなれば、デポジットが可能となる(ボタンが表示される)。デポジットすると、付与されたCOD番号が表示される。ここで重複があると警告がでる。このCOD番号でデポジットしたcifファイルへ直接アクセスできるようになる。
  • 既にデータベースに登録されているデータのcif作成に時間を使うのは悲しいので、cifを作る前に、検索でよくチェックすることが必須。
  • validationでのエラー:最初にデポジットした時に出てきたいくつかのエラーは、
    • Zが計算できない:この場合は以下のようにZを直接入れることで解決。Vestaはこのタグを出力しないので。
      _cell_formula_units_Z            4
    • 値に空白が含まれる時は''をつける。これは自動的に直してくれる。
    • ファイル冒頭のdata_は必須で、間違って消去しないこと。
    • CODをupdateしたら、デポジットしたデータがちゃんとダウンロードされていた。
  • depositionでのエラー:
    • 一連の温度、圧力を変えたデータであまり構造が大きく違いがないものをデポジットした時に、既にデータがありますというエラーがでることがある。これはmailing listで聞いて解決した。データが3シグマ以内のものは同じものとして判断しているそうだ。もし温度や圧力変化が小さくて、同じと間違われる時は測定温度のタグ"_diffrn_ambient_temperature 298.15"や測定圧力のタグ"_diffrn_ambient_pressure 14.4E+6"を追加することで解決できる。タグの名前が変だが。温度はK単位。圧力の単位はkPaなので、この例の14.4E+6は14.4 GPaとなる。注意する必要があるのは(私の間違ったところ)、既にデポジットした一連のデータにもこのタグを追加する必要があること。そうしないと、温度・圧力タグが両者で揃ってないので、それらのタグは比較されなくて、3シグマ以内だとエラーがでることになる。既に自分でデポジットしたものは以下のようにManage depositionsで訂正として、タグを追加することができる。温度、圧力を変えたデータでは、最初からそれらのタグを書いておくことをお勧めする。
  • 似た様なことで、DFT計算と実験構造が両方ある場合にも(DFTの予測がよいほど)同じデータと認識されるが、この場合はDFTは0 Kとして、やはり温度で区別することができるだろう。
  • 自分のデポジットしたデータの間違い訂正(事後)
    • 訂正はManage depositionsからできる。そこでupdateボタンをクリック。editボタンで直接直して、再チェックする。また、log messageのところに直した理由など書く必要があり、これを入力しないと怒られる。
  • OCRを使った座標データの読み込み
    • Le Bail先生の最近のTwitterでやり方が紹介されてました。
  • Le Bail先生のTwitterに、CODについてのcomplainはCod-users listへどうぞと書かれていたので、subscribeした。上記の温度・圧力データについて質問したら、返事がちゃんと来た。それで問題が解決した。普段は投稿がゼロ。

私のCODへのデポジット状況

  • 2016年10月から初めて、現在(2019/07/17)まで、合計464個(cifファイルの数で)をデポジットした。
  • 現在、以下の雑誌の結晶構造データを定期的に拾って、デポジット中。
    • Journal of the Ceramic Society of Japan:新号には継続対応
    • Journal of Asian Ceramic Societies:新号には継続対応
    • J. Mineral. Petrol. Sciences:新号には継続対応
  • なお、私のデポジットしたcifの番号は大体#1544***~1545***くらいとなってます(この範囲の全てではない)。もしこの番号あたりで、かつ上記雑誌の場合は私の入力したものである可能性が非常に高いので、間違い等がありましたらご連絡ください(自分で入力した分は直せます)。
  • また、私は異方性温度因子がある場合は、それらも入力してます。CODのデータで異方性温度因子が入力されていないことが多いようです(オリジナルの論文に載っていても)。

デポジット近況(古い分)

  • 最近ネットニュースで見かけたcarmeltazite(理想組成 ZrAl2Ti4O11の新鉱物)は、地球外物質(?)、ダイヤモンドより硬い、宝石に有望などと書かれていた。ちょっと興味を惹かれたので、調べてみると最近論文が出ていて、そこで結晶構造がすでに決められていた。その構造をCODへデポジットした(cif)。組成および構造からみて、硬度はダイヤモンドはもちろん、コランダム(サファイア)にも及ばないはず。見つかっているのは現在のところ、粒径数十ミクロンでしかない。宝石と言われているのは、carmeltaziteを含んでいるコンランダム結晶(サファイア)が宝石として扱われていることを言っているようだ。どちらかというと、サファイアの不純物であるので、サファイアの宝石価値をむしろ下げているのではないか。かなり還元条件(Tiが三価)で出来ているので、色々と普通にはない鉱物が見つかり、それらは隕石中の鉱物と共通しているので、地球外物質と誤読されかねない記述も見られたが、carmeltaziteを含む岩石自体は火山岩起源である。また、報告された結晶構造(下に示した)については、M1席(球で示した原子)周りが明らかにおかしい。本来配位多面体として表示されるのだが、1つの酸素だけが通常の結合距離で、他がそれより離れているため、多面体にできない。構造解析をやり直す必要がありそう。1度、1.5 GPa, 1000 Cで合成にトライしてみたが、反応が全然進んでいかなかった。
    carmeltazite.png
  • 2019年1月号のJ. Ceramic Soc. JapanのDFT計算論文から。面白いことに、どちらの構造も私がDFT計算で予測したZn2SiO4の高圧相2つ(https://arxiv.org/pdf/1903.05339 )と同じ構造をしている。Zn2SiO4の高圧相転移の研究から考えて、これらも圧力をかけると、オリビン、変形スピネル, スピネル構造のどれかに相転移しそう(分解さえしなければ)。
    deposite201901.jpeg
  • (2018/11/02) J. Ceramic Soc. Japanから2構造をデポジット。
  • (2018/10/06) 最近デポジットした構造を上に持ってきて、古い近況を最後に移動。
  • (2018/10/03) 自分の論文からDFT計算で最適化した構造をデポジットした。
  • (2018/10/02) J. Ceramic Soc. Japanから2論文の構造をデポジット。
  • (2018/10/01) tridymiteのOC相の構造がCODにはないことに気づいたので、木原先生の論文からデポジット。
  • (2018/08/19) 今日、CODをupdateしたら、updateされているのはcod/cifで以前通りとなった。この前のは何だったのか。
  • (2018/08/09) CODをupdateしたら、cifが入るdirectoryが変わったのか、cifを全部ダウンロードし直している。以前はcod/cif/, 今はcod/tags/v0.1.0/cif/
  • (2018/08/07) 竹内先生らのhemimorphiteの中性子回折データ(1978)がCODになかったので、デポジットした。XRD解析も同じ論文にあるが、それをデポジットすると中性子データと同じだと言われる。ちょっと工夫してなんとかXRDの結果もデポジットできた。
  • (2018/08/03) JMPS最新号の2つの構造をデポジット
  • (2019/10/30) 直接雑誌からcifへデポジットされているはずだが、実際にはなかったので、1つデポジット。総計480個。
  • (2019/12/08) 某雑誌の最新号から1個デポジットしようとしたが、構造がおかしいので止めた。Z. Kristの古い論文から、研究で必要だったので、1件デポジット。総計481個。
  • (2019/10/30) 直接雑誌からcifへデポジットされているはずだが、実際にはなかったので、1つデポジット。総計480個。
  • (2019/10/03) 最近の論文から2つデポジット。計479個。
  • (2019/10/01) 最近の論文から8つデポジット。計477個。split atom modelがduplicateだとのエラーでデポジットできなかった。何か方法を考えないと。
  • (2019/08/06) 最近の論文から5つほどデポジット。計469個。
  • (2019/07/17) chrysotileのまともな構造がCODになかったのでデポジットした。ちょうど研究で必要だった。
  • (2019/06/9) 下記のエラーの件、デポジット時にいちいち対応しているのは面倒なので(対称要素が多いとかなり大変)、VestaからのcifファイルをCODの要求に合うように直接変換するスクリプトをPythonで作成してみた。Z, 温度、圧力、鉱物名、論文情報のタグなども追加するようにした。論文情報等を書き込む必要はもちろんあるが、少し作成が楽になった。ちょっと慣らしてから公開する予定。
  • (2019/06/8) いつも通りにデポジットするとエラーが出た。_space_group_symop_operation_xyzの前に_space_group_symop_idがないことと、対象操作リストのフォーマットの違い。
    'x, y, z'
    1 x,y,z
    上側でこれまでは問題なかったが、現在は下側のフォーマットでないと怒られる。また、x,y,z間にスペースがあるとやはりエラーとなる。これらを直すとエラーは消えた。エラーとも格闘しながら、10個デポジットした。
  • (2019/06/7) CODと同じ感じで、ラマンスペクトルのオープンデータベース(ROD)ができていた。それの紹介のオープンアクセス論文がJ. Appl. Crystallographyに出ている。私はラマンもやっているので、スペクトルを今後デポジットして行きたいと思っている。とりあえずの問題はデポジットできるフォーマットにデータを変換しないといけないが、その変換を簡単にするプログラムか何かをまず作る必要があり、フォーマットをまず見ている。CODと同じようにSQLで検索できるので、CODの検索に作ったCOD_Search_SQLのようなものを作る必要がある。ただ、検索できるのは組成や名前で、このデータベースは現状ではラマンスペクトル自体では検索はできない。CODとひもづけることができるので、構造とラマン同時に測定している場合にはリンクできる。結晶以外のガラスなどもデポジットできる。現在1100くらいのスペクトルがある。
  • (2019/05/22) arXivに出した論文の構造データ11個をprepublicationとしてデポジットした。prepublicationの場合は本人でないとデポジットできない。
  • (2019/05/21) 自動的にデポジットされるはずの雑誌に発表されている、ある高圧相結晶構造1つが何故かCODに入ってなかったので、デポジットした。QualX2での検索で気づいた。
  • (2019/05/21) 7名に増えていた。
  • (2019/05/18) 下のCODのメーリングリストに参加したが、現在のところ4名しかいない。
  • (2019/05/17) Le Bail先生がCODの新しいメーリングリストをYahoo Groupsに作られた。https://groups.yahoo.com/neo/groups/C-O-D/info
  • (2019/05/13) J. Ceramic Soc. Japan最新号から4構造をデポジットした。
  • (2019/04/09) SrAl2O4のP63相が入ってなかったので、デポジットした。
  • (2019/03/15) J. Ceramic Soc. Japan最新号から1構造をデポジット。
  • (2019/01/24) Cohen and Lin (2014) FeSiO3 PPv-II (DFT+U計算)をデポジット
  • (2019/01/22) 話題(?)のcarmeltaziteをデポジット。
  • (2019/01/12) J. Ceramic Soc. Japanから2構造をデポジット。これらはDFT計算結果。DFT計算結果をデポジットするかどうかは微妙だが、これらの化合物の構造解析はされているが、CODには登録されていなかったので、登録する意味はあると判断。また、構造解析論文はアクセスには料金必要だったこともある。

トップ   編集 凍結解除 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2020-02-12 (水) 08:45:47 (182d)