Get Adobe Flash player
Home 比較ゲノム
English (UK)

O04 近縁種ゲノム間のVENNダイアグラムを描画する

ベン図(Venn Diagram)とは?

ベン図(Venn Diagram)は集合論で使用される図で、3個の集合(4集合の場合も描画可能ですが、IMCでは3集合以下のみ描画します)間の要素の数の分布を示したものです。それぞれの集合に属する要素を円内に示し、それらが重なり会う部分を共通要素として示します。生物学への応用として近縁種ゲノム間の相同遺伝子の数を図示すことに使用されます。

搭載ソフトウェア

  • - IMC GE and AE
  • - GT

機能

すでに遺伝子が同定された3株の近縁種ゲノム塩基配列についてそれらのGenBank形式ファイルを使い、それぞれのゲノム上に存在するすべての遺伝子の間に共通遺伝子か否かを判定し、3ゲノム間あるいは2ゲノム間のベン図(Venn Diagram)を描画します。

  • 共通遺伝子の判定には、NCBI Blastによるアミノ酸配列性検索を使用します。
  • 判定基準は、Blast結果のPercent IdentityとOverlap Lengthを使用します。
  • Percent IdentityとOverlap Lengthが指定値以上の組をそれぞれが共通と定義します。

Venn Diagramをカラーグラフィック描画します。

  • 各数値をクリックするとその遺伝子リストを表示します。
  • 描画色を変更することが可能です。
  • 印刷が可能です。

共通遺伝子等のリストを表示、ファイル出力します。

  • 3種に共通な遺伝子数とそのリスト
  • 3種のうち、いずれかの2種に共通な遺伝子数とそのリスト
  • そのゲノムのみに存在し、他の2種ゲノムに共通な遺伝子が存在しない遺伝子の数とそのリスト
  • 各リストはCSVファイルとして出力できます。

共通遺伝子あるいはユニーク遺伝子に関して、遺伝子フィーチャーアラインメントします。

  • リスト上の各共通遺伝子あるいはユニーク遺伝子をクリックすることにより、MGV(参照ゲノムマップ)上の各ゲノムをその遺伝子位置で遺伝子フィーチャーアラインメントします。

制限事項

  • Venn Diagram機能は、IMC GE/AEに実装されています。IMCSEには実装されていません。
  • Venn Diagramの描画対象ゲノムはすべてMGV上にロードしておく必要があります。

結果表示ダイアログ画面および項目説明

  • 結果表示ダイアログ画面説明
  • 共通・ユニーク遺伝子リスト表示説明

操作方法

準備

  • MGV (=Reference Map) に2株以上の近縁種ゲノム塩基配列ファイルを読み込みます。
  • MGVに解析対象ゲノムを読み込むのは、ゲノム間アラインメントを実行するためです。
  • IMC_5.0.6_BX22001.JPG

実行手順

  • 1. Venn Diagram ボタンをクリックします。
    • Venn Diagram Setting ダイアログが表示されます。
    • Multiple Genome Viewer(MGV) MapにロードされているGenBankファイルが表示されます。
    • IMC_5.0.12_BZ29_012.JPG
  • 2. リストからVENN Diagramの対象ゲノムを3個までチェックします。
    • imcimgO/IMC_5.0.12_BZ29_008.JPG
  • 3. Setボタンをクリックします。
  • Venn Diagram 実行プログレスメッセージが表示されます。
    • imcimgO/IMC_5.0.6_BX22004.JPG
    • 処理が終了するまで、ゲノムの大きさによっては、数分から数十分かかる場合があります。
    • 処理が終了すると、結果画面が表示されます。
  • IMC_5.0.6_BX22006.JPG

タブ切換操作

  • 1. 結果表示ダイアログの上部タブをクリックします。
    • IMC_5.0.6_BX22018.JPG
    • -- 表示内容を切り替えることができます。
  • 2. 3ゲノム共通リストの表示
    • IMC_5.0.6_BX22012.JPG
    • 3ゲノム間の共通相同遺伝子リスト表示
    • 結果表示ダイアログ画面説明
  • 3. 任意の2つのゲノム間の共通相同遺伝子リスト表示
    • リスト表示説明
    • IMC_5.0.6_BX22014.JPG

各円の描画色および文字色の変更

  • 以下の描画色を変更可能です。
    • ゲノム1の描画カラーの変更
    • ゲノム2の描画カラーの変更
    • ゲノム3の描画カラーの変更
    • 数値の文字カラーの変更
  • IMC_5.0.6_BX22020.JPG
  • 1. 各カラーボックスをクリックします。
    • カラーパレットが表示されます。
    • IMC_5.0.6_BX22024.JPG
  • 2. 変更するカラーを選択します。
    • パレットのカラーが変更されます。
    • IMC_5.0.6_BX22025.JPG
  • 3. "Show" をクリックします。
    • 描画色の変更が反映されます。
  • IMC_5.0.6_BX22026.JPG

共通遺伝子の参照ゲノムマップ対応位置および同位置でのゲノムアラインメント表示

  • 1. 各共通遺伝子リストの各行をクリックします。
    • 各ゲノムの対応する遺伝子がアラインメントされ、Multiple Genome Viewerに表示されます。
  • IMC_5.0.6_BX22031.JPG
  • 2. 2ゲノムに共通な遺伝子や、1ゲノムだけに存在するユニーク遺伝子からもMultiple Genome Viewer上のその遺伝子位置を表示し、ハイライトします。
  • IMC_5.0.6_BX22032.JPG
Venn Diagram図形の印刷
  • 1. Venn Diagramが表示されているウィンドウの下部にあるボタンを使用して印刷します。
    • IMC_5.0.2_B910004.JPG
    • i) Pageの設定を変更する --> [[Page Setupボタン>IMC_ButtonSetup]]をクリックする
    • ii) Printerに直接印刷する --> [[Printボタン>IMC_ButtonPrint]]をクリックする
    • iii) 印刷イメージを[[PDF]]ファイルで出力する --> [[PDFボタン>IMC_ButtonPDF]]をクリックする
    • iv) 印刷イメージを[[PNG]]ファイルで出力する --> [[PNGボタン>IMC_ButtonPNG]]をクリックする
    • v) 印刷イメージを[[EMF]]ファイルで出力する --> [[EMFボタン>IMC_ButtonEMF]]をクリックする

共通遺伝子およびユニーク遺伝子リストのCSVファイル出力

  • 1. 各遺伝子リストのタブを選択した後、下部のCSVボタンをクリックします。
    • IMC_5.0.2_B910005.JPG
    • -- 出力ファイル指定ダイアログが表示されます。
  • 2. ファイル名とディレクトリ(フォルダー)名を指定します。
    • -- 出力ファイルはMS Excelで閲覧・加工できます。

過去にVENN Diagramを実行した結果の読み込みと表示

  • 1. VENN Diagram実行ボタンをクリックします。
    • VENN Diagram実行ダイアログが表示されます。
  • IMC_5.0.12_BZ29_012.JPG);
  • 2. "Read..."をクリックします。
    • File Chooserが表示されます。
  • IMC_5.0.12_BZ29_004.JPG
  • 3. 過去に実行したVENN Diagram結果ファイルを指定します。
    • 確認メッセージが表示されます。
    • IMC_5.0.12_BZ29_006.JPG
  • 4. 「はい(Y)」をクリックします。
    • 指定した結果がロードされ、表示されます。
    • IMC_5.0.12_BZ29_014.JPG

アルゴリズム

  • 比較するゲノム上に同定されたCDSのアミノ酸配列をNCBI Blastの相動性検索を利用して比較します。
  • 2ゲノムの比較の場合は、一方のゲノム上の1つのCDSが他のゲノムの全CDSに対してアミノ酸配列相動性検索を行い、さらにそのトップヒットCDSが元のゲノムのクエリーCDSと一致する場合に、共通遺伝子であると定義します。
  • ただし、指定条件(Percent IdentityとOverlap Length)が判定基準値以下である場合には、棄却されます。

バグ情報

未修正のバグ

  • 未修正のバグは報告されていません。

修正済のバグ

  1. IMC Version 5.0.4 (2011/9/20リリース)にて修正
    • 結果の識別表示用にオプションで選択したQualifierに改行が含まれていると、正しい解析結果を得ることができないというバグが修正されました。
  2. IMC Version 5.0.2 (2011/9/10リリース)にて修正
    • VENN Diagram図上の遺伝子数がマイナスとなるバグが修正されました。

最新追加・変更機能

IMC Version 5.0.11 (2011/12/20リリース)における改良項目

  1. VENN Diagramの解析対象ゲノムの選択方法が変更されました。
    • 従来はVENN Diagramの実行ダイアログで直接2つ以上のGenBankファイルを指定していました。
    • 今回の改良で、VENN Diagram実行ダイアログにはMGVにロードされている全配列ファイルが表示され、その中から3個を選択するように変更されました。

IMC Version 5.0.10 (2011/12/6リリース)における改良項目

  1. VENN Diagramの実行結果を保存し、後で参照できるようになりました。
    • VENN Diagramに使用したゲノムがMGVにロードされていない場合は、自動的にロードされますが、ファイル名を変更したり、保存場所を移動すると参照できなくなります。

IMC Version 4.3.11 (2011/6/1リリース)における改良項目

  1. 参照プールに2株以上のゲノムが読み込まれていない場合はVenn Diagramを実行できません。
  2. 読み込んだゲノムを番号表示ではなくファイル名で表示します。
  3. ダイアグラムの各数値のフォントが大きくなりました。
  4. ダイアグラムの塗りを枠線を濃く、中を薄く、描画します。
  5. ダイアグラムの数値をクリックすると対応するタブが開くようになります。
  6. 共通遺伝子リストの各行をクリックすると、各ゲノムの対応する遺伝子がMultiple Genome Viewer上でアラインメント表示され、ハイライト表示されます。
  7. 共通遺伝子であるか否かの判定基準をe-valueからPercent IdentityとOverlap Ratioに変更されました。 Percent IdentityとOverlap RatioはメニューからOption Setting → Option → Venn Diagramで設定することができます。
  8. 結果リストに連番が追加されました。
  9. 結果リストにゲノムの位置が追加されました。
  10. + 結果リストをクリックすると対応する参照ゲノムの位置が表示されます。
  11. + 他の2つのゲノムになく、そのゲノムにだけあるリストが作成されます。
  12. + 他の1つのゲノムになく、2つのゲノムにだけあるリストが作成されます。

今後の機能強化予定

  • 外部データベースへのリンク付加
  • 結果の保存・再現機能

関連機能

近日中リリース予定製品

近日中リリース予定機能