Get Adobe Flash player
Home 比較ゲノム
English (UK)

O04: ベン図(Venn Diagram)の描画

 

ベン図(Venn Diagram)とは?

ベン図(Venn Diagram)は集合論で使用される図で、3個の集合(4集合の場合も描画可能ですが、IMCでは3集合以下のみ描画します)間の要素の数の分布を示したものです。それぞれの集合に属する要素を円内に示し、それらが重なり会う部分を共通要素として示します。生物学への応用として近縁種ゲノム間の相同遺伝子の数を図示すことに使用されます。

搭載ソフトウェア

  • IMC GE and AE
  • GT

機能

すでに遺伝子が同定された3株の近縁種ゲノム塩基配列についてそれらのGenBank形式ファイルを使い、それぞれのゲノム上に存在するすべての遺伝子の間に共通遺伝子か否かを判定し、3ゲノム間あるいは2ゲノム間のベン図(Venn Diagram)を描画します。

  • 共通遺伝子の判定には、NCBI Blastによるアミノ酸配列性検索を使用します。
  • 判定基準は、Blast結果のPercent IdentityとOverlap Lengthを使用します。
  • Percent IdentityとOverlap Lengthが指定値以上の組をそれぞれが共通と定義します。

Venn Diagramをカラーグラフィック描画します。

  • 各数値をクリックするとその遺伝子リストを表示します。
  • 描画色を変更することが可能です。
  • 印刷が可能です。

共通遺伝子等のリストを表示、ファイル出力します。

  • 3種に共通な遺伝子数とそのリスト
  • 3種のうち、いずれかの2種に共通な遺伝子数とそのリスト
  • そのゲノムのみに存在し、他の2種ゲノムに共通な遺伝子が存在しない遺伝子の数とそのリスト
  • 各リストはCSVファイルとして出力できます。

共通遺伝子あるいはユニーク遺伝子に関して、遺伝子フィーチャーアラインメントします。

  • リスト上の各共通遺伝子あるいはユニーク遺伝子をクリックすることにより、MGV(参照ゲノムマップ)上の各ゲノムをその遺伝子位置で遺伝子フィーチャーアラインメントします。

制限事項

  • Venn Diagram機能は、IMC GE/AEに実装されています。IMCSEには実装されていません。
  • Venn Diagramの描画対象ゲノムはすべてMGV上にロードしておく必要があります。

結果表示ダイアログ画面および項目説明

  • - [[結果表示ダイアログ画面説明>IMC_VennDiagramResultDialog]]
  • - [[共通・ユニーク遺伝子リスト表示説明>IMC_VennDiagramResultList]]

アルゴリズム

  • 比較するゲノム上に同定されたCDSのアミノ酸配列をNCBI Blastの相動性検索を利用して比較します。
  • 2ゲノムの比較の場合は、一方のゲノム上の1つのCDSが他のゲノムの全CDSに対してアミノ酸配列相動性検索を行い、さらにそのトップヒットCDSが元のゲノムのクエリーCDSと一致する場合に、共通遺伝子であると定義します。
  • ただし、指定条件(Percent IdentityとOverlap Length)が判定基準値以下である場合には、棄却されます。

バグ情報

未修正のバグ

  • 未修正のバグは報告されていません。

修正済のバグ

  1. IMC Version 5.0.4 (2011/9/20リリース)にて修正
    • 結果の識別表示用にオプションで選択したQualifierに改行が含まれていると、正しい解析結果を得ることができないというバグが修正されました。
  2. IMC Version 5.0.2 (2011/9/10リリース)にて修正
    • VENN Diagram図上の遺伝子数がマイナスとなるバグが修正されました。

最新追加・変更機能

IMC Version 5.0.11 (2011/12/20リリース)における改良項目

  1. VENN Diagramの解析対象ゲノムの選択方法が変更されました。
    • 従来はVENN Diagramの実行ダイアログで直接2つ以上のGenBankファイルを指定していました。
    • 今回の改良で、VENN Diagram実行ダイアログにはMGVにロードされている全配列ファイルが表示され、その中から3個を選択するように変更されました。

IMC Version 5.0.10 (2011/12/6リリース)における改良項目

  1. VENN Diagramの実行結果を保存し、後で参照できるようになりました。
    • VENN Diagramに使用したゲノムがMGVにロードされていない場合は、自動的にロードされますが、ファイル名を変更したり、保存場所を移動すると参照できなくなります。

IMC Version 4.3.11 (2011/6/1リリース)における改良項目

  1. + 参照プールに2株以上のゲノムが読み込まれていない場合はVenn Diagramを実行できません。
  2. + 読み込んだゲノムを番号表示ではなくファイル名で表示します。
  3. + ダイアグラムの各数値のフォントが大きくなりました。
  4. + ダイアグラムの塗りを枠線を濃く、中を薄く、描画します。
  5. + ダイアグラムの数値をクリックすると対応するタブが開くようになります。
  6. + 共通遺伝子リストの各行をクリックすると、各ゲノムの対応する遺伝子がMultiple Genome Viewer上でアラインメント表示され、ハイライト表示されます。
  7. + 共通遺伝子であるか否かの判定基準をe-valueからPercent IdentityとOverlap Ratioに変更されました。 Percent IdentityとOverlap RatioはメニューからOption Setting → Option → Venn Diagramで設定することができます。
  8. + 結果リストに連番が追加されました。
  9. + 結果リストにゲノムの位置が追加されました。
  10. + 結果リストをクリックすると対応する参照ゲノムの位置が表示されます。
  11. + 他の2つのゲノムになく、そのゲノムにだけあるリストが作成されます。
  12. + 他の1つのゲノムになく、2つのゲノムにだけあるリストが作成されます。

今後の機能強化予定

  • 外部データベースへのリンク付加
  • 結果の保存・再現機能

関連機能

 

近日中リリース予定製品

近日中リリース予定機能