バイオインフォマティクス 第7回 第8

演習1 データベースの概要 データ取得

演習2 多重配列比較 系統樹解析  相同性配列検索

 

演習マニュアル(pdfファイル)

 

日 程

7 : 1128日(火) 演習及び課題

8 : 1205日(火) 課題

レポート提出: 1219日(火)の講義時 E210教室 大前先生へ)

 

場 所

情報メディア教育研究センター2階    学生証を忘れないように!

 

演習項目

1.配列情報の取得と確認 (2−4ページ

NCBIのデータベースを利用 キーワード検索など 配列情報を確認する

    http://www.ncbi.nlm.nih.gov/

 

2.相同性検索 (5−6ページ

NCBIBLASTを利用 オーソログ遺伝子の配列情報(アミノ酸配列、mRNAの塩基配列、翻訳領域の塩基配列、非翻訳領域の塩基配列、イントロンを含む遺伝子の塩基配列など)を取得する

    http://blast.ncbi.nlm.nih.gov/Blast.cgi

 

3.マルチプルアライメント(多重配列比較)と分子系統樹の作成 (7−9ページ

   ゲノムネットの ClustalW を利用

    http://www.genome.jp/ja/

 

4.課題 (9ページ

 

 

データベース検索の実践

今回は実際にインターネットに公開されているデータベースを用いて、配列解析の演習を行います。通常は自分で新規に取得・決定した塩基配列またはアミノ酸配列に関して解析しますが、ここでは化学科の化学実験で扱うヒトのアルデヒドデヒドロゲナーゼ2(Aldehyde dehydrogenase 2; ALDH2)を例として解析を行うことにします

 

 

課 題

1. 前項までで利用した5種(ヒト、ラット、ウシ、ニワトリ、および任意の一種)のアミノ酸配列に対応した mRNAの全塩基配列を入手し、マルチプルアライメントと2種類の分子系統樹を作成せよ。

 

2. 各自興味のある蛋白質を2種類選び、それぞれ適当な生物種(5種以上)のオーソログ遺伝子由来のアミノ酸配列mRNAの全塩基配列を入手し、それぞれマルチプルアライメントと2種類の分子系統樹を作成せよ。

 

3. レポートは目的、方法、結果、考察などの項目で3オーソログ遺伝子分まとめて作成すること。アミノ酸配列と塩基配列の解析結果の比較や、mRNAのマルチプルアライメントの開始コドンと終止コドンを明示して翻訳領域と非翻訳領域の相同性の比較をするなど、すべての結果について統合的に考察するように(講義時に配付した「第6回課題」を考察に含めてもよい)。

 

配列データ選択における注意事項

1.     BLAST検索や注釈付きデータベースより「オーソログ遺伝子」の配列データを取得する。

2.     極端に長いまたは短い配列を避ける。

マルチプルアライメントの結果をよく吟味する。

取得した配列データの組み合わせを替えるなどして、何度も解析し直すように。

3.     繰返し配列を含むデータの解析は難しい。

4.     塩基配列で解析する場合、全mRNAや翻訳領域に絞るなどなど工夫するように。

 

レポートについて

1.     A4レポート用紙を用いて、表紙を付けて各自作成する。CDなどのデータは添付しなくてもよい。

2.     レポートはワープロで書いてよいが、必ず自分の言葉で書くこと。Wikipedia等を過信しない。

3.     データベースのAccession No.などを明記し(「方法」に一覧)、他人が再解析可能なレポートにする。

4.     「結果」は単にプリントアウトしたものを添付するのではなく、わかりやすくまとめること。たとえば、すべての分子系統樹(12種あるはず)は一カ所にまとめる。

5.     必ずマルチプルアライメントの結果(不要部分は削除)を入れ、レポート用紙10-15枚にまとめる。データ部分は「二段組み」にし、行間を詰めるなどの工夫をすること。

6. レポート提出は1219日の講義時(E210教室 大前先生へ)。

 

 

過去のレポートの感想

・選択したデータについて

マルチプルアライメントに使ったAccession numberは必ず明記すること。

タンパク質の種類が未記載の例が多い。何を調べたのか全くわからない。

「白血球の遺伝子のマルチプルアライメント」という意味不明も。

 

・対象タンパク質の選び方について

オーソログ遺伝子でない塩基配列やアミノ酸配列をゲットしている。

相同部分がほとんどないタンパク質間でマルチプルアライメントしているのが多い。

アミノ酸の数が極端に異なる配列を比較しても意味がない。

中には、56残基と496残基のアミノ酸配列を比較するのがあった。

タンパク質の名前の一部が同じだが全く異なる種類のタンパク質間で比較しているのが多い。

同属のタンパク質はたくさんある。ファミリー間の別遺伝子由来のタンパク質に対して、xxx type 1, 2とかyyy alpha, beta とかzzz acid, basic といった名前で区別するのが多い。

種間で異種のタンパク質を比べても分子系統樹を調べることはできない。

たとえば、humantype 1bovinetype 2といった形で、異種タンパク質間で調べても、分子系統樹はわからない。

マルチプルアライメントの結果をよく見れば、異種タンパク質が混じっていることに気がつくはず。

BLASTによるホモロジー検索を利用して、同類のタンパク質を選ぶように。

 

 

説明: 説明: 説明: 説明: hr-green

第2>→<第3>→<第4>→<第5>→<第6>→<第7回・第8回>

ホームに戻る

無断転載を禁じます(Yoshiyuki Ashida; 芦田嘉之)