バイオインフォマティクス 第4

 基礎分子生物学3 具体的な遺伝子

 

資 料

講義で使うPPファイル(pdfファイル)

具体的な遺伝子の拡大図(pdfファイル)印刷可

マルチプルアライメントの例pdfファイル)印刷可(上と同一ファイル)

 

課 題

1.ある遺伝子Aから転写・翻訳の後、分子量30,000のタンパク質が合成されるとする。この遺伝子ADNA鎖は何塩基対(base pair = bp)か。この遺伝子Aにはイントロンはないものとし、翻訳領域(終止コドンを含む)の塩基対数のみを推定せよ。アミノ酸の平均分子量を100とする。

2.ヒトの肝細胞に存在するタンパク質Bは、アミノ酸300個がペプチド結合でつながった単量体である。このタンパク質BmRNAの長さは1,200塩基(1,200-b)、この遺伝子Bの長さは2,000塩基対(2,000-bp)であった。この遺伝子Bの塩基対数、イントロンの総塩基対数、遺伝子Bから転写により合成されるmRNA前駆体の塩基数および成熟型mRNAの塩基数、成熟型mRNAに含まれる翻訳領域および非翻訳領域の総塩基数、タンパク質Bのアミノ酸数との関係を、転写・翻訳システムを絡めながら簡潔に図解せよ。

3.分子系統樹やマルチプルアライメントの結果から何が読み取れるだろうか? 進化と分子生物学の両方の立場から解説せよ。

 

 

講義項目

具体的な遺伝子の構造と機能

・チトクロームC遺伝子

遺伝子の構造 エキソンとイントロン

生命情報の種間多様性 分子系統樹

 

・ヒトインスリン遺伝子

翻訳後修飾

 

・ヒトのABO式血液型を決定する遺伝子

3つの対立遺伝子と遺伝子型、表現型

 

==========================

 

講義内容

遺伝子構造やデータベースの登録情報を理解することにつとめます。

そのうえで、対立遺伝子、遺伝子型といった遺伝子の基本概念など、具体的な遺伝子にまつわる分子生物学の基本を学びます。

 

DNAの中でも転写される単位が遺伝子

遺伝子はイントロンによって分断

遺伝子領域から転写によってmRNA前駆体が合成

スプライシングによりイントロンが除かれエキソンのみに

成熟mRNAはエキソンのみで構成

成熟mRNAがタンパク質合成(翻訳)に関与

 

 

体細胞と生殖細胞 体細胞の多様性

すべての2倍体細胞は基本的には受精卵のクローンです。すなわち、細胞核を持つすべての体細胞は卵子の核由来のゲノムと精子の核由来のゲノムの2セット分のゲノムを持っています。

細胞分裂の時に遺伝情報が若干変化するため、完璧なクローンと言うわけではありません。

すべての細胞核を持つ体細胞が同じゲノムを持つと言うことは、基本的には同じ遺伝情報を持ち、同じ遺伝子セットを2組持つと言うことになります。

 

体細胞分裂の過程で、細胞は分化します。体細胞分裂時にゲノムはほぼ正確にコピーされるため、生じた体細胞はクローンですが、形や働きの異なる体細胞に変化していきます。その過程が分化です。

 

体細胞は受精卵のクローン細胞のため、すべての体細胞は基本的には同じ遺伝情報・ゲノムを持っています。

すべての体細胞が同じゲノムであると言うことは、すべての体細胞は同じ種類の遺伝子群を持ちます。

すなわち、どの体細胞も同じタンパク質群を合成する情報を持っているわけです。

しかし、胚発生から胎児になり、誕生以降も成長していく細胞を見てみると、形や働きが異なる200種類ぐらいの細胞があることがわかります。

 

このように多様な細胞になることを細胞の分化と言います。

 

多種多様な細胞は基本的にはすべて同じゲノムを持っています。

なぜ、ゲノムが同じなのに異なる形と働きを持つ細胞になるのでしょうか?

1つのゲノムには2万数千種類の遺伝子があります。

体細胞には2セットのゲノムがありますから、2万数千対の遺伝子があります。

それぞれの遺伝子の遺伝情報からそれぞれの細胞がタンパク質を合成します。

これが遺伝子発現です。

しかし、すべての遺伝子が発現するわけではなく、細胞の種類ごとに発現する遺伝子が異なります。

遺伝子が発現する場合でも、発現の頻度が細胞ごとで異なり、発現するタイミングも異なります。

その結果、細胞ごとに合成されるタンパク質の種類と量が異なります。

遺伝子発現には多種多様なタンパク質が関与していますので、細胞が持つタンパク質の種類と量により発現する遺伝子が決まり、作られたタンパク質によりさらに調節されます。

ある1つの遺伝子発現だけでも巧妙に調節されており、各々の細胞には2万数千も遺伝子があり、さらには数十兆個の細胞が分担したり協調したりしながら恒常性を保って生きているわけです。

 

 

ヒトの2万数千ある遺伝子のうち、ここでは3つの遺伝子を取り上げ、それぞれの構造の特徴や性質について解説します。

 

 

具体的なヒトの遺伝子

ヒトチトクロームC遺伝子

まずはヒトチトクロームC遺伝子の構造と機能を説明します。

この遺伝子を取り上げるのは、比較的遺伝子の構造が単純で、サイズも小さいからです。

また、単細胞生物から多細胞生物まで、多くの生物が持っているからです。

 

ヒトチトクロームC遺伝子の構造

慣例に従って、塩基配列は5’から3’方向のmRNAと同じ方向の配列のみ記入してあります。実際のDNAは2本鎖ため、この配列から一意に決まる逆方向に延びるもう1本の鎖があります。

一方の鎖の塩基配列を書くともう一方の鎖の塩基配列は一意に決まるため、通常、このように1本だけ書きます。

2本のうち、mRNAと同じ方向だけが選ばれます。

真核生物では、ある遺伝子領域では、片方の遺伝情報のみが使われます(例外もあります)。

 

真核生物では、ほとんどの遺伝子はイントロンで分断されています。

スプライシングにより、エキソン部分のみが再構築され、タンパク質に翻訳されるmRNAができます。

ヒトチトクロームCの場合、ます81番目のCから2512番目のAまでが核内でmRNAに転写されます。

これは「初期転写産物」です。

この中にはエキソン1、イントロン1、エキソン2、イントロン2、およびエキソン3が含まれます。

この初期転写産物のうちイントロン1とイントロン2の部分が切り出され、エキソン1、エキソン2、およびエキソン3が再結合し、成熟したmRNAが合成され、細胞質のリボソームに結合します。

最初のAUGコドンから翻訳が開始されます。

105個のアミノ酸が解読されたあと終止コドンのUAAが来るので、そこで翻訳が終わります。

 

分子生物学的な系統樹

基本的なタンパク質のアミノ酸配列は進化の過程でよく保存されおり、タンパク質のアミノ酸配列やそれをコードしている遺伝子の塩基配列を解析することにより、地球上で起こった進化を分子レベルで調べることができます。

進化の過程でいつ頃枝分れしたか数量的に分析することができますし、またこのことは地球上で進化が起こった証拠でもあります。

アミノ酸配列の置換や挿入、欠失は塩基配列の変化に依存します。

この塩基配列の変化はDNAの突然変異によります。

ある領域に突然変異がおこるのはランダムであり、変異結果が蓄積する個数は時間に依存します。

このことから、1塩基変異するのに必要な時間が推定でき、逆に変異数から変異の起きた時間を推定することもできます。

このような観点で遺伝情報を解析することにより、進化の系統樹を作成することができます。

 

タンパク質の機能と翻訳後修飾

遺伝子の情報にしたがって合成されるタンパク質は、そのままの形で働くことはほとんどありません。

多くの場合、働きを持たない状態か、不安定な状態で合成され、何らかな化学的な変化が起こってはじめて働きを持った構造になります。

これを翻訳後修飾と言います。

タンパク質は必ずリボソーム上でmRNAのコドンを読み解く形で合成されます。

リボソームは細胞内にありますが、合成されたタンパク質の活躍する場所は多肢に渡っており、それぞれの場所に移動する必要があります。

例えば、転写を調節する因子なら核の中へ移動しないといけませんし、ミトコンドリアや葉緑体の構成成分ならそれぞれの小器官の中に入り込む必要があります。

また、細胞の外で働くのなら、細胞膜を通過して、細胞外へ出て聞く必要があります。

タンパク質が合成された後どこへ行くかは、実はタンパク質のアミノ酸配列として書いてあります。

 

 

ヒトインスリン遺伝子と翻訳後修飾

翻訳後修飾をインスリン遺伝子を例にして具体的にみてみましょう。インスリンの前駆体はアミノ酸の数が110個しかなく、タンパク質としては小さなほうで、エキソンも3つしかなく、遺伝子もコンパクトに収まっています。

また、医薬品としても重要なことから、古くから研究に利用されてきました。

合成されつつあるインスリン前駆体のN末端側にアミノ酸24個からなるシグナルペプチドがあります。

シグナルペプチドを認識するタンパク質の働きを借りて、合成されつつあるタンパク質は小胞体の中に入ります。

タンパク質合成が終わると(翻訳後)、シグナルペプチドは切断されます。

残った部分にはSH基を持つシステインというアミノ酸が6個あります。

このアミノ酸はお互いに結合することがあり、新たにS-S結合を作る性質を持っています(酸化)。

インスリンの場合、化学的に安定な状態に折りたたまれると3個のS-S結合ができます。さらに中間部分が切り離され、S-S結合でつながった2本の鎖の状態になります(A鎖とB鎖)。

これらの反応が小胞体の中で起こり、ゴルジ体という装置を通り抜けて、細胞膜と融合する形で細胞の外へ出て行きます。

最初に合成された110個のアミノ酸の状態ではインスリンとしての働きは持っておらず、2本の鎖の状態になって初めてホルモンとしての働きを持つようになります(実際には単独で働く訳でははく、他の因子が必要です)。

S-S結合は還元されて元のSHに戻ることもあります。そうなれば2本の鎖はバラバラになります。いったん離ればなれになると、インスリンのホルモンとしての機能は失われてしまいます。

再び同じ所でS-S結合ができることは考えにくいことから、機能を持ったインスリンとして復活することもありません。

 

 

ヒトのABO式血液型を決定する遺伝子

ABO式血液型」を決定する対立遺伝子は大きくわけて3種類あります。仮にA遺伝子、B遺伝子、およびO遺伝子のとします。

血液型は赤血球表面の糖タンパク質(「H抗原」)の糖鎖の末端部分にある糖の種類とその結合様式によって決まります。

A遺伝子の産物のAタンパク質は「N−アセチルガラクトサミン転移酵素」で、B遺伝子の産物のBタンパク質は「ガラクトース転移酵素」です。

いすれも酵素の名前についている糖(N−アセチルガラクトサミン、ガラクトース)をH抗原の糖鎖の末端に結合させる働きを持っています。

 

3種の遺伝子の塩基配列のちがいは次のようです。

A遺伝子を基準に考えると、B遺伝子との間で7つの塩基置換があり、そのうち4箇所の塩基置換は生成されるタンパク質のアミノ酸置換に関与しています。

2個のアミノ酸置換が酵素の「基質特異性」に影響を与え、Aタンパク質とBタンパク質で転移できる単糖の種類が異なります。

A遺伝子とO遺伝子の塩基配列はもっとよく似ていて、なんと1塩基の欠失のみです。

しかし、翻訳領域で1塩基欠失が見られるため、欠失のあったコドン以降の読み枠は1個ずれ、そこから翻訳されるアミノ酸配列はAタンパク質とは全く異なるものになります。

30個分のアミノ酸が翻訳された後に終止コドンが来るため、そこで翻訳は終わり、Oタンパク質には単糖を転移する酵素活性は全くありません。

 

遺伝子型と表現型 1塩基多型

ABO式血液型を決定する対立遺伝子の遺伝子型と表現型は次のようになります。

表現型(血液型)A型の遺伝子型はAOAAのいずれかで、おなじくB型はBOBBのいずれかです。AB型はABのみ、O型はOOのみです。

 H抗原はすべてのヒトが持っています。A遺伝子を持っている細胞ではH抗原にN−アセチルガラクトサミンがついており(A抗原)B遺伝子を持っている細胞ではH抗原にガラクトースがついています(B抗原)。

AB型はA遺伝子とB遺伝子の両方の遺伝子を持っていることから、A抗原とB抗原が両方存在します。O遺伝子由来のタンパク質には糖をくっつける働きがないため、H抗原に変化はありません。

この表現型からわかるように、A遺伝子とB遺伝子は優性、O遺伝子は劣性遺伝子です。

A遺伝子とB遺伝子との間に優性・劣性の区分はありません(優れている、劣っているという意味ではありません)。

A抗原などの血液型物質は赤血球だけでなく他の組織にも見られます。

抗原の分子レベルでのちがいはひとつの糖の種類のちがいだけで、それを決定している遺伝子の塩基配列もわずかに異なるだけです。

このような遺伝情報の個体差につながる多様性を1塩基多型とよびます。

ヒトのゲノムには1塩基多型が300万箇所あるといわれています。血液型遺伝子はそのうちのひとつです。

 

次回の講義

次回は、バイオインフォマティクスと生物進化との関係を学びます。生物進化が遺伝子頻度の変化や自然選択で起こることや、遺伝情報が変化するしくみを学びます。

また、オーソログ、パラログといった遺伝情報を理解する上で基本となる概念を学びます。

 

説明: 説明: 説明: 説明: hr-green

第2>→<第3>→<4>→<第5>→<第6>→<第7回・第8

ホームに戻る

無断転載を禁じます(Yoshiyuki Ashida; 芦田嘉之)