RNA網羅発現量データから機能遺伝子を選出する新規トランスクリプトーム解析方法

タイトル RNA網羅発現量データから機能遺伝子を選出する新規トランスクリプトーム解析方法
担当機関 (国研)農業・食品産業技術総合研究機構 中央農業研究センター
研究課題名
研究期間 2014~2018
研究担当者 福田あかり
廣瀬竜郎
青木直大
近藤聡
米倉円佳
片岡知守
大音徳
永野惇
発行年度 2018
要約 本研究で開発したトランスクリプトーム解析方法は、RNA網羅発現量データを用い、目的とする表現形質にその発現量が大きく影響する遺伝子を、統計分析により選出するものである。この手法を用いることで、農業上有用な機能を持つ遺伝子を効率的に見つけ出すことができる。
キーワード イネ、初期生育、トランスクリプトーム、eQTL、RNA-seq
背景・ねらい 農業形質に関わる遺伝要因の解析手段として、原因となる染色体領域を見つけ出すQTL解析法がよく用いられている。しかし、QTL解析は多くの労力を必要とし、また、遺伝子配列に変異を持つ場合でなければ検出ができない。遺伝子配列に変異がなくとも、その発現量によって制御される形質も多く、そうした要因の解析手段として期待されている方法が、全遺伝子の発現量を測定し、形質に関わる転写産物を検出するトランスクリプトーム解析法である。近年、次世代シーケンサーを利用してのRNA網羅解析(RNA-seq解析)により、全転写産物の発現量をデータとして得ることができるようになったが、その膨大なデータから、必要な形質に関わる機能遺伝子のみを選出する統計解析手法が求められている。そこで本研究では、RNA網羅発現量データから、有用な農業形質に関わる遺伝子を効率的に選出するための新規統計解析法を開発する。この手法を用い、初期生育の早いイネ品種「Arroz da Terra」と生育が並の「奥羽365号」、および両者の戻し交配自殖系統(BIL)のRNA網羅発現量データから、苗重量に影響する機能遺伝子を選出する。
成果の内容・特徴
  1. 転写産物の発現量データを用いて、図1の解析方法により、全発現遺伝子について、その発現量が調査したい表現形質に関連しているか、説明変数選出頻度として表すことができる。
  2. 新規のトランスクリプトーム解析方法で評価する形質として、苗重量のように連続的に変化する形質を使用でき、従来のトランスクリプトーム解析法で用いられるように、両極端の形質を持つ系統を選抜し比較する必要は無い(図2)。親品種およびBIL20系統のRNA網羅解析データを用い、苗重量に関わる高頻度選出遺伝子として158遺伝子を選出でき、その中に、既存の低温発芽遺伝子qLTG3-1、組織伸長抑制遺伝子Short Grain1 (SG1)が含まれる。
  3. qLTG3-1は苗重量QTL内に含まれ、また、親品種間で遺伝子コード領域内に変異を持ち、QTLの原因遺伝子の候補と考えられる(図3、図4)。このことから、トランスクリプトーム解析により、QTLの原因遺伝子の候補を選出できると期待される。
  4. SG1は苗重量QTLに含まれず、親品種間で遺伝子コード領域内に塩基配列の違いも無い。SG1の発現量に関わるQTL(eQTL)は、SG1遺伝子が存在する領域ではなく、苗地上部重QTLと同位置の第7染色体上に検出され、この位置に、SG1の発現量に関わる転写因子がコードされていると予想される(図3、図4)。トランスクリプトーム解析は、塩基配列に変異を持たない、遺伝子カスケードの下流にある機能遺伝子を検出できる。
成果の活用面・留意点
  1. トランスクリプトーム解析方法(図1)は、統計分析フリーソフトRのglmnetパッケージのコードを使用したプログラムにより行える(R Core Team; https://www.R-project.org/)。
  2. 本研究では22系統という少数のサンプル数で機能遺伝子を検出できたが、これは人工気象器内の均質な環境下で、類縁の遺伝子背景を持つ戻し交配自殖系統を用いての結果である。
URL http://agriknowledge.affrc.go.jp/RN/3010029779
カテゴリ 品種

この記事は