忍者ブログ

下っ端研究者のメモ

研究、バイオインフォマティクス、日常等の備忘録

sequence read archive






×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

コメント

ただいまコメントを受けつけておりません。

sequence read archive






近年、次世代シークエンサーのおかげで非モデル生物においてもトランスクリプトームやゲノム解析が行われています。

トランスクリプトームやゲノム解析の論文がでているのに、NCBIで検索しても配列が全然でてこないことがもっぱらです。

そんなときはseqence read archiveを探してみると論文が出ているものについてはSRAファイルが登録されています。SRAファイルは、要は次世代シークエンサーの出力ファイルです。

ですので、linux マシンがあれば自分で次世代シークエンサーの出力ファイルを解析できれば、必要な情報を得ることができます。特に、ディジェネレートプライマーを使ってホモロジークローニングしようとしている時には非常に強力なデータになります。

SRAファイルは
DDBJのDRA search http://trace.ddbj.nig.ac.jp/DRASearch/
NCBIのSRA http://www.ncbi.nlm.nih.gov/sra
から検索、ダウンロードできます。

検索してみると意外と使えるデータがあります。


SRAファイルはそのままでは使えないのでSRA tool kitを使ってfastqファイルに変換してあげます。
SRA tool kit はNCBIからダウンロード http://eutils.ncbi.nih.gov/Traces/sra/?view=software

使い方はWolf Earsとショートリードの憂鬱の記事がわかりやすいです。
http://g86.dbcls.jp/~yag/wordpress/archives/959
http://shortreadbrothers.blogspot.jp/2011/08/sra-toolkit-v212.html

僕のパソコンはcent OSの64bit版なのでそれをダウンロード
tar -xvf sratoolkit.2.3.4-2-centos_linux64.tar
で解凍

SRAファイルをfastqファイルに変換するにはbinの中のfastq-dump
-A で出力するファイルの名前を指定
-split-files でRとFに分けて出力
./bin/fastq-dump -A SRA -split-files SRAfile.sra
これで
SRA.fastq_1
SRA.fastq_2
が出力されます。

あとはこのfastqファイルをアッセンブルしてあげます。
アッセンブルについてはまた今度


ランキング参加中
ブログランキング・にほんブログ村へ
にほんブログ村


スポンサードリンク


PR

コメント

スポンサードリンク

ブログ内検索

最新記事

2022 / 12 / 12 ( Mon ) 21 : 06 : 08 )
2017 / 08 / 12 ( Sat ) 23 : 05 : 33 )
2016 / 06 / 19 ( Sun ) 19 : 27 : 00 )
2016 / 01 / 16 ( Sat ) 20 : 15 : 10 )
2016 / 01 / 03 ( Sun ) 20 : 17 : 35 )

リンク

おすすめの本

ランキング