バイオインフォマティクス有用なウェブサイト・ウェブツールを紹介します。初心者でも扱いやすいものを中心に掲載します。随時更新予定。
Bioinformaticsの基本であるデータベース検索を行う際に、総合検索サイトであるNCBIとEBIが一般的に使用されている。これらのサイトの使用法をいくつかの項目について簡単に紹介する。
1. 遺伝子発現解析
現在、ほとんどのpeer-reviewの科学雑誌で発現マイクロアレイやRNA-seqによる網羅的遺伝子発現プロファイルをpublic databaseに登録することを義務づけている。従って、発行済み論文に記載されているデータのほとんどを自分の目で見ることができるようになっている。つまり、自分の興味のある遺伝子がどのような状況で発現変動するか、自分の興味のある遺伝子改変マウスではどのような遺伝子発現の変動があるのかといった情報を引き出すことができる。さらに、既存データと手持ちの網羅的データとを組み合わせたmeta-analysisを行うことで、自分のデータの新たな解釈を生み出すこともできる。Open databaseは数多くあるが、NCBIが運営しているGEOとEBIが運営しているArray Expressには世界規模で多数のデータが登録されている。
NCBI GEO (Gene Expression Omnibus)
NCBIの総合サイト(http://www.ncbi.nlm.nih.gov/guide/)のpulldown menuから入ることができる。
GEO Datasetsでkeyword検索 keywordを含む実験条件の検索結果が表示される。個別のdatasetのページに入ると生データや数値データをダウンロードすることができる。これらを解析ソフト等で開くことで全データ解析をすることができる。また、一部のdatasetに関してはGEOサイト上でサンプル間の発現比較や階層クラスタリング等の解析ができる。
GEO Profilesでkeyword検索 遺伝子名で検索すると様々な実験条件におけるその遺伝子の発現プロファイルを見ることができる。遺伝子名のみだと膨大な数の発現プロファイルが出てくるので生物種、細胞種等による絞り込み検索が必要。
EBI ArrayExpress
EBIの総合サイト(http://www.ebi.ac.uk/)からArrayExpressを選ぶ。
Experiments Archiveでkeyword検索 GEO Datasetsの場合と同様。情報が整理されていて見やすい。
Gene Expression Atlasでkeyword検索 GEO Profilesと類似しているが、自分の興味のある遺伝子の発現が増加・低下する実験条件を限定して検索することができる。組織分布、薬剤、疾患等に分けて実験条件を見ることができるので、わかりやすい。
NGS解析用Linuxサーバ
次世代シーケンサー(NGS)データを用いた論文で使用されている、解析ソフトウェアを導入したLinuxサーバのリソースを提供しています。ChIP-seq,RNA-seqやsingle cell RNA-seqの解析パイプラインで使用する主なツールを導入しています。
発生研内のみSSH経由でのアクセスが可能です。
利用には、最初に解析講習会への参加と利用登録が必要になります。
お問い合わせは臼杵(usu(at)kumamoto-u.ac.jp)まで。
主な利用可能ソフトウェア:
fastqc,cutadapt,bwa,bowtie2,tophat2,hisat2,star,RSEM,cufflinks,homer,MACS2,samtools,bedtools,cellranger等
主な生物種のリファレンス:
ヒト、マウス、ショウジョウバエ、カニクイザル等(UCSC/Ensembl/NCBI/FlyBase等各種)
genomatix genome analyzer (次世代シーケンサー データ解析ソフト)
使用方法)発生研内のみインターネットブラウザからアクセス可能。初回は研究室ごとにユーザー登録が必要となります。502号室(内線5786)へお問い合わせください。
genomatixへ
CLC-Bio Genomics Workbench (次世代シーケンサー データ解析ソフト)
使用方法)512号室に設置のワークステーションを直接使用していただきます。初回はユーザー登録が必要となります。502号室(内線5786)へお問い合わせください。
製品ホームページはこちら
GeneSpring GX (遺伝子発現解析ソフト)
http://www.chem-agilent.com/contents.php?id=27881
GeneSpirng GX は遺伝子発現解析やゲノム解析を行う生物学者のニーズに特化した強力な解析ソフトウェアです。解釈が困難と言われるマイクロアレイデータを生物学的に理解することを容易にします。マイクロアレイデータから統計学的にも生物学的にも意味のある結果を迅速に導き出せます。
設置場所)発生研 712号室 PC(GeneSpring用PCと記載)
使用方法)共通機器 使用予約サイトで予約。使用後は、使用記録をノートに記載。
予約カレンダーへ
PCが立ち上がったら、genespring(passなし)でログイン
Genespring GXアイコンをダブルクリック