遺伝学

RepeatMaskerを使ってみた

RepeatMaskerとは RepeatMasker はその名の通りリピートをマスキングしてくれるようなプログラムです。ホームページはhttp://www.repeatmasker.orgです。解析はhttp://www.repeatmasker.org/cgi-bin/WEBRepeatMaskerから可能です。また、ローカルで実行する…

bedtoolsについて思ったこと

最近 bedtools を使ってて躓いたところがありました。 bedtools maskfasta を使っていたのですが全くマスクされた配列が出力されず、 入力がそのまま出力されているように見えていました。 特にエラーも吐かず平然とインプットファイルと同じアウトプットを…

snakemakeでバリアントコールパイプライン構築

今回は snakemake でバリアントコール パイプラインを構築してみたいと思います。 bcftoolsによるバリアントコール まずはbamファイルからバリアントコールを行うルールを書いていきます。 rule bcftools_mpileup_call: input: rg="read_groups.tsv", bam=ex…

vcfファイルのサンプル名を変えたい

vcfファイルのサンプル名がbamファイル名なんですけど… bcftoolsで何も考えずにバリアントコールをしたとき、vcfのサンプル名はbamファイル名になっています。 別にこのままでもいいかもしれませんがなんかダサい感じがします。 そこでvcfの列名の部分にサン…

Genome Graphを参照配列とする時代が来たみたいです

Reference Bias 現在広く普及しているゲノム配列解析では、実験対象の種のゲノム配列を代表する参照配列(リファレンス)を用意し、それに対しシーケンスされたリードをマッピングするという手順を踏みます。 しかし、この方法にはReference Biasという現象…

簡易的に遺伝子型を図示したい

生物系の研究室ではある系統の交雑後代の遺伝子型を複数のマーカーについて調べるという実験をすることがよく?あります。こういった実験ではエクセルなどの表に結果を記録していきます。行にサンプル、列にマーカーが並んでいて、各セルにそのマーカーの示…