RepeatMaskerを使ってみた

RepeatMaskerとは

RepeatMasker はその名の通りリピートをマスキングしてくれるようなプログラムです。ホームページはhttp://www.repeatmasker.orgです。解析はhttp://www.repeatmasker.org/cgi-bin/WEBRepeatMaskerから可能です。また、ローカルで実行することもできます。今回はローカルで実行してみようと思います。

インストール

新規にtransposable element (TE) familyを同定するためにはRepeatModelerというプログラムも必要で、両者をインストールし実行環境を整えるにはさらに依存プログラムもインストールしないといけないので今回はdockerを利用することにします。dockerでのインストールの仕方は https://github.com/Dfam-consortium/TEToolsに載っています。今回は以下のコマンドでコンテナを起動しました。また、コンテナ内に解析対象のFASTAファイルを docker cp コマンドでコピーしています。

docker run -it --rm dfam/tetools:latest

実行

上記コマンドでコンテナ内に入ったらGitHubにて紹介されている通りのコマンドを打ちます。

BuildDatabase -name mygenome mygenome.fa
RepeatModeler -database genome1
RepeatMasker genome1.fa
runcoseg.pl -d -m 50 -c ALU.cons -s ALU.seqs -i ALU.ins

結構時間がかかるみたいです。