2021-01-01から1年間の記事一覧

二項分布とカイ二乗検定(と遺伝)

とある標本がとある分布に従ってサンプリングされたかを検定する方法として適合度の検定を行うことがあると思います。 今回は、得られた分離集団の形質の分離比が想定する遺伝様式に即しているかについての検定について見ていきたいと思います。 分離比に対…

Rust-BioでGzip圧縮されたFASTAを読み込む

Rustが注目を集めているらしいので流行りにのって使ってみました。 RustにはRust-Bioというバイオインフォマティクス用パッケージが存在します。そこで、今回はこれを用いてGzip圧縮されたFASTAファイルを読み込むプログラムを書いてみます。 まずはコードの…

枝豆データセットを分類してみた

この間会社の先輩から「IT農家のラズパイ製ディープ・ラーニング・カメラ」(2020、小池誠)という本を貸していただいたので読んでみました。その中でディープラーニングの応用例として枝豆の莢の画像を2粒莢と3粒莢に分けるというタスクが紹介されていまし…

ラズパイで植物の定点観測

数年前にRaspberry Piを購入してたのですがちょっと遊んだまま放置になっていたので何か意味のある 装置を作ってみようと最近になって思い立ったので作ってみました。 作ったものはセルトレー上で育てている植物を上からカメラで定点観測するというものです…

ImageJで葉面積を測ってみた

ImageJを使って単純な方法で画像から葉面積を測ってみました。大まかな方法としては、画像から緑の部分を選択して選択された部分の面積(ピクセル数)を数える感じです。 RGBからLab色空間に変換する RGBのGチャンネルが高いピクセルが緑だと思いそうですが…

Organelle_PBAを使ってみた

ちょっと古いですがOrganelle_PBA (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5219736/) というPacBioロングリードシーケンスのオルガネラ用アセンブラを使ってみました。Organelle_PBAはさまざまなアセンブリに関するプログラムを組み合わせて自動的に…

vcfから周辺配列の取得

VCFファイルから周辺配列(flanking sequence)を取得したいとき、様々な方法が考えられると思います。今回はその中で bedtools を用いた方法を考えていきたいと思います。 bedtools flank というコマンドが周辺配列をとってくる際に用いるコマンドですが、…

RepeatMaskerを使ってみた

RepeatMaskerとは RepeatMasker はその名の通りリピートをマスキングしてくれるようなプログラムです。ホームページはhttp://www.repeatmasker.orgです。解析はhttp://www.repeatmasker.org/cgi-bin/WEBRepeatMaskerから可能です。また、ローカルで実行する…