蛍光ジェノタイピングデータクラスタリングアプリを更新しました

アプリURL https://sabe.shinyapps.io/clfbg/

ということで、改めてアプリの詳しい使い方をここで示したいと思います。

アプリサイトにアクセスするとまず最初に以下のような画面が現れます。

f:id:menseki:20200915223058p:plain

最初にすることはインプットファイルのロードです。上図で赤く囲まれた部分にドラッグ&ドロップもしくは"Browse..."ボタンを押してファイルを選択します。

ここでインプットファイルは以下の形式であることが必要です。

Well FAM.* VIC.* ROX.*
A1 2383 1899 16523
A2 311 1603 16033
A3 1662 2471 17739

具体的には"Well","FAM.*", "VIC.*", "ROX.*"の4つの列名からなる列(".*"の部分は任意の文字列)を含む エクセルファイルやCSVとしてください。この列以外に列があっても構いませんが解析には使用されません。 エクセルの場合は複数シートが含まれていてもOKです。

実際にインプットファイルを提出すると以下の様になります。

f:id:menseki:20200915223122p:plain

右側に図と表が現れていることがわかります。図についてはx軸にFAM/ROX、y軸にVIC/ROXの値がプロットされます。 自動的にクラスタリングが実行され色分けされます。また、詳しいデータは表として表示されます。

上図で赤く囲まれた部分はサンプルとウェルの対応表をロードする部分です。インプットファイルがエクセルで 複数シートを含む場合はインプットファイルと同じ数だけのシートを含み順番が同じであることが必要です。 表の形式は以下のようにWell列とSample列を含むデータです。"Well"は必ずこの文字列である必要があり、 インプットファイルのWell列と1対1対応している必要があります。他の列があっても構いません。

Well Sample
A1 NTC
A2 sample1
A3 sample2

実際にサンプルウェル対応表を提出した図が下図です。

f:id:menseki:20200915223146p:plain

表が表示されている部分でSample列が追加されたことがわかります。また、図ではNTCという点が追加されていると思います。 これはSample列に"NTC"というデータがあった場合にそのことがわかるように点の形を変えているためです。

上図で赤く囲まれた部分ではそれぞれ、

  1. 複数シートを含むデータの場合に表示するシートを選択する
  2. 正規化の方法を選ぶ
  3. クラスタリングアルゴリズムを選ぶ
  4. 選んだクラスタリングアルゴリズムにおけるパラメータを変える

ことができます。

最後に自動的にクラスタリングされ、表示されたジェノタイプを編集する方法を説明します。

まずは、プロット上をドラッグすることにより点を選択します。

実際に行うと以下の様になります。

f:id:menseki:20200915223232p:plain

矢印1で示されている部分は選択範囲を示し、この選択範囲に含まれるデータが表に表示されます。

続いて矢印2で示されている部分のボタンから、変更したい遺伝子型を選びます。

今回はAを選びます。結果は以下の様になります。

f:id:menseki:20200915223248p:plain

上図の選択範囲内の点を見ると、点の色が緑から赤(HからA)に変わっていることがわかります。 これで無事遺伝子型を変更することもできました。うまくクラスタリングができないデータなど の場合はこの機能を用いると良いと思います。

結果はDownload result file というボタンからダウンロードできるようになっています。

ぜひご利用ください。