Non-InterleavedなPHYLIPファイルを作る
しばしばNon-Interleaved (Sequential) なPHYLIP形式データを用意したいことがありますが、これが案外面倒なものです (PAUP*を使えば簡単ですが) 。そこで、ReadSeqさえあれば一発でNon-InterleavedなPHYLIP形式へ変換できるスクリプトを作成してみました。PHYLIP形式ではOTU名は10文字以下という制限がありますが、このスクリプトでは全て"TaxonX"に置き換えますのでこの問題は回避できます。元のOTU名とTaxonXとの対応関係を示すタブ区切りテキストファイルも生成します。今のところ置き換えをしないモードは用意していません。
License
This script is distributed under GNU GPL.
決まり文句
例によって例のごとく内容は無保証なので要注意。このページの情報に従って何らかの損害が出ても補償できませんのであしからず。要するに自己の責任において実行してちょうだいねということです。
必要なもの
本スクリプトはReadSeqで一旦FASTA形式へ変換した上でNon-Interleaved PHYLIP形式データを生成します。実行ファイルはスクリプトと同じディレクトリか、PATHの通った場所に置いて下さい。ユーザー権限上難しいようでしたらスクリプト2行目の呼び出しコマンドの定義を書き換えて下さい。C言語版でもJava版でも使えます。
スクリプトを実行するために必要。WindowsではActivePerlでOK。
スクリプト
ページ下部にあるリンクからどうぞ。ファイル名はConvNonInterleavePhy.plです。
使用方法
まず、ReadSeqで変換可能な形式で長さの揃った配列ファイルを用意し、
perl ConvNonInterleavePhy.pl ファイル名
とします。すると、以下の3つのファイルが出力されます。
- 入力ファイル名.fas
ReadSeqで変換したFASTA形式ファイル。
- 入力ファイル名.phy
FASTA形式からさらにNon-Interleaved PHYLIP形式へ変換したファイル。
- 入力ファイル名.taxlist.txt
TaxonXと元のOTU名の対応関係を記したタブ区切りテキストファイル。
ということで、ご入り用の方はどうぞ。
最終更新時間:2006年11月22日 23時03分17秒