- 追加された行はこのように表示されます。
- 削除された行は
このように表示されます。
{{category 系統解析のための色々}}
*概要
*核酸・アミノ酸配列ファイル形式の変換
DNA塩基配列・アミノ酸配列のファイル形式には何種類もあり、様々なソフトをうまく使いこなすにはファイル形式の相互変換が重要になる。ここではJavaで作成されているReadSeq Ver.2を利用したファイル形式の変換について取り扱う。C言語で記述されたVer.1系もあるが、プラットフォームを選ぶ上、サンプル名の文字数制限がJava版より厳しいように思うのでここでは推奨しません(ホントはオプションで指定すればいいんですけどね)。
*Java Runtime Environmentの入手とインストール
Sun Microsystemsの[java.com|http://java.com/ja/index.jsp]からJava Runtime Environmentをダウンロードしてインストールしておきます。これが無いとJavaで書かれたソフトウェアは動作しません(OS標準でJavaに対応している場合を除く)。既にインストールされている場合、また、このページ経由でインストールされた場合は「Java Software Installed」と表示されます。
*ReadSeqの入手
[こちら|http://iubio.bio.indiana.edu/soft/molbio/readseq/java/]からjarファイルの形で入手できます。Macではhqxファイルをダウンロードして下さい(OS9でも使えるかは不明)。ソースコードもありますのでコンパイルしたい方はそちらを選んで下さい。
*グラフィカルインターフェイスの起動
jarファイルのあるディレクトリをカレントとして(Windowsの場合コマンドプロンプトを使う)
java -cp readseq.jar app
として下さい。Windowsの場合、ショートカットを作成して「リンク先」に
java.exe -cp "C:\Program Files\ReadSeq\readseq.jar" app
などとしておけばショートカットから起動できます(インストール先に注意)。
*コマンドラインインターフェイスの起動
標準ではこちらか使用されます。WindowsではJREを入れてある場合、jarをダブルクリック一発で起動できますが、こちらのコマンドラインインターフェイスが立ち上がって、メッセージを表示して終了してしまうため一見何も起こらないかのように見えます。
java -jar readseq.jar
とするとそのメッセージが出ます。使い方は基本的にC言語版と同様です。
*グラフィカルインターフェイス利用時の注意点
まず出力形式を指定して、File - Open sequence files...でファイルを開き(これが変換元ファイルの指定になる)、File - Save as...で変換後のファイル名を指定します。しかし、これだけでは変換は実行されません(変換後のファイルは作成されない)。File - Process selected filesを実行する必要があります。その他のメニューはオプションの指定となっていますので適当に指定して下さい。NEXUS形式の場合はPretty Printのオプションは全て外した方が良いようです。サンプル名の長さに応じてName width...の値を調整はやった方が良いでしょう(溢れた分は削られます)。