トップ 差分 一覧 Farm ソース 検索 ヘルプ PDF RSS ログイン

核酸・アミノ酸配列ファイル形式の変換

[系統解析のための色々]

核酸・アミノ酸配列ファイル形式の変換

 DNA塩基配列・アミノ酸配列のファイル形式には何種類もあり、様々なソフトをうまく使いこなすにはファイル形式の相互変換が重要になる。ここではJavaで作成されているReadSeq Ver.2を利用したファイル形式の変換について取り扱う。C言語で記述されたVer.1系もあるが、プラットフォームを選ぶ上、サンプル名の文字数制限がJava版より厳しいように思うのでここでは推奨しません(ホントはオプションで指定すればいいんですけどね)。

Java Runtime Environmentの入手とインストール

 Sun Microsystemsのjava.comからJava Runtime Environmentをダウンロードしてインストールしておきます。これが無いとJavaで書かれたソフトウェアは動作しません(OS標準でJavaに対応している場合を除く)。既にインストールされている場合、また、このページ経由でインストールされた場合は「Java Software Installed」と表示されます。

ReadSeqの入手

 こちらからjarファイルの形で入手できます。Macではhqxファイルをダウンロードして下さい(OS9でも使えるかは不明)。ソースコードもありますのでコンパイルしたい方はそちらを選んで下さい。

グラフィカルインターフェイスの起動

 jarファイルのあるディレクトリをカレントとして(Windowsの場合コマンドプロンプトを使う)

java -cp readseq.jar app

として下さい。Windowsの場合、ショートカットを作成して「リンク先」に

java.exe -cp "C:\Program Files\ReadSeq\readseq.jar" app

などとしておけばショートカットから起動できます(インストール先に注意)。

コマンドラインインターフェイスの起動

 標準ではこちらか使用されます。WindowsではJREを入れてある場合、jarをダブルクリック一発で起動できますが、こちらのコマンドラインインターフェイスが立ち上がって、メッセージを表示して終了してしまうため一見何も起こらないかのように見えます。

java -jar readseq.jar

とするとそのメッセージが出ます。使い方は基本的にC言語版と同様です。

グラフィカルインターフェイス利用時の注意点

 まず出力形式を指定して、File - Open sequence files...でファイルを開き(これが変換元ファイルの指定になる)、File - Save as...で変換後のファイル名を指定します。しかし、これだけでは変換は実行されません(変換後のファイルは作成されない)。File - Process selected filesを実行する必要があります。その他のメニューはオプションの指定となっていますので適当に指定して下さい。NEXUS形式の場合はPretty Printのオプションは全て外した方が良いようです。サンプル名の長さに応じてName width...の値を調整はやった方が良いでしょう(溢れた分は削られます)。

最終更新時間:2006年11月22日 23時05分07秒