{{category 系統解析のための色々}}

*データの用意

　アライメントをしやすいデータを整えることがまずは肝要です。自前のデータのみで系統解析する際にはさして気を遣う必要はありませんが、GenBankから落としてきたデータ、特に特定の遺伝子のみの配列データではなくミトゲノムデータなどの場合には適宜必要な部分のみを取り出した方が、この後のアライメントで使うソフトウェアに扱いやすいデータになります。GenBankデータからの特定領域の取り出しには[[GenBank形式配列から特定遺伝子を切り出す]]をご参照下さい。

*アライメントソフトウェアの選定

　基本的には使いやすいソフトで構いませんが、速度、精度の面から言ってMAFFTを使うことをお薦めします。アミノ酸・核酸のどちらでも使えます。

*アライメント

　データを整えて、MAFFTでアライメントを行う。それ以上のことは私は特にしていません。rRNA領域などのアライメントが困難なデータではdirect optimizationとか予測された二次構造情報の利用などを行う必要がある場合もあるかもしれませんが、そういうデータはなるべく使わないようにしています。怪しい部分は捨てる。これが原則です。タンパクコード領域データの場合は、[[タンパクコード領域塩基配列のマルチプルアライメント]]にあるように、アミノ酸配列に基づいて行ったアライメント結果と核酸をそのままアライメントした結果を照らし合わせて妥当な方を使います。と言ってもほとんどの場合はその両方式でのアライメント結果が矛盾していたら、その部分は使いません。まれに明らかに最節約的なアライメントがわかることがあるのでそういう場合はそれを使います。