進化系統樹から進化系統ネットワークへ
基幹理工学部 応用数理学科 早水桃子

地球上には現在,数百万種以上の生物が存在するといわれていますが,これらの多様な生物たちの間にはどのような関係があるのでしょうか.17世紀頃までは,サルはヒトに進化する前段階の生物であるという考えが長らく支持され,生物の進化は単に未熟なものが成熟する一本鎖状のモデルで説明できる現象だと信じられていたようです.もちろん,この説はやがて否定され,例えばサルとヒトは両者の共通祖先から枝分かれして別々の方向に進化を遂げた産物であるという認識が定着し,生物たちがこれまでに辿ってきた進化の道筋は「系統樹」と呼ばれる木構造で広く記述されるようになりました.

しかし,一般に現実のデータにはノイズや不確かさなどが含まれているため,データが持つ情報というのは系統樹のような木構造で簡単に説明しきれるものではありません.また,系統樹は進化の道筋の分岐は表せても合流までは表現できないモデルですから,それが進化の実態に合わないという状況も多々あります.例えば植物が進化する過程では異種同士の掛け合わせで新種が出現することがありますし,微生物の世界では突然変異した細菌が自分の遺伝子を別の細菌に伝えることで病原性の低い細菌を病原性の高い細菌に進化させるという現象がよく起きます.このように,古典的な系統樹モデルだけで複雑なデータや複雑な現象を記述することには明らかに無理があるので,その拡張版モデルとして,網目のように複雑なプロセスも記述できる「系統ネットワーク」というものに期待が寄せられています(下図参照).



ただし,系統樹は今でも進化のスタンダードなモデルであり,系統ネットワークの登場によって過去のものになったわけではありません.確かに,進化の道筋の分岐しか表現できない系統樹に比べると,合流も分岐も表現できる系統ネットワークは柔軟で優れたモデルです.しかし,余分かもしれないものを潔く削ぎ落とした系統樹のようなモデルには,人間が解釈しやすい上に,数学的・計算機科学的にも扱いやすいという利点があります.だからこそ,系統樹の推定に関わる効率的なアルゴリズムはこれまでに数多く生まれ,生物学分野でも,それ以外の分野でも,データ解析の定番ツールとして幅広く活用されるに至りました.その反面,系統ネットワークは豊かな表現力の代償として,系統樹が備えていた単純明快さを失ってしまったのです.実際,これまでに系統樹では当たり前のようにできていたことが,系統ネットワークになった途端にハードな問題へ変貌してしまうという状況は沢山あります.そのため,この巨大で仰々しい武器を使いこなして複雑怪奇なデータから情報を見通し良く抽出するにはどうすれば良いのか,そもそもそんなことができるのか,といった疑問が山積みとなったのです.

今のところ,系統ネットワークを活用した手法のうちデータ解析の現場で広く使われているのは生物同士の非類似度を系統ネットワークで近似的に可視化するヒューリスティクスぐらいのもので,データから構築された系統ネットワークの解釈のしやすさや,信頼性の統計学的な評価方法といった多くの重要な課題が残されています.もし,それらの難題を解決して系統ネットワークを巧みに活用した新しいデータ解析技術を創ることができたなら,それは系統樹に関するデータ解析技術と同様に生物学という垣根を越えて,例えば写本系統ネットワークを構築する人文科学の研究などにもインパクトを与えるものとなるでしょう.そのフロンティアを切り拓いて人類にできることを拡げる研究には大きなやり甲斐と手応えがあります.ご興味のある方は,本稿の著者の最近の研究結果を非専門家向けに解説した下記の連載記事[1, 2]をご覧いただけたら幸いです.

[1] 早水 桃子, 進化の系統樹とデータ解析/(1)系統樹と系統ネットワークの離散数学, 日本評論社『数学セミナー』2020年1月号 通巻 699号, 数理のクロスロード
[2] 早水 桃子, 進化の系統樹とデータ解析/(2)系統ネットワークの構造定理といろいろなデータ解析への応用, 日本評論社『数学セミナー』2020年2月号 通巻 700号, 数理のクロスロード