場所:埼玉大学
理学部1号館
(3階) 基礎数理演習室
(お茶会の場所は理学部1号館3階のコモンルームです。)
高次元空間に有限個の点(座標成分は 01)が与えられている。 これらの点の配置(有限個の点の距離空間)を尤もらしく tree, network とせよ
”尤もらしく”とは、一般的に言えば、何らかのコストを最小にする。例えば、”距
離”関係を極力再現する、或いは進化過程を最小手数の説明で行う、ような tree な
どを作る。01のベクトルなら、一番普通の距離は(coding theory で云う)
Hamming distance である。(単に分類なら、主成分分析とか対応分析で済む。クラ
スター分解も分類)
系統図を求める古典的方法は、文献学では Lachmann による系譜法(Stemmatics),
生物系統学では Hennig による Cladistics、があり、ある規準(principle of
parsimony) で系統を表す Tree を求める(これはNP完全問題)。しかし、生物では
雑種の問題、文献学では混態の問題があり、Tree に拘ると色々と都合が悪い。1992
年に、Split decomposition という手法が提起された(Bandelt, Dress: Advances
in Math.92)(注1)。
これの基礎になっているのは、Dress の 1984年の論文であるが、その主定理(あ
る距離空間の category における、universal object の存在)は、実は−よくある
話だが−1964年に、Isbell によって発表されていた(Comm. Math. Helvetici 39)。
Bandelt-Dress の手法による data analysis のプログラム SplitsTree が公開さ
れている(V.Moulton, 1992; Dress-Huson-Moulton 1996, D.H.Huson, 1998)(注
2)。これが有名になったのは、カンタベリー物語の写本・刊本群の整理においてで
あった。当初 P.Robinson は、Tree を求める手法でなんとかなると思っていたが、
それでは問題が生じ、この SplitsDecomposition がよい結果を与えた。それは、
Nature にも掲載された(NATURE 394, 27 AUGUST 1998)(注3)。
現在ではこれでも不満があるため、NeighborNet とかまた色々なものが出ている
(D.Bryant, V.Moulton; WABI'02, LNCS 2452, 2002。SplitsTree に含まれている)。
Reduced median network についても、少し触れる(K.T.Huber, M.Langton, D.Penny,
V.Moulton, M.Hendy, Applied Bioinf. 1, 2002)。
具体的な写本群の系統に使った例も、色々提示する。
注1 Bandelt-Dress の主定理(距離分解)の別証明が、昨年公表された。平井広志
氏(京都大学数理解析研究所助手。東京大学大学院 情報理工学系研究科数理情報学
専攻出身。日本OR学会第22回学生論文賞授賞)。数理研ともかくて縁が繋がっている。
さらには、今になって気づいたが、昨年の「第六回 日本進化学会」にて (8月4
日の)4E1 企画が、”系統解析の アルゴリズムとその応用”であり、そこに平井氏
の講演「スプリット分解法の数理とその拡張」があった。(8月6日の)6B1 が、”
非生命体の進化理論2”であり、私の「茶道古文書の定量的文献系図」があった。ま
さに、missed opportunity である。
注2 Version 1 は、Dress の指導の元に R.Wetzel の学位論文で発表(1995)。
Bandelt,Huson が協力している。Version 2 が公開版であり、Huson による(1998)。
注3 但し、公表された図は事前に混態写本 El などを取り外し処理している。すで
に PAUP* 処理により、それらは接続位置が不安定であった。