This is the Japanese translation of this site.
2024/7/26 13:41
1. アセンブリ理論が約束するもの
アセンブリ理論 (AT) は、科学全体とまではいかなくとも、理論生物学で現在進行中のものでは最も注目されています。その主唱者である生命の起源研究者リロイ(リー)・クローニンは、複雑性の問題への、それも生物学だけでなく物理学や宇宙論における複雑性、要するにあらゆる場所における複雑性への、待望の唯物論的解決策であると宣伝しています。
2023年に『Nature』誌は、クローニン他による「Assembly Theory Explains and Quantifies Selection and Evolution」を掲載し、この理論の科学界での地位を押し上げました。生物学に関して、クローニンはアセンブリ理論が生命の起源とその後の進化を説明しながら、同時にインテリジェントデザイン (ID) を決定的に論破すると見ています。
下記は、サンタフェ研究所が報じたアセンブリ理論を取り巻く熱狂の一端です。例えば、クローニンの共同研究者である物理学者サラ・ウォーカーは、次のようにこの理論を賛美しています。
アセンブリ理論は、物理学、化学、生物学を、根底にある同じ現実の異なる視点として見るための、完全に新しいレンズを提供します。この理論により、私たちは還元主義的物理学とダーウィン的進化の間のギャップを埋め始めることができます。
クローニンはウォーカーの賛辞をさらに強めて、アセンブリ理論がすべての精密科学に革命をもたらすとして推奨しています。
アセンブリ理論が提供するのは、私たちの世界を作っている物質が、不変の粒子だけでなく、時間をかけた選択を通してオブジェクトを構築するのに必要な記憶によって定義されるという、全く新しい見方です。さらなる研究により、このアプローチは、宇宙論からコンピューター科学に至る分野を変革する可能性を秘めています。 物理学、化学、生物学、そして情報理論が交差する新たなフロンティアを表しているのです。
進化生物学者のマイケル・ラックマンは、比較すればより冷静ですが、いかなる客観的基準からしても、やはり大仰です。
生命は進化の過程によって定義される。生命を見つけるには進化を見つけるべきであり、幸運なことに、オブジェクトや分子の構築過程は進化の有無で全く異なる。進化はアセンブリ計画を発見し、それから同じオブジェクトを何度も構築するか、より複雑なオブジェクトに再利用するだろう。一度でも進化が関与すれば、私たちは粒子ではなく、アセンブリ計画の力学を扱うことになるのだ。
クローニンが『YouTube』の「デイブ教授」にアセンブリ理論について説明しているのを聴くと、科学的成果のあらゆる壮麗さがこの理論において頂点に達していると思うでしょう。クローニンによれば、パラダイムシフト的科学革命にとって望ましいであろうことは全て、アセンブリ理論に現れているといいます。すなわち、
- 経験的測定のための効果的なツール: クローニンは、アセンブリ理論によって分子からアセンブリ指数を直接測定できるようになり、複雑性の経験的定量化が可能になると強調しています。
- 実りある実験の枠組み: この理論は、特に複雑な構造の集合を引き起こす過程を理解する上で、新たな実験を触発する枠組みを提供すると言われています。
- 幅広い説明力: アセンブリ理論は、宇宙における選択過程がどのように複雑な生物学的・非生物学的システムの形成につながるかを説明することで、複雑性を理論的かつ具体的に研究し、特に生命を検出するための包括的な理論となっていると記述されています。
- 単なるアルゴリズムを超える: アルゴリズムがデータや処理を扱うのに対し、アセンブリ理論は、アルゴリズム的情報理論だけでは扱えない選択と因果の原理を統合することで、複雑な構造がなぜ、どのように出現し進化するのかについての理論的基礎を提供すると言われています。
- 新たな発見の潜在力: クローニンは、この理論が既に選択の定量化やプレバイオティック化学の理解といった顕著な発見につながっており、今後も複雑性と進化のメカニズムへの新たな洞察を明らかにし続けるだろうと示唆しています。
2. アセンブリ理論の現実
私が初めてアセンブリ理論に遭遇したとき、複雑なシステムがどのように形成され理解されていくのかについて新たな洞察を提供するというその約束に興味をそそられました。私は自然が部分の集合以上のものであると考える程にはプラトン主義者かつアリストテレス主義者ですが、複雑系の発展において集合が決定的に重要な役割を果たしていることは認識しています。これは、究極的な原因が知的か非知的かにかかわらず、人間が作った人工物にも生命形態にも当てはまります。
しかし、アセンブリ理論の文献を読み、その理論の詳細を学んだとき、それがいかに実質と洞察に欠けているかを目の当たりにし、私は率直に言って愕然としました。問題は、それが間違っているということではなく、あまりに単純化され、範囲が限定されているため、何が正しいのかがどうでもよくなることです。生物学におけるその不十分さは、特にそれを取り巻く誇大広告とは比べるべくもないものでした。
情報理論や複雑性理論の研究をしている人なら誰でも、アセンブリ理論が最も容易に想起させる理論、すなわちアルゴリズム情報理論と厳密に同じではないにせよ、この理論が使っている技法に親しみを覚えるでしょう。アセンブリ理論が用いている数学は、その限りにおいて正当なものです。ただ、その推進者たちが主張するほどではないだけです。というのは、単にそれが良い進歩を遂げており、フィニッシュラインを完全に通過することはできなくても、行くべき距離の半分までは連れて行ってくれる、という意味ではありません。ニューヨークからロサンゼルスまで行けると約束しながら、ニューアークまでしか行けないというような意味です。
アセンブリ理論を取り巻く修辞は、過剰で勝利主義的なものです。でも、その約束にはるかに及んでいない現実は、精力的な反駁の根拠となります。私はそのような反駁を、『BIO-Complexity』誌に本格的な科学的レビュー記事として書きたい衝動に駆られました。しかし、アセンブリ理論が形式的な数学理論であっても、その中で数学が行っていることは極めて容易に説明できます。さらに、そのような説明により、教育を受けた一般読者にも、アセンブリ理論がリロイ・クローニンや彼の同僚ができると主張しているような仕事を果たせないことが明らかになります。
アセンブリ理論の主な欠点はこれです。複雑なシステムの集合についてのそのモデルは、非常に単純かつ様式化されており、生物学的なものであれ人工的なものであれ、私たちが経験する複雑なシステムに合理的にマッピングすることができません。そして、もしこれらを扱えないのであれば、銀河の構造のような物理学や宇宙論の複雑なシステムについて気にすることはありません。このことを見るには、理論の要点を吟味する必要がありますが、次の3つのセクションでそれを行います。
3. アセンブリ理論の起源
複雑なシステムの集合についてのアセンブリ理論のモデルが、なぜクローニンや彼の同僚たちが背負わせたいような重みに耐えられないのかを理解するために、アセンブリ理論が別の名前で、その志がもっと控えめだった頃の原点に戻ってみましょう。2017年、クローニンと同僚たちは『Philosophical Transactions of the Royal Society (A)』に「A Probabilistic Framework for Identifying Biosignatures Using Pathway Complexity」と題する論文を発表しました。
その論文の要点は、生物の集合体と非生物の集合体を区別できる測度を展開することで、生物によって生み出されたアーティファクトも生物の集合体に含めます。この経路複雑性 (Pathway Complexity) の測度の背景にあるアイディアは、基本構成要素から成る集合体はより複雑な集合体へと再帰的に構築されうるというものです。ここでの再帰的という言葉は、コンピュータサイエンスで使われる、ある関数がより単純なサブ問題を解くために自身を繰り返し呼び出すことによって問題を解決する技法のことです。
経路複雑性の非常に単純な例として、ビットの配列を取り上げましょう。ここでの基本構成要素は0と1です。すると、あるビットの配列の経路複雑性は、基本構成要素 (この事例では0と1) だけでなく、途中で生成される中間部分配列も加えることで、所与の配列を生成する最短のステップ数になります。このスキームの再帰性は、既に生成された部分配列をあたかも基本構成要素であるかのように再利用できることにあり、それらは最終的な集合体を生成する際に使用・再使用できる構成要素の増大するリストに追加されます。
例えば、16ビットの配列0000000000000000を考慮してみましょう。この配列は、今説明したスキームに従って、4つのステップで生成できます。
- 0,1 | 00
- 0,1,00 | 0000
- 0,1,00,0000 | 00000000
- 0,1,00,0000,00000000 | 0000000000000000
0000000000000000の経路複雑性を表現するこの方法では、ソリドゥス (すなわち|) の左側は集合体を生成するために使用あるいは再使用できるアイテムの増大するリストで、右側は実際に生成された集合体です。それぞれの場合にソリドゥスの右側に表れているものは、経路に沿った次のステップで左側に行き、利用可能な構成要素の増大するリストの一部となります。
この例では、16ビットの0000000000000000が4ステップで生成されます。log2(16) = 4 (すなわち、16の底2に対する対数が4) なのは偶然ではありません。一般に、(繰り返しを許容する) n 個の基本構成要素を持つ任意の集合体について、クローニンのスキームによる最短経路複雑性は log2(n) です。
逆に、n 個の基本構成要素からなる集合体の最長経路複雑性は、最大でも n - 1 であることは明らかです。なぜなら、基本構成要素は常に1度に1つずつ加えることができるからです。例えば、8ビットの配列01000110を考慮してみましょう。この配列は次のように構築することができるでしょう。
- 0,1 | 01
- 0,1,01 | 010
- 0,1,01,010 | 0100
- 0,1,01,010,0100 | 01000
- 0,1,01,010,0100,01000 | 010001
- 0,1,01,010,0100,01000,010001 | 0100011
- 0,1,01,010,0100,01000,010001,0100011 | 01000110
ここでの数 n は8で、この8ビット配列への経路には n - 1 = 8 - 1 = 7 のステップが存在します。
クローニンの経路複雑性の測度を複雑にしている要因の1つは、中間のステップが独立してできるかもしれないことです。そのため、前の2つの例のように、構築される集合体は厳密に漸増することで成長する必要はありません。例えば、先ほど考えた8ビットの配列 (すなわち01000110) は、次のように形成されるかもしれません。
- 0,1 | 01
- 0,1,01 | 00
- 0,1,01,00 | 0100 [1. と 2. から]
- 0,1,01,00,0100 | 01000
- 0,1,01,00,0100,01000 | 11
- 0,1,01,00,0100,01000,11 | 0100011 [4. と 5. から]
- 0,1,01,00,0100,01000,11,0100011 | 01000110
目標配列01000110へのここでの経路は、ちょうど先ほど与えられたものとは異なりますが、これも n - 1 = 8 - 1 = 7 ステップとなります。
ある集合体 A について、繰り返しを含む A の基本要素の総数を |A| と表記することにしましょう。その場合、a で表記される A の経路複雑性は、A を生成するのに必要な最短のステップ数として定義されます。ビット列の場合で見たように、a は常に log2(|A|) と |A| - 1 の間にあります。この結果は一般に成り立ちます。
クローニンによれば、生物学的に興味深い集合体は、この経路複雑性の測度が log2(|A|) と |A| - 1 の間の適所に位置しており、これらの両極端のどちらにも近接していません。したがって、もし a が log2(|A|) に近ければ、ビットの繰り返しである配列0000000000000000のように、その集合体は生物学的に有意義であるには単純すぎることを示唆しています。対照的に、もし a が |A| - 1 に近ければ、その集合体は生物学的に有意義であるには複雑すぎる/ランダムすぎることを示唆しています。
経路複雑性についてのこのような考え方は、生物学的複雑性を評価するために用いられてきた他の複雑性の測度、とりわけ特定された複雑性を想起させ、合理的と思われます。私が『The Design Inference』の第2版で説明し、こちらやこちらで要約しているような特定された複雑性についての説明を別にしても、この概念を、創始者であるレスリー・オーゲルが1973年の著書『The Origins of Life』(クローニンと類似して宇宙生物学に焦点を当てている) で導入したとき、オーゲルは3つのタイプの状況を考慮しました。
生物と非生物の間のより根本的な区別は、その分子構造と分子挙動を調べることにより可能となる。簡潔に言えば、生物はその特定された複雑性によって区別される。結晶は、非常に多数の同一の分子が一様に詰め込まれたものであるため、通常、単純でよく特定された構造の原型とされる。花崗岩の塊やポリマーのランダムな混合物は、複雑だが特定されていない構造の例である。結晶は複雑さに欠けるため生物としては不適格であり、ポリマーの混合物は特定性に欠けるため不適格である。(189ページ)
オーゲルは、複雑性の異なった形態を理解するこの直感的な方法を、情報理論を活用することで詳しく説明しました。
これらの漠然としたアイディアは、情報というアイディアを導入することでより正確にすることができる。大雑把に言えば、ある構造の情報量とは、その構造を特定するのに必要な最小の命令数である。複雑な構造を特定するために多くの命令が必要であることは直観的に分かる。一方、単純な繰り返し構造であれば、むしろ少ない命令で特定できる。(190ページ)
「複雑な構造を特定するのに必要な最小の命令数」を識別するためのオーゲルの計算は、複雑な構造の経路複雑性を識別するためのクローニンの計算と類似しています。具体的には、2017年の論文 (3ページ) で、クローニンは経路複雑性を「所与のオブジェクトを、そのオブジェクトは基本的な構築単位の集合に分解できるものとし、それらの単位を用いてオブジェクトを再構築することによって組み立てるための最短経路」のステップ数と定義しました。それらの測度は詳細において異なりますが、根底にある理論的根拠は同じです。
4. 経路複雑性からアセンブリ指数へ
クローニンは生命存在指標の識別に経路複雑性を用いた2017年の論文で、それらをそのままにしておくこともできたかもしれません。その場合、生命と非生命を区別するための数学的/確率的兆候としての役割を果たすために、情報理論家や理論生物学者によって使用された複雑性の測度の系統に、もう1つ彼の複雑性の測度が加わったことでしょう。多分興味深く、有意義だったでしょう。しかし、画期的なものは何もありません。
経路複雑性を生命存在指標として扱うというクローニンの提案からすると、次の課題は信頼性分析だったでしょう。そのような分析では、経路複雑性のどのような測定値が生命と確実に相関するのか、またこの測度がどれだけ良くも悪くも偽陽性 (生命のように見えるが、非生命) や偽陰性 (非生命のように見えるが、生命) を産み出すのかを決定することになったでしょう。そのような分析はまだ実行されていません。もしそれが実行できれば、経路複雑性の特定の値が生命と確実に相関することが分かり、したがって真の生命存在指標を識別することができるかもしれません。それは興味深いことでしょう。しかしそのような分析がなければ、経路複雑性が生命存在指標を診断するという十分な独立した証拠に欠けます。
経路複雑性は、それ自体で考えれば、その値がどのように解釈されるかに関係なく、統計学においてデータ削減として特徴づけられる仕事を実行します。生物であれ非生物であれ、実世界のほとんどの集合体は複雑です。経路複雑性は、それらの集合体から特定の特徴を抽出して、ある数値を割り当てます。2017年の論文では、この数字は経路複雑性と呼ばれていました。2023年にクローニンが『Nature』に発表した「Assembly Theory Explains and Quantifies Selection and Evolution」と題する論文では、アセンブリ指数と改名されました。
この専門用語の変更に悪意はありません。経路複雑性というアイディアは、統計学的なデータ削減と一致しており、この測度が測定しようとしている現実のかなりの部分を省略しているかもしれないことを示唆しています。例えば、基本構成要素からなるアイテムの集合体についてではなく、車で移動する旅行者についての経路複雑性の測度を考慮してみましょう。そのような測度の1つは、旅行者が必要とする右折と左折の回数を単純に数えることです。そのような経路複雑性の測度であれば、旅行者が通る道筋の複雑性をある程度捉えているでしょう。しかしそれでは、純粋に移動しなければならない距離は言うまでもなく、ウェストバージニア州の山道でヘアピンカーブを曲がる必要があるなど、他の形態の複雑性を見逃すかもしれません。経路複雑性の有効な測度は、アセンブリ理論を使う化学者であれ、車による旅行者であれ、経路を横断する労力とコストのある側面を捉え、他の側面を省略することになります。
ただし、経路複雑性をアセンブリ指数と改名すると、この測度が所与の集合体を産み出すのに必要なものを完全に捉えていることを示唆します。統計学から別の例を挙げると、n 個の実数値データ点の集合が与えられたとして、標本平均 (すなわち、データ点の合計を n で割ったもの) は、母集団平均に関してそれらのデータの全てを捉えています。あるいは統計学者が言うように、標本平均は母集団平均に対する十分統計量です。平均の計算に内在するデータ削減は広範囲に及びます。元の n 個のデータ点よりもはるかに少ないデータを追跡することが要求されます。ただし、統計分析の目的からすれば、平均を求めることによって結果的に失われるものは何もありません。
アセンブリ指数についても同じことが言えるわけではありません。それが複雑なアイテムの集合を適切に表現できない、という欠点については次のセクションで詳述します。しかし、このセクションの残りの部分では、クローニンと彼の同僚がアセンブリ指数を過剰に売り込み、それが有していない力を帰していることを単純に示しておきましょう。クローニンのプロジェクトにとって本質的なのは、彼がアセンブリ方程式と呼ぶもので、2023年の『Nature』の論文 (323ページ) において、以下のように特徴づけられています。
我々はアセンブリを、観測されたオブジェクトの集合を生成するために必要な選択の総量と定義し、式 (1) を用いて定量化する。
ここで、 はアンサンブルのアセンブリ、 はオブジェクト のアセンブリ指数、 はそのコピー数、 は一意のオブジェクトの総数、 はオイラー数、 はアンサンブル内のオブジェクトの総数である。アンサンブル内のオブジェクト数で正規化することで、オブジェクト数の異なるアンサンブル間でアセンブリを比較することが可能になる。
前のセクションでは、経路複雑性 a を持つ所与の複雑なアイテム A を考えました。アセンブリ方程式では、個々の複雑なアイテムではなく、そのようなアイテムのアンサンブルに焦点を当てます。そのため、i が1から N までの N 個の異なるアイテム Ai のアンサンブルを考えなければなりません。ここで、A はアイテム Ai のアンサンブル全体であり、集合論的に A = {A1, A2, ..., Ai} と表すことができます。各 Ai は一意のアイテム型を表し、それぞれが ni 個のコピー (≥1) で繰り返されていることに注意してください。さらに、全てのコピーを含むアンサンブル A のアイテムの総数は、 となります。
上の引用で与えられたアセンブリ方程式から、あることが直ちに明らかになります。各アイテム型が1度しか出現しない場合、すべての i について、ni - 1 = 0 であり、その結果 A = 0 となります。するとこの式において、A が厳密に0より大きくなるには、同じ型のアイテムが繰り返される必要があります。さらに、アイテムが繰り返され、それらに対応するアイテムのアセンブリ指数が大きくなればなるほど、A は増大します。それは、という項が、アセンブリ指数 ai が大きいほど大きくなり (これらの各項は、 によって指数化されているため、アセンブリ方程式ではその重みはより大きくなります)、それ自体が大きくなる (項目の総数 NT に対して項目 Ai の繰り返しが多いことを意味する) 重み付け係数 が乗算されるからです。アセンブリ方程式は事実上、それぞれの指数に応答する同じ型のアイテムの数を制御して、アセンブリ指数の正規化された合成値を提供します。
平たく言えば、アセンブリ方程式の値が大きくなるためには、大きなアセンブリ指数を持つアイテムが存在し、それらがしばしば繰り返されなければなりません。しかし、アセンブリ方程式のこの特徴づけにより、直ちにある厄介な問題が浮上します。
- そもそも、この方程式の基礎を形成するアイテムのアンサンブルはどのように識別されるのでしょうか?アンサンブルの選択における恣意性は、アセンブリ方程式に組み込まれているように思えます。クローニンはアセンブリ方程式を「所与のオブジェクトのアンサンブルを産み出すのに必要とされる因果関係の度合いを捉えるもの」と称するでしょう。しかし、それは問題をそれ自身の解に変えてしまうという誤謬を犯しているだけです。アセンブリ方程式は、アンサンブルの選択自体は説明されないまま、そうであるという独立した証拠となる根拠の上に示されているというより、単純に因果的/説明的洞察を与えるものとして仮定されています (以下のポイント4. と比較してください)。
- この方程式のどこに、生物学や他の厳密科学への橋渡しがあるのでしょうか?実際の経験科学はどこにあるのでしょうか?形式自体としては純粋に数学的です。この方程式が前提としているのは、そこで計算されるアセンブリ指数が、問題となる現実の物理的アイテムを構築するのがいかに複雑であるかを適切に捉えているということです。ですが、クローニンと彼の同僚たちは、ここでの実際の橋渡しをどこにも確立していません。彼らはそうしたと考えているかもしれませんが、次のセクションで見るように、彼らのプログラムが依存する経路複雑性の測度は、アセンブリ指数として解釈した場合に深刻な問題があります。それは、ものを構築する際に生じる実際の複雑性を適切に捉えることができないのです。
- アイテム型の繰り返し回数の多さは、選択や進化と何の関係があるのでしょうか?ある生物が選択的優位性を持っていれば、その生物は複製します (その傾向があります)。しかし、複製の規模は生物によって大きく異なります (哺乳類と昆虫と細菌を比較してください)。たとえ問題のアンサンブルが慎重に選ばれたとしても、なぜそれが自然選択と何らかの関係があると考えられるのでしょうか?アセンブリ方程式は技術的な選択にも同様に適用でき、そこでは人間の目的に答える機能的な理由でアイディアやアイテムが複製されます (発明的問題解決理論としても知られるTRIZと比較してください)。また、経済的選択にも適用できます。そこでは、アイディアやアイテムが複製されるのは、(この点については明日この記事の付録で詳しく説明しますが、ハーバード大学の経営学教授カーリス・ボールドウィンのデザイン規則とモジュール性の力についての研究にあるように) 消費者がそのアイテムを大量に購入するからです。
- 最後に、2023年の『Nature』のクローニンの論文「Assembly Theory Explains and Quantifies Selection and Evolution」のタイトルからすると、彼のいわゆる理論はどのような意味で説明的な仕事をしているのでしょうか?事実として、ここには伝統的な用語の意味での理論、すなわち説明されるべき事柄の因果的記述 (説明) を提示する概念的枠組みという意味での理論は存在しません。実際、ここで説明されるべきものとは何でしょうか?恐らく、あるアンサンブルの中でしばしば繰り返される、アセンブリ指数 (経路複雑性) が高い、しかし高すぎない特定のアイテムでしょう。そう、アセンブリ方程式はこれを数字で表しているのです。しかし、なぜこの数字が何かを説明すると考えるべきなのでしょうか?確かに定量的な記述を提供してはいますが、単純にものに数字を割り当てるだけでは説明をしたことにはなりません。町と町の間の距離にマイル数を (直線距離のように) を直接割り当てることはできますが、それらの町と町の間の道路を進むのがどれだけ難しいか、あるいはそれらの間に道路があるかどうかについてさえ、それは何も語らないでしょう。
5. アセンブリ理論の非同型問題
非同型とは、生物学と数学で使い方が異なる用語です。生物学では、似たような機能を果たしながらも独立して進化してきた2つの種の解剖学的構造の差異を指します。例えば、鳥と昆虫の翼は、同じ機能 (飛翔) を担っているにもかかわらず、構造的に異なっており、異なる進化的経路を経て進化したため、非同型です。
しかし、私が非同型という言葉への私の興味は、数学的なものです。数学での非同型は、2つの数学的オブジェクトの間に構造的な類似性が欠如していることを記述しています。2つの構造がその演算と関係性を保持する方法で互いに写像できる同型とは対照的に、非同型はそのような写像が不可能であることを示しています。
アセンブリ理論の失敗の程度を評価するには、その経路複雑性の測度 (アセンブリ指数に改名された) に直面する非同型問題 (数学的に理解される) を理解する必要があります。この測度は、基本構成要素から構築される複数部分のアイテムの複雑性を数値で記述したものであり、正当に適用されるのはごく少数の限定された人為的な事例のみです。しかし、現実世界のアイテムのアセンブリを理解したいような事例の大部分では、これは完全に失敗します。
もし経路複雑性が、アセンブリ下のアイテムの段階的な形成の複雑性を捉えているのであれば、経路複雑性からアセンブリされる複雑なアイテムへの同型写像が存在しなければなりません。特に、基本構成要素の抽象的な記述と、経路複雑性と整合的な最短経路が与えられれば、アセンブリ理論のこれらの数学的ツールが使用されている複雑なアイテムの実際の形成を記述することが可能になるはずです。
簡単に言えば、数学側で基本構成要素と最短経路を埋めれば、現実側で問題のアイテムを構築することが可能になるはずです。CAD/CAMや青写真のように、アセンブリ理論の数学は、複雑なアイテムを、そのアイテムの本質的な特徴を省くことなく構築する方法を特徴付けるはずです。ただしそれがまさしく、アイテムが無向グラフによって特徴づけられ得るという非常に限定された状況を除いて、アセンブリ理論がしないことなのです。
アセンブリ理論はそのままでは、ビット列を正しく扱うことさえできません。所与のビット列と、同じビット列を逆順に並べたものを同一のものとして扱ってしまいます。アセンブリ理論にとってさらに悪いことに、レゴのピースで構成される集合体の構築は、経路複雑性/アセンブリ指数の観点から適切に説明することができません。どちらかと言えば、レゴはアセンブリ理論の概念実証を提供するはずなので、これは皮肉なことです。実際、『サンタフェ研究所』による2023年10月10日の、アセンブリ理論が生物学と科学全体に革命を起こす用意があるという発表には、レゴの集合体が特選画像として使われていました (著作権上の理由で、この記事には転載しませんが、読者はこちらで見ることができます)。
経路複雑性 (別名アセンブリ指数) を使ってアセンブリを特徴付けることの主要な問題は、数学的形式論がその仕事を扱うにはあまりにも貧弱で弱いということです。これを見るには、経路複雑性は無向グラフに適用される複雑性の測度であり、そのようなグラフの特定の形成履歴を伴うことを理解する必要があります。ここでグラフと呼んでいるのは、グラフ理論という数学的な意味です。グラフ理論の見地から、アイテムがどのように組み立てられるかは下記のとおりです。これは2017年のクローニン他の論文における鍵となる例で、5ページに出てきます。著作権上の理由から、構成要素の余計な繰り返しを省いて、作り直しました。

この例で説明しましょう。2つの基本構成要素、暗い円と明るい正方形から始めます。アセンブリ理論で形成される集合体は無向グラフなので、最初のステップは、基本構成要素から2つを取り出し、それらを接続して無向グラフを形成することです。したがって、2つの円または2つの正方形、あるいは私たちがしたように1つの円と1つの正方形を取り出し、それらを接続する線を引くことになるでしょう。これらは無向グラフなので、円を左に、正方形を右に置き、それらを接続する線を引いても問題はありません。この図で等号で記したように、順序を逆にしても同一の無向グラフになります。どんな無向グラフであろうが、円がティンブクトゥにあり、正方形がトリポリにあるということもあり得ます [訳注: 歴史的にトリポリとティンブクトゥ間のルートは、サハラ交易路の一部として重要な位置を占めていました。また、こちらの記事にあるように、ティンブクトゥという名称自体に象徴的な意味があるようです。]。
円と正方形が接続されると、それは構成要素 (の増大するリスト) に追加されます。ここでステップ2となり、基本構成要素 (円と正方形) と非基本構成要素 (正方形に接続された円) があることになります。ステップ2では、単純に円を別の円に接続することにします。するとステップ3に移り、別の円に接続された円が構成要素に追加されます。
次のステップ、ステップ3では、接続した正方形と円が複製されますが、一方の円は他方の正方形に接続され、一方の正方形は他方の円に接続されます。各ステップにおいて、集合体の増大するリストに現れるこれまでに形成された構成要素から2つのアイテムが選ばれ、一方の構成要素にある少なくとも1つの基本アイテムが、他方の構成要素にある1つの基本アイテムに接続されていることに注意してください。一方の構成要素にある基本アイテムが他方の構成要素にある2つの基本アイテムに接続されることは (無向グラフの理論ではそれが許容されますが) ないとします。
さて、ステップ3で形成された集合体を、増大する構成要素のリストに加え、次にステップ4で、2つの正方形と2つの円からなる構成要素を、一方の正方形を他方の円に接続することによって、2つの円からなる集合体に結合します。
ステップ4で形成されたこの集合体において、4アイテムからなる部分集合体のどの正方形が2アイテムからなる部分集合体のどちらの円に接続されているかは問わないことに注意してください。それらは全て等価です。
このアセンブリの過程を単純に目で見るだけで、それがいかに限定されたものであるかは明らかです。アイテムは順序に注意を払うことなく接続されます。したがって、ステップ2では次のような集合体を形成することもできたでしょう。

しかし、これは順序のないグラフなので、下図と等価です。

今、円を0、正方形を1と考えると、最初のものは0101、2番目のものは1010のように見えるでしょう。しかし、それは見た目の問題に過ぎません。事実として、この2つの無向グラフは等価です。結果として、アセンブリ理論はビット列や一般的な単語の形成を適切にモデル化することができません。例えば、クローニン他は2017年の論文 (4ページ) にあるように、ローマ字を基本構成要素として単語の形成を特徴づけており、基本構成要素B、A、Nから「BANANA」という単語を組み立てています。実のところ、この文字列はアセンブリ理論では、「ANANAB」と等価です。
この例は、アセンブリ理論が無向グラフで単語を表現することと、私たちが通常単語を表現する方法との間に非同型問題があることを明確に強調しています。ここでの問題は、単に文字の列を前から後ろへ読むのか、後ろから前へ読むのかを追跡する必要があるというだけの、些細なことに思えるかもしれません。しかし、ここでの問題はもっと広範囲に及びます。これを理解するために、レゴに目を向けてみましょう。

標準的なレゴブロックは、いくつかの鍵となる部品で構成されています。
- スタッド: ブロックの上部にある小さな円筒形の突起。スタッドによって、ブロックは他のブロックと結合することができます。
- チューブ: 他のブロックのスタッドとかみ合う、ブロックの裏側にある中空の円筒。これにより安定性がもたらされ、部品同士をしっかりと接続できます。
- 上面: スタッドのあるブロックの平らな面。これは、ブロックが他のブロックと接続したときに見える側です。
- 下面: チューブを含むレンガの下面。この部分は他のブロックのスタッドと結合します。
- ウォール: 上面と下面をつなぐブロックの垂直側面。これらのウォールにより、ブロックの構造的な形状が決まります。
- エッジ: ウォールが接するブロックの角。伝統的なブロックでは、これらのエッジは鋭く、垂直になっています。
今、標準的な8スタッドのレゴブロックを2つ取り上げ、一方を赤、もう一方を緑とし、アセンブリ理論が促すように、これらを成長する集合体の基本構成要素として扱うとしましょう。アセンブリ理論は、単純にそのような2つのブロックが連結することを示唆しています。それが赤と緑だとしましょう。レゴブロックで作業したことのある人なら誰でも、これら2つのブロックを連結する方法がたくさんあることに気付きます。赤のブロックが下にあり、緑のブロックが上にあると想像してください。緑のブロックに1本、2本、3本、4本、6本、8本のスタッドを掴ませることができますが、場合によっては、等価でない複数の方法でこれを行うこともできます。したがって、緑のブロックの短辺に赤のスタッドを2本含ませつつ、緑のブロックの向きを赤色のブロックと同じか垂直にすることもできるでしょう。あるいは、緑のブロックの長辺のどこかに、隣接する2つの赤のスタッドを含ませることもできるでしょう。さらに、赤のブロックの上に緑のブロックをどのような配置で置いても、緑のブロックの上に赤のブロックを置く幾何学的に等価な配置があるでしょう。
私はここで何十もの可能性を数えています。事実として、ここでは無限の可能性があります。というのも、ブロックを1つの角スタッド (角と角) で取り付けると、2つのブロックの間に無限の角度をつけることができるからです (単一のスタッドはレゴのピースを固定することはできませんが、回転させることはできるからです)。そのため、たった2個の8スタッドのレゴブロックで、無限に多くの配置が可能になります。ところが、アセンブリ理論は全てのアセンブリを無向グラフの観点から捉え直すので、これら全ての可能性を等価なものとして扱わなければなりません。さらに、赤と緑の8スタッドのレゴブロックのどのような配置を選んだとしても、アセンブリ過程にもう1つブロックを追加することで、ここでの非同型、つまり、レゴブロックの実際の配置と、それを表現することになっているアセンブリ理論側の無向グラフとの間の対応関係の欠如がさらに際立つことになります。
6. もしこの理論がレゴを扱えないなら・・・
アセンブリ理論がレゴブロックを扱えないのであれば、事実上扱えるものなど何もないことは今や明らかでしょう。しかし、疑念を払拭するためにこの点を強く言わせてください。アセンブリ理論は、基本構成要素が常にただ1つの方法で所定の位置に固定され、複合構成要素 (ATのアセンブリ過程に沿って構築される) が常にその (適合する固定法が固有の) 基本構成要素を介してのみ接続されるのであれば、機能します。その場合には、アセンブリ理論に内在する無向グラフのアプローチは、実際に組み立てられたものに同型的に写像されるでしょう。
しかし、現実世界では何がそれに当てはまるのでしょうか?アセンブリ理論に完全に欠けているのは、集合体における構成要素間の接点が複数の自由度を持ち得るということであり、実際にそうなっています。クローニンは化学者で、生命の起源を研究しているので、この点を理解できています。タンパク質のアミノ酸間の結合を考えてみましょう。生命形態に見られるL-アミノ酸は、ペプチド結合と非ペプチド相互作用の両方を通して、さまざまな方法で互いに繋がることができます。
ペプチド結合は、あるアミノ酸のカルボキシル基と別のアミノ酸のアミノ基の間に形成され、タンパク質中のポリペプチド鎖の骨格を創出します。しかし、アミノ酸はさらに、システイン残基間のジスルフィド結合、反対に帯電した側鎖間のイオン結合、水素結合、非極性側鎖間の疎水性相互作用、遷移双極子モーメントによるファンデルワールス力を形成することができます。非酵素的環境においてランダムなL-アミノ酸が2つだけあるとすると、ペプチド結合よりも非ペプチド結合の方が、ペプチド結合形成に必要な高い活性化エネルギーや特異的な触媒条件を要求しないため、自発的に形成されやすくなります。
アミノ酸間の結合にこのような界面の変動性があることは、複雑性を適切にモデル化するために構成要素の結合が単一であることを要求するアセンブリ理論では、タンパク質の形成を説明できないことを意味します。同様の考察が、核酸鎖、炭水化物、脂質にも当てはまります。その結果として、アセンブリ理論は生命の基礎的な構築単位を扱うことができません。そのため、アセンブリ理論は生命の起源にも、それに続く分子進化にも無関係です。
アセンブリ理論は、さらに深刻な理論的問題にも直面しています。生物学の文脈で、前生物スープに存在すると考えられているアミノ酸やその他の分子を基礎的な構築単位とする代わりに、周期表の原子を基礎的な構築単位とすることに決めたと想像してください。言い換えると、それらを基本構成要素にするということです。仮にこれらの原子がどのように生命の基礎分子へ構築されていくのかをアセンブリ理論が説明できたとしても、生命を説明しようとするとやはり行き詰まります。
問題は、原子が結合して分子を形成するとき、分子間に新規の多様な界面が出現することで、これは分子間の接続に複数の自由度があることを示唆しており、ひいては界面の変動性を扱うための資源を持たないアセンブリ理論のここでの妥当性を無効にしてしまいます。アセンブリ理論では、各アイテムの間の関係はそれ自体が管理すると仮定して、アイテムごとに集合体を構築しようとします。しかし界面に変動性があると、そのような関係はそれ自体で管理できなくなります。なぜなら、この理論は界面の変動性を許容しない無向グラフの観点で定式化されているからです。
この界面の変動性の問題は、アセンブリ理論が入れ子構造の階層を扱えないことにも現れています。アセンブリ理論では、アイテムのアセンブリの各段階で、基本構成要素を基本構成要素に接続することが要求されます。しかし、入れ子構造の階層では、様々な階層レベルにある複合構成要素は、階層の基礎を形成する最小限の基本レベルに戻ることなく、それらのレベルを横断して接続されることができます。例えば、アミノ酸は分子レベルで他のアミノ酸と結合するのであって、アセンブリ理論が (原子を基本構成要素と仮定した際に) 要求するように、純粋な原子レベルでの原子同士が見合うわけではありません。
論議のこの時点で、アセンブリ理論の熱烈な擁護者は、アセンブリ理論が説明しようとしている複雑なアイテムについての多くの情報を失ったとしても、そのアイテムへの何らかの洞察を提供している、と言いたくなるかもしれません。確かに、どのような複雑なアイテムについても最終的なグラフに至る無向グラフの経路は存在し、そのグラフが大まかにそのアイテムを表すことができます。しかし、それは印象的とは言い難いものです。
これがどれほど印象的でないかを見るために、赤、緑、青の8スタッドのレゴブロックを基本構成要素として組み合わせる2ステップの過程により、3つのパーツから成るレゴブロックのアイテムを構成できることを以下に示します。
- 赤-緑 [2パーツのアイテム]
- 赤-緑-青 [3パーツのアイテム]
このアセンブリ過程が、3色の8スタッドレゴブロックの実際の配置について提供する洞察とはなんでしょうか?事実として、何の洞察も提供しません。あるブロックのスタッドが別のチューブにどのように嵌まるのか、ここでは何も分かりません。実際のレゴの配置についての特定性はすべて失われています。
究極的には、アセンブリ理論の問題は、アセンブリの理論であるかのように装っていますが、事実としてはせいぜい粗雑な冗長性の測度を提示していることです。その核心は、ステップごとの二元的な増強過程において、構成要素 (基本および複合) の繰り返しを追跡することにあります。言い換えると、各ステップにおいてアセンブリ理論は、以前に識別あるいは形成された構成要素のペアを一緒にします。それから、増大する構成要素のリストにおける繰り返しを再帰的に活用して、最終的なアイテムを産出する過程を迅速化します。
しかし、無向グラフモデルに基づくアセンブリ理論では、界面の変動性や入れ子の階層を理解することも、アイテムの配置を忠実に表現することもできず、実際のアセンブリについては言うまでもありません。アセンブリ理論で経路複雑性 (別名アセンブリ指数) を計算できる経路は、せいぜい基本構成要素の粗雑な組織編成を表すものです (アセンブリ理論の経路に基づいて実際のアイテムを再構築するには間違いなく不十分です)。そのため、その経路は実際の構成経路ではなく、問題の複雑なアイテムの組織化を特徴づける逐次的な方法に過ぎず、通常、アイテムが無向グラフの構造に準拠しない限り、大量の詳細が失われます。そして、ほとんどの場合準拠しません。
アセンブリ理論には他にも多くの問題があります。それは純粋に増加的なのに、実践的なアセンブリの多くは、最終的なアセンブリをもたらすために足場のようなものを取り除く必要があるので、減法的です。例えば、ヒトの胎児の発生では、手の指の分離はアポトーシスによって起こります。発生中の指の間の領域の細胞がプログラムされた細胞死を経て、指が適切に造形され、分離されるのです。アセンブリ理論においてこのようなものは存在しませんし、存在することもできません。
要約すると、アセンブリ理論に対してさらに批判することができるとしても、ここまでの議論の流れは、アセンブリ理論がそれ自身の基準において敗北していることを十分に示しています。
明日は、「リー・クローニンへの返答: アセンブリのモジュール化理論」です。
『Substack』の Bill Dembski にクロスポストされました。