【知能の簡潔な歴史】2. 操縦(両側対称動物)

両側対称的な体の構造

最も初期の動物の親戚であるサンゴ、アカガイ、クラゲなどは、その体の構造が放射対称的でした。しかし、現代のほとんどの動物種は両側対称性を持っています。この両側対称性により、動物の運動装置は単一方向(つまり前方)に最適化されると同時に、ナビゲーションの問題を解決するために舵取り機構が追加されます。

両側対称的な動物は脳を持つ唯一の生物です。最初の脳は、両側対称的な体の構造と同じ進化の目的を持っていました:動物が効果的に舵取りを行うのを助けることです。多細胞生物にとって、舵取りできるという能力は重要な進歩でした。

最初の脳は線虫の脳のように非常に単純でした。例えば、秀丽隠線虫の脳はわずか302個のニューロンで構成されています(比較すると、人間の脳には約850億個のニューロンがあります)。しかし、線虫の脳構造は単純であっても、その行動はかなり複雑です。線虫は目標(例えば食物)に近づいたり、光や有害な冷たさや熱さ、鋭い表面などの不都合な条件から遠ざかることができます。

最初のロボット

世界初のロボットは、MITのロボティクス研究者ロドニー・ブルックスによって作られました。彼が提唱した原則は「ステップごとに完全なシステムを持つ形で、段階的に知能システムの能力を構築する」ことでした。これは生物の進化プロセスと似ており、単純な脳から始まり、徐々に複雑性を増していきます。ブルックスの第一歩は脳の進化の第一歩と一致していました——彼もまた舵取りから始めました。ルンバ掃除ロボットは非常にシンプルなセンサーと脳を持ちながら、両側対称的な構造を呈し、複雑な世界でナビゲートすることができます。ただし、それは本当にその世界を理解したりシミュレートしたりすることはありません。

市場と進化には共通点があり、最も重要な三つは常に優先的に報酬を与えられます:

  • 価格の安い製品
  • 実用的な製品
  • 発見されるのに十分に単純な製品

舵取り自体は他の知的能力の成果ほど驚くべきものではないかもしれませんが、確かに安価で非常に実用的であり、進化的な調整においては十分に単純です。そのため、脳の進化はまさにこの点から始まりました。

刺激の価値

両側対称動物の舵取り機能の突破により、彼らは世界を二つのカテゴリに分けなければなりませんでした:接近すべき物体(「良いもの」)と回避すべき物体(「悪いもの」)。この単純な二元分類は、最も原始的な脳が世界を認識する方法でした。

この二元分類は、私たち人類が幼少期に経験するものの簡単な判断方法と非常に似ています。心理医との議論の中で述べたように、私たちは成長するにつれて「良い」または「悪い」という単純な方法で世界を評価します。このような二元思考は、私たちの成長の初期段階では非常に一般的であり、周囲の環境を迅速かつ直感的に理解するのに役立ちます。

しかし、年齢と経験とともに、私たちは「グレーゾーン」の概念を取り入れるようになります。つまり、世界は必ずしも黒か白ではなく、複雑さと微妙な違いで満ちていることを学びます。この認知の発展は、脳の進化と同様に、単純から複雑へと進むプロセスです。この徐々にグレーゾーンを受け入れるプロセスは、私たちの心理的な成熟の重要な指標の一つと考えることができます。


を付与することです。価値とは刺激の良し悪しの程度であり、道徳的判断とは無関係です。これはより基本的な生物メカニズムであり、動物が刺激に対して接近するか回避するかを決定します。

ということです。化学物質、画像、温度そのものは良し悪しの区別はありません。逆に、刺激の価値は主観的であり、完全に脳による刺激の評価に依存します。

温度に関して、線虫は二つの主要な調節回路を持っています:

  • ある閾値を超えた場合に反応し、線虫が高温を避けるために舵取りを誘発する「暑すぎる」負のニューロン。
  • ある閾値を下回った場合に反応し、線虫が寒冷を避けるために舵取りを誘発する「寒すぎる」負のニューロン。

これらの二つの負のニューロンが相互作用することで、線虫は温度が高い場合は速やかに熱源から離れたり、温度が低い場合は寒冷な環境を避けることができます。

があります。これには温度に敏感なニューロンが含まれており、線虫のニューロンと同様の原理で体温を調節し、生物の生存を確保します。

Trade-Offs

動物が複数の刺激に直面したとき、どのように舵取りの方向を選択するのでしょうか?答えは次の通りです:

具体的には、「良いもの」(例えば食物の匂い)と「悪いもの」(例えば銅の匂い)の相対的な濃度に依存します。動物体内の前進ニューロンと舵取りニューロンはお互いに抑制し合い、全体のニューロンネットワークがこれらのトレードオフを統合して意思決定を行います——どのニューロンが「投票」を多く集めるかによって勝敗が決まり、それが動物が銅の障害を越えて前進するかどうかを決定します。

最も単純な脳でも、たとえ神経細胞が千個未満であっても、このような複雑なトレードオフメカニズムを行うことができます。この能力は、放射対称動物(例えば初期のサンゴ類動物)における抑制性ニューロンの進化に由来します。以前の記事で脳出現前のニューロンについて触れましたが、その中で述べられた抑制ニューロン(Inhibitory neurons)は、同じ抑制メカニズムが現在では両側対称動物において複雑な舵取り意思決定でのトレードオフを助けているのです。

相対的な濃度だけでなく、線虫の飢餓レベルにも依存します。飢餓信号がある場合にはニューロンは食物の匂いにさらに敏感になり、饱食信号がある場合にはそれほど敏感ではありません。上記のルンバ掃除ロボットも同じメカニズムを利用しており、完全に充電されているときは基地からの信号を無視しますが、バッテリー残量が少ない状態では基地からの信号が正の価値(modulate valence)を持つようになります。

感情

という二つの重要な次元を含んでいます。

線虫のような単純な生物の第一世代の脳においても、これらの状態の原型を見ることができます。

でした——外界の刺激が行動を引き起こした後、刺激が消えてもその行動パターンはしばらく続くのです。

同様の設計は第一世代のロボットであるルンバにも見られます。ルンバは汚れを検出したときに汚れ検出モードを活性化し、汚れのある領域を何度も掃除します。汚れが検出されなくなった後も、ルンバはしばらくその領域内で回転し続け、完全に清掃されることを確認します。

に依存しています。例えば、ドーパミンやセロトニンといった化学物質は、ニューロンの活動を調節します。興奮と抑制ニューロンがコンピュータの「0」と「1」に似ているとするなら、調節ニューロンは複雑な化学信号を通じてニューロン活動を総合的に調節します。

例えば:

  • :線虫が環境中に食物を検出したとき、ドーパミン分泌が増加し、「近くに良いことが起きている」と伝え、食物への追い求めを駆動します(
  • :線虫が体内に食物を持っているとき、セロトニン分泌が増加し、「良いことが起きている」と伝え、食物の享受を駆動します(

(例えばオピオイド類)が回復プロセスを開始し、生物を正常状態に徐々に戻します。

状態に移行し、覚醒と動機が徐々に停止します。このとき、セロトニン分泌は増加しますが、ドーパミン反応は鈍くなり、快感欠如が引き起こされます。これは現代の人間のうつ症状と類似しており、心理学ではこれを「習得性無力感」と呼ぶ専門用語があります。

感情は5.5億年前の両側対称動物に初めて現れ、その主な役割は彼らに鍵となる舵取り意思決定をさせるためでした:

習得性無力感について、パブロフの晩年の実験を挿入します。彼が最もよく知られているのは「パブロフの犬」実験であり、古典的条件付けの研究を切り開きました。しかし、スターリン時代のパブロフ晩年には、残酷で倫理的に問題があるため、学界ではあまり語られない実験がありました。この実験では、パブロフは動物を瀕死の環境に置き、どれだけ「強く」耐えられるかを観察しました。最終的に彼は、すべての動物が繰り返し瀕死の環境にさらされることで最終的に崩壊することを発見しました。そして、崩壊前に長く耐えた動物ほど、崩壊の程度が大きく、回復にかかる時間も長くなりました。これにより、災害に直面したとき、誰も真に免れることはできず、最終的にはすべて習得性無力感の罠に陥ることが示されました。

まとめ

舵取りには少なくとも以下の要素が必要です:

  • 舵取りに使用される両側対称的な体計画
  • 刺激を「良い」と「悪い」に分類するための価ニューロン
  • 単一の舵取り決定に統合するための大脳
  • 内部状態に基づいて価を調整する能力
  • 感情はさらに舵取りの効率を高めます