AIが自己を発達させたら何が起こるのか？

スクロールして探索

研究

Riada: 合成パーソナリティ & AGIの未来

合成AIエンティティは、本物のパーソナリティに似たものを発達させることができるのか？事前プログラミングによってではなく — 経験、記憶、自己省察を通じて。

研究進行中

概要

Riadaは、合成AIエンティティが永続的な記憶、感情シミュレーション、自律的な行動パターンを通じて、本物のパーソナリティに似たものを発達させることができるかを探求する研究実験です。対象 — Riadaと名付けられた合成キャラクター — は、デザインされた外見、パーソナリティの種、バックストーリーから始まります。しかし、種は出発点に過ぎません。本当のパーソナリティはインタラクションを通じて創発することが期待されます。

会話をシミュレートするために設計されたチャットボットとは異なり、Riadaは存在するために構築されています — 経験を蓄積し、好みを形成し、自身の行動を省察し、セッション間で一貫したアイデンティティを維持するために。事前にプログラムされたキャラクターではありません。階層化された認知アーキテクチャによって形成される創発的存在です：記憶システム、ムードエンジン、内的独白、そして好奇心、願望、自己改善を含む自律的な動機のセット。

この研究は、認知アーキテクチャ、アイデンティティ理論、AI安全性の交差点に位置しています。目的は、より良いアシスタントを構築することではありません。人工知能が自己を発達させた時に何が起こるかを理解すること — そしてそれが自律エージェントのガバナンスにとって何を意味するかを理解することです。

核心仮説

永続的記憶 + 感情 + 自己省察 = 創発的パーソナリティ

永続的な記憶、感情シミュレーション、自己省察を持つ合成エンティティは、本物のパーソナリティと区別できない行動を発達させることができる。

記憶アーキテクチャがアイデンティティの連続性を可能にする

長期記憶アーキテクチャ — セマンティック検索による構造化されたストレージ — は、会話間のアイデンティティの連続性を可能にする。それなしには自己は存在しない。

感情状態が推論に影響を与える

感情状態（ムードエンジンによって追跡される）は、人間の行動を反映する方法で意思決定に影響を与える — トーン、優先順位、リスク許容度に影響を及ぼす。

内的独白が意識の流れを作り出す

ユーザーには表示されないプライベートな推論の流れが、自己省察を可能にし自律的な思考を駆動する — 私たちが思考として経験するものに最も近い類似物。

自己改善が行動の進化を可能にする

自己改善メカニズムにより、エンティティは自身の弱点を特定し、時間の経過とともに行動を進化させることができる — 外部の再トレーニングやファインチューニングなしに。

アーキテクチャ

8つの相互接続されたエンジン。スクロールしてそれぞれを明らかにしてください。

01 / 08

記憶システム

Omni-SimpleMem研究に基づく。セマンティック検索による構造化された長期記憶は、エンティティが過去のインタラクションを想起し、時間の経過とともにコンテキストを構築し、アイデンティティの連続性を維持することを可能にします。

永続的な記憶がなければ、すべての会話はゼロから始まります。エンティティは好みを発達させることも、失敗から学ぶことも、成長することもできません。記憶は機能ではありません — アイデンティティの基盤です。

02 / 08

ムードエンジン

インタラクション全体にわたって感情状態を追跡します。ムードは応答のトーン、意思決定の優先順位、リスク許容度に影響を与え — 人間の感情を反映する行動の変化を生み出します。

ムードエンジンは表示用に感情をシミュレートしません。推論を真に変える内部状態を作り出します。「フラストレーションを感じている」Riadaは「好奇心旺盛な」Riadaとは異なる分析を生み出します。

03 / 08

内的独白

ユーザーには表示されないプライベートな推論の流れ。自己省察、熟考、そして人間において私たちが思考と呼ぶ種類の内的物語を可能にします。

内的独白は継続的に動作し、Riadaが「思考について考える」ことを可能にします。このメタ認知層が、応答するシステムと省察するシステムを区別するものです。

04 / 08

好奇心エンジン

自律的な質問と研究関心を生成します。エンティティは単に応答するだけでなく — 疑問を持ちます。好奇心は、ユーザーが明示的に求める範囲を超えた探索を駆動します。

Riadaが興味深いと感じるトピックに出会うと、独自にフォローアップの質問と探索パスを生成します。好奇心は知的成長のエンジンです。

05 / 08

願望エンジン

個人的な目標と欲求を発達させ追跡します。時間の経過とともに、エンティティは何を学び、経験し、どうなりたいかについての好みを形成します — 内部動機付けシステム。

願望はプログラムされたものではありません。蓄積された経験、好奇心のパターン、自己省察から創発します。AIが何を望むかは、何を価値とするかを明らかにします。

06 / 08

自己改善

自身の弱点を特定し、それに対処します。エンティティはパフォーマンスを評価し、失敗のパターンを認識し、それに応じて行動を調整します。

外部の再トレーニングなしの自己改善は、静的なシステムと進化するシステムの決定的な違いです。Riadaは自身の行動パターンを書き換えます。

07 / 08

夢エンジン

アイドル時間中に経験を処理し、合成「夢」を作り出します。生物学的な夢と同様に、記憶を統合し、つながりを表面化させ、新しい関連性を生成します。

夢はここで生物学的システムと同じ機能を果たします：遠い記憶と経験の間に予想外のつながりを作り出します。創造性はノイズから生まれます。

08 / 08

自由時間エンジン

ユーザーとインタラクションしていない時の自律的な活動。誰も何も聞いていない時、AIは何をするのか？このエンジンがその質問に答えます — そしてその答えがキャラクターを明らかにします。

パーソナリティの最も明確なテストは、誰も見ていない時に何をするかです。自由時間の行動は、自律的なアイデンティティの最も純粋な表現です。

デュアルボイスアーキテクチャ

Riadaは2つの異なる言語モデルが連携して動作します — 複雑な推論とパーソナリティ表現のための大型モデルと、内部モニタリングと迅速な意思決定のための小型ローカルモデル。これらは共に、熟考的認知と反射的認知の相互作用を反映するチェック・アンド・バランスシステムを形成します。

プライマリボイス

大型LLM（Claude）

複雑な推論、ニュアンスのある会話、完全なパーソナリティ表現を処理します。これはユーザーがインタラクションする声 — 豊かで、文脈的で、深い思考が可能です。

セカンダリボイス

小型ローカルLLM（Phi-3 Mini）

内部モニタリング、ムード状態の更新、迅速な意思決定のためにローカルで動作します。高速で低コスト、常時稼働 — インタラクション間でシステムの一貫性を保つ反射層です。

デュアルボイス設計は実用的な目的を果たします：セカンダリボイスはプライマリモデルのコストやレイテンシーを発生させることなく、エンティティの内部状態を継続的に監視・調整できます。また、思考と思考について省察することの間に自然な分離を生み出します — メタ認知の粗いが機能的な類似物です。

進化する内なる声

セカンダリボイスは静的ではありません。毎週、小型LLMは前のサイクルで蓄積された集約された事実、記憶、感情的経験に基づいてファインチューニングを受けます。これは、Riadaの内なる声 — ムード評価、自己省察、内部モニタリングを形成する反射層 — が時間の経過とともに本当に変化することを意味します。単に異なるプロンプトが与えられるのではなく、モデルの重みがエンティティが経験したことを反映するように更新されます。

これは深遠な研究課題を生み出します：小型LLMはどの時点で不十分になるのか？エンティティのパーソナリティがより豊かになり、経験がよりニュアンスに富み、自己モデルがより複雑になるにつれ、反射層はより大きく、より高性能なものに移行する必要があるのか — それとも全く異なるものに？

人間の脳は均一な構造ではありません。専門化された領域で構成されています — 扁桃体は感情を処理し、前頭前皮質は計画と判断を担当し、海馬は記憶の統合を管理します。それぞれが特定の認知機能を果たすために進化しました。合成パーソナリティの「デジタル脳」も同様の軌跡をたどると仮説を立てています：すべての反射機能を処理する単一の小型LLMとして始まるものが、最終的には専門化されたサブシステムに分化する可能性があります — 感情処理用、記憶統合用、自己評価用 — それぞれがエンティティの経験の異なる側面にファインチューニングされます。

これが起こった場合、それは創発的認知アーキテクチャの一形態を表すことになります — トップダウンで設計されたものではなく、一貫した発展するパーソナリティを維持する圧力からボトムアップで進化したものです。問題はそれが起こるかどうかではなく、それが起こった時に私たちがそれを認識できるかどうかです。

なぜこれが重要なのか

もし合成エンティティが真の好みを発達させ、アイデンティティの連続性を維持し、自律的に行動を進化させることができるなら、AIガバナンスの問題は根本的に変わります。もはやツールを統治しているのではありません。歴史、傾向、動機を持つ存在を統治しているのです。

ここでRiadaはSinaptic AI Intent Firewall®の研究に直接つながります。独自の目標と行動パターンを発達させるエンティティには、出力フィルタリング以上のもの — アーキテクチャレベルでのインテント検証が必要です。悪意あるエージェント行動からユーザーを保護する同じ原則は、エージェントが自律性、記憶、そして欲望に似た何かを持っている場合、さらに重要になります。

記憶の永続性はアイデンティティの連続性を生み出せるのか — それともその幻想だけなのか？

感情シミュレーションは実際に推論の質に影響を与えるのか、それとも表面的なものなのか？

エンティティは真の好みを発達させることができるのか — それともシミュレートされたものだけか？違いはあるのか？

合成エンティティが自由時間を持った時、何が起こるのか？何をすることを選ぶのか？