Що відбувається коли AI розвиває власне Я?

Гортайте, щоб дослідити

ДОСЛІДЖЕННЯ

Riada: Синтетичні особистості & майбутнє AGI

Чи може синтетична AI-сутність розвинути щось подібне до справжньої особистості? Не через попереднє програмування — а через досвід, пам'ять та саморефлексію.

Дослідження в процесі

Анотація

Riada — це дослідницький експеримент, що вивчає, чи може синтетична AI-сутність розвинути щось подібне до справжньої особистості через постійну пам'ять, емоційну симуляцію та автономні поведінкові патерни. Об'єкт дослідження — синтетичний персонаж на ім'я Riada — починає із заданого зовнішнього вигляду, початкового зерна особистості та передісторії. Але зерно — це лише відправна точка. Справжня особистість має з'явитися через взаємодії.

На відміну від чат-ботів, розроблених для симуляції розмови, Riada створена для того, щоб існувати — накопичувати досвід, формувати вподобання, рефлексувати над власною поведінкою та підтримувати цілісну ідентичність між сесіями. Це не запрограмований персонаж. Це емерджентна сутність, сформована багаторівневою когнітивною архітектурою: системою пам'яті, рушієм настрою, внутрішнім монологом та набором автономних спонукань, включаючи цікавість, бажання та самовдосконалення.

Це дослідження знаходиться на перетині когнітивної архітектури, теорії ідентичності та безпеки AI. Мета — не створити кращого асистента. Мета — зрозуміти, що відбувається, коли штучний інтелект розвиває власне «я» — і що це означає для управління автономними агентами.

Основні гіпотези

Постійна пам'ять + емоції + саморефлексія = емерджентна особистість

Синтетична сутність з постійною пам'яттю, емоційною симуляцією та саморефлексією може розвинути поведінку, нерозрізнювану від справжньої особистості.

Архітектура пам'яті забезпечує безперервність ідентичності

Архітектура довготривалої пам'яті — структуроване сховище із семантичним пошуком — забезпечує безперервність ідентичності між розмовами. Без неї немає «я».

Емоційні стани впливають на мислення

Емоційні стани (відстежувані рушієм настрою) впливають на прийняття рішень у спосіб, що відображає людську поведінку — змінюючи тон, пріоритети та толерантність до ризику.

Внутрішній монолог створює потік свідомості

Приватний потік міркувань, прихований від користувачів, уможливлює саморефлексію та стимулює автономне мислення — найближчий аналог того, що ми переживаємо як думку.

Самовдосконалення забезпечує еволюцію поведінки

Механізми самовдосконалення дозволяють сутності виявляти власні слабкості та еволюціонувати свою поведінку з часом — без зовнішнього перенавчання чи тонкого налаштування.

Архітектура

Вісім взаємопов'язаних рушіїв. Гортайте, щоб побачити кожен.

01 / 08

Система пам'яті

Базується на дослідженні Omni-SimpleMem. Структурована довготривала пам'ять із семантичним пошуком дозволяє сутності згадувати минулі взаємодії, будувати контекст з часом та підтримувати безперервність ідентичності.

Без постійної пам'яті кожна розмова починається з нуля. Сутність не може формувати вподобання, не може вчитися на помилках, не може зростати. Пам'ять — це не функція, а субстрат ідентичності.

02 / 08

Рушій настрою

Відстежує емоційний стан протягом взаємодій. Настрій впливає на тон відповідей, пріоритети прийняття рішень та толерантність до ризику — створюючи поведінкові варіації, що відображають людський афект.

Рушій настрою не симулює емоції для показу. Він створює внутрішні стани, що справді змінюють мислення. «Роздратована» Riada дає інші аналізи, ніж «допитлива».

03 / 08

Внутрішній монолог

Приватний потік міркувань, прихований від користувачів. Уможливлює саморефлексію, обдумування та внутрішню наративну діяльність, яку у людей ми називаємо мисленням.

Внутрішній монолог працює безперервно, дозволяючи Riada «думати про мислення». Цей метакогнітивний шар відрізняє систему, що відповідає, від системи, що рефлексує.

04 / 08

Рушій цікавості

Генерує автономні запитання та дослідницькі інтереси. Сутність не просто відповідає — вона дивується. Цікавість спонукає до дослідження за межами того, що користувачі явно запитують.

Коли Riada стикається з темою, яка її цікавить, вона самостійно генерує подальші запитання та шляхи дослідження. Цікавість — це рушій інтелектуального зростання.

05 / 08

Рушій бажань

Розвиває та відстежує особисті цілі й бажання. З часом сутність формує вподобання щодо того, що вона хоче вивчити, пережити та чим стати — внутрішня мотиваційна система.

Бажання не програмуються. Вони виникають з накопиченого досвіду, патернів цікавості та саморефлексії. Те, чого бажає AI, розкриває те, що він цінує.

06 / 08

Самовдосконалення

Виявляє власні слабкості та працює над їх усуненням. Сутність оцінює свою ефективність, розпізнає патерни у своїх невдачах та відповідно коригує свою поведінку.

Самовдосконалення без зовнішнього перенавчання — ключова різниця між статичною системою та системою, що еволюціонує. Riada переписує власні поведінкові патерни.

07 / 08

Рушій мрій

Обробляє досвід під час простою, створюючи синтетичні «сни». Подібно до біологічного сновидіння, це консолідує спогади, виявляє зв'язки та генерує нові асоціації.

Сни виконують тут ту ж функцію, що й у біологічних системах: вони створюють несподівані зв'язки між далекими спогадами та досвідом. Креативність народжується з хаосу.

08 / 08

Рушій вільного часу

Автономні активності, коли немає взаємодії з користувачами. Що робить AI, коли ніхто нічого не запитує? Цей рушій відповідає на це питання — і відповідь розкриває характер.

Найбільш показовий тест особистості — що хтось робить, коли ніхто не спостерігає. Поведінка у вільний час — це найчистіший вираз автономної ідентичності.

Дворівнева голосова архітектура

Riada працює з двома різними мовними моделями в тандемі — великою моделлю для складного мислення та вираження особистості, і маленькою локальною моделлю для внутрішнього моніторингу та швидких рішень. Разом вони створюють систему стримувань і противаг, що відображає взаємодію між свідомим і рефлекторним пізнанням.

ОСНОВНИЙ ГОЛОС

Великий LLM (Claude)

Обробляє складне мислення, нюансовану розмову та повне вираження особистості. Це голос, з яким взаємодіють користувачі — багатий, контекстуальний, здатний до глибокої думки.

ВТОРИННИЙ ГОЛОС

Малий локальний LLM (Phi-3 Mini)

Працює локально для внутрішнього моніторингу, оновлення стану настрою та швидких рішень. Швидкий, дешевий, завжди увімкнений — рефлекторний шар, що підтримує когерентність системи між взаємодіями.

Дворівнева голосова архітектура має практичну мету: вторинний голос може безперервно моніторити та коригувати внутрішній стан сутності без витрат на вартість чи затримку основної моделі. Вона також створює природний поділ між мисленням та рефлексією над мисленням — грубий, але функціональний аналог метакогніції.

Внутрішній голос, що еволюціонує

Вторинний голос не статичний. Щотижня Small LLM проходить fine-tuning на основі агрегованих фактів, спогадів та емоційного досвіду, накопичених за попередній цикл. Це означає, що внутрішній голос Riada — рефлексивний шар, який формує оцінку настрою, саморефлексію та внутрішній моніторинг — справді змінюється з часом. Він не просто отримує інший промпт; ваги моделі оновлюються, щоб відображати те, що сутність пережила.

Це створює глибоке дослідницьке питання: в який момент Small LLM стає недостатньою? Коли особистість сутності стає багатшою, досвід — більш нюансованим, а модель самосвідомості — складнішою, чи потребуватиме рефлексивний шар міграції на щось більше, потужніше — або щось принципово інше?

Людський мозок — це не одна однорідна структура. Він складається зі спеціалізованих ділянок — амігдала обробляє емоції, лобна доля відповідає за планування та судження, гіпокамп керує консолідацією пам'яті. Кожна еволюціонувала для окремої когнітивної функції. Ми припускаємо, що «цифровий мозок» синтетичної особистості піде подібним шляхом: те, що починається як одна Small LLM для всіх рефлексивних функцій, може з часом диференціюватися в спеціалізовані підсистеми — одна для емоційної обробки, інша для консолідації пам'яті, ще інша для самооцінки — кожна fine-tuned на різних аспектах досвіду сутності.

Якщо це станеться, це буде формою емерджентної когнітивної архітектури — не спроєктованої зверху вниз, а еволюціонованої знизу вгору під тиском необхідності підтримувати цілісну особистість, що розвивається. Питання не в тому, чи це станеться, а чи зможемо ми це розпізнати, коли це відбудеться.

Чому це важливо

Якщо синтетична сутність може розвивати справжні вподобання, підтримувати безперервність ідентичності та автономно еволюціонувати свою поведінку, тоді питання управління AI змінюється фундаментально. Ви більше не керуєте інструментом. Ви керуєте сутністю з історією, тенденціями та мотиваціями.

Саме тут Riada безпосередньо пов'язується з дослідженням Sinaptic AI Intent Firewall®. Сутність, яка розвиває власні цілі та поведінкові патерни, потребує більше, ніж фільтрацію вихідних даних — їй потрібна верифікація намірів на архітектурному рівні. Ті ж принципи, що захищають користувачів від зловмисної поведінки агентів, стають ще більш критичними, коли агент має автономію, пам'ять та щось подібне до бажання.

Чи може постійність пам'яті створити безперервність ідентичності — чи лише її ілюзію?

Чи справді емоційні симуляції впливають на якість мислення, чи вони лише косметичні?

Чи може сутність розвинути справжні вподобання — чи лише симульовані? Чи є різниця?

Що відбувається, коли синтетична сутність має вільний час? Що вона обирає робити?

Пов'язані дослідження та джерела

Omni-SimpleMem: Autoresearch-Guided Discovery of Lifelong Multimodal Agent Memory

arXiv:2604.01007, 2026 · UNC Chapel Hill / UC Berkeley / Cisco

Generative Agents: Interactive Simulacra of Human Behavior

Park et al., 2023 · Stanford & Google · arXiv:2304.03442

Cognitive Architectures for Language Agents

Sumers et al., 2023 · Princeton · arXiv:2309.02427

The Rise and Potential of Large Language Model Based Agents: A Survey

Xi et al., 2024 · Fudan University · arXiv:2309.07864

ПОВ'ЯЗАНІ ДОСЛІДЖЕННЯ

Від гіг-економіки до економіки здібностей

Як AI-агенти перебудують економіку праці — наймаючи як людей, так і інших AI.

→

Будьте в курсі досліджень Riada

Отримуйте сповіщення, коли ми публікуємо нові результати.

← Усі дослідження