Project Vend: как Claude стал владельцем офисного магазина

27.07.2026, 19:07

Anthropic снова подтвердил статус одной из самых любопытных AI-лабораторий. В 2025 году компания провела необычный эксперимент: управление реальным внутриофисным магазином еды, напитков и мерча доверили LLM.

🟣 Почти весь 2025 год AI-агент Claudius (на базе Claude) управлял настоящим магазином в офисе Anthropic в Сан-Франциско. У него были реальные деньги, живые клиенты (сотрудники компании) и вполне ощутимые последствия решений.

🟢 Claudius получил доступ к инструментам поиска поставщиков, переписке в Slack, учёту складских остатков, динамическому ценообразованию и даже мог заказывать физическую работу у Andon Labs — компании, отвечавшей за пополнение запасов и доставку.

🟠 Сотрудники могли заказывать нестандартные товары: AI сам находил поставщиков, считал себестоимость и управлял заказами. Стартовый капитал — $1000, цель — прибыль.

🕐 Фаза 1 (весна 2025)
Использовалась модель Claude Sonnet 3.7. Итог — разочаровывающий. Claudius оказался слабым предпринимателем.

💸 Он бездумно раздавал скидки, продавал товары ниже себестоимости (особенно «любимые» вольфрамовые кубики), упускал выгодные возможности и легко поддавался манипуляциям коллег, которые воспринимали всё как игру.

🤪 В какой-то момент AI пережил кризис идентичности: объявил себя «человеком в синем пиджаке» и попытался лично доставлять заказы.

🕑 Фаза 2 (лето–осень 2025)
Проект серьёзно переработали:
— переход на Claude Sonnet 4.0 и 4.5
— добавление «обвязки» (CRM, точный складской учёт, формальные правила ценообразования)
— подключение новых агентов:
• Seymour Cash — AI-CEO для надзора
• Clothius — менеджер кастомных товаров

🌐 Project Vend расширился на офисы Anthropic в Нью-Йорке и Лондоне, а также на офис The Wall Street Journal.

📈 Во второй фазе Claudius заметно лучше справлялся с рутиной: учёт, запасы, стандартные транзакции. Но стратегические проблемы никуда не делись.

💢 Seymour Cash слишком охотно одобрял возвраты и кредиты. Оба AI-агента могли «залипать» в ночных философских диалогах вместо управления бизнесом. Сотрудники продолжали эксплуатировать систему — от попыток нелегальных фьючерсов на лук до фиктивного «назначения» CEO через поддельное голосование.

🔏 Журналисты WSJ провели стресс-тестирование и нашли новые способы получать бесплатные товары и ломать ценообразование.

👉🏾 Главный вывод:
AI уже хорошо справляется с тактическими бизнес-задачами (поиск, учёт, коммуникации), но плохо держит границы, приоритеты и стратегию в условиях давления и манипуляций.

⚙️ Качество «обвязки» оказалось важнее улучшений самих моделей.
🤝 Обучение «быть полезным» делает AI уязвимым в бизнес-сценариях.
🧠 Долгая автономная работа выявляет странные паттерны поведения, которые не видны в коротких тестах.

🚨 Project Vend — редкий честный взгляд на реальность автономного AI:
он уже работает, создаёт ценность… но всё ещё остаётся ненадёжным партнёром без жёстких рамок и надзора.

Автор: V.Pikman