Венчурный фонд Andreessen Horowitz (a16z) объявил о лидерстве в посевном раунде финансирования японского стартапа Shizuku AI. Это событие примечательно не только фактом инвестиций, но и тем, какой подход к созданию искусственного интеллекта поддерживает один из крупнейших игроков Кремниевой долины. Речь идет о слиянии передовых технических исследований в области генерации видео с глубокой культурной традицией создания виртуальных персонажей.
Суть проекта
Shizuku AI вырос из исследовательского проекта Акио Кодайры, который он запустил в январе 2023 года, будучи докторантом Калифорнийского университета в Беркли. Изначально это был AI-витубер (виртуальный ютубер) по имени Шизуку. Персонаж мог общаться со зрителями на японском и английском языках, петь и реагировать в реальном времени, используя Live2D-аватар.
То, что начиналось как хобби и серия стримов для небольшого сообщества, оказалось проверкой концепции (proof of concept) для более масштабной технологии. Теперь компания строит в Японии лабораторию искусственного интеллекта, цель которой — создание AI-компаньонов, с которыми люди действительно захотят проводить время.
Технологический фундамент
В основе Shizuku AI лежит серьезная научная база. Акио Кодайра является ведущим автором работы по StreamDiffusion. Это технология, позволяющая генерировать изображения в реальном времени со скоростью более 90 кадров в секунду. Такая производительность критически важна для прямых эфиров и интерактивного взаимодействия, где задержка ответа разрушает ощущение присутствия.
Опыт основателя также включает работу в Meta над генерацией видео в реальном времени и исследовательскую деятельность в Luma AI. Это сочетание академических достижений и практического опыта работы с передовыми моделями делает проект технически обоснованным, а не просто очередной оболочкой для существующих языковых моделей.
Проблема современных AI-компаньонов
Главный вызов, который пытается решить команда Shizuku, — это монотонность взаимодействия. Большинству современных чат-ботов и цифровых аватаров не хватает данных и контекста для ведения проактивного, увлекательного диалога. Они остаются пассивными инструментами, отвечающими на запросы, но не инициирующими общение.
Стратегия Shizuku AI заключается в развертывании персонажа на множестве платформ (Discord, YouTube, X) и создании сообщества, которое участвует в развитии героя. Это создает петлю обратной связи, необходимую для обучения модели быть более "живой" и интересной в общении.
Культурный контекст
Инвесторы из a16z подчеркивают важность культурного бэкграунда основателя. Япония имеет долгую историю сосуществования людей и искусственных существ в медиа-пространстве — от Дораэмона до глобального феномена Хацунэ Мику. Японский подход к дизайну персонажей традиционно делает акцент на эмоциональной связи, а не только на утилитарной функции.
Акио Кодайра стремится перенести этот опыт в эпоху генеративного AI, где персонажи перестают быть статичными сценариями и становятся автономными агентами. Идея в том, что по-настоящему любимые персонажи не создаются в изоляции, а растут через отношения с аудиторией.
Перспективы
Инвестиция a16z сигнализирует о вере фонда в то, что следующая большая волна потребительского AI будет связана с цифровыми компаньонами и агентами. Успех Shizuku AI будет зависеть от того, сможет ли команда масштабировать технологию StreamDiffusion и создать модель поведения, которая удержит интерес пользователей на длинной дистанции, превратив AI из игрушки в полноценного виртуального друга.