Стартап Vana предлагает оплату за личные данные для обучения искусственного интеллекта

Инновационный стартап Vana разрабатывает децентрализованную платформу, где пользователи могут предоставлять свои данные для обучения ИИ-моделей и получать за это криптовалютное вознаграждение. В условиях прогнозируемого дефицита данных для обучения ИИ данная инициатива может стать важным решением проблемы.

G. Ostrov

20 мая 2025

Надвигающийся кризис данных для ИИ

Согласно исследованиям авторитетного института Epoch AI, в период между 2026 и 2032 годами отрасль искусственного интеллекта может столкнуться с серьезной проблемой — дефицитом данных для обучения новых моделей. Это потенциально способно замедлить развитие технологий ИИ, которые становятся все более требовательными к объему и качеству обучающих данных.

В качестве перспективного решения этой проблемы выступает стартап Vana, предложивший принципиально новый подход к сбору данных. Компания разрабатывает децентрализованную сеть, где обычные пользователи смогут предоставлять свои личные данные для обучения искусственного интеллекта и получать за это вознаграждение в виде криптовалютных токенов. Проект уже привлек серьезное финансирование в размере 25 миллионов долларов от инвесторов.

Механизм работы платформы Vana

Платформа Vana объединяет множество сервисов (более нескольких десятков), через которые пользователи могут делиться различными типами своих данных:

Публикации из социальных сетей
История браузеров
Данные с устройств "умного дома"
Биометрические показатели с фитнес-трекеров
Расшифровки геномов и другая персональная информация

Компания уже заявила о разработке собственной ИИ-модели под названием Collective-1, обладающей 7 миллиардами параметров. Отличительной особенностью является то, что для её обучения используются исключительно данные пользователей платформы. Техническую сторону обеспечивает система Flower, позволяющая объединять вычислительные мощности устройств участников для распределенного обучения нейросети.

На текущий момент к сети Vana присоединилось более 1,3 миллиона пользователей. Однако амбициозные планы компании предполагают увеличение этого числа до 100 миллионов участников. Такой масштаб позволит собрать около 453 триллионов токенов для обучения — это значительно превосходит объемы данных, использованные для создания современных моделей. Для сравнения: Llama-3 обучалась на 15 триллионах токенов, а Qwen3 — на 36 триллионах.

Демократизация искусственного интеллекта

Основная философия проекта заключается в демократизации процесса создания и владения ИИ-моделями. Согласно словам сооснователя Vana Анны Казлаускас: «Вы не окажетесь в ситуации, когда одна компания контролирует всемогущую модель ИИ. Благодаря нашему подходу, пользователи будут действительно владеть моделями. Вы получаете более совершенную технологию, и от этого выигрывают все».

Такая модель потенциально позволяет решить сразу несколько проблем современной отрасли ИИ:

Увеличить доступность качественных данных для обучения
Обеспечить честное вознаграждение лицам, предоставляющим свои данные
Предотвратить монополизацию ИИ-технологий крупными корпорациями
Повысить прозрачность и этичность процесса сбора данных

Однако подобная инициатива вызывает и закономерные вопросы о конфиденциальности, безопасности данных и потенциальных рисках. Многих пользователей беспокоит, насколько надежно будут защищены их личные данные и какие последствия может иметь их использование для обучения ИИ-моделей.

Тем не менее, в условиях растущего спроса на данные для ИИ и прогнозируемого дефицита, подобные децентрализованные платформы могут стать важным звеном в экосистеме искусственного интеллекта будущего.

Официальный сайт проекта Vana: https://www.vana.org

В случае каких-либо проблем напишите нам, мы поможем быстро и качественно!