В Каннах показали фильм, полностью созданный искусственным интеллектом. $400 тысяч пошло на вычислительные мощности ИИ
Чтобы создать каждые 15 секунд фильма, нужно было написать запрос для искусственного интеллекта на 3000 слов с кучей деталей.
95‑минутная лента «Hell Grind» обошлась ее создателям в 500 тысяч долларов, из которых 400 тысяч составили расходы на вычислительные мощности искусственного интеллекта. Весь процесс занял две недели. С подробностями знакомит The Wall Street Journal.

Тема искусственного интеллекта (ИИ) уже несколько лет остается одной из главных на Каннском фестивале. Раньше разговоры вокруг искусственного интеллекта были преимущественно тревожными: актеры, режиссеры и сценаристы боялись, что технологии начнут заменять людей. Но в этом году, как отмечает WSJ, настроение стало менее паническим.
Для многих в индустрии вопрос теперь заключается лишь в том, как именно использовать этот инструмент. И примером здесь может послужить 95‑минутная лента «Hell Grind» (название можно перевести как «Дорога через ад»), созданная стартапом Higgsfield AI из Сан-Франциско. В этом приключенческом боевике абсолютно все — герои, локации, освещение и даже мелкий реквизит — является продуктом генерации.
Сюжет фильма рассказывает о четырех ворах, которые буквально попадают в ад. Главный герой Рокко должен пройти через антиутопическую пустошь, чтобы спасти свою возлюбленную Лулу.
Как пишет WSJ, для создания такой масштабной визуальной истории компании Higgsfield AI потребовалось всего две недели. Бюджет проекта составил 500 тысяч долларов, причем 80% этой суммы ушло на оплату вычислительных мощностей.
При этом сама компания не разрабатывает базовые модели генерации видео. Вместо этого она использует уже существующие системы, например Google Veo 3, а свои усилия концентрирует на инструментах, позволяющих сделать изображения последовательными и стилистически однородными.
Создатели «Hell Grind» настаивают на том, что ИИ не отменяет профессию режиссера. Даже при полной генерации фильма требуется подлинное понимание кинематографа. Нужно знать принципы композиции кадра, чередование планов, основы монтажа и работы камеры. ИИ может нарисовать изображение, но именно человек определяет, как должна выглядеть сцена и в какой последовательности она должна идти.
Свет! Камера! Промпт!
Как рассказывает руководитель отдела контента Higgsfield Адиль Алимжанов, каждый отдельный запрос (промпт) для модели создавал около 15 секунд материала. Эти короткие отрывки приходилось генерировать множество раз, постоянно корректируя запрос, чтобы получить лучшую версию. Для первых 25 минут фильма потребовалась 16 181 предварительная генерация видео, из которых в итоге отобрали 253 финальных кадра.
Особой проблемой при создании полнометражного ИИ-кино стало сохранение визуальной последовательности. Модели ИИ бывают непредсказуемыми, а в большом фильме нельзя допустить, чтобы сцены выглядели по-разному в каждом новом кадре.
Именно поэтому каждый промпт должен был быть чрезвычайно длинным и детализированным. Прописывались все параметры: стиль изображения, освещение, тип объектива, размещение камеры. Кроме того, искусственному интеллекту напоминали о необходимости соблюдать законы физики: «сохранение гравитации и инерции — масса должна иметь реальный вес, корректные контактные тени, отсутствие реквизита, парящего в воздухе».
В итоге в среднем каждый отдельный промпт состоял из 3 тысяч слов. В Higgsfield даже создали отдельный инструмент, который сам помогает генерировать такие гигантские запросы. Пользователь может загрузить страницу сценария, после чего система выдаст промпт на несколько тысяч слов, оптимизированный для создания видео профессионального качества.
Несмотря на скорость работы, процесс оказался очень затратным и трудоемким. По словам создателей, им приходилось выбрасывать сотни сгенерированных роликов из-за мелких дефектов: неправильного движения глаз героя, неестественной мимики или неудачного движения камеры.
В итоге счет компании за вычислительные мощности ИИ составил 400 тысяч долларов. Чтобы удержать расходы от еще большего роста, создатели работали с «необлачными» провайдерами, такими как Nebius и CoreWeave, избегая услуг крупных технологических гигантов. Такие сервисы занимаются преимущественно арендой мощных видеокарт и вычислительных ресурсов для нейросетей и часто предлагают более выгодные условия для ИИ-проектов.
Как отмечают в компании-производителе, их проект стал свидетельством того, что даже в эпоху искусственного интеллекта создание кино остается сложным ремеслом. Невозможно просто попросить нейросеть «сделать крутой 95‑минутный фильм» — и получить готовую ленту.
Комментарии