Новый договор. Кино и зритель после ИИ

- -
- 100%
- +

© М. Ю. Кувшинова, 2025
© Н. А. Теплов, оформление обложки, 2025
© Издательство Ивана Лимбаха, 2025
Предисловие
Автобиография глаза
Эта книга – автобиография кинокритика. Это автобиография медиаживотного, которое без разбора поглощает визуальный контент из любого источника. Но я постаралась сделать так, чтобы она была интересна не только поклонникам жанра автофикшн.
Я писала о кино с середины 1990-х, а в конце нулевых стало слишком заметно, что с кинематографом что-то происходит – визуальный океан XX века в веке XXI начал превращаться в остров, трансформируясь под воздействием цифровых технологий и конкурирующих медиа. Результатом этих наблюдений стала книга «Кино как визуальный код» и конференция «История кино как медиаархеология», которую мы с коллегами по журналу «Сеанс» провели на Новой сцене Александринского театра в 2015 году.
Кинокритика – одновременно очень закрытая и очень инклюзивная профессия. Для полевой работы в ней совсем не обязательно обладать теоретической базой. Книга «Кино как визуальный код», известная среди моих знакомых под прозвищем «визуальный кот», была собранием догадок и гипотез, почти не подкрепленных теорией. Сидя в кинозале или перед монитором компьютера, я в режиме реального времени открывала и описывала многое из того, что уже было описано и открыто теоретиками. Тогда, в 2015 году, моя коллега Александра Ахмадщина предложила пригласить на нашу конференцию известного исследователя кино и медиа Томаса Эльзессера – и он неожиданно согласился. Одним из последствий его визита в Санкт-Петербург стал выход в издательстве «Сеанс» русского перевода их совместной с Мальте Хагенером работы «Теория кино. Глаз, эмоции, тело». Оказалось, что уважаемых авторов интересовал тот же круг вопросов, что и меня, – цифровая трансформация кино, влияние носителей (от пленки до DVD) на кинокультуру и содеражание фильмов; физиология взаимодействия кино и зрителя. Наверное, мне надо перестать переживать из-за того, что «Визуальный код» недостаточно фундирован, и порадоваться, что мои интуиции двигались в том же направлении, что и у Эльзессера (уж теперь-то, будьте спокойны, я умею пользоваться источниками – и мне приходилось сдерживаться, чтобы не превратить эту книгу в палимпсест из цитат).
Прошло десять лет, на русском языке вышло множество книг по теории медиа и кинематографа, зарубежные источники стали более доступны, а цифровая трансформация продолжалась пока в 2022 году, наконец, не появились общедоступные коммерческие модели для генерации текстов, картинок и видео. Новый инструмент, очередной доминирующий вид на планете Земля, предмет ожесточенных споров – в обиходе его называют «искусственный интеллект», очевидно меняет и то, что я называю договором между экраном и зрителем. Договор этот представляет собой набор не всегда сформулированных конвенций, определяющих наши отношения с движущимися изображениями, на которые мы смотрим.
Каждый новый этап в истории визуальных медиа предполагает перезаключение этого негласного соглашения – процесс, который происходит постепенно и с участием больших групп людей («Хранишь ли ты старые договоры?» – спрашивает меня один из пользователей Twitter, ныне X). Художники протестовали против фотографии; первые зрители братьев Люмьер, по широко распространенной легенде, бежали от прибывающего поезда. Сегодня генеративные изображения и видео, или как их презрительно называют «ИИ-слоп», вызывают ненависть у одних, интерес у других, а для третьих выглядят, как нечто достоверное, как слепок реальности.
Почти все вирусные генерации, которые мы видим в соцсетях в середине 2020-х являются обработкой и переосмыслением уже знакомых картинок и лиц: морфинги с возрастной трансформацией знаменитых актеров, музыкантов и политиков; лидеры стран, марширующие по подиуму то в образе маленьких детей, то в качестве супергероев в компании гигантских животных, символизирующих из страны; Виктор Цой и Сергей Бодров, отдыхающие сидя, на земле между съемками небесного «Брата 3». И даже вспыхнувший в начале 2025 года «итальянский брейнрот» («бомбардилло крокодилло»), сделанный, казалось бы, без участия человека, в русскоязычном пространстве отсылал к сказкам Эдуарда Успенского и Корнея Чуковского. Так ретропическое сознание использует для своего выражения самую актуальную и самую постмодернистскую из всех технологий – генеративные модели, создающие новые картинки и тексты из все, что когда-то было сначала создано, а потом оцифровано.
Цифровое будущее ностальгии, предсказанное Светланой Бойм в ее неустаревающей книге[1], манифестировалось в виде визуализации коллективной памяти, в виде актуализации «потенциального пространства» культурного опыта. В виде визуальных симуляций прошлого, которого никогда не существовало: советское детство глазами Уэса Андерсона; архитектура социалистического модернизма в Нью-Йорке; поставленная речь пионеров, которые произносят на камеру непредсказуемые реплики.
Однако в этом новом типе движущихся изображений к знакомым образам и эмоциям присоединяется что-то еще – потусторонний эффект «зловещей долины», нечеловеческая пласти-ка человеческих существ, внезапные визуаль-ные метастазы. Жиль Делёз сказал однажды, что «мозг – это экран». Многие теоретики, чьи выводы подтверждаются современной нейронаукой, согласны с тем, что при столкновении с новой формой медиа возникает особый вид сознательного опыта. Как и «Визуальный код», эта книга – результат моих наблюдений за трансформацией визуального и нашего отношения к нему. Попытка заглянуть в «черный ящик» техноло-гии и зафиксировать параметры нового договора между экраном и зрителем, который возникает на наших глазах.
Санкт-Петербург,август 2025Глава 1
Как я стала токеном
Спустя несколько месяцев после первого публичного сеанса на бульваре Капуцинок братья Люмьер разослали во все концы света людей с киноаппаратами, чтобы «принести мир в мир» – запечатлеть живые сцены повседневной жиз-ни, пейзажи, улицы городов, парады, выставки, лица прохожих. 1895-й был годом рождения не столько киноискусства, сколько коммерческого кинематографа, и обширный каталог движущихся изображений был частью бизнес-стратегии Люмьеров, которые продавали оборудование и занимались дистрибуцией готовых фильмов. Проект охватывал около тридцати стран – от Австро-Венгрии до Мексики, от Австралии до Индокитая. Работавший на братьев журналист Камилл Серф отправился в Россию для съемок коронации императора Николая II.
Еще один из таких специально обученных в Лионе операторов стал второстепенным персонажем короткометражного фильма Алексея Балабанова «Трофим» – эпизода из альманаха молодых российских режиссеров, посвященного столетию кинематографа. Крестьянин, в порыве ревности убивший брата, бежит в Петербург, и на вокзале видит француза с кинокамерой – подлиным деревянным киноаппаратом, найденным в запасниках «Ленфильма». Трофим нерешительно вступает в кадр, а спустя девяносто лет его, пойманного полицией в публичном доме и, скорее всего, казненного, вырежет из хроники режиссер, работающий над русско-немецким проектом «Вокзалы Санкт-Петербурга». Человек, растворившийся в небытии, неожиданно выныривает из него почти столетие спустя, но снова исчезает по воле диктатора-режиссера – на этот раз уже безвозвратно.
Сегодня мы сказали бы, что, отправив операторов в разные части мира, Люмьеры создали первый в истории структурированный датасет движущихся изображений. Воображаемый балабановский Трофим, как и другие случайно попавшие в кадр прохожие, был токеном – минимально значимой единицей информации в большом наборе данных. Судьба Трофима отражает дискретность и фрагментарность исторической памяти – он появляется из небытия на короткий миг и снова исчезает, подобно тому как токен может быть активирован в системе, снова деактивирован и удален. В фильме Балабанова режиссер, сыгранный Алексеем Германом, вырезает героя, потому что он портит кадр; цель удаления токенов в наборах данных – шумоподавление, исключение ошибок, создающих искажения в нейросетевой модели. Попытка довести модель и результаты ее выдачи до совершенства.
* * *Люмьеры, развивающие свое предприятие, не могли предвидеть, что их коммерческие съем-ки однажды будут осмыслены как набор данных и, возможно, войдут в датасет, на котором тренировались известные модели для генерации видео, такие как Runway, Veo 3 или Luma. В каком-то смысле братья оказались в той же ловушке, что и все мы. Современный этап развития нейросетей связан с социальными медиа – то есть с теми бесконечными терабайтами контента, которые совершенно бесплатно произвели мы сами и на которых впоследствии обучались современные языковые модели. Модели, которые теперь говорят человеческими голосами и фантазируют человеческими образами. То, как стремительно и неотвратимо наши эмоции, наши связи, наше стремление к социальной принадлежности и самовыражению, пойманные в ловушку соцсетей, превратили нас в ресурс для того, что греческий экономист Янис Варуфакис в своей книге «Технофеодализм» называет «облачным капиталом», сегодня подвергается критическому осмыслению, а многим даже внушает обоснованный ужас.
Но я хотела бы опуститься с уровня социально-политической абстракции на высоту человеческого роста и попытаться описать, что сегодня чувствую я – маленький токен, растворившийся в бесконечной вселенной цифровых данных. Что чувствую я, отдавая результат своего труда не только корпорациям, но и той форме жизни, которая, как кажется некоторым, в будущем заменит человечество?
Поп-культура и кинематограф не одно десятилетие готовили нас к встрече с разумными машинами и искусственным интеллектом (об этом подробнее в Главе 3). Но если один известный греческий автор уже упомянут в предыдущем абзаце, то у будет уместно упомянуть и другого. В 2011 году режиссер Йоргос Лантимос, тогда еще не снимавший на английском и не ставший звездой глобального арт-мейнстрима, показал на Венецианском фестивале свой третий полнометражный фильм «Альпы». В центре сюжета – деятельность секретного общества и отчасти коммерческого предприятия: его члены, называющие себя именами альпийских вершин (предводителя зовут Монблан), собирают информацию о недавно умерших людях и предлагают родственникам на время заменять их за небольшую плату. Вместе ходить на любимые фильмы, произносить знакомые реплики, заполнять пустоту.
Предыдущий фильм Лантимоса, превративший его в кумира интеллектуалов, «Клык» (2009), исследовал, как семья и общество формируют наши представления о мире: родители держат своих взрослых детей взаперти, внушая им искаженную информацию о самых заурядных вещах («кошка – это опасный зверь»). «Альпы» же ставили под вопрос само содержание понятия «человек». Социальные медиа находились на начальном этапе своего развития (Facebook[2] стал доступен для всех желающих в сентябре 2006 года), но в раннем фильме Лантимоса, впрямую никак не затрагивающем тему цифровой трансформации, каждый из людей оказывается совокупностью информации, суммой привычек и страхов, которые можно определить, алгоритмизировать, перезаписать на другой носитель – и копия справлялась со своими функциями не хуже оригинала. Я помню, как во время просмотра «Альп» меня пронзило это осознание, за много лет до появления ИИ запустившее рефлексию по поводу моего собственного превращения в токен. Лантимос во время интервью согласился с моей интерпретацией, хотя и не дал развернутого ответа. И теперь мне кажется, что его третий фильм подготовил меня ко встрече с ИИ гораздо лучше, чем голливудские фантастические фильмы про восстание машин.
В этом есть что-то глубоко тревожное – в ощущении, что наша субъектность редуцируется до статуса «токена». Подобно Трофиму из фильма Балабанова, мы нерешительно вступаем в кадр истории, не понимая, что становимся частью чужого датасета. На данном этапе проблемой больше всего озабочены художники и иллюстраторы, не желающие, чтобы их работы использовали модели, которые генерируют картинки в том числе и для коммерческого применения – процесс, который вряд ли можно остановить: недавно, спускаясь по эскалатору в метро Санкт-Петербурга, я поняла, что большинство изображений в рекламных лайтбоксах больше не является изображениями реально существующих людей – на меня смотрели сгенерированные цифровые призраки, производство которых обходится значительно дешевле, чем студийная съемка. Уверена, что большинство пассажиров просто не обращает на это внимание.
* * *В 2022 году, после нашего первого лета с Midjourney, компания Spawning.ai, создающая инфраструктуру для защиты авторских прав в области ИИ, запустила сервис Have I Been Trained? – онлайн-платформу, помогающая художникам, фотографам и другим творческим людям узнать, использовались ли их работы в обучающих наборах данных генеративных моделей. Поиск по тексту или картинке в LAION-5B – крупном открытом наборе данных для обучения ИИ-моделей, содержащим более 5 миллиардов пар изображений и текстовых описаний, – позволяет выяснить, какие именно данные лежат в основе ИИ-моделей, а также выявить проблемы с нарушением авторских прав и отсутствием согласия со стороны создателей; авторам также предоставляется возможность запросить исключение своих работ из будущих обучающих наборов данных. Несмотря на свои размеры LAION-5B – это капля в цифровом море, но в этой капле можно кое-что рассмотреть.
Помимо фотографий моего собственного лица с разных сайтов и из соцсетей, при помощи сервиса Have I Been Trained? я обнаружила в LAION-5B фотографию филиппинского режиссера Бриллианте «Данте» Мендозы, сделанную мной на цифровой фотоаппарат Sony во время итого-вой пресс-конференции на Каннском фестивале в 2009 году. Эта фотография в плохом разрешении до сих пор иллюстрирует статью о Мендозе в нескольких версиях «Википедии». Когда-то редактор онлайн-энциклопедии нашел ее в моем аккаунте на платформе Flickr, которая была «инстаграмом до инстаграма»[3], и попросил передать в общественное пользование по лицензии Creative Commons, регулирующей (разумеет-ся, не в российском правовом поле) свободное распространение контента. Речь о том, что когда-нибудь на этом изображении будут обучать нейросетевую модель, в конце нулевых, разумеется, не шла.
Ирония цифровой реальности заключается в том, что весь мой фотоархив погиб на одном из неисправных жестких дисков, Flickr в какой-то момент обрезал аккаунты у своих бесплатных пользователей, и «Википедия» оказалась случайно подвернувшимся способом надолго сохранить и эту картинку, и мои воспоминания о том, как я толкалась в толпе других журналистов возле стола в зале пресс-конференций каннского Дворца фестивалей, куда из зала «Люмьер» по одному приводили свежих лауреатов.
Любой, кто вплотную соприкасается с нейросетями, знает, что генерации картинок, текстов или кода происходят в «черном ящике». Современные системы ИИ, особенно большие языковые модели (LLM), – чрезвычайно сложные математические конструкции, поэтому даже их создатели не полностью понимают, как именно они работают[4]. «Мы его построили, мы его обучили, но мы не знаем, что он делает», – говорил в интервью Vox Сэм Боуман, университетский исследователь и научный сотрудник компании Anthropic – разработчика модели Claude, конкурента ChatGPT.
Первый филиппинский автор, получивший режиссерский приз в Каннах в том самом 2009 году, Мендоза занимает почетное место в фестивальной иерархии, но он не так известен в мире, как однажды сыгравшая у него Изабель Юппер – именно поэтому редактор «Википедии» и обратился ко мне: других подходящих и не защищенных копирайтом фотографий режиссера ему отыскать не удалось. Более того, я отлично помню, что специально поместила это изображение в свой аккаунт на Flickr, понимая, что оно может оказаться востребованным именно из-за того, что Мендозу, в отличие от голливудских и европейских кинозвезд, фотографировали не часто. Сервис Have I Been Trained? находит в датасете LAION-5B всего 533 изображений, помеченных именем Бриллианте «Данте» Мендозы, причем около 230 – почти половина – оказываются тем самым бесполезным «шумом» (постерами и кадрами из фильмов, просто визуальным мусором), а пять являются вариациями все той же сделанной мной фотографии.

Ил. 1. Моя фотография из Википедии с подписью Brillante Mendoza at the 2009 Cannes Film Festival (слева) и результаты генераций в одном из сервисов на базе нейросети Stable Diffusion, которая обучалась на LAION-5B
Исследуя эти фрагменты датасета можно приоткрыть крышку «черного ящика» и сде-лать допущение, что моя работа сыграла некоторую роль в том, что нейросети, обученные на LAION-5B, сегодня умеют различать и воссоздавать, пусть и весьма приблизительно, изображение режиссера Бриллианте Мендозы. Вдруг именно от меня модель Stable Diffusion, лежащая в основе многих сервисов генерации изображений, узнала, что Мендоза на закрытии Каннского фестиваля в 2009 году был в бабочке? Установить это достоверно вряд ли возможно[5].
Но если все-таки от меня, то нет ли в этом бессмертия – какой-то другой формы бессмер-тия, отличной от описанных Миланом Кундерой в одноименном романе («малое бессмертие» в памяти близких людей и «великое бессмертие» в мыслях незнакомцев) – осуществленного на практике анонимного цифрового бессмертия? Мне хочется верить, что да.
* * *В 1936 году немецкий инженер Конрад Цузе в берлинской квартире своих родителей начал (и продолжал до конца войны) строить машину, которая впоследствии была названа первым цифровым компьютером. Программирование осуществлялось при помощи перфорированной ленты, которая на самом деле была списанной 35-миллиметровой пленкой, найденной в мусорных баках рядом с киностудией. На одном из кусков пленки можно увидеть бинарный код, выби-тый поверх обычной сцены с участием двух актеров в замкнутом помещении. Теоретик ме-диа Лев Манович рассказывает историю Цузе в статье «Как медиа стали „новыми“», опубликованной в сборнике «Теории софт-культуры»[6], и добавляет: «Какие бы смыслы и настроения ни заключались в этой сцене, они стирались новой функцией ленты как носителя данных <…>. В технологической версии эдипова комплекса сын убивает своего отца. Иконический код кино списывается в пользу более эффективного бинарного кода. В итоге кино становится рабом компьютера».
Этот ранний случай странной сцепки изображения на пленке и программного кода, которая случилась задолго до дигитализации самого кинопроцесса, стал для меня еще одним мостиком, перекинутым от кинематографа к новым цифровым технологиям, изучением которых я занималась в магистратуре Art & Science университета ИТМО.
В конце первого года обучения по этой программе, предлагающей любому за пару лет превратиться в художника, мы должны были представить свои работы на выставке в пространстве AIR, расположенном в одном из корпусов ИТМО на Васильевском острове. Бросив магистратуру незадолго до диплома, я успела, однако, получить сертификат о дополнительном образовании по специальности «Аналитик данных», а также базовые представления о языке программирования Python, и мне хотелось применить эти неожиданные для меня навыки в своем курсовом проекте.
Приступая к работе, я уже знала, какой этический ад представляют собой датасеты – эти цифровые свалки, экологичностью которых никто никогда не занимался. Использование картинок и текстов из интернета без согласия правообладателей, отсутствие прозрачности при их формировании, материалы из полицейских баз для обучения алгоритмов распознавания лиц, отчуждающие человека от собственного тела и биографии, многочисленные предрассудки, кочующие от человеческой популяции к ИИ[7], – все это подробно описано в литературе, и в частности, в превосходной книге американской исследовательницы Кейт Кроуфорд «Атлас искусственного интеллекта»[8].
Работа с набором собственных данных казалась элегантным выходом из этического тупи-ка, ведь эти данные только мои. Более того, они в некотором смысле и есть я, – к тому же, далеко не у каждого живущего на Земле человека есть такой большой массив собственных текстов, посвященных одной теме (кинематографу). Собрав все доступные мне файлы, самый ранний из которых относился к 2001 году, я склеила их в один при помощи кода на Python. В нем оказалось более 8 млн знаков.
Я поступила в магистратуру летом 2023 года, когда, после 25 лет работы кинокритиком в ежедневных изданиях и сотен тысяч написанных слов, врезалась в стену немоты. Дело не только в разрушении привычной инфраструктуры после 2022 года: как будто происходило нечто большее, пока ускользающее от понимания, – привычный мир осыпался на каком-то очень глубоком уровне. Резкая трансформация реальности – это еще и обвальное устаревание предыдущего языка и невозможность им пользоваться. В одном из фильмов про атомную войну, снятых в начале 1980-х, потомки выживших обитают на руинах прежних городов и разговаривают на редуцированном, вполне функциональном, но другом английском. Новый язык нельзя изобрести (об этом подробнее в Главе 9) – его можно только обнаружить в хаосе времени и усовершенствовать, используя такие инструменты, как собственный талант и собственный опыт. Но для этого требуется время.
Не понимая, что, зачем и как писать, я решила делегировать свой голос роботу-кинокритику, который унаследовал бы мои пристрастия и мою интонацию, а заодно повеселил бы посетителей нашей выставки под названием «Реализм невидимого». Разумеется, в персонализированном чат-боте нет ничего оригинального. Еще в середине 2010-х в медиа всего мира много писали о посмертном чате с погибшим московским издателем Романом Мазуренко, который по перепискам с друзьями создала бывшая ресторанная обозревательница журнала «Афиши» Евгения Куйда. Впоследствии ее американский стартап вырос в популярный ИИ-сервис Replica, который делает почти то же самое, что делали участники тайного общества в «Альпах» Лантимоса: подстраивается под пользователя, превращаясь в его собеседника и даже психолога.
Робот, которого я назвала «Армавир» (в честь проникающего в мозг словечка из корпуса текстов драматурга и режиссера Александра Миндадзе), пишет короткие рецензии по трем ключевым словам, введенным пользователем, – и эти несуществующие фильмы кажутся не менее реальными, чем те, что когда-то были сняты, оставив свой след или и бесследно сгинув в болоте аудиовизуального контента. Интонация этих часто бредовых, часто смешных текстов, довольно сильно похожа на мою.

Ил. 2. Фотография интерфейса проекта «Армавир», сделанная одной из посетительниц выставки в ИТМО
Работа оказалась трудоемкой и заняла несколько недель. Мое представление о том, что можно загрузить в уже готовую фундаментальную модель некий дополнитлеьный набор данных, то есть «дообучить» ее под свои потребности, столкнулось с большим количеством технических трудностей. В результате, остановившись на на российской модели YandexGPT, я вручную выбрала 200 отрывков своих текстов, разметила их специальным образом и загрузила в сер-вис в виде файла JSON, каждая строка которого состояла их трех фрагментов: образец текста примерно из 4000 знаков, вопрос к модели и вариант ответа на пару тысяч знаков.
У меня есть обтекаемая формулировка для медиации выставки, описывающая процесс создания датасета как персонального путешествия в собственное прошлое, опыт работы в жанре цифрового автофикшна (в датасет также вошли отрывки новых текстов, которые сегодня невозможно опубликовать целиком). Впервые в жизни перечитывая эти тексты после публикации, я пребывала в перманентном удивлении от количества труда и страсти, потраченного на формирование ныне бесследно исчезнувших контекстов, на описание ныне полностью позабытых фильмов, на манифестацию собственных предрассудков и предрассудков своей социальной группы. Большая часть этих текстов никогда не была бы прочитана снова, но я прочитала их, как случайный прохожий читает имена забытых мертвецов на деревенском кладбище.
Конец ознакомительного фрагмента.
Текст предоставлен ООО «Литрес».
Прочитайте эту книгу целиком, купив полную легальную версию на Литрес.
Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.
Примечания
1
Бойм С. Будущее ностальгии. М.: Новое литературное обозрение. 1-е изд., 2001; 2-е изд., 2021.
2