Как ИИ изменит индустрию звука

Дата публикации 07.04.2025

Почему этичное использование нейросетей для создания музыки практически невозможно. Разбирается журналист и музыкант Антон Образина

Антон Образина

текст

Недавно больше тысячи музыкантов, включая Ханса Циммера, Кейт Буш и группу Jamiroquai, выпустили альбом «Is This What We Want». В него вошло 12 записей тишины в студиях и концертных залах. Названия треков складываются в предложение «The British Government Must Not Legalize Music Theft to Benefit AI Companies» («Британское правительство не должно легализовывать воровство музыки ради обогащения ИИ-компаний»). Альбом — это акция протеста против инициативы правительства Великобритании разрешить разработчикам ИИ свободно использовать защищенный авторским правом контент, если только правообладатель не запретит это сам. Неожиданно, но британские власти пошли навстречу артистам и согласились пересмотреть законопроект.

Журналист и музыкант Антон Образина рассказывает, как нейросети изменяют музыкальную индустрию и почему они могут стать большой проблемой.

Зачем ИИ-компаниям произведения искусства?

Сам по себе искусственный интеллект не умеет генерировать ни текст, ни изображения, ни музыку. По сути, все, чем он занимается, — это математические расчеты, а задача его разработчиков — добиться от ИИ нужных результатов. Для этого нейросети дают набор задач и готовых решений, а она должна сама выработать алгоритмы, которые позволяют прийти к нужному ответу. Чем больше попыток, тем точнее результат, а для большего количества попыток нужно больше данных. И здесь у разработчиков ИИ возникает потребность использовать чужой контент.

Чтобы научить ChatGPT и его аналоги генерировать связный и осмысленный текст, им нужно «скормить» терабайты примеров. То же самое с изображениями, музыкой и любым другим контентом. Если выразиться совсем просто, нейросеть не может создать то, что ей не показали заранее. Разработчики генеративных нейросетей, как правило, не раскрывают, на каких данных обучают свои модели, однако такие проекты, как недавно представленный генератор картинок OpenAI в стиле работ японского режиссера аниме Хаяо Миядзаки, указывают на использование произведений, защищенных авторским правом.

Сам по себе ИИ как технология нейтрален и не нарушает прав. Но компании, работающие с этой технологией, и особенно создатели генеративных проектов (OpenAI, Suno, Udio или Midjourney) все чаще игнорируют понятие интеллектуальной собственности. И скорее всего, без этого их сервисы не смогли бы развиться так стремительно.

Это совершенно новая правовая коллизия: в судах рассматривается несколько исков к компаниям, разрабатывающим ИИ, однако решений по ним пока не вынесено. То есть юридического прецедента, который определил бы правила лицензирования контента для обучения нейросетей, пока нет. ИИ-компании остаются в «серой зоне».

Самый богатый ребенок в мире

Проблематичность генеративных ИИ-стартапов можно рассмотреть на примере сервиса генерации музыки Suno — как с правовой, так и с философской точки зрения.

Летом 2024 года против компании подала иск Американская ассоциация звукозаписывающих компаний (RIAA), обвинив проект в нарушении авторских прав. Стартап использовал чужие песни для обучения своей ИИ-модели. Suno в ответ признали, что, действительно, тренировали нейросеть на защищенных копирайтом треках, однако это было «добросовестным использованием» (fair use). Так в США называется правовая доктрина, которая допускает использование произведений без разрешения автора, если это способствует «прогрессу науки и полезных искусств».

Отвечая на претензии RIAA, основатель и генеральный директор Suno Майки Шульман сравнил искусственный интеллект, который тренируют на музыке, доступной в открытом интернете, с ребенком, который пробует писать собственные песни, наслушавшись рока. Шульман согласился, что большая часть материала защищена авторским правом, но подчеркнул, что не считает обучение нарушением.

Между ребенком из примера Шульмана и моделью искусственного интеллекта Suno есть одно существенное различие: подписка на сервис стоит 10 долларов в месяц. В интервью Rolling Stone основатель Suno озвучивал план привлечь миллиард подписчиков, то есть выйти на доход в 120 миллиардов долларов ежегодно. Самым богатым музыкантом по версии Forbes в 2024 году стал Джей-Зи, его состояние оценили в 2,5 миллиарда долларов, на втором месте Тейлор Свифт с 1,6 миллиарда долларов. То есть, если все пойдет по плану, «ребенок» Шульмана будет зарабатывать в десятки раз больше, чем двое самых успешных артистов в мире вместе взятые.

В подкасте Rolling Stone Music Now Шульман аккуратно уходит от ответов на вопросы ведущего об этике его компании. Как Шульман относится к тому, что бизнес предпочтет использовать генеративные треки Suno, вместо того чтобы обращаться к живым музыкантам? Стартапер говорит, что мечтал, «чтобы у любого гастронома был собственный джингл», а теперь благодаря Suno у них появилась такая возможность.

Проблема в том, что малый бизнес мог позволить себе собственную музыку и раньше, отмечает композитор и исследователь ИИ Рави Кришнасвами. Запись джингла у живого композитора стоит от 10 долларов, если заказывать ее через фриланс-биржу Fiverr. Возможно, отсутствие у гастрономов собственных музыкальных тем не связано с фактом, что до Suno они не могли себе их позволить; скорее всего, джинглы им попросту не нужны.

Но Suno действительно может заместить труд части музыкантов, особенно тех, кто зарабатывает созданием функциональных треков для аудиобиблиотек, подкастов или рекламы. То же касается и представителей других творческих профессий (иллюстраторы, художники, дизайнеры), работе которых не слишком взыскательный заказчик может предпочесть ИИ-генерацию. Исследования, посвященные тому, как нейросети перекраивают рынок труда, публикуются регулярно. Так что мем о том, что дизайнеров и создателей джинглов заменят ИИ, уже не шутка.

Колонизация знания

Шульман упирает на доступность создания музыки с помощью Suno. «Технологии делают возможным будущее, в котором любой может исследовать, творить и активно участвовать в той области искусства, где большинство раньше были лишь потребителями», — пишет он в том же посте с ответом на иск RIAA. В конце 2024 года завирусилась (в основном силами возмущенных музыкантов) его цитата о том, что «большинству людей не приносит удовольствия процесс создания музыки».

Основатель Suno также настаивает, что в создании искусства вкус имеет большее значение, чем мастерство. Однако в процессе обучения нейросетей решающую роль играет именно вкус разработчиков, которые подбирают данные для ИИ и оценивают качество их ответов. Но это противоречие — меньшая из проблем с генеративным ИИ. Интересно взглянуть на эту технологию в контексте современного неолиберального капитализма.

Канадский исследователь Ник Срничек называет сложившуюся после финансового кризиса 2008 года экономическую модель «капитализмом платформ». Под платформами он подразумевает цифровые сервисы, которые выступают посредниками во взаимодействии между разными группами людей: продавцами и покупателями услуг и товаров, рекламодателями, работниками и работодателями.

Речь может идти о практически любых известных онлайн-сервисах, будь то Facebook, Amazon, Uber, Spotify или упомянутый Fiverr. Они, действительно, в большинстве своем удобны конечному пользователю. Но обратная сторона этого удобства — поглощение такими корпорациями целых рынков, обход законов и государственный лоббизм, незащищенность работников, непрозрачный сбор пользовательских данных и торговля ими (их можно использовать в том числе в машинном обучении ради автоматизации работы и экономии на найме людей).

В закладки Пролетариат 3.0: почему мы работаем, но ничего не зарабатываем

Неравенство Капитализм

Дата публикации 09.01

Посредничеством корпорации превращают в активы явления, прежде принадлежавшие обществу, будь то коллективное знание, каналы коммуникации, инфраструктуры или данные, обращает внимание исследователь канадского Йоркского университета Кин Берч. Примером могут быть стриминговые сервисы, вроде Spotify или Яндекс Музыки, которые предоставляют доступ к защищенной авторским правом музыке, зарабатывая на подписке или за счет дохода от рекламы (и выплачивая музыкантам по большей части мизерные роялти). Но особенно точно эта концепция описывает ИИ-проекты.

Каждый, у кого есть доступ в интернет, теперь может писать песни, стихи или картины — достаточно оплатить подписку на соответствующий сервис. Самый крошечный бизнес может позволить себе собственную музыку, визуальный стиль, текстовый контент и даже автоматизированную коммуникацию с клиентами. Знание, которое было сосредоточено в руках пусть и большого, но ограниченного круга специалистов, теперь доступно всем. Это можно было бы назвать демократизацией, если вынести за скобки то, как обеспечивается эта доступность.

В феврале 2025 года суд установил, что Meta использовала больше 80 терабайт книг из пиратской библиотеки LibGen для тренировки своих языковых моделей Llama. В ответ компания заявила, что не делилась скачанными файлами через протокол BitTorrent, а следовательно, формально не нарушала закон. OpenAI обращаются к тем же аргументам о добросовестном использовании, что и Suno, одновременно лоббируя разрешение использовать защищенные копирайтом материалы, чтобы сохранить «технологическое лидерство Америки». Решения суда по многочисленным искам о нарушении авторского права против ИИ-компаний еще не вынесены, но с нынешними вводными уже можно говорить не о демократизации, а об экспроприации или, если угодно, колонизации знания.

На фоне этих разбирательств показательна история Аарона Шварца — американского интернет-активиста, борца за свободу информации. В конце 2010 года Шварц скачал на свой ноутбук 70 гигабайт научных статей из базы Массачусетского технологического института JSTOR и хотел выложить их в открытый доступ в знак протеста против неравенства в доступе к академическим публикациям. Распространить материалы он не успел — 6 января 2011 года его задержала полиция.

Хотя институт не стал подавать иск против Шварца, за активиста всерьез взялись федеральные прокуроры. В июле 2011 года ему предъявили обвинения в нескольких преступлениях, включая компьютерное мошенничество и повреждение имущества, по которым ему грозило до 35 лет заключения и один миллион долларов штрафа. Процесс затянулся более чем на два года, а в январе 2013-го активист покончил с собой.

Технологическая (анти)утопия

Капитализм платформ действительно упрощает жизнь. Почти под любые задачи найдется сервис, который поможет справиться с ними быстро и по доступной цене. Люди, которые непосредственно решают эти задачи, либо незаметны и функциональны, либо формально равны клиенту.

ИИ-революция идет еще дальше, совсем освобождая человека от работы, причем как рутинной, так и творческой. Многие потребности уже можно закрыть либо нажатием одной кнопки, либо с помощью правильного промпта. Риторика ИИ-визионеров о бесконечных новых возможностях подкупает — в конце концов, о таком будущем просто хочется мечтать.

В неолиберальной парадигме, когда каждый сам себе предприниматель и каждый каждому конкурент, искусственный интеллект если и может кого-то освободить, то только бизнес от лишних издержек. Однако технология уже существует, и вряд ли остановка разработок новых моделей ИИ и уничтожение дата-центров, как предлагал известный технопессимист Элиезер Юдковский, помогут исправить ситуацию.

Ник Срничек, например, призывал создавать собственную утопию, альтернативную неолиберальной модель общественных отношений, которая при этом будет приветствовать и технологический прогресс. Эта идея, хоть и довольно абстрактная, гораздо интереснее последнего предложения гендиректора OpenAI Сэма Альтмана — закупить больше графических процессоров, чтобы ChatGPT генерировал картинки еще быстрее.

Авторские колонки ⚙ Технологии

Дата публикации 07.04.2025

Антон Образина

текст