«Я же лучше нейросети…»: потеряют ли художники работу из-за искусственного интеллекта?
Казалось, только вчера мы баловались свежими фильтрами на основе ранних нейросетей, «превращающих» людей в героев Диснея. Сегодня же весь интернет восхищается картинами, что создает эта технология по короткому запросу.
Год назад «Краснодарские известия» писали о дипфейках и проблемах, которые они способны прибавить обществу — от распространения лживых новостей до создания видео 18+ с любимыми кинозвездами. Не успело человечество решить этот вопрос, как нарисовался новый — в буквальном смысле. Появление Midjourney, обученной творить шедевры изобразительного искусства на ровном месте, и других подобных сервисов поставило под угрозу существование многих древних профессий и открыло дверь для создания новых. Но обо всем по порядку…
«Нарисуй меня, как одну из своих француженок…»
Для тех, кто не понимает, что происходит. Последний тренд в соцсетях — картинки, созданные искусственным интеллектом по текстовому описанию. Работает это так: вбиваешь набор слов вроде «Брюс Уиллис сидит и читает книгу в горящей библиотеке» и нейросеть выдает готовое изображение, основываясь на том, что знает об этих словах из интернета.
Полученный результат в половине случаев пока далек от совершенства. Частенько ИИ выдает шестипальцевые руки, неправильные пропорции тела или странные артефакты (локальные ошибки в изображении. – Прим. ред.), портящие рисунок. Но в тех вариантах, где все вышло идеально, невозможно отличить творчество ИИ от работы настоящего художника. Буквально на днях автор этой статьи прошел опрос, где пытался отгадать, какие картины принадлежат «кисти» нейросети, а какие — человека. Правильно ответить он смог лишь на половину вопросов.
Новая возможность породила в Сети небывалый «Ренессанс» артов. На них изображены удивительные и прекрасные вещи, созданные буквально за минуту: от забавных котиков в строительных касках до мегаполисов будущего. Все эти арты создаются в интерпретации нейросетей — они подсматривают, как подобное изображают люди, и воспроизводят на свой лад, объединяя продукты творчества всей цивилизации в один результат.
Такой контент ИИ не одобряет
Удобного приложения, которое можно скачать на телефон, пока нет. Да и в целом доступность таких сервисов для обычного человека не то чтобы абсолютна. Взять, к примеру, Midjourney, умеющую не только создавать, но и объединять готовые изображения в одно (что произойдет, если соединить магистра Йоду и Арнольда Шварценеггера, лучше не знать). На сайте сервиса есть бета-версия, позволяющая бесплатно «запилить» несколько десятков изображений. За плату можно открыть новые возможности, но и то не все.
Так, создатели похожего сервиса Stable Diffusion 2.0 ограничили генерацию NSFW-изображений (с элементами 18+). Аналогичный запрет, похоже, действует и в Midjourney — по понятным причинам. К слову, некоторые пользователи раскритиковали такое решение, назвав это «актом цензуры». По их мнению, в программе с открытым исходным кодом принимать решение о создании NSFW-контента должен сам автор.
Так или иначе, придется сильно попотеть, чтобы «нарисовать» что-то с помощью нейросети. Тот же MJ — на английском языке и интерфейс там такой, что осуществить задуманное можно лишь с помощью русской инструкции. И это на сегодня еще самая доступная программа из всех подобных. Пока что рядовым юзерам остается лишь восхищаться тем, что создают другие.
«Коламбия Пикчерс» не представляет
Впрочем, все это покажется цветочками на фоне изобретения Meta (признана экстремистской организацией на территории России), которая недавно представила нейросеть, генерирующую целые видео по текстовым описаниям. Программу так и назвали – Make-A-Video. Она пока недоступна: разработчики не опубликовали модели программы, опасаясь, что такая технология может быть использована во вред.
Ролики, которые предоставила сама компания, имеют небольшое качество, в них присутствуют артефакты и нет звука. Однако это все равно выглядит удивительно. Смысл здесь тот же — вбиваешь ключевые слова вроде «бультерьер бежит по пляжу» и получаешь готовое видео. Насколько оно будет соответствовать ожиданиям — сказать трудно, но последние достижения в данной сфере указывают на то, что скоро нас ждут настоящие шедевры анимации.
И в чем подвох?
Проблема, по мнению многих, кроется в очевидном факте — ИИ отбирает работу у человека. Еще недавно мы были уверены, что машины возьмут на себя всю сложную техническую и монотонную работу, а люди будущего будут лишь созидать, а не вкалывать (да, как в той самой песенке из «Приключений Электроника»). MJ наглядно показала, что машины способны осилить и творческую стезю.
Скажем, программа может стать невероятно полезным инструментом в сфере рекламы. Больше не нужно объяснять художнику/дизайнеру, как должен выглядеть герой новой видеоигры или типичный пользователь свежей модели кроссовок. Достаточно вбить несколько ключевых фраз и вот уже готов новый постер для PR-кампании. Машина не скандалит, машина не профукивает сроки, машина стоит дешевле.
Дизайн помещений также стал доступнее. Новая разработка компании Runway — Erase and Replace — позволяет менять любой участок изображения, просто выделив его и написав текстовый запрос с нужным объектом. Не нравится этот стол на картинке будущей гостиной? Пара кликов и вот вместо него стоит громадный фикус. В мгновение ока курсы фотошопа стали не нужны.
Наглядным примером торжества нейросети над человеком стала недавняя победа американца Джейсона Аллена в конкурсе изобразительных искусств в США. Он потратил несколько недель и около сотни попыток на создание качественного описания для MJ-картины под названием «Театр космической оперы». В итоге она выиграла в номинации «Цифровое искусство/фотография с цифровой обработкой».
Сообщество художников оказалось встревожено и возмущено — ведь Аллен не лично рисовал эту картину, а лишь сформулировал запрос для ее создания. Так победил человек или машина? Стоит ли задуматься над разработкой отдельных конкурсов для нейросети и ее пользователей? Или ограничить к ней доступ во избежание подобных инцидентов?
Это облако? Это самолет? Это птица?
Если уж зайти совсем далеко, то потенциально нейросети могут подарить нам целые виртуальные миры, в которых объекты и локации будут меняться чуть ли не в режиме реального времени.
На днях разработчик под ником ScottieFox использовал нейросеть Stable Diffusion и инструмент визуального программирования TouchDesigner для создания нескольких VR-сцен, объекты для которых по текстовому запросу сгенерировали алгоритмы машинного обучения.
Уже сейчас ему удалось добиться создания полноценных сцен в виртуальной реальности, которые рендерятся в реальном времени при 60 fps. Stable Diffusion генерирует изображения по запросу, после чего TouchDesigner создает их сферическую проекцию. Когда финальная версия объекта готова, он добавляется в VR-сцену, заменяя собой один из старых.
Разработчик считает, что результаты подобной генерации можно использовать в том числе в играх. По его словам, в таком случае игроки будут каждый раз исследовать уникальный мир, созданный нейросетью. И это поражает воображение. Если когда-нибудь вымышленная виртуальная вселенная «Оазис» из романа/фильма «Первому игроку приготовиться» станет реальной, то она будет намного интереснее, чем ее отобразили в кино.
Нейросеть понимает меня лучше, чем люди
А теперь посмотрим на все это с другой стороны. Да, по запросу можно создать что угодно. Но этот запрос должен быть понятным для нейросети. Звучит намного сложнее, чем кажется, — пример американца Аллена доказывает это.
Сегодня весь интернет смеется над тем, что MJ никак не может нарисовать сказочного героя Карлсона. Она попросту не понимает, что от нее хотят люди, и в итоге получается толстый мужчина с вертолетом за спиной. Это не значит, что она никогда не сумеет справиться с задачкой, — нужно просто правильно ей объяснить.
Этой осенью один из пользователей Пикабу рассказал, что нашел эксперта для генерации иллюстраций для своей книги. Тот, в свою очередь, давал MJ точные «приказы» и получал качественные результаты быстрее, чем это сделал бы сам заказчик. Таким образом, уже совсем скоро мы сможем увидеть появление новой профессии: обученные люди будут создавать с помощью нейросети нужные изображения и видео на заказ. Интересно, как их назовут — нейродизайнеры?
Вы имеете право на адвоката…
Другой вопрос касается юридической стороны, и он намного серьезнее. Как уже было сказано, MJ основывается на опыте других художников, в том числе современных. Прецеденты, когда изображение было очевидно выполнено в стиле того или иного автора, имеют место. Случайно так выходило или по конкретному запросу — не важно. Важно то, что художественный авторский стиль, как и само изображение, — продукт, который принадлежит определенному человеку или юридическому лицу. И здесь мы вступаем на тропу тотальной неизвестности.
Разработчик платформы искусственного интеллекта обладает авторскими правами на саму технологию, на ПО, которое представляет собой платформа. Однако творческого участия в создании самих произведений разработчик не принимает. Он создает алгоритмы, на основе которых технология обучается и творит сама — в этом и заключается суть искусственного интеллекта и технологии нейросетей, имитирующих нейронные связи человеческого мозга.
С пользователем же платформы все не так очевидно. С одной стороны, он лишь вводит команду посредством набора слов и за несколько секунд получает готовое произведение. Такое участие в процессе едва ли можно назвать творческим трудом. И все же определенный вклад есть — снова вспоминаем Аллена и его сотню запросов.
Есть мнение, что нейросеть следует наделить правосубъектностью и признать авторские права за ней. Но такой подход противоречит российскому законодательству, так как автором результата интеллектуальной деятельности признается гражданин, творческим трудом которого такой результат создан.
Сегодня произведения искусства, созданные нейросетью, не охватываются актуальными нормами авторского права. Эксперты предлагают создать новый институт, сходный с нормами об авторском заказе, так как данные отношения лучше всего подходят с точки зрения экономической целесообразности и защиты интересов участников. Вопросов в этом плане — тьма, и их хватает на целый цикл статей.
Наконец, надо признать, что перед нами потенциальная угроза для личной жизни граждан. Началом стали дипфейки, позволившие пользователям подставлять своих знакомых или звезд, «прилепив» их лица на актеров фильмов для взрослых (в прошлой статье мы писали о подобном случае в США). Теперь же «ящик Пандоры» стал глубже и опаснее, ведь нейросеть научилась генерировать целые ситуации по запросу. NSFW-возможности от нейросети станут доступными рано или поздно – это лишь вопрос времени.
Чему мы научились?
Хотелось бы восторженно кричать и провозглашать светлое будущее, которое дадут нам нейросети, но 2022 год показал, что проблем, связанных с ними, все больше, а четких решений так и не видно. Мир продолжает игнорировать тонны видео с голыми знаменитостями, созданных с помощью дипфейков. А то, что преступники до сих пор не создали фейковый ролик с политиком, делающим скандальное заявление, которое ставит под угрозу благополучие людей, — огромная удача для всех нас.
Наука делает огромные шаги вперед, а современное общество за ней не поспевает. Человечество до сих пор не осознало возможности и риски новых технологий. Пока что мы забавляемся новой «игрушкой», создавая веселые картинки, но очень скоро эти забавы станут серьезным инструментом или оружием — в зависимости от того, в чьих руках окажутся.
Материал подготовил Максим Дмитриев
Сообщение «Я же лучше нейросети…»: потеряют ли художники работу из-за искусственного интеллекта? появились сначала на Краснодарские известия.