Многие хотят высказаться про искусственный интеллект, потому что хайповая тема, но увы мало кто понимает, как он работает и какие у него естественные ограничения.
Кстати, поигрался с midjourney на тему “нарсуй мне комнату аудиофила”. Получилось занятно, но в обучающей выборке явно было маловато аудиотехники, технически корректные картинки даются нейросети с трудом.
Сначала однако надо научиться писать такие тексты про музыку:
The music is hypnotic and trance-like, and it is easy to get lost in the rhythm. The strings high-pitched notes pierce through the darkness, adding a layer of tension and suspense.
чтобы накормить ими модель. Это не так то просто.
Замечу, что при таком подходе авторы, умеющие делать музыку, плавно превращаются в писателей, умеющих красиво говорить о музыке. Очень в духе эпохи
Музыка должна сама говорить и рассказывать. Двойне сложно.
С другой стороны, допустим что существует идеальный композитор (в виде AI или живого человека), который может написать любую музыку какую хочешь, и она будет офигенной. Но как ему объяснить, что ты хочешь, если не словами? Другого человеко-машинного и человеко-человекового интерфейса пока не придумали. И правило “правильная постановка задачи - 50% успеха” тоже никто не отменял. Можно делегировать само написание музыки композитору, но и заказчик тоже должен потрудиться.
Кстати, в академической музыке до XX века часто создавались программные произведения, т.е. музыка, содержащая отсылку к внешнему тексту, или даже являющаяся “иллюстрацией” к этому тексту. Возможно, сейчас эти времена могут вернуться, т.к. выбор и/или тюнинг текста программы будет основным вкладом человека.
Я думаю, что сама суть творчества подразумевает нахождение решения созвучного “заказчику” но им не “заказанного”.
Есть в осени первоначальной
Короткая, но дивная пора —
Весь день стоит как бы хрустальный,
И лучезарны вечера…
Нас завораживает то, что мы на основе казалось бы “нелепого” сравнения вдруг все понимаем. На основе произведения созданного другим мы делаем открытия внутри себя.
Это в чем-то созвучно с теорией врожденных знаний Хомского. Мы понимаем открыли что-то новое и наш мир стал больше чем был до того.
А когда мы выступаем в роли “заказчика”, такого чувства нет. (
Дар делегировать нельзя.
Бездарность — можно.
В общем то нейросеть тоже генерирует “по мотивам”, с одного и того же мотива можно нагенерировать много всякого разнообразного, причём вариативность нейросети, в отличие от человеческого творца, никогда не иссякает.
Но открытий, “мир станет больше”, от нейросети конечно ждать бессмыссленно, это чисто утилитарный инструмент, в который заложены паттерны предыдущих человеческих произведений, и он работает как калейдоскоп, комбинируя эти паттерны в новые узоры. Впрочем, большинство современных “творцов” занимается ровно тем же самым. Очень толковый (но длинный) текст на эту тему недавно написал мой товарищ, он про фотографию и визуальное искусство, но суть та же.
Читать
сказка: в этом году появилось много нейросетей, которые генерят изображения — по текстовому описанию, совмещая стили разных авторов, ну и дипфейки всякие… и если раньше это были все больше какие-то «игрушки», то сейчас вот буквально в последние несколько месяцев эти картинки стали побеждать в каких-то конкурсах, художники выступают против публикации этих работ на профильных ресурсах, обыватели кричат что визуальное искусство кончилось… ну и я с интересом смотрю на эти картинки там где их выкладывают, много смотрю.
Визуальное искусство, как мы его знали в 20ом веке, конечно умрет, но думаю не прямо сейчас… сейчас происходит то, что произошло с фотографией, когда цифра освободила творческую составляющую фотографии от любителей, профессионалов, тех «по девушкам», от карточек памяти из поездок, от котиков в конце концов!..
У меня сложилось впечатление, что те картинки которые я видел на художественной ярмарке, не все, многие, вполне может нарисовать нейросетка … без ущерба для общего визуального впечатления… я вижу некий горный пейзаж и спрашиваю автора (без имен!): «это вы рисовали из головы или с натуры?»; «с фотографии, я никогда не был в горах»… Но рисунок гор по фотографии это тоже-самое что и рисунок нейросетки по словесному описанию, что даже более творческая работа… да, рисунок с ярмарки сделан руками, но есть ли что-то в этой картинки кроме этого?
кладовщики и бухгалтера — боятся, и страхи их оправданны… боятся того что их заменят роботы… художники в работе которых нет яркого внутреннего содержания, только техника, скоро будут приравнены к кассирам в супермаркете… в 2х из 3х сетевых магазинов в которые я хожу, кассы самообслуживания + одна классическая лента для сложных случаев, кассиров уже упраздняют!
Откровение, майнинг, комбинаторика
В конце 90х я работал в лаборатории «комбинаторной химии» — суть комбинаторной химии в том, что есть набор из 10 веществ А и есть набор из 10 веществ Б и вот комбинируя эти вектора мы получаем допустим 71 вещество AБ… почему не 100, потмоу, что «реальный мир».)
И вот сидим в лабе мы за чаем, я читаю в слух новости фотографии о, том, что в Японии поймали фотографа который в публичных местах засовывал камеру девушкам под юбки и фотографировал, полиция проявила пленку, на ней было 17 «интересных» кадров… и тут с одного конца стола кто-то спрашивает: «всего 17 кадров? это же мало!», а с другого отвечают: «их можно перемножить на 100 кадров с изображением помоек и получить товар: библиотеку в полторы тысячи изображений!»
Понятно, что это шутка на тему нашей проф деформации; но существенная часть тех картинок котоыре я видел на ярмарке были именно перемножением пикантных видов на вектор помойек… грубо прозвучало, и не совсем соответствует реальности но суть передает … ну скажем так, многие картинки были дизайнерским, композиционно выверенным, перемножением сущностей которые смогла бы сделать машина.
До сего момента у меня не было особых примеров на которых показать чем отличаются разные типы творчества: откровение, майнинг и комбинаторика (прогрессия от высшего к низшему)… спасибо криптовалюте, за то что ввела в русский язык слово «майнинг» — этот вид творчества сравнивают с работой в шахте по добыче самоцветов, или называют планомерным диалектическим развитием, что не так наглядно как добыча блестящих камушков в темноте и духоте… вот теперь я могу сказать что «комбинаторика» — это то, что за вас могут сделать роботы… и будут делать, сперва под присмотром «пастуха», потом как фишка ляжет, может и пасти уже некому будет.
пример с переходом на личности — Георгий Колосов
Герогий Колосов идет и фотографирует на кладбище, это отличается от того, как это сделает «фотолюбитель» — ну что может быть проще: прогуляться по старому кладбищу с любимым фотоаппаратом?… отличие не в технике, и да же не в ракурсе, отличие в авторской позицией, то есть в том, что находится вне изображений… и не только тексты к проекту но и позицией обусловленный всей его жизнью, прошлыми деяниями… нам, зрителям, могут нравится, или не нравится конкретно эти серии фотографий, но они есть результат большой внутренней работы, без относительно техники и прочего…
При этом сам Колосов идет от визуального, которое в фотографии обусловлено техникой; но живописность, пластика, тональность — термины которыми он оперирует, это свойства техники, оптики и внутрикамерной обработки, инструменты, причем довольно простые, из оптики там где-то пентаксовский софт… как там говорят подростки: я проявляю свою индивидуальность через консьюмеризм — то есть этот обьектив коммерчески доступный, не самый дешевый, но это всего-лишь деньги.
Эти серии сняты на очень старую цифру, без обработки на компьютере, после «напечатаны с флешки» в какой-то обычной(?) фотолаборатории сидя с оператором — здесь нет ничего эдакого кроме авторской позиции, душевных качеств автора. Выбор инструмента сильно вторичен… даже если автор считает что это не так!
Противоположный пример - девочка (лень искать) снимала моноклем с экрана какие-то сцены из компьютерной игры в стиле «русская глубинная жизнь» избы, лес в тумане на горизонте … интересный опыт? — по моему скучная ученическая работа, зато монокль. Imho с той-же виртуальной реальностью, а компьютерные игры рисуют нам вполне реальный, иногда сказочный, а иногда нет, мир можно сделать много больше … девочка ничего не могла особого от себя сказать, она комбинировала технический прием и картинку которую можно получить не поднимая попы от кресла… ничего не напоминает?
Текст взят отсюда.
Оффтоп - кстати, тот же товарищ недавно написал текст про тонкое восприятие, чем безмерно меня порадовал, потому что этот текст и про аудиофилию тоже. Это мы тут думаем, что наши проблемы уникальны и мы все такие свихнувшиеся, но на самом деле проблема тонкого восприятия универсальна и проявляется очень много где.
Замечал, что люди, развившие в себе (или имеющие от природы) тонкое восприятие в одной области, в аудио тоже слышат больше среднестатистического человека с улицы. И с этой позиции коренной причиной споров между “субьективистами” и “обьективистами” является наличие тонкого восприятия у первых и отсутствие у вторых.
Соседство “тонкого восприятия” с “нейросетью” еще и в теме “генеративной музыки” выглядит сюрреалистично!
А в чём противоречие? Что запрещает одновременно иметь тонкое восприятие и разбираться в технических темах? Тонкое восприятие это же не про “гуманитарный склад ума”.
Там вопрос рассматривается больше со статистической точки зрения (у любого распределения качества есть хвосты, и обычно в них зарыто самое интересное, это правда), я же больше про когнитивно-перцептивную сторону. Распределение “чувствительности воспринималки” у людей - оно тоже с хвостами, и люди попавшие в “положительный хвост”, они, в общем, немного странные с точки зрения остальных
Сюрреализм не про противоречие, а про “парадоксальное сочетание форм”. Тонкое восприятие и нейросети, на мой взгляд, два противоположных полюса, одновременно присутствующих в современном мире. Остается только наблюдать, в какой точке человечеством будет найден баланс между этими полюсами.
С одной стороны, нейросети замещают определенные функциональные стороны человеческой деятельности, с другой - освобождают человека от рутинных функций, предоставляя ему лучшую потенциальную возможность для развивития, в том числе, тонкого восприятия.
Теперь я удивился
Кажется вы считаете “тонкое восприятие” чем-то из области трансцендентного, хотя на самом деле это всего лишь пониженный порог когнитивной чувствительности, вполне себе материалистический и даже измеримый. Всё равно что иметь необычно низкий голос или необычно высокий рост, только восприятие при желании можно тренировать.
В такой терминологии, скорее, результат работы нейросетей со стороны выглядит трансцендентным, будучи вполне материальным.
Так поэтому все так и переполошились, когда недавно появились нейросети, результат которых выглядит слишком трансцендентно для бездушной машины.
Вот!
Ага, фоновую музыку для Youtube клипов генерировать самое то, нечего людям такой ерундой заниматься. Люди должны открывать новые горизонты музыки, писать симфонии, а не производить дешевое одноразовое музлишко в промышленных масштабах.