2014 № 2 (11)
Погружение в хаос: парадокс выбора и путеводители по музыкальным джунглям
Все мы живем сегодня в информационном мире – особом пространстве, о котором несколько десятилетий назад говорили разве что самые смелые социологи. Их слушали с восторгом и недоверием, предаваясь мечтам манящим и одновременно, как казалось, несбыточным, пока не грянула цифровая революция и информационная эпоха не стала реальностью – чем-то повседневным, даже обыденным. Сегодня трудно представить, что еще до всякой компьютеризации исследователи, такие как Э. Тоффлер и Д. Нейсбит, смогли предсказать то, что теперь кажется нам прямым следствием интернет-бума – глобальную культурную фрагментацию и демассификацию. Общественный тренд сложился вначале, а цифровые технологии создали лишь инструменты для его развития и масштабного углубления. Однако именно эти инструменты сделали окончательно очевидным, что в современности «образовалась новая парадигма культуры – гетерогенное, множественное, картографическое пространство, расширять которое можно до бесконечности» [3, с.102].
Впрочем, описывая закономерности, характерные для этого пространства, теперь довольно редко поминают «Третью волну». Зато почти постоянно – концепцию Длинного хвоста, представленную в 2004 г. Крисом Андерсоном. В общем-то это вполне логично – ведь последняя не только принадлежит цифровой эпохе целиком, но и очень наглядно демонстрирует, как то, что прежде было все же моделью преимущественно теоретической, утверждается в качестве неоспоримой реальности, подтвержденной даже наглядной статистикой.
Суть идеи Андерсона вкратце сводится к следующему: сегодня по мере того, как все более доступными становятся средства производства культурных товаров, а цифровая эпоха делает их ассортимент больше не ограниченным физическим пространством магазинных полок, создаются условия бесконечно разнообразного выбора, в которых потребитель культуры – читатель, зритель, слушатель – начинает вести себя совершенно не так, как прежде. Его интерес смещается от громких общеизвестных имен к гораздо менее популярным и более специфичным. Человек уже не стремится смотреть, читать и слушать то же, что и все остальные, невероятное культурное разнообразие провоцирует его искать иные явления, большинству окружающих, быть может, неизвестные, но оптимально подходящие именно ему. Фактически на смену культуре звезд и хитов цифровая революция приводит культуру ниш, лучшим доказательством чего служит тот простой факт, что уже к середине 2000-х суммарный тираж узкопопулярных «нишевых» культурных продуктов начал заметно превышать тиражи бестселлеров.
Цифровая революция фактически открыла настоящую эпоху изобилия – наглядно проследить это можно хотя бы на примере музыкальной культуры. Так, в ней в XXI веке оказались созданы все возможности для того, чтобы делать качественные записи без больших финансовых затрат. Это привело к взрывному росту числа выпускаемых музыкальных работ – только в период с 2004 по 2005 год их количество увеличилось на 36% [ 1, с. 72]. В то же время емкость виртуального пространства оказалась действительно практически неисчерпаемой и к тому же требующей для своего обслуживания минимальных ресурсов, что обеспечило возможность доступа аудитории к огромной массе даже самых экзотических музыкальных явлений, сформировав условия беспрецедентно разнообразного выбора. В этих условиях направление слушательского интереса, как показывают приводимые Андерсоном цифры, действительно стало смещаться, и если «в традиционной рознице 1 тыс. самых популярных альбомов составляет примерно 80% всего рынка (в среднем розничном магазине, который предлагает лишь часть доступных дисков, 100 самых популярных альбомов могут привлекать более 90% продаж)» [1, с. 163], то в интернет-пространстве «те же самые альбомы составляют менее трети рынка. Можно сказать, что половина рынка в Сети представлена альбомами, менее популярными, чем первые 5 тыс.» [там же]. Таким образом, в цифровую эпоху востребованными оказываются даже те – и в основном те – музыкальные явления, которые ориентированы на достаточно узкий круг слушателей, и в целом происходит масштабный сдвиг от массовой культуры к массе параллельных культур.
Реальности, рожденной такой демассификацией трудно не радоваться: слушатели в ней все меньше подчиняются законам толпы, артисты находят публику в обход железной логики хит-парадов, звезды по-прежнему имеют право на существование, но уже не заслоняют собой все вокруг – каждый находит свое, соразмерное место. Этот мир всеобщего благоденствия – что и говорить – привлекателен, вот только вовсе не идилличен: все его несомненные преимущества в действительности имеют свою оборотную сторону, о которой умолчали теоретики информационного общества, но которая с каждым днем все громче и громче заявляет о себе.
В цифровую эпоху, когда технологии сделали создание музыки доступным практически каждому, а возможность свободной самопубликации сняла барьеры на вход в культурное пространство, исчезли практически все ограничения в производстве и распространении самых разнообразных произведений, что реально создало беспрецедентно широкий выбор, но в то же время привело к переизбытку, огромному перепроизводству музыкальных работ. Упомянутые 36%, на которые увеличилось количество записей в одном только 2005 г., – цифра внушительная, но даже она не отражает масштаба произошедшего скачка. На 36% за год может увеличиться количество всей выпускаемой в мире музыки, но на до-цифровом этапе едва ли существовал человек, который имел доступ ко всем создаваемым в мире аудиозаписям сразу. Сегодня же этот доступ открыт почти любому желающему, и в целом цифровая революция увеличивает объем музыки, предоставленной в распоряжение среднего слушателя, не на треть, а на несколько порядков. Только крупнейших интернет-сервисов, предлагающих музыкантам возможность самопубликации, сейчас не один десяток, на каждом из них сотни тысяч исполнителей, не говоря уже о всей массе записей, доступной в файлообменных сетях. При этом отсутствие в медиа цифровой эпохи столь порицаемой когда-то «узколобой фильтрации» масс-культуры, централизованного отбора, оборачивается отсутствием фильтрации как таковой, и в конечном итоге – информационным хаосом, способным уничтожить все преимущества культурной демассификации и для слушателя, и для музыканта.
В теории все продолжает быть верно: новые медиа и фрагментированная культура действительно могут служить интересам создателя и потребителя музыки, формируя пространство, где для каждого, даже самого уникального вкусового запроса найдется соответствующий ему нишевый ответ. Однако на деле в ничем не ограниченном информационном хаосе Сети «соответствующие друг другу» музыкант и слушатель в своих попытках встретиться оказываются почти что обречены. Поощрение цифровой эпохой всех музыкальных «цветов» привело к тому, что изобилие зеленых насаждений быстро превратилась в дремучие заросли, не заблудиться в которых – весьма нетривиальная задача. Музыка самого разного рода переполняет сегодня интернет, среди многих и многих тысяч артистов каждый ждет своего слушателя, и каждый, если не успел заявить о себе прежде в традиционной медиа-системе или не стал счастливцем – объектом вирусного распространения – никак не обнаруживает себя на общем фоне. В то же время ежедневно на музыкальную охоту в Сеть выходят миллионы людей, воодушевленных отсутствием навязчивых ротаций, собственной свободой, возможностью делать уникальные открытия в самых дальних уголках безграничной музыкальной вселенной. И день за днем большинство тех и других так и не получают желаемого, не сумев найти друг друга в информационном шуме цифрового мира…
В конечном итоге предельно наглядно ситуацию иллюстрирует замечание Кристофера Ихихо, фиксирующее нынешнее положение дел: «…введите в поисковой системе какой-либо музыкальный стиль, например, acid house, rock. Вы получите в результате огромный список из множества названий, где не будет видно никаких отличительных особенностей для каждого отдельного названия. “Ну, рок, ну, название…” — и что возникает? “Я не буду скачивать 1000 mp3 неизвестных мне групп”» [2]. Там, где невозможно даже обозреть (не говоря уже о прослушать) и сотой доли доступной музыки, в том, кому действительно удастся, а кому нет, найти свою подходящую нишу и – встречно – обрести свою подходящую аудиторию, присутствует слишком большая доля случайности.
Конечно, ограниченность массовой культуры всегда ущемляла интересы множества слушателей и музыкантов, однако, как выясняется на практике, отсутствие каких бы то ни было ограничений вообще вовсе не гарантирует удовлетворения этим интересам. К тому же, ничем не сдерживаемое разнообразие провоцирует возникновение ситуации, которую Барри Шварц окрестил «парадоксом выбора», утверждая, что, пересекая определенную количественную черту, выбор перестает стимулировать человека, становясь слишком большим для возможностей его восприятия и в результате лишь парализует, демотивирует [5]. В своих построениях Шварц ссылается на целый ряд исследований, в частности – на классический эксперимент, проведенный учеными из Стэндфорда и Колумбийского университета в американских супермаркетах, где посетителям предлагали поучаствовать в дегустации джемов – и они с радостью покупали понравившийся, пока вариантов на пробу было 6, но впадали в ступор и уходили ни с чем, когда вкусов становилось 24 [9]. Музыка – не варенье, но принцип в ней, похоже, работает тот же самый: стремление познакомиться с как можно большим количеством предложений при физической невозможности переварить их все, в конечном итоге притупляет само желание выбирать, вести поиск собственной ниши в безграничном музыкальном океане цифровой эпохи. Кризис перепроизводства ведет к кризису перепотребления, рискующему обернуться утратой интереса к музыке как таковой.
Музыкальный мир цифровой эпохи в конечном итоге становится жертвой парадокса, оказавшегося едва ли не главной болевой точкой всего информационного общества: «мы тонем в информации, но испытываем голод по знанию» [4, с. 41]. Именно поэтому все нынешние цифровые достижения еще не гарантируют демассифицированной культуре светлого будущего сами по себе. По сути, они могут оказаться бесполезными вовсе, если к ним не добавить условие, в котором сегодня принято видеть залог успешного развития всей современной цивилизации вообще: возможность эффективного отбора информации, способность преодолеть информационный шум.
Однако что такое отбор применительно к музыкальному миру? Осадок, оставленный XX веком с его масс-маркетом и культиндустрией по-прежнему велик. Что такое отбор – если это не тот способ, с помощью которого вертикаль музыкальной власти навязывала слушателям свои законы на протяжении всего прошедшего столетия? Впрочем, современным сетевым энтузиастам контроль выстроенной иерархиями культуры вовсе не кажется единственной альтернативой информационному хаосу интернет-пространства. Между подконтрольным порядком и хаотичной свободой они выбирают свободную упорядоченность. Подобная бескомпромиссность может казаться беспочвенной, вот только на деле за ней скрывается довольно прочный бэкграунд, составленный огромным числом вполне реальных разработок, опирающихся на базовые основы свершившейся революции – технологии и сетевые социальные связи – и рассчитывающих создать совершенно новый, горизонтальный механизм отбора, не ущемляющий ничьих свобод.
Работа над этим механизмом ведется, в сущности, довольно давно. Вопрос о создании инструмента, способного стать новым культурным фильтром, встал в полный рост с тех пор, как призрак хаоса лишь замаячил на цифровом горизонте. Характерно, что именно музыкальный мир взялся за решение этого вопроса одним из первых, причем подходы его буквально во всем оказались принципиально отличными от того, что могло напомнить прежнюю вертикальную фильтрацию индустрии. Так, разработчики новых музыкальных фильтров вовсе не стремились создать нечто, что могло бы помочь найти в Сети музыкантов, достойных стать любимцами публики, и отсечь всех прочих как не стоящих внимания. Они исходили из принципа специализации, нишевости, изначально опираясь на базовые основания фрагментированной культуры. Не пытаясь отделить зерна от плевел в масштабе всего музыкального поля, они стремились создать механизм индивидуального отбора, интуитивно предчувствуя, что в эпоху длинного хвоста плевелы для одного обязательно окажутся зерном для кого-то другого. В общем-то, их главная цель всегда была одна – не разделить лучших и худших, а соединить ту самую музыку с той самой аудиторией. И только средства, применяемые для достижения этой цели, на разных этапах отличались довольно сильно.
Одним из таких средств стала так называемая контентная (content-based) фильтрация – та, в основу которой был положен непосредственный анализ музыкального материала. Способов этого анализа существует множество. Часть из них исходит из незыблемой веры в решения чисто технологические, пуская в ход цифровую обработку сигнала: DSP(от Digital Signal Processing)-методики и психоакустическое моделирование. Такой подход позволяет исследовать различные параметры звукового потока в автоматическом режиме и классифицировать совершенно любую музыку в соответствии с этими параметрами. При этом подразумевается, что навигационная система, основанная на DSP-фильтрах, анализирует музыкальные произведения, которые нравятся конкретному пользователю, а затем из всей имеющейся базы отбирает для него лишь те, которые максимально схожи с ними по звучанию, и – по логике разработчиков – соответственно также должны понравиться ему. Все прочее отсекается как не нужный данному человеку «шум».
Работающие по такому принципу конкретные функциональные сервисы впервые стали появляться в самом начале 2000-х. Одним из пионеров среди них был созданный Максом Уэллсом Cantametrix. Его программные алгоритмы позволяли вычленять из цифрового музыкального трека информацию о темпе, ритме, мелодии, гармонии, тембре. С помощью работы с пятьюстами отобранными слушателями была также создана методика автоматического распознавания настроений – «подопытные» фиксировали эмоции, которые вызывает у них то или иное произведение, а система изучала параметры звукового сигнала, с этими эмоциями потенциально связанные. На выходе получился продукт, способный с помощью математических манипуляций с «0» и «1» цифрового звука составлять своего рода формулу вкуса любого желающего, а затем находить музыку, способную удовлетворить этот вкус.
При всей технологизированной прагматичности такого подхода, в его фундаменте лежала мечта, в сущности, чисто романтическая. Сам Уэллс однажды описывал ее так: «Представьте – вы просыпаетесь утром и говорите, обращаясь, скажем, к своим часам: “Эй, компьютер, найди-ка мне новую хорошую музыку!” И несколько минут спустя раздаются звуки – прекрасная комбинация бопа и фри-джаза – это какой-то музыкант, скажем, из Лиссабона, который только что выложил свою новую работу в Сеть» [7]. Компьютер осуществляет постоянный мониторинг всей новой музыки, выкладывающейся онлайн из любой точки планеты, компьютер сортирует ее и всегда готов предоставить что-то новое, записанное, быть может, лишь вчера вечером – и ты непременно останешься доволен, ведь компьютер знает формулу твоего вкуса и всегда попадает в точку. Никаких усилий бесконечного поиска, никакого погружения в хаос, никаких разочарований. Трудно не соблазниться – однако утопия осталась утопией, и на деле путь Cantametrix-a оказался не так чтобы особенно романтичным. В надежде донести свою технологию до конечных пользователей – слушателей, он предлагал ее музыкальным торговцам и издателям, рекорд-лейблам, пытался внедрять в качестве надстройки для сайтов потокового аудио и всевозможных музыкальных агрегаторов, но большого успеха не достиг. В какой-то момент его главными клиентами стали вовсе не жаждущие новых открытий меломаны, а агентства, занимающиеся лицензированием музыки для телевидения, кино и рекламы. Они приспособили Cantametrix к своим нуждам на свой лад. «Скажем, есть режиссер, – рассказывал об этом Уэллс, - и он кричит: “Нам нужна яростная музыка! Найдите что-нибудь яростное!” И вместо того, чтобы выкладывать огромный кусок бюджета за права на "Start Me Up" Rolling Stones, компания просто находит для него что-то дешевое, но звучащее практически так же» [там же]. Впрочем, даже такая специфическая аудитория проекту не помогла – в какой-то момент он был продан и перепрофилирован.
Дело Cantametrix, однако, продолжили другие. В частности, вполне предсказуемым образом со своей собственной технологией обработки музыкальных параметров и выстраивания на их основе вкусовых фильтров на каком-то этапе выступил тот самый Институт Фраунгофера, который создал в свое время судьбоносный, и также выросший из психоакустического моделирования, формат mp3. На базе их разработки был выстроен доступный конечным пользователям рекомендательный сервис Mufin. Свою технологию контентной музфильтрации с помощью автоматического анализа треков предложила в какой-то момент и Sun Microsystems. Вообще же на мечту создать алгоритм технологического вычисления индивидуальной формулы вкуса до сих пор продолжают работать многие энтузиасты, вот только интерес к идее в целом в последнее время все же заметно ослаб. Механизмы обработки сигнала совершенствуются день ото дня, но вера в машину, способную действительно «понять» и музыку, и слушателя, тем не менее, постепенно сходит на нет. Этой вере противостоит сегодня другой полюс контент-фильтрации – анализ «с человеческим лицом», проводимый вручную профессионалами, который нашел свое наиболее последовательное применение в проекте по расшифровке музыкального генома…
Так называемый Music Genome Project стартовал в конце 1999 года с подачи Уилла Гласера и Тима Вестергрена и под научным руководством Нолана Гассера – пианиста, композитора и музыковеда. Имя проекта, безусловно, представляло собой метафору, но сам Гассер не раз утверждал, что относится к ней более чем серьезно. «Биологи, - объяснял он, - пришли к пониманию специфики человека как вида, расшифровывая значение генов в нашем геноме; к тому же это дало им понять, как каждый отдельный ген определяет то, что мы представляем собой как личности – а заодно, что он говорит о взаимосвязях, в которых мы находимся с другими… Именно в подобном ключе я и видел свою конечную цель. Идея состояла в том, чтобы выделить отдельные музыкальные виды – и затем выяснить из каких индивидуальных генов их геном состоит» [8].
Музыкальных видов, настолько различных, что они требуют выделения в отдельную генетическую группу, обнаружилось 5: поп/рок, электроника/хип-хоп, джаз, классика и ворлд мьюзик. При этом, по сути, геном каждого из них представлял собой все тот же набор специфических музыкальных параметров, организованных с помощью определенного математического алгоритма. Разница с методиками автоматической обработки сигнала состояла лишь в том, что анализ проводился здесь живыми специалистами, что позволило сделать набор анализируемых параметров гораздо более сложным, многомерным и всеобъемлющим. Там, где машина справлялась с определением темпа, гармонии, тембра, квалифицированный человек оказался способен выделять сотни характеристик – тех самых генов – к примеру, в геноме классики их обнаружилось более 400. Тип аранжировки, доминирующая эстетика, использованные инструменты и техники игры на них, модуляция, тип вокала и пол вокалиста, способ фразировки, прослеживающееся влияние различных жанров, основные приемы звукозаписи, корни материала – от фольклорных до уходящих в панк, тематика текста, – вот лишь случайный набор качеств, которые способен описывать – и выстраивать в определенную систему – Music Genome[1] .
Такая доскональность на практике, конечно, позволяет создавать гораздо более убедительные фильтры, чем машинный анализ. Правда, мечта о свежевыпущенных новинках со всех концов света к завтраку оказывается в этой ситуации полностью утраченной. Ручная расшифровка генома – задача не из простых, справиться с ней могут лишь самые компетентные специалисты. Высшее образование в области музыкальной теории и композиции, совершенное ориентирование в самом широком спектре жанров и стилей – вот стандартные требования к человеку, которому еще предстоит пройти через многоступенчатый отбор и довольно длительное обучение для того, чтобы оказаться в команде Music Genome. Предпочтение отдается действующим композиторам и музыкантам. Очевидно, что штат такого рода по определению не может быть многотысячным – по некоторым данным на сегодняшний день в проекте работает лишь несколько десятков экспертов. При этом известно, что на расшифровку генома одного музыкального трека у специалиста может уходить от 15 минут до 2 часов, а 10% произведений в рамках контроля качества расшифровываются разными людьми повторно. Пропускная способность системы в результате оказывается критически малой. Она едва справляется с постепенной обработкой огромной массы наиболее значимой музыки, записанной прежде, из всей же лавины ежедневно появляющихся новинок в базу Music Genome успевает попасть и вовсе лишь самая крошечная часть. При этом в теории проект совершенно открыт: он принимает к рассмотрению любые музыкальные работы независимо от того, кто стоит за ними – мейджор-лейбл или никому не известный самодеятельный артист. Вот только всех желающих заранее предупреждают, что из-за чрезвычайной загруженности большую часть предложенного компания вынуждена будет отклонить. Впрочем, даже те немногие счастливцы, что оказываются принятыми, реально попадают в базу, как правило, месяца через три после своего утверждения.
Несмотря на столь существенные для эпохи все увеличивающегося музыкального изобилия недостатки, Music Genome, тем не менее, обрел довольную большую популярность – главным образом благодаря своему выходу к широкой публике в виде сервиса Pandora, существующего в качестве сайта Сети, приложения для смартфонов, даже канала ряда автомагнитол. По сути Pandora – рекомендательный ресурс, работающий в формате персонализированного радио. Пользователь указывает на любимую музыку, а система из всей доступной базы подыскивает ему – и дает послушать – ее ближайших «генетических» родственников. При этом сервис способен к дальнейшему обучению – слушатель указывает на то, что из предложенного ему нравится, а что нет, информация обрабатывается, вкусовой профиль корректируется и становится точней. Определенные ограничения – например, не предлагать песен с обсценной лексикой – можно и вовсе задавать заранее самостоятельно. Характерно, что Pandora, хотя и охраняет полную расшифровку генома любого произведения как коммерческую тайну, тем не менее, является одним из немногих рекомендательных ресурсов, всегда готовых предоставить пользователю довольно подробное объяснение того, почему именно этот трек предложен именно ему. Все это делает Пандору, пожалуй, самой востребованной контентной фильтрационной системой на сегодняшний день, хотя конкурентов на разных этапах у нее существовало немало.
Так, например, одним из них был созданный компанией Siren Systems ресурс Soundflavor, сходный по своим базовым установкам с Music Genome, но склонный к метафорам не столько научным, сколько кулинарным. Специалисты Siren Systems точно так же раскладывали музыку на характеристики – такие, как настроение, жанр, стилистика, использованные инструменты, вокальная техника и т.д., – но при этом считали их «ингредиентами», из которых складывается неповторимое музыкальное блюдо. «Рецепт» каждого трека был, надо сказать, гораздо более прост, чем 400-элементный геном, но и выкладывался на всеобщее обозрение тут же. При этом пользователь мог сам выделять наиболее симпатичные ему ингредиенты и искать новую музыку уже по их набору, а параллельно, наблюдая за его поведением, система автоматически формировала для себя представление о том, каков же – уже почти в буквальном смысле – его вкус.
В целом ресурсов с похожей логикой за последнее десятилетие появлялось – и исчезало – немало: Myna, DigitalMC, или, скажем, MoodLogic, Songza, Musicovery с их возможностью отбора музыки по ее соответствию сиюминутному настроению пользователя или уместности в определенной ситуации – вроде утренней пробежки или романтического ужина. Рождались среди них и начинания с нестандартным подходом – вроде рекомендательного сервиса по независимой малоизвестной музыке Audiri, в котором описывать характеристики произведений, их параметры, настроения, влияния, предлагалось вручную – но самим авторам. В общем, контентная фильтрация развивалась и развивается интенсивно. Между тем, пока что это развитие не особенно помогло контент-фильтрам разрушить репутацию технологии как не слишком-то эффективной. Совершаемый ими отбор в абсолютном большинстве случаев не способен по-настоящему удовлетворить слушателя до сих пор.
В общем-то, это обстоятельство не удивляет: механизмы музыкального анализа могут приближаться к идеалу сколь угодно близко, но это никак не отменяет того факта, что в самой основе фильтрации по сходству звучания лежат крайне спорные предпосылки. Предположим, музыкальный геном и вправду может быть расшифрован – но так ли много действительно важного способен он сообщить? Что раскрыл нам геном человека? Слишком много и слишком мало. Определяет ли набор генов личность? Способен ли он ее объяснить или хотя бы просто – исчерпывающе описать? Вопросы музыкальной генетики – не новы и не уникальны… Конечно, музыкальное произведение обладает многими поддающимися аналитическому разложению параметрами, но как целое оно всегда будет чем-то большим, чем сумма формальных характеристик. Точно так же и вкус человека, безусловно, подразумевает определенные тембровые, темповые и прочие пристрастия, но никак не сводится только к ним. В сущности, контентная фильтрация не способна быть достаточно эффективной ровно поэтому: она оставляет за кадром все над-формальное, не поддающееся жесткой классификации – то есть то, что вообще-то и определяет содержание музыки. Работы гениального автора и его жалкого подражателя могут звучать очень похоже – и система не увидит между ними никакой принципиальной разницы, ведь их музыкальные характеристики близки, а судить о качестве она не в состоянии по определению. К тому же, за одними и теми же выразительными средствами может скрываться совершенно разный посыл, не говоря уж о совершенно разном культурном контексте. Акустическая баллада в исполнении поп-старлетки и легенды фолк-рока состоят из одних и тех же элементов, но едва ли они найдут общего слушателя. Отдельные фрагменты песен Muse могут иметь в точности тот же «генетический набор», что фортепианные сочинения Рахманинова – но принадлежат они к другой музыкальной вселенной. Впрочем, создатели контентных фильтров порой утверждают (и с ними вполне можно согласиться), что подобная неразборчивость их детищ – вовсе не минус, а плюс, что она дает людям возможность расширять горизонты, выходить за рамки того, что они всегда считали единственно приемлемым. Что плохого, если фанат Muse совершит экскурсию в земли Рахманинова? Да и поклонникам Рахманинова не лишним будет поумерить снобизм…
Между тем, большинством разработчиков контентных систем нечувствительность к качеству и культурному контексту все же признается проблемой – и если ситуация с качеством почти неизбежно остается тупиковой, то в отношении контекстов в последнее время, похоже, наметился некоторый прогресс. Добиться его удалось с помощью еще одного «машинного» решения – технологий семантического анализа. Метод их работы довольно прост: «специально обученной» программе задается имя артиста, и она начинает искать в интернет-пространстве всевозможные упоминания о нем. Из этих упоминаний складывается определенный текстовый массив, состоящий из многочисленных обсуждений в блогах, форумах и социальных сетях, рецензий критиков и отзывов обычных слушателей, биографий главного героя, статей о нем, наконец, текстов его творений, если они не принадлежат целиком инструментальной музыке. Этот массив и подвергается уже собственно семантическому анализу – вычленению словесных конструкций, формулировок и понятий, чаще всего встречающихся в нем. В результате формируется так называемое «облако ассоциаций», в которое погружен артист, и в котором тот самый неуловимый культурный контекст должен оказаться уловленным и зафиксированным.
При всей своей незамысловатости подобный фильтрационный механизм, получивший название семантического (semantic-based) или – по аналогии с контентным – контекстного (context-based), справляется со своей задачей в целом довольно неплохо. Он обрабатывает огромный поток данных, погружается в океан описаний и суждений, выясняет, что в самых разных уголках планеты говорят о том или ином явлении, и в результате определяет культурную категорию, в которую это явление стоит поместить. Все это происходит без трудозатрат живого специалиста, полностью автоматически и зачастую – вполне точно. При этом семантический анализ дает реальную возможность существенно корректировать данные контентных рекомендательных систем. Все акустические баллады звучат похоже, но там, где поп-стралетка окружена облаком ассоциаций из «sexy» и «baby», у фолк-рок-легенды доминируют «поэзия» и «социальный протест» - что самым неизбежным образом разводит их по совершенно разным нишам. Качество фильтров в итоге растет. Понимая это, к контекстному анализу обращается сегодня множество сервисов музфильтрации: от Search Inside The Music – того самого детища Sun Microsystems – и сервиса One Llama до SmartMusic, созданного в Университете Нанкина и ориентированного на анализ китайско-язычного семантического поля в противовес всем прочим, чаще всего англоговорящим системам.
Впрочем, как бы широко ни распространялись контентные и контекстные технологии, дело никогда не ограничивалось только ими. Главным соперником на поле музыкальной навигации с самого начала были для них механизмы совершенно иного рода, отталкивающиеся не столько от чисто технических, сколько от более глубоких, коммуникативных оснований цифровой эпохи – сетевой модели взаимодействия и развитых социальных связей. Эти механизмы, получившие обобщенное название коллаборативной (от англ. - совместной, кооперативной) фильтрации, подвергают анализу не собственные свойства произведений, а отношения к ним, ведут поиск музыки, соответствующей вкусу слушателя, исходя не из формальных характеристик материала и не из описывающих его словесных конструкций, а из оценок, вынесенных – прямо или косвенно – другими людьми.
В самых общих чертах принцип коллаборативной музыкальной фильтрации сводится к следующему: сначала система изучает мнения человека относительно музыки самого разного рода, затем среди всех своих пользователей она находит людей, оценки которых максимально схожи с вынесенными им, и в результате выдает список рекомендаций – тех артистов и произведений, которые данному человеку еще не известны, но были высоко оценены его «единомышленниками». Через индивидуальные фильтры проходит, таким образом, не то, что максимально похоже на любимую музыку пользователя по звучанию или описанию, а то, что востребовано максимально похожей на него аудиторией, как бы оно при этом не описывалось и не звучало. Все стилистически близкое, но отвергнутое «братьями по вкусу», равно как и все прочее – не известное или не интересное им – попадает в этой ситуации в отсекаемый шум.
Сама идея – автоматически обнаруживать в сетевом пространстве людей со схожими пристрастиями и заставлять их, все так же автоматически, служить друг для друга проводниками в информационных джунглях – была предложена еще в 1992 году учеными американского исследовательского центра Xerox PARC. Первыми же, кто реализовал ее на практике в области музыкальной фильтрации, были сотрудник медиа-лаборатории Массачусетского технологического института Патти Маес и один из студентов MIT Упендра Шардананд. Именно ими был создан ресурс Ringo, появившийся в свободном интернет-доступе в 1994 году и бывший коллаборативным фильтром самого классического толка. Слушатель вручную выставлял оценки разнообразным музыкальным работам, после чего получал список рекомендаций и антирекомендаций – тех музыкантов и произведений, мнение о которых по прогнозам, выданным в результате анализа оценок остальных пользователей, у него должно было оказаться очень высоким или очень низким соответственно. Достоверность таких прогнозов сильно варьировалась в зависимости от того, как много музыки человек успел оценить, или от числа его единомышленников, найденных в системе. В целом, однако, по мере роста популярности сервиса и, соответственно, – количества слушателей в каждом вкусовом сегменте – она постоянно увеличивалась, что, однако, не помешало перепрофилированию и фактически закрытию Ringo после его продажи корпорации Microsoft в 1998 году.
Несмотря на столь быстрый закат первопроходца, музыкальная коллаборативная фильтрация чуть позже стала развиваться небывалыми темпами. Как и в контентной истории здесь сменила друг друга целая вереница ресурсов, открывавшихся, закрывавшихся, менявших стратегии: MusicStrands, iLike, Music Recommendation System for iTunes, Emergent Music, мутировавший в Goombah и слившийся в конечном итоге все с тем же iTunes, став плагином для его медиаплеера. Сама технология тем временем трансформировалась в направлениях порой противоположных: то предельно упрощаясь на службе у электронной коммерции, сведшей ее принципы к формуле «те, кто приобрели данный товар, также интересуются…», то – напротив – совершенствуясь и усложняясь.
Совершенствование затрагивало при этом довольно разные аспекты: так, помимо коррекции аналитических алгоритмов, разработчики серьезно сосредоточились на проблеме сбора стартовой информации, достаточно радикально меняя представление о том, что именно должно служить материалом для анализа. Масса вручную выставленных оценок – как в Ringo – была, конечно, максимально достоверна, но подразумевала слишком много осознанных усилий, серьезных временных затрат пользователей, мешая сервису стать по-настоящему массовым, а значит – по-настоящему эффективным. Альтернатива оценкам была необходима – и в какой-то момент ее стали видеть в автоматическом поиске данных о музыкальных коллекциях слушателей. Самым очевидным источником оказались здесь файлообменные сети. Подразумевалось, что то, что тот или иной человек открывает для скачивания в p2p, и является его любимой музыкой – а следовательно, анализ раздач позволяет выделить вкусовые группы и получить базу данных, составленную по модели: «те кто имеет в своей коллекции A, В и С, чаще всего любят также D, Е и F». Учитывая огромное число пользователей файлообмена, выборка при таком подходе получалась внушительной – и не в последнюю очередь именно на нее опирались такие рекомендательные сервисы как Echocloud или UpTo11.net. Между тем, доминирующим подходом в коллаборативной фильтрации мониторинг p2p все же не стал – то ли из-за постоянных гонений на файлообмен, то ли вследствие того факта, что тождество между попавшим в «расшареные» папки и по-настоящему любимым вовсе не бесспорно.
Вообще же проблема сбора данных о вкусе слушателя в какой-то момент стала камнем преткновения не только для коллаборативных, но и для всех прочих рекомендательных систем – даже контентные фильтры, хотя и не имели намерения сравнивать предпочтения пользователя с чьими бы то ни было, нуждались, тем не менее, в том, чтобы как-то узнать о них – желательно, не задавая бесконечных вопросов. В конечном итоге эта всеобщая потребность в ненавязчивом накоплении информации была реализована с помощью самой беззастенчивой современной технологии – анализа следов (чаще всего попросту логов), оставляемых людьми в цифровом пространстве. Эти следы могут сообщить самые разнообразные сведения о человеке: историю посещений им интернет-ресурсов, его поисковые запросы, статистику скачиваний и прослушиваний той или иной музыки. То же, как эти сведения используются в рамках рекомендательных систем, можно наглядно проследить на примере наиболее известного – хотя и задействующего отнюдь не весь спектр доступных возможностей – сервиса Audioscrobbler, работающего в рамках Last.fm.
Для того, чтобы составить представление о предпочтениях пользователя, Audioscrobbler-у не нужно ни о чем спрашивать, он требует лишь установки специальной программы на компьютер, в медиаплеер или другие поддерживаемые цифровые устройства – и она сама отслеживает его поведение: какую музыку он слушает, какие треки проматывает, не дожидаясь конца, а к каким, напротив, возвращается снова и снова. В отличие от анализа p2p, логика здесь становится более сложной: важно уже не только то, какая музыкальная коллекция собрана слушателем, но и то, как он на практике взаимодействует с ней. Какие части накопленного действительно востребованы, а какие лежат мертвым грузом – вот что, по мнению разработчиков, позволяет судить о подлинных пристрастиях. При этом постоянное наблюдение за пользователем делает систему очень отзывчивой – она не только выстраивает, но и постоянно уточняет вкусовой профиль, приводя его в соответствие с внутренней динамикой человека, с изменениями в его настроениях и желаниях. Именно этот профиль и сопоставляется, в свою очередь, с профилями других слушателей, полученными тем же способом, позволяя вычленять группы так называемых «соседей» – людей, с максимально близким музыкальным поведением, а затем обрабатывать информацию по коллаборативным принципам и выдавать рекомендации каждому из них. Последняя часть процедуры происходит уже непосредственно на Last.fm, где при этом не только выдаются индивидуальные рекомендации, но и, как уже упоминалось выше, вещает персонально настраиваемая радиостанция – по форме сходная с Пандорой, но основанная на совершенно ином механизме анализа. Система подразумевает и возможность дальнейшего обучения – слушатель может помочь автоматическому сбору данных еще и вручную, например, указывая во время «эфира», что ему особенно понравилось – или не понравилось – из предложенного. Если добавить к этому тот факт, что Last.fm к тому же содержит контентные элементы – вроде добавленных пользователями тегов, а аудитория его перевалила за 40 миллионов, становится очевидно, что системы коллаборативной фильтрации на сегодняшний день очень далеко ушли от Ringo с его предельной простотой.
Помимо подобного – практического – совершенствования коллаборативной технологии, весьма любопытны и некоторые теоретические разработки последнего десятилетия. Так, например, отечественный экономист Александр Долгин в какой-то момент предложил модель сервиса, соединяющего коллаборативные фильтры с важнейшим трендом цифровой музыкальной культуры – экономикой дара. Подразумевается, что такой сервис должен, с одной стороны, служить площадкой, технически обеспечивающей возможность публики отправлять артистам благодарственные платежи, а с другой – выдавать рекомендации, эти самые платежи анализируя, исходя из предположения, что именно то, кому и сколько человек добровольно платит, свидетельствует о его пристрастиях лучше всего[2]. Такая модель определенно не лишена изящества, однако попытки реализовать ее на практике, несмотря на все усилия, успехом пока что не увенчались: созданный Долгиным ресурс Imhonet.ru за 6 лет своего существования так и не смог ввести возможность «оценки рублем», за исключением эксперимента с читательской премией, в котором деньги были привнесены в систему искусственно[3], да и раздел «Музыка» просуществовал на сайте совсем недолго. Впрочем, что бы там ни было с практикой, многие проблемы модели Долгина очевидны уже в теории и признаются им самим: так, например, очень сомнительно, что благодарственный платеж может выступать в качестве универсального мерила полученного от произведения удовольствия – хотя бы потому, что ценность одной и той же суммы неравнозначна для людей с разным достатком.
Между тем, серьезные проблемы связаны и с коллаборативной фильтрацией как таковой. Одна из основных среди них – так называемый холодный старт. В самом начале любому сервису нужно как следует узнать нового пользователя – во всех нюансах изучить его поведение и вкусы. На это уходит довольно долгое время, в течение которого рассчитывать на качественные рекомендации слушателю, как правило, не приходится. Это, впрочем, всего лишь вопрос терпения. Гораздо хуже дела обстоят с холодным стартом для нового артиста. Для того, чтобы начать попадать в списки рекомендаций, ему нужно преодолеть критическую отметку, понравиться определенному количеству пользователей, а сделать это внутри системы практически невозможно – ведь в списках рекомендаций его еще нет. Этот замкнутый круг порождает совершенно непростительную для эпохи нишевой культуры особенность коллаборативных сервисов: они не способны охватить Длинный хвост целиком. Аналитик навигационных систем Педро Кано приводит любопытную статистику: если вслед за Крисом Андерсоном разделить кривую музыкальной популярности на голову, середину и хвост, то рекомендации, выдаваемые коллаборативными системами, распределены между головой (45,32%) и серединой (54,68%). На хвост приходится гордый 0% [6]. Отдельные ресурсы – вроде вышеупомянутого UpTo11 – пытаются преодолеть сложности, давая слушателю возможность выбирать, результаты какого рода он хотел бы получить, интересуют ли его артисты более или менее популярные. Однако полностью решить проблему, корни которой уходят в специфику самого фильтрационного алгоритма, все равно невозможно. Кстати, именно в силу алгоритма гораздо лучше обстоят дела в этой области у контентных фильтров. В них на голову приходится 6,46%, на середину - 64,74%, а на хвост - 28,8% рекомендаций [там же]. Казалось бы, неплохо, но общий вывод Кано все равно неутешительный: коллаборативные системы эффективно работают, но не умеют работать с хвостом; контентные системы работают с хвостом, но малоэффективны в принципе.
Впрочем, на деле эффективность коллаборативной фильтрации сегодня тоже постоянно ставится под вопрос, и, в общем-то, все современные музыкальные навигационные ресурсы по-прежнему можно рассматривать лишь как площадку для более или менее успешного эксперимента. Этот эксперимент активно продолжается – так, на место чистых коллаборативных, контентных, контекстных фильтров начали претендовать гибриды – разработки, пытающиеся тем или иным способом вместить в себя всю сумму предшествующих достижений. Yahoo! Music Radio, дополняющее коллаборативные механизмы простейшими контентными; ресурс Rate Your Music, использующий одновременно сортировку по формальным параметрам, сложную систему метаданных, а также оценки и рецензии обычных пользователей; технология MediaUnbound и основанный на ней сайт EMusic; канадский RACOFI Music, объединивший коллаборативные фильтры с семантическими; разработанный iTunes рекомендательный сервис Genius.
Другое востребованное сегодня направление развития музыкальной навигации пошло по пути экспериментов не столько с механизмами анализа, сколько со способами представления полученных результатов. Так, определенную популярность получили на каком-то этапе визуальные сервисы, подобные Liveplasma, Musicplasma, Flokoon – многоступенчатые интерактивные схемы, отражающие внутренние связи между самой разнообразной музыкой. Пользователь задает в них стартовую точку – имя любимого артиста или произведения – после чего попадает в графически выстроенное пространство, где может путешествовать по смежным музыкальным областям, досконально изучая ближайшие окрестности пункта отправления или, напротив, уходя через лабиринты гиперссылок все дальше и дальше – параллельно, разумеется, прослушивая музыкальные образцы. Больше всего это напоминает движение по картам, призванным помочь человеку не заблудиться в хаосе современного музыкального мира. Правда, представленные на этих картах топографические сведения сами по себе вовсе не оригинальны. Например, Flokoon берет данные с Last.fm, Liveplasma и вовсе основана на информации Амазона – а значит, все традиционные недостатки навигационных систем в наличии и здесь.
Проблема качества самих механизмов фильтрации стоит очень остро – настолько, что, например, компания Netflix, занимающаяся рекомендациями в области кино, даже учредила в какой-то момент Netflix prize, обещая 1 млн. долларов тому, кто сможет хоть немного усовершенствовать ее (в основе своей коллаборативный) алгоритм. В 2009 миллион достался команде разработчиков BellKor’s Pragmatic Chaos, сумевшей повысить достоверность прогнозов о будущих оценках пользователей на 10,09%. Между тем, никакие улучшения алгоритмов, никакие, даже самые новые, яркие и смелые решения пока что так и не способны обеспечить действительно надежную навигацию в информационном шуме. Более чем наглядные результаты демонстрирует в этом смысле опрос, проведенный в феврале 2011 исследовательской группой Orpheus Media Research. Согласно ему, разнообразными рекомендательными сервисами пользуется сегодня около 54% любителей музыки, и хотя 77% из них признают, что по крайней мере однажды обнаружили с их помощью нечто действительно любопытное, 40% утверждают, что больше чем в половине случаев советы навигационных систем совершенно не адекватны, а 22% и вовсе считают, что найти с их помощью новую интересную музыку практически невозможно[4].
Так что, похоже, сколько бы ни настаивали цифровые энтузиасты на том, что безграничное культурное изобилие «в принципе это вообще не проблема – просто нужны качественные фильтры» [1, с. 141], создание этих фильтров оказалось не такой уж тривиальной задачей. Абсолютно эффективного способа преодоления информационного хаоса техническими средствами цифровой эпохи не существует до сих пор – и именно этот факт заставляет все большее число специалистов, да и простых слушателей, задаваться вопросом: а что, если технологии – вовсе не решение?
Список литературы
- Андерсон К. Длинный хвост. - М., 2008.
- Ихихо К.М. Публикция музыкальных работ в Интернет // Oxid.ru, 31 марта 2006. URL: http://cjcity.ru/news/content/statya_33.php
- Костылева Т.В. По дорогам культуры индивидуальных миров // От массовой культуры к культуре индивидуальных миров: новая парадигма цивилизации (Сборник статей). - М., 1998. С.102.
- Нейсбит Д. Мегатренды. М., 2003.
- Шварц Б. Парадокс выбора: как мы выбираем и почему «больше» значит «меньше». - М., 2005.
- Cano P. Music Recommendation Systems: A complex network perspective. URL: http://mmds.imm.dtu.dk/presentations/cano.pdf
- Comerford W. Tin ears for the 21st century // Seattle Weekly, Nov 15, 2000. URL: http://www.seattleweekly.com/2000-11-15/news/tin-ears-for-the-21st-century/
- Lasar M. Digging into Pandora's Music Genome with musicologist Nolan Gasser // ArsTechnica URL: http://arstechnica.com/tech-policy/2011/01/digging-into-pandoras-music-genome-with-musicologist-nolan-gasser/
- Why Choice Is Demotivating: Can One Desire Too Much of a Good Thing? Sheens Iуengar (Columbia) and Mark Lepper (Standford), 2000.
Примечания
- C обширным, но также далеко не полным перечнем музыкальных «генов» можно ознакомиться, например, здесь: http://en.wikipedia.org/wiki/List_of_Music_Genome_Project_attributes
- Подробнее об этом см. Долгин А. Экономика символического обмена. – М. Инфра-М, 2006.
- В 2010 году Имхонет объявил о вручении литературной премии. Для того, чтобы определить ее лауреата, всем пользователям ресурса была перечислена сумма в 50 руб., которые можно было либо потратить на свои нужды, либо перевести в пользу любимого писателя и тем самым «проголосовать».
- Приводится по: http://www.cliomusic.com/are-music-recommendation-services-working