2012 № 3 (4)
Семь веков английской поэзии
Семь веков английской поэзии [1]
У меня создается впечатление, что исследователей литературы преследует кошмарная мысль о том, что кто-то «прогонит» все поэзию через компьютер, и в его руках окажется всеобъясняющая формула. Очень жаль, что компьютеры – это всего лишь скучные серые коробки с голубым экраном, к которым питают склонность ребята в кроссовках. Для кошмара было бы гораздо лучше, если бы они были чернее преисподней и несли на себе леденящие душу руны, если бы к ним питали склонность брутальные парни в военных ботинках и они больше походили бы на «темные фабрики Сатаны»[1], поглощающие и разрушающие все вокруг. Однако, компьютерный анализ совершенно не деструктивен. С его помощью можно извлечь некую информацию из «Потерянного Рая», но это не повлечет разрушение самой поэмы. Может быть, эта глава сделает сон литературоведов спокойнее. Одна формула в принципе не может передать все сложное многообразие 650-летней истории британской поэзии. Формул понадобится полдюжины, а я пока получил только пару.
От Чосера к современным поэтам
Моей целью является рассказ о развитии британской поэзии от времени Дж.Чосера до настоящего момента. Первый шаг к достижению этой цели – проследить изменения в словаре английской поэзии. При наличии текстов, мы можем численно выразить перемены в использовании слов. Получив результаты, мы смогли бы обобщить их в некоем уравнении. Подобное уравнение – не более чем краткое, сжатое, сущностное описание обнаруженных изменений, которые можно было бы описать и словами, но ведь, как правило, цифры точнее слов. Раз мы взялись за поиск законов, стоящих за этими изменениями, то и в случае их успешного обнаружения всегда останется много работы. Ведь объяснение причин изменений в употреблении слов совсем не обязательно объясняет изменение смысла, идей, для передачи которых использовались эти слова. Поэтому, несмотря на видимое несогласие литературоведов, мне кажется, что все-таки не стоит говорить о смыслах, не имея убедительного описания и объяснения более простых и объективно измеряемых данных.
Наша первая задача это точно определить, чтὸ, собственно, составляет британскую поэзию как таковую: вся ли это поэзия, которая вообще когда-либо была написана на территории Великобритании, или же это некий общепризнанный канон. Немало времени потрачено литературной критикой на споры о том, может ли существовать такой канон вообще. Феминистская критика, например, утверждает, что женщины-писательницы представлены в каноне недостаточно. С точки зрения эволюционной теории, то, каким образом определяется популяция британских поэтов, на самом деле, неважно. Любое осмысленное определение даст нам некую историческую последовательность нескольких сот поэтов, которые находились под воздействием одних и тех же законов эволюции.
В связи с этим, интересующий нас период времени с 1290 по 1949 гг. был разделен на тридцать три последовательных отрезка по двадцать лет каждый. Поэты, родившиеся в каждый из этих отрезков времени, были ранжированы в соответствии с количеством страниц, посвященных им в соответствующей Оксфордской антологии английской поэзии [5]. Для последних двадцати периодов – с 1550 до 1949 гг. – в выборку входили по семь поэтов, имеющих самые высокие ранги. Для периода 1530-49 удалось отобрать только шесть поэтов[2]. Список из ста семидесяти поэтов в (табл. 1), скорее всего, включает все фамилии, которые читатель слышал, а также те, о которых он не слышал вообще. Всего в паре периодов не оказалось поэтов, которые должны присутствовать там в силу своей значимости. Наряду с этим, в большинстве периодов есть поэты, которые не должны были бы присутствовать там в силу своей незначительности. Хотя, возможно, и было бы правильнее отбирать поэтов на основе их значения для их эпохи, а не для наших современников, но объективного метода для такого отбора не существует; а если бы и существовал, этот критерий не может быть надежным ориентиром, так как восприятие достижений творца, как правило, варьирует на протяжении нескольких десятилетий после его смерти, а затем, в противоположность популярной точке зрения, имеет свойство останавливаться на достаточно стабильном значении [6;7]. Список несовершенен и в других отношениях. Джон Кливленд или Эдвард Бенлоуз вполне могли бы и войти в него в силу своего влияния на развитие английской поэзии. Томас Траэрн же, возможно, не должен в нем находиться: это хороший поэт, но так как его работы были обнаружены сравнительно недавно, он не мог влиять ни на современников, ни на следующее после него поколение поэтов. Так как оксфордские антологии включают поэтов, родившихся на территории Великобритании и эмигрировавших впоследствии, также как и поэтов, родившихся за пределами Великобритании, но продолжительное время творивших на ее территории (как Т.С.Элиот, например), эти поэты вошли и в наш список. Тем не менее, ряд исключений все-таки потребовался: не рассматривались поэты с неизвестной датой рождения, так как, в соответствии с методом, разбиение на периоды осуществлялось именно на основе даты рождения; некоторые поэты, написавшие не так уж много (например, Генри VIII), а также Льюис Кэрролл – в силу предположения, что компьютер не справится с его стихотворной бессмыслицей.
Таблица 1. Британские поэты, вошедшие в исследование (1290-1949)
№ периода |
Даты |
Имена поэтов |
1 |
1290-1309 |
Richard Rolle, Laurence Minot |
2 |
1310-29 |
John Cower, John Barbour |
3 |
1330-49 |
Geoffrey Chaucer, William Langland |
4 |
1350-69 |
Thomas Hoccleve, Andrew of Wyntoun |
5 |
1370-89 |
John Lydgate, John Hardyng |
6 |
1390-1409 |
James I (king of Scotland), Charles of Orleans |
7 |
1410-29 |
Robert Henryson, Benedict Burgh |
8 |
1430-49 |
Thomas Norton, Blind Hary |
9 |
1450-69 |
John Skelton, William Dunbar |
10 |
1470-89 |
Sir Thomas More, Steven Hawes |
11 |
1490-1509 |
Sir Thomas Wyatt, John Heywood |
12 |
1510-29 |
Henry Howard (Earl of Surrey); Thomas, Lord Vaux |
13 |
1530-49 |
Thomas Sackville (Earl of Dorset), Nicholas Breton, Sir Edward Dyer, George Turberville, George Gascoigne, Giles Fletcher the elder |
14 |
1550-69 |
Edmund Spenser, William Shakespeare, Samuel Daniel, Michael Drayton, Sir John Davies, Sir Walter Ralegh, Sir Philip Sidney |
15 |
1570-89 |
John Donne; Ben Jonson; William Drummond of Hawthornden; George Wither; Edward, Lord Herbert; Phineas Fletcher; Francis Beaumont |
16 |
1590-1609 |
John Milton, Robert Herrick, George Herbert, Thomas Carew, Francis Quarles, Edmund Waller, Sir John Suckling |
17 |
1610-29 |
Richard Crashaw, Andrew Marvell, Henry Vaughan, Abraham Cowley, Richard Lovelace, Joseph Beaumont |
18 |
1630-49 |
John Dryden, Thomas Traherne, John Wilmot (Earl of Rochester), Charles Cotton, Sir Charles Sedley, Charles Sackville (Earl of Dorset), Katherine Philips |
19 |
1650-69 |
Jonathan Swift, Matthew Prior, John Pomfret, Anne Finch (Countess of Winchelsea), Daniel Defoe, William Walsh, John Oldham |
20 |
1670-89 |
Alexander Pope, John Gay, Isaac Watts, Thomas Tickell, Joseph Addison, Nicholas Rowe, Thomas Parncll |
21 |
1690-1709 |
James Thomson, John Byrom, John Dyer, Samuel Johnson, Charles Wesley, William Hamilton of Bangour, Matthew Green |
22 |
1710-29 |
Thomas Gray, Christopher Smart, William Collins, Oliver Goldsmith, Mark Akenside, William Shenstone, William Whitehead |
23 |
1730-49 |
William Cowper, William Mickle, Charles Churchill, James Beattie, John Langhorne, John Wolcot (Peter Pindar), Erasmus Darwin |
24 |
1750-69 |
Robert Burns, Thomas Chatterton, William Blake, George Crabbe, Sir John Henry Moore, Thomas Russell, William L. Bowles |
25 |
1770-89 |
William Wordsworth, George Gordon (Lord Byron), Samuel Taylor Coleridge, Sir Walter Scott, Thomas Moore, Walter Savage Landor, Thomas Campbell |
26 |
1790-1809 |
Alfred, Lord Tennyson; John Keats, Percy Bysshe Shelley, John Clare, George Darley, J. H. Reynolds, Thomas Hood |
27 |
1810-29 |
Robert Browning, Matthew Arnold, George Meredith, Dante Gabriel Rossetti, Sidney Dobell, Emily Bronte, A. H. Clough |
28 |
1830-49 |
Algernon Charles Swinburne, Thomas Hardy, William Morris, Gerard Manley Hopkins, James Thomson, Christina Rossetti, Robert Bridges |
29 |
1850-69 |
Laurence Binyon, William Butler Yeats, Francis Thompson, Oscar Wilde, Lionel Johnson, Ernest Dowson, George William Russell (A.E.) |
30 |
1870-89 |
T. S. Eliot, D. H. Lawrence, Sir John Squire, Ralph Hodgson, Edith Sitwell, Rupert Brooke, John Masefield |
31 |
1890-1909 |
W. H. Auden, Sir John Betjeman, Basil Bunting, Louis MacNeice, Robert Graves, Wilfred Owen, Hugh MacDiarmid
|
32 |
1910-29 |
Dylan Thomas, John Wain, Philip Larkin, John Heath-Stubbs, Donald Davie, Kingsley Amis, Roy Fuller |
33 |
1930-49 |
Derek Walcott, Ted Hughes, Anthony Thwaite, Peter Redgrove, George Macbeth, Brian Patten, Alan Brownjohn |
Для периодов с 1 по 12 было найдено только по 2 поэта, даже несмотря на попытки выйти за рамки Оксфордской антологии и проконсультироваться с другими авторитетными изданиями. От этих периодов, во-первых, до нас дошло немного поэзии вообще, а во-вторых, у многих из поэтов (даже некоторых из тех, которые вошли в исследование) под вопросом дата рождения. Таким образом, для ранних периодов результаты будут значительно менее достоверными, чем для поздних. Более того, несмотря на то, что в те времена английская и шотландская поэтические традиции были весьма независимыми, нам пришлось включить и шотландских поэтов для увеличения их общего числа. И, наконец, так как поэзия того времени существовала на среднеанглийском и шотландском языках, она переводилась на современный английский язык. Размер выборки составил 521,566 слов.
Потенциал возбуждения [3].
Первым предметом исследовательского интереса стала гипотеза об увеличении значения потенциала возбуждения во времени. В качестве инструмента измерения характеристик текста, определяющих его сложность, неожиданность, неоднозначность, непредсказуемость и изменчивость, нами был предложен комплексный индекс вариативности. Индекс включает в себя следующие характеристики:
- семантическая полярность (величина смысловой неожиданности, интенсивности);
- количество многозначных слов (использование слов с множественными значениями порождает большую неопределенность текста);
- доля hapax legomena (количество слов, встретившихся в тексте только один раз, как некая мера сложности текста). Для измерения данной и последующих величин, была разработана программа LEXSTAT;
- средняя длина слова (мера трудности восприятия текста);
- коэффициент вариации частот встречаемости слов (мера изменчивости лексического состава). Коэффициент вариации – это отношение стандартного отклонения к выборочному среднему. Если поэт использует каждое из употребляемых слов по два раза, среднее будет равняться двум, а коэффициент вариации – нулю. Высокие значения коэффициента возникнут в случае роста разности в частоте употребления различных слов, что, как мне представляется, более свойственно поэтическому тексту, нежели обычному;
- коэффициент вариации длины слова (еще одна мера изменчивости). Это величина, описывающая тенденцию к смешению коротких и длинных слов;
- коэффициент вариации длины фраз (также мера изменчивости). Мера непредсказуемости длины фразы (под последней подразумевается последовательность слов, ограниченная точкой или точкой с запятой).
Комплексный индекс вариативности это, по большому счету, инструмент измерения вероятностных свойств текста, энтропии. Следствием непредсказуемости в тексте является удивление при его восприятии. Чем более непредсказуем текст, тем менее мы уверены в том, что скажет автор дальше. Индекс показывает непредсказуемость текста на уровне простейших лингвистических параметров. Несмотря на утверждение Якобсона о том, что поэтической функцией языка является попытка привлечения внимания к самому себе, она не всегда заканчивается успехом. Читатель может прочитать поэтический текст как прозу, не увидев игры со словом. Хотя изменчивость лингвистических показателей не является основным аспектом поэзии, она, безусловно, наиболее проста для измерения.
Значения для различных периодов варьируют на высоко значимом уровне. Дисперсионный анализ показывает, что межгрупповая дисперсия значительно превышает внутригрупповую. Дисперсионный анализ – это статистический инструмент, сутью которого является результат отношения межгрупповой дисперсии к внутригрупповой. В нашем случае 71% вариаций приходится на вариацию межгрупповую. На графике (4.1) видно, что это объясняется влиянием зависимости – восходящего тренда. Аппроксимирующая кривая имеет следующее уравнение:
АР = 10 + 1/(-10,23+10,41е-0,00036Р)
Где е – основание натурального логарифма, а АР – период. Эта тенденция объясняет 76.5% дисперсии средних значений. Почти столь же удачную аппроксимацию (74 процента объясненной дисперсии) дает и более простое экспоненциальное уравнение:
АР = 10 + 4,74е0,035Р
Как видно из графика, скорость роста значений потенциала возбуждения увеличивается со временем. Действительно, потенциал возбуждения не просто растет, а растет с ускорением с чосеровских времен в соответствии с полученными уравнениями.
Рисунок 1
Среднее значение комплексного индекса вариативности (инструмент измерения потенциала возбуждения) в текстах 170 английских поэтов, родившихся с 1290 по 1949. Линия аппроксимации указывает на ускоряющийся рост потенциала возбуждения.
На графике видно, что отклонение значений средних от линии тренда для более ранних периодов больше, чем для поздних. Рост потенциала возбуждения от периода к периоду не настолько очевиден и гладок, как в более поздние века. Такая неустойчивость частично обусловлена технической сложностью применения индекса к ранним текстам. Например, в связи с тем, что пунктуация в среднеанглийском была прихотливой и непоследовательной в сравнении с современными стандартами, а некоторые поэты не пользовались ею вообще, нам пришлось догадываться о ней самостоятельно. Кроме того, имея лишь двоих поэтов на период, мы неизбежно сталкиваемся с меньшей устойчивостью средних по сравнению с более поздним временем. Но все-таки, я полагаю, что у этой изменчивости есть и сущностные причины. Когда поэтическая традиция только формируется, поэтам не вполне понятны правила игры и не известны все те, кто в нее играет. Как следствие, для этих поэтов более вероятно случайное завышение или занижение необходимой планки потенциала возбуждения.
Если мы исключим из рассмотрения первые десять периодов в силу вышеупомянутых источников неопределенности, мы обнаружим, что скорость роста непредсказуемости, или, другими словами, величина влияния этой зависимости на британскую поэзию, не показала существенного роста или падения за последние 450 лет.
Некоторые составляющие индекса растут со временем неравномерно, но все они показывают устойчивый долговременный тренд. Поэты разных периодов повышают потенциал возбуждения за счет разных компонентов индекса. В одни периоды растет доля длинных слов и гапакс, в другие растет такой показатель, как семантическая полярность.
Очевидным аргументом против возможности существования теории, в качестве основы литературного развития устанавливающей стремление к новизне и вариативности, является существование таких направлений, как неоклассицизм, сознательно декларирующих стремление к простоте, порядку, симметрии и сбалансированности. Неоклассицизм в английской поэзии занимает периоды с 18 по 21. Индекс продолжает расти и на протяжении этого отрезка времени. Изучение отдельных показателей в составе индекса показало, что некоторые из них действительно уменьшились, например семантическая полярность. Однако это падение не оказало существенного влияния, будучи компенсировано ростом других показателей – ростом гапакс легомена и средней длины слова (см. рис 2). Другими словами, уменьшение непредсказуемости в некоторых показателях не сказалось на общей тенденции, отраженной в росте прочих показателей. Эти результаты позволяют предположить, что общепринятая точка зрения на неоклассицизм как возвращение к простоте после излишеств XVII века неправомерна. Напротив, создается впечатление, что неоклассический стилевой сдвиг привел к увеличению потенциала возбуждения и изменчивости, а декларации поэтов относительно введения простоты в некоторые аспекты поэтической практики служили ширмой для усложнения других аспектов.
Рисунок 2
Пример компенсаторного взаимодействия между составляющими Комплексного индекса вариативности: в период роста средней длины слова (отрезки с 15-го по 21-й) уменьшается вариативность длины фраз. Во время уменьшения средне длины слова (с 21-го по 28-й), вариативность длины фраз, наоборот, увеличивалась. Несмотря на постоянный рост потенциала возбуждения с течением времени, время от времени в художественно практике имели место тенденции к упрощению той или иной составляющей Индекса, которые, в свою очередь, компенсировались усложнением друго аспекта поэтической речи.
Первичное содержание [4]
Помимо устойчивого роста первичного содержания во времени, на восходящий тренд накладывается циклическая кривая дящий тренд накладывается циклическая кривая во времени, на восдля усложнения други(см. рис 3) Изучение последовательности показывает, что за 62% существующей дисперсии ответственна межгрупповая дисперсия, оставшиеся 38% – это внутригрупповая дисперсия, возникающая за счет случайных отличий поэтов друг от друга. Для данных на рис 3 70% вариации объясняет монотонно восходящий тренд. Это линейная аппроксимация, рост которой не ускоряется и не замедляется во времени. Однако из графика видно, что вокруг линейного тренда существуют квазипериодические осцилляции, объясняющие оставшиеся 30% вариации. Теоретически, эти колебания указывают на смену стиля. Так, в британской поэзии, первичное содержание имеет свойство падать в те периоды, которые обычно рассматриваются, как время возникновения нового стиля – чосеровский, скелтоновский, тюдоровский, якобинский, неоклассический, преромантический, романтический, постромантический, модерн. После установления нового стиля первичное содержание снова растет. Спектральный анализ данных на рис. 3 показывает существование накладывающихся циклов между 3 и 4 пиками, что очевидно и при визуальном изучении данных. Перемена стиля дает возможность первичному содержанию упасть. По завершении смены стиля первичное содержание снова возрастает. И это необходимо, так как поэт неизбежно должен прибегать ко все более глубокому погружению в первичное мышление для нахождения все более необычных сочетаний языковых элементов, которые позволяет стиль. Уровень падения первичного содержания и продолжительность цикла – все это зависит от того, насколько кардинальна смена стиля, и сколько хорошей поэзии он может дать. Регулярная цикличность с равными периодами и амплитудой возможна только при равной продуктивности стилей. Но такая ситуация маловероятна, так как поэты, инициирующие стилистические перемены, не могут заранее предполагать, насколько плодотворен будет стиль. Ведь для этого они уже должны представлять все поэтические средства, которые потенциально заложены в формирующемся стиле.
Рисунок 3
Среднее количество первичного содержания в текстах английских поэтов, разбитых на 33 отрезка, длиной 21 год, на основании даты рождения с 1290 по 1949 годы. Как и предсказывает модель, первичное содержание растет во времени с квазипериодическими колебаниями.
Для того чтобы суммировать наши результаты в уравнении, следует прибегнуть к авторегрессионному анализу. Этот статистический инструмент основан на расчете прогноза значений периода на базе предыдущих периодов. Этот метод хорош для эволюционной теории как таковой, например, в случае нашей теории, мы утверждаем, что, так или иначе, содержание поэзии на определенный период в основном определяется ее содержанием в предыдущие периоды. Наблюдаемые нами колебания следует анализировать авторегрессией второго порядка, когда искомое значение определяется двумя предыдущими. Перед работой с данными из них должен быть исключен тренд. Автокорреляционный анализ средних значений первичного содержания (без линейной восходящей компоненты) на протяжении 33 периодов подтвердил наши ожидания. Нам удалось построить авторегрессионную модель второго порядка для данного процесса. Для теории, в которой рост первичного содержания объясняется влиянием экстралитературных факторов, автокорреляционная модель выглядит совершенно по-другому (обсуждение того, почему данные результаты позволяют мне делать такие заключения см. в [1]).
Лучшая авторегрессионая модель для первичного содержания выглядит так: РС(t)= - 0.368 РС(t-2), т.е. количество первичного содержания в поэзии в данный период является функцией этого количества двумя периодами ранее. Значения первичного содержания коррелируют с данной моделью на высоком уровне значимости. Так как авторегрессия объясняет лишь 16% колебаний первичного содержания, на осцилляции сильно влияют и прочие факторы. Теоретически, колебания порождаются сменой стиля и, как я пытался показать выше, должны отличаться по длительности и амплитуде в зависимости от того, насколько радикальной была смена.
Значения конкретности словаря растут на высоко достоверном уровне. Корреляция принимает значения от 0.44 для глаголов до 0.57 для образных прилагательных. Конкретность словаря не показала таких осцилляций, какие мы видим в случае первичного содержания, хотя первичное познание склонно оперировать именно конкретными, а не абстрактными единицами смысла. Однако на конкретность словаря, помимо первичного мышления, влияют и другие факторы. Как я показывал в первой главе, абстрактные утверждения в поэтической речи чреваты тем, что, будучи озвучены, они отрицают большое число других возможных абстрактных заявлений. Утверждения о конкретных частностях менее опасны. Если смена стиля подразумевает смену словаря, то абстрактные слова имеют мало шансов остаться, а конкретные слова рискуют меньше всего.
Временной тренд использования слов, описывающих эмоции, хорошо согласуется с теоретическими предсказаниями. Обращение к эмоциям образует перевернутую U-образную кривую: рост использования слов начался с 3-4 процентов в ранние периоды, достиг 6.2% в 20 период и затем упал до 2.6 в 33 период. Если эмоциональная сфера является переходной точкой между первичным и концептуальным полюсами сознания, то вид кривой имеет логическое объяснение: при движении в континууме от концептуального к первичному полюсу эмоциональная составляющая должна увеличиваться до промежуточной точки и падать по прохождении ее.
Закономерность поэтическая или общеязыковая?
Так как совершенно очевидно, что надо отделять закономерности в поэтической речи от общеязыковых, для контрольных целей я проанализировал нелитературный текст. С середины XVII века в Англии издавалось повествовательное описание событий в мире – Ежегодный Альманах. Полагаю, что нет оснований считать, что у составителей Альманаха, была потребность увеличения потенциала возбуждения в тексте; их задачей было лишь составление отчета обо всем произошедшем за год. Методом случайного отбора я извлек 10 выборок из текстов за каждый десятый год в период с 1770 по 1970. Среднее количество слов в выборке составило 2 690. Общий размер выборочного материала составил 56 055 слов. Подсчитанное для каждой выборки значение индекса не показало различий между периодами или какого-либо временного тренда. Первичное содержание также не имеет ни тренда, ни осцилляций. Таким образом, можно заключить, что найденные в поэзии закономерности не являются отражением общеязыковой действительности.
Для того чтобы иметь в распоряжении более протяженную во времени выборку прозаического текста, я взял пять выборок длиной по 340 слов из Актов Парламента. Чтобы избежать высокого стиля первого параграфа, выборка делалась только из средней и конечной части текста. Объем выборки составил 40 789 слов юридического языка. Возможно, эта выборка не может репрезентативно отражать английский язык как таковой, но более длинной последовательности текстов, единых по стилю, содержанию и пр. просто не существует. (Выборка ограничена 1500 годом, так как английские законы до этого писались на французском языке). И снова значения индекса не показали значимой вариации или тренда. Корреляция со временем незначима (0.14).
Первичное содержание, однако, показывает различия по периодам, которые зачастую близки к достоверным. Хотя причиной этому является не наличие тренда (корреляция с периодом –0.01), некая упорядоченность в этих различиях присутствует. Средние значения первичного содержания для каждого периода выглядят как квазипериодические колебания (рис. 4) Авторегрессионный анализ дает уравнение точно такого же вида, как и для поэзии. Если циклы в поэзии и Актах Парламента в одной фазе, то это будет серьезным ударом по всей теории, так как получится, что закономерность и в актах и в поэзии отражает некий общий закон.
Рисунок 4
Среднее количество первичного содержания в Актах Парламента, представленных в виде в 20-летних интервалов с 1510 по 1970 гг. Количество первичного содержания гораздо ниже, чем в поэзии. Хотя в данных присутствует периодичность, она не коррелирует с таковой в поэзии.
Чтобы проверить находятся ли эти циклы в фазе, я выровнял обе последовательности по времени. Изначально поэты были отобраны по датам рождения, а акты по датам публикации. Средней датой рождения для поэтов, родившихся с 1470 по 1489 будет 1480 год. В 1510 (год публикации акта, из которого сделана первая выборка) им будет в среднем по 30 лет. В результате осуществления такой процедуры, корреляции между первичным содержанием в поэзии и актах выявлено не было. При других вариантах разбиения поэтов на группы значимого коэффициента корреляции также получено не было. Перед исчислением коэффициента корреляции необходимо выделить и удалить из обеих последовательностей авторегрессионную компоненту [2]. После этого корреляция между обоими корпусами пропадает полностью. Помимо этого, мною были предприняты попытки прогнозирования количества первичного содержания в поэзии на основе всевозможных комбинаций данных по трем предшествующим периодам Актов, но значимой связи обнаружено не было. Наилучший прогноз подобного рода для поэзии дает значение первичного содержания на три периода ранее, но объясненная дисперсия в этом случае составляет всего лишь 7%, что не является статистически значимым. Лучшее предсказание для Актов дает предшествующий период поэзии, но и при этом мы имеем незначимые 4% объясненной дисперсии.
Если первичное содержание в Актах не коррелирует с таковым в поэзии, откуда вообще берутся его колебания как таковые? Возможно, история законотворчества в некотором смысле повторяет историю развития литературы. Возможно и она имеет стили, которые доминируют на протяжении нескольких десятилетий, а затем уступают другим стилям. Члены законодательных органов, безусловно, находятся под воздействием необходимости создания и принятия новых законов. Все-таки для законодателей было бы неадекватным решением принятие положения о том, что необходимости в новых законах более не существует. Есть на то нужда или нет, новые законы будут приниматься всегда. Таким образом, действительно, законодатель, как и поэт, находится под давлением необходимости продуцировать новые комбинации слов, которые он называет законами. Предположим, Парламент пропускает некий комплекс законов, который имеет далеко идущие последствия (в нашем понимании – инициирует новый стиль). Впоследствии Парламент должен будет принимать законодательные акты, которые развивают и уточняют вышеозначенный общий комплекс. В результате будет получен конгломерат невнятных, запутанных и противоречивых текстов. На этом этапе потребуется следующая стилистическая перемена, новый комплекс законов. Этот комплекс также будет нуждаться в развитии, и процесс начнется сначала.
Если все вышесказанное хотя бы отдаленно отражает то, чем занимаются законодательные органы, тогда колебания в количестве первичного содержания весьма ожидаемы в силу регулярного перехода от общего к частному – и беглое чтение Актов Парламента подтверждает эту мысль. Более общие положения предшествуют более конкретным и специальным актам, разъясняющим или ограничивающим их действие. С другой стороны, иногда за общим законом может следовать не ряд специальных, а еще более обобщающие законы. Если бы в нашем распоряжении был более адекватный инструмент измерения влияния сложности текста, высоко вероятно, что мы обнаружили бы, что сложность законодательных актов возрастает со временем. Говоря абстрактно, юридический и поэтический дискурс подвержены изоморфным эволюционным изменениям.
Смена стиля
Если падение количества первичного содержания на момент смены стиля не только видимость, то этому стоит поискать количественное подкрепление. В конце концов, вряд ли может быть единогласие в литературной критике по вопросу датирования смен стиля в британской поэзии. Помимо заявлений самих поэтов о том, что они основали новый стиль, критику для вынесения суждения нужны некие коренящиеся в содержательной стороне поэзии основания. Для этого должны быть найдены способы измерения таких изменений в поэзии объективным способом.
Одной из задач поэта является поиск таких комбинаций слов, которые будут поддерживать интерес и удовольствие публики. Последняя привыкает к старым сочетаниям смыслов и требует новых. Одной из составляющих моей теории является положение о том, что первичное познание более эффективно при поиске таких комбинаций, но адаптация и привыкание к ним аудитории создает постоянное давление на поэтический лексикон, в результате которого он должен постоянно обновляться. Это влияние усиливается еще и тем, что из всего количества слов существует лишь ограниченное число возможных комбинаций – и здесь уже не важно насколько глубоко будет первичное познание. Таким образом, поэтический словарь должен претерпевать постоянную эволюцию. Индикатором стилистических перемен может выступать ускоренное выбывание старых и добавление новых слов. Конечно, на самом деле стилистические перемены влекут и изменения норм поэтической практики – законов того, как и какие слова могут сочетаться друг с другом. Однако этот аспект значительно труднее поддается измерению.
Джозефин Майлз [4] полагает, что смена стиля может быть определена посредством подсчета изменений в словаре. В рамках ее теории, пионеры нового стиля чаще вводят в свой словарь новые лексемы, но при этом не ускоряют выбывание слов, введенных предшественниками. После того как новый стиль обретает силу, старые слова уходят из лексикона с большей скоростью. Несмотря на то, что Майлз предоставила убедительные количественные доказательства своим предположениям, она не проводила статистических исследований, которые позволили бы нам оценить достоверность этой закономерности. Так как данные Майлз не- достаточно полны, то вместо того, чтобы применить к ним статистический инструментарий, я просто позволю себе позаимствовать принцип подхода к материалу.
Если мы знаем, сколько отдельных слов использовали поэты в каждый период, не составит труда сказать, сколько из них позаимствованы из словаря предшествующего периода, сколько новых, и сколько слов предыдущего периода не вошли в словарь. В любом периоде количество слов связано с количеством словоупотреблений. Вообще, доля слов в тексте уменьшается с ростом числа словоупотреблений [3]. В тексте длиной в 10 словоупотреблений каждое из них может оказаться отдельным словом; в тексте из 100 словоупотреблений это маловероятно, так как служебные слова (доля которых в среднем составляет 40%) обязательно повторятся. Имея по два поэта в периоды с 1-го по 12-й, шесть в 13-м и по семь на каждый последующий и не имея возможности более равномерно организовать данные, мы сталкиваемся с проблемой неравноценности выборок, адекватное решение которой – исключение ранних периодов из рассмотрения. Так как мы планируем оценивать словарь одного периода в сравнении с предыдущим периодом, мы можем начать рассмотрение только со второго периода, представленного семью поэтами. В анализируемых периодах количество словоупотреблений отличалось незначительно. Средняя длина текстов – 20 970, среднее количество использованных слов – 4 814. Общий объем исследованного текста составляет – 398 432 словоупотреблений, и состоит из 91 471 слова. Так как количество словоупотреблений на каждый период практически совпадает, влияние на количество слов также должно быть одинаковым.
Первый этап нашего исследования – количество использованных поэтами одного периода слов, отдельных лексем, независимо от того, было ли оно использовано единожды одним единственным поэтом или многократно использовалось всеми поэтами периода. (Я пытался использовать различные варианты взвешивания слов на основе их частоты и каждый раз это заканчивалось слишком сложной и неудобной путаницей. Избежать этого мне показалось достаточной причиной, чтобы работать с агрегированными данными, а не данными по каждому поэту в отдельности. К тому же в нашем распоряжении лишь по 3 000 словоупотреблений на поэта). Если поэты стремятся к продуцированию все более непредсказуемых комбинаций слов, можно ожидать увеличение количества слов во времени. При равенстве прочих условий, вероятность новой комбинации слов должна быть функцией от количества слов, находящихся в распоряжении поэта. Однако, как это видно на рис 4.5, количество слов скорее подвержено флуктуациям, чем монотонному росту. Вероятно, равенство прочих условий не соблюдено.
Рисунки с 6 по 8 демонстрируют процент слов, добавившихся, сохраненных или удаленных их словаря каждого периода. Совершенно очевидно, что поэтически лексикон обновляется с ускорением во времени. С каждым периодом на все больший процент словарь поэта состоит из новых слов, что, соответственно, сокращает количество слов, унаследованных от предыдущего поколения.
Рисунок 5
Количество слов в текстах британских поэтов, родившихся в период с 1550 по 1949. Количество словоупотреблений 21 000 на период (20 лет). Количество слов варьирует очень сильно.
Ясно, что словарь не может ни пополниться, ни сократиться на процент больший, чем 100. И если существующая тенденция сохранится, поэты, которым предстоит родиться через сто лет от сегодняшнего момента, превысят возможную скорость обновления словаря. Тогда скорость обновления словаря должна уменьшаться, начиная с какого-то момента критического приближения к 100% потолку. Если эволюция словаря существует с целью повышения потенциала возбуждения, тогда обратная тенденция приведет к его падению. Система, основой которой является стремление к новому, не может существовать без постоянных перемен. В поэзии уменьшение потенциала возбуждения равнозначно фиаско. Для компенсации этого падения, поэт должен прибегнуть к более глубокому первичному познанию, пока и оно, в свою очередь, не исчерпает своего потенциала. Другой стратегией было бы увеличение общего количества слов в поэтическом лексиконе, но и у этого есть естественный предел – количество словоупотреблений. В случае, когда количество слов и словоупотреблений равны, ни одно слово в тексте не может повториться. Такой текст не будет читаем, так как он будет лишен связующих элементов – служебных слов. Но конечно, «читаемость» текста не является первичной задачей поэта.
Рисунок 6
Доля слов, появившихся в британском поэтическом лексиконе в каждый из 20-летних периодов. Пополнение словаря поэтов идет с ускорением, как и видно из наиболее удачной линии тренда.
Решение всех этих проблем я позволю себе оставить поэтам будущего, а сейчас вернемся к поэтам прошлого. Несмотря на то, что скорость обновления словаря совершенно очевидно растет во времени, точки не ложатся на одну прямую. Возможно, эти отклонения от линии тренда и связаны со стилистическими изменениями. Индикаторами этих изменений как раз могут служить, если верить теории Майлз, набор или уменьшение словаря. Доля новых слов и доля удаленных из словаря слов вместе дают нам индекс стилистической перемены. На рис. 9 стилистические изменения и изменения количества первичного содержания приведены к виду, который позволил бы сопоставить их друг с другом. Индекс перемены стиля ведет себя именно так, как мы и прогнозировали: он имеет тенденцию к росту в периоды спада первичного содержания и наоборот.
Рисунок 7
Доля слов в словаре британских поэтов, сохранившихся от предыдущего периода. Как и видно из графика, с течением времени, все меньше и меньше слов сохраняется каждым последующим поколением поэтов.
Перемена стиля и первичное содержание не могут быть абсолютно зеркальными отражениями друг друга в силу того, что инструментарий их измерения несовершенен. Но давайте взглянем на то, какую информацию мы можем извлечь из данного графика. Обе величины растут во времени, теоретическим обоснованием чего может быть сопротивление габитуации[5]. Колебания вокруг этого восходящего тренда находятся не в фазе, так как поэты склоняются к использованию то одного, то другого метода повышения потенциала возбуждения. Однако не существует и железного правила относительно того, что поэт, активно обновляющий свой словарь, не может при этом погрузиться в первичное познание, когда дело касается комбинирования слов друг с другом. Но существует тенденция к тому, чтобы это не становилось системой.
Рисунок 8
Доля слов, выбывших из поэтического лексикона в каждом из 20-летних отрезков: т.е. те слова которые использовались в предыдущем периоде, но не использовались в последующем. Процесс также идет с ускорением.
Как только обновление лексикона становится значительным по своему масштабу, скорость появления новых слов и исчезновения старых замедляется и поэт сосредотачивается на комбинаторных возможностях появившегося в его распоряжении материала. С ростом сложности поиска новых сочетаний, растет и степень погружения поэта в первичное, доконцептуальное мышление, позволяющее «открыть» эти сочетания. Если бы поэты находились в идеальных интеллектуальных условиях, не находились бы под воздействием случайных факторов, колебаний первичного содержания и перемен стиля не существовало бы, так как поэты могли бы просчитать необходимое количество слов, требующихся для введения или удаления из словаря для увеличения потенциала возбуждения без излишнего привлечения первичного мышления. Но это вряд ли возможно, так как в итоге скорость обновления словаря должна была бы стать слишком высокой. Мы же можем проверить, указывают ли наши данные на наличие фактора, ограничивающего стилистические колебания.
Рисунок 9
Индекс стилистических изменений (основанный на доле вошедших и выбывших из словаря лексем), а также первичное содержание в двадцати последовательных отрезках протяженности в 20 лет с 1550 по 1949 г. Индекс стилистических перемен растет в моменты падения первичного содержания и наоборот.
Данные подтверждают предположение о том, что потенциал возбуждения возрастает при обоюдном влиянии первичного мышления и стилистических колебаний. Уравнение
AP = 0,58 PC + 0,25 SC
(где AP – потенциал возбуждения, PC – первичное мышление, SC – стилистическое изменение
объясняет 88% вариации потенциала возбуждения (мерой которого является общий индекс вариативности) на протяжении рассматриваемых периодов. На самом деле, если в уравнение добавить и долю слов, появляющихся в каждый период (А%), то оно объяснит 95% вариации потенциала возбуждения.
АР = 0,64РС + 0,49А%
Хотя удаление слов из лексикона, безусловно, имело влияние на современную аудиторию, метода объективного измерения этого влияния не существует.
Если причиной изменения значений потенциала возбуждения являются первичное мышление и стилистические колебания, то что же провоцирует изменения в них самих? Теоретически их изменения обусловлены габитуацией и их взаимным влиянием. Мы можем постараться предсказать значения первичного содержания в конкретный период времени на основании значений в более ранние периоды, а также на основе значений стилистической вариации в данный и предшествующие периоды. Наилучшее уравнение изо всех полученных вариантов, дающее наиболее статистически значимые прогнозы, следующее:
PCt = 12,81 + 0,51t –0,55SCt–1 –0,52PC t–1 –0,56PCt-2.
Это уравнение объясняет 91% вариации первичного содержания. В словах это выражается в утверждении того, что оно линейно возрастает и уменьшается как функция от стилистической вариации в предшествующий период и от первичного содержания за два периода до рассматриваемого.
Наилучшее уравнение для стилистической вариации, объясняющее 94% дисперсии следующее:
SCt = – 1,027 + 0,0094e0,0175t + 0,57SC t–1 –0,50PCt-2.
Первые два члена уравнения просто означают экспоненциальное возрастание значения. Третий член показывает, что если значение стилистической вариации в предыдущий период было большим, оно продолжит рост и в текущем периоде. Однако этот процесс контролируется четвертым членом, который показывает, что рост значений на протяжении двух периодов сдерживает дальнейшее возрастание стилистической вариации. Таким образом, с началом нового стиля его рост может продолжаться два периода, но не более того.
Так как полученные уравнения объясняют практически полностью вариацию потенциала возбуждения, смены стиля и первичного содержания, высока вероятность осцилляций в двух последних переменных, что вообще характерно для уравнений такого рода. Уравнение первичного содержания имеет ряд членов с отрицательной обратной связью: если оно было высоким в предыдущие периоды, оно понижается в текущем; если держалось низким, то современники пытаются его повысить. Это очень похоже на термостат. Из-за физических свойств процесса вместо сохранения постоянной желаемой температуры, мы имеем ее регулярное повышение (пока нагревательный элемент работает) и понижение, после того как термостат отключает нагревательный элемент по достижении критической точки. До-концептуальный контент также контролируется состоянием стиля в предшествующий период: в случае высоких значений последнего, первый испытывает падение значений и наоборот. С другой стороны, из уравнений не следует, что первичное содержание каким-либо образом контролирует смену стиля. Первичное содержание отрицательно коррелирует со сменой стиля в данный и предшествующий периоды. Однако, эти корреляции малоинформативны.
Полученные уравнения хорошо описывают имеющиеся данные. Теперь задумаемся, насколько точно мог бы ученый, имевший эти уравнения в 1650 г. предсказать будущее развитие британской поэзии. Имея значения по первичному содержанию и стилистическим изменениям по периодам 15 (1570-89) и 16 (1590-1609), и подставив их в имеющиеся уравнения, наш воображаемый исследователь получил бы данные для периода 17, подставив уравнение снова – получил бы данные для периода 18, и так далее. Несмотря на то, что прогнозы этого ученого были бы неидеальными, тем не менее, он увидел бы, что первичное содержание будет вести себя как периодический процесс с длиной цикла в 3-4 периода. Даже если бы он вводил исходные данные совершенно наобум, характер периодичности остался бы таким же. Я сам попробовал эту процедуру, используя совершенно случайные параметры. В результате я получал нерегулярную периодичность, накладывающуюся на восходящий тренд.
Экспоненциальный член уравнения описывающего стилистические изменения – 0,0094e0,175t – указывает на то, что в какой-то момент показатель устремится к бесконечности. Как я и говорил выше, со временем это приведет к такому абсурдному прогнозу, что поэты будут вводить в лексикон и выводить из него более, чем 100% слов. Причем, как показывают данные, случится это примерно в настоящее время. Значения, определяемые уравнением для индекса стилистических изменений адекватны до 34-го периода, т.е. для 1950-69 г. Затем значения становятся слишком высоки, что ведет к слишком низкому количеству первичного содержания. Все это означает, что скорость обновления поэтического лексикона должна вот-вот сильно уменьшиться и эта точка где-то совсем рядом.
Примечания
- “Dark, satanic mills” – цитата из стихотворения У. Блейка «Иерусалим» в переводе С. Маршака
- Более ранние периоды представлены только двумя поэтами на период.
- Термин Д.Берлайна, определяющий предпочтительность стимула на основе его структурных, содержательных и психофизическихсвойст свойств. Низкий потенциал возбуждения вызывает равнодушное отношение к стимулу, средние и умеренно высокие значения – максимальный интерес, слишком высокие – раздражение. Этот концепт является основой эволюционной теории Мартиндейла – потенциал возбуждения в ходе развития искусства должен возрастать.
- Первичное (primordial) мышление, антипод концептуального (conceptual), задействует познавательные стратегии, более свойственные правому полушарию; позволяет художнику находить все более непредсказуемые сочетания привычных элементов. Мартиндейл проанализировал все теории появления новых идей, все они устанавливают две стадии этого процесса – первичное, раскрепощенное состояние сознания, способствующее сближению отдаленных понятий, и вторичная, концептуализирующая стадия, в рамках которой новая идея обретает способность быть описанной и сформулированной.
- Габитуация – общее свойство нервной системы, подразумевающее неизбежную потерю интереса к повторяющемуся стимулу (прим. пер).
Список литературы
- Gottman J. M. Time Series Analysis: a Comprehensive Introduction for Social Scientists. Cambridge1981.
- Haugh L.D. Checking the Independence of Two Covariance Stationary Time Series: a Univariate Residual Cross-correlation Approach // Journal of the American Statistical Association . 1976. 71: 378-85.
- Herdan G The Advanced Theory of Language as Choice and Chance. New York, 1971.
- Miles J. Eras and Modes in English Poetry. Berkeley, 1964.
- Oxford anthology of English verse. Chambers, 1932.
- Reitlinger G. The Economics of Taste: the Rise and Fall of the Picture Market, 1760-1960. New York, 1961.
- Simonton D.K. Genius, Creativity and Leadership: Historiometric Inquiries. Cambridge, 1984.