Феномен "мир тесен" действует в технологических сетях
Итак, мы продолжаем рассказ о теории "тесных миров", который получил свое начало в статье "Занимательная наука: Правда ли, что "мир тесен"?". В рамках новой статьи Роман Горбенко приводит некоторые доказательства того, что феномен "мир тесен" действует в социальных, биологических и технологических сетях.
В первой же статье мы упомянули ученых Колумбийского университета, через 30 лет попытавшихся этот эксперимент повторить, но на этот раз уже с использованием электронной почты. Отдельно мы рассказывали и о трудностях, с которыми столкнулись организаторы.
Так, в отличие от Милграма, ученым удалось решить проблему глобальности. И действительно, созданный проект интернационален. Страницы сайта переведены на десятки языков, адресаты, к которым отсылаются письма, тоже разбросаны по всему миру. Но, на самом деле, у этого эксперимента есть одна, но очень большая проблема. Обычным пользователям приходится ежедневно выкачивать десятки спам-писем и большинство людей, которые получат письмо-эксперимент с просьбой где-то зарегистрироваться и куда-то что-то отослать, просто не смогут понятьзначимости такого поступка. Это письмо примут за очередное "письмо счастья" и, недолго думая, отправят в корзину. Если ко всему этому добавить, что для успешной доставки послания используется не одно звено, то представьте, что если в цепочке попадается хоть один "не разобравшийся", то идет насмарку работа всех предыдущих людей. Становится понятным, почему до сих пор не обнародованы даже какие-либо предварительные результаты...
И в самом конце мы постарались заинтриговать читателей информацией о проведении собственного эксперимента в этой области. Обещания, как известно, надо выполнять, и поэтому с удовольствием представляю вторую часть статьи.
Эксперимент
Итак, наш эксперимент заключается в том, чтобы использовать для статистической обработки сообщество LiveJournal.com (Живой Журнал или ЖЖ). Это уникальный интернет-проект, появившийся относительно недавно. Общая суть его работы заключается в том, что каждому желающему предоставляется возможность вести свой личный дневник. Бесплатность данного сервиса, отсутствие какой-либо рекламы, простота использования, и, по видимому, врожденная для многих потребность постоянно что-то писать привели к тому, что ЖЖ приобрел огромную популярность. На сегодняшний день свои сетевые дневники ведут уже 700 000 (!) зарегистрированных пользователей, представляющих большинство стран мира.
Немаловажную роль в такой популярности проекта сыграло опять же природное желание людей читать чьи-то записи, имеющие личный характер, а также предоставляемая сервисом возможность добавлять комментарии к этим записям, находить новых друзей и много-много чего еще.
Именно существование в ЖЖ такого понятия, как "friends" и механизмов, которые эту "дружбу" обеспечивают, и сделали этот эксперимент возможным. Поэтому давайте рассмотрим его чуть подробнее. Итак, например, в список своих "друзей" можно занести других пользователей ЖЖ, записи которых читать вам интересно, которые близки вам по духу, либо интересны вам по каким то другим критериям. Для удобства все записи ваших friends помещаются в специально формирующуюся ленту (http://www.livejournal.com/users/имя_пользователя/friends). И теперь, чтобы прочитать новые записи друзей, уже не надо открывать все их журналы. Механизм дружбы является основой философии Живого Журнала, а пользователи, которые не добавили хотя бы одного человека в свои "друзья" встречаются крайне редко. Зато очень часто так бывает, что горячее обсуждение какой-то темы начинается на страницах Живого Журнала, а потом уже продолжается в реальной жизни за чашечкой кофе в каком-нибудь кафе. То есть многие знакомства, завязанные в Живом Журнале, продолжаются уже в реальной жизни и наоборот.
Опять же, необходимая техническая деталь - на одной из страниц отображается вся персональная информация данного пользователя. То есть, если при регистрации были корректно заполнены соответствующие поля, на странице будут собраны имя, e-mail, icq, род занятий, дата рождения, сфера интересов и так далее. Наиболее важно в нашем случае то, что здесь также присутствуют поля Friends, и Friends of. В поле Friends будут отображаться те пользователи, которых пользователь добавил в свои "друзья", а в поле Friends of, будут, соответственно отображаться, те, кто добавил пользователя в свои "friends".
Конечно, этот затянувшийся экскурс никак не претендует на полноту и предназначен он лишь для того, чтобы лучше понять суть эксперимента. Очевидно, что Живой Журнал с определенной и довольно высокой точностью моделирует социальные связи в обществе. Но в отличие от нашего реального мира, ЖЖ находиться в форме, которая очень и очень удобна для быстрой статистической обработки. Технически при помощи вычислительной техники очень легко за очень малое время обрабатывать сотни и тысячи страниц, при этом анализируя количественные и качественные характеристики friends-связей между пользователями.
Итак, нам нужно определить среднюю длину цепочки из знакомых, связывающую двух случайно выбранных жителей Земли. Как мы уже указывали, Милграм для этого пытался отследить движение бумажных писем, а ученые из Колумбийского университета — движение писем электронных.
Мы же в своем эксперименте просто делаем выборку 2-х случайных пользователей сервиса LiveJournal.com. Затем наша программа заходит на страницу с персональными данными случайного пользователя.
Рисунок 1
Теперь внимательно посмотрите на рис. 1, где изображена некоторая вымышленная выборка пользователей Живого Журнала. Эту выборку мы представили в виде графа. Здесь вершины, изображенные кружочком, - это пользователи. Ребра, то есть соединяющие линии - это friends-связи между пользователями. Как видно, от пользователя igor до пользователя vlad - эти кружки выделены красным цветом - можно добраться несколькими способами. Нас же интересует среднее значение количества вершин, через которые по friends-связям можно добраться от вершины igor до вершины vlad.
Все достаточно просто - именно построением такого графа и занимается наша программа. Она переходит по ссылкам с одной страницы пользователя на другую до тех пор, пока не дойдет до страницы 2-го выбранного нами случайного пользователя. Далее, благодаря построенному графу, программа вычисляет среднюю длину цепочки, связывающую этих двух пользователей. Для того чтобы заработал закон больших чисел, "прогоняем" через программу 700 пар случайно выбранных пользователей и получаем результат. С достаточно большой вероятностью, по крайней мере, на порядок большей, чем в эксперименте Стэнли Милграма, можно сказать, что двух случайных жителей связывает цепочка, состоящая в среднем из 7 знакомых.
Рисунок 2
В ходе наших изысканий мы также выявили несколько довольно любопытных фактов. Вот, например, посмотрите на рисунок 2. Здесь, конечно же, упрощенно, представлены несколько объектов. А - это сообщество Livejournal.com. Красные, синие и черные точки - это пользователи ЖЖ, а соединяющие их линии, как вы уже, наверное, догадались, — friends-взаимоотношения между ними. Теперь представьте себе появление нового пользователя. Как только он начинает вести свой сетевой дневник, добавлять других пользователей в свои "друзья", то с большой вероятностью тут же будет соотнесен к одной из общностей.
Термином общность, на нашем рисунке мы их обвели и пометили цифрами 1, 2 и 3, мы решили называть вершины, сгруппировавшиеся в графе по каким-либо причинам. Например, если взять Живой Журнал, то, скажем, можно выделить общность русскоязычных пользователей и другие общности.
Когда мы провели точно такой же эксперимент, взяв 2-х случайных пользователей и найдя среднее значение связывающей их цепочки, то обнаружили интересный факт. Получается, что средняя длина цепочки в таком случае даже на порядок меньше. Ее длина составляет всего-навсего - три пользователя.
То есть мы хотим сказать, что одного произвольным образом выбранного человека с другим человеком связывает цепочка знакомых со средней длиной в 7 человек. Но в то же время, если, например, взять общность, образованную учеными-генетиками, а затем выбрать из нее случайным образом двух ученных, возможно и живущих на разных концах света, то окажется, что этих двух ученых будет соединять цепочка знакомых со средней длиной всего в 3 человека.
Заметим, пока мы рассматривали и исследовали некоторые интересные проявления теории "тесного мира" только лишь в социальных сетях. Причем термины "сеть" и "граф" в нашем случае являются синонимами. Когда мы говорили о графе пользователей сообщества LiveJournal.com, и графе жителей Земли, мы говорили о примерах социальных сетей.
Теперь обратимся к работе двух американских ученых-математиков Стивена Штрогатца и Дункана Уотса (Watts D. J. and Strogatz S. H. (1998) Collective Dynamics in "small-world" networks). В этой основополагающей книге они не только впервые ввели в математику такое понятие, как "тесный мир" (small-words или SW), но и доказали существование этого эффекта в социальных, биологических и технологических сетях. Именно это доказательство, в принципе, и дает нам право интерпретировать результаты нашего эксперимента более глобально. Можно сделать следующее предположение - чтобы перейти с одного, случайным образом выбранного сайта, на другой, передвигаясь при этом по ссылкам, мы в среднем пройдем цепочку из 7 сайтов. Однако если они, то есть сайты, находятся в одной общности, скажем, расположены в домене *.edu, то средняя длина этой цепочки сократиться до трех сайтов. И таких примеров можно привести сотни, начиная от движения пакетов данных в интернете и заканчивая движением вирусных болезней.
Как уже было неоднократно сказано, это — абсолютно новая тема, и надеемся, что своим исследованием мы внесли хоть какую-то лепту в ее изучение. И, конечно же, попытаемся донести результаты нашего эксперимента до как можно большего количества ученых, работающих в этой области.
Еженедельные обозрения на CNews.ru Редакция готова рассмотреть к публикации материалы (статьи, описания систем/продуктов/услуг), подготовленные специалистами вашей компании, для публикации в следующих обозрениях:
Ждем Ваши предложения и заявки по этому адресу. |
Короткая ссылка на материал: //cnews.ru/link/a383