Стратегия игр и человеческое общество
Стратегия игр в человеческом обществe.
В этой статье мы рассмотрим различные стратегии поведения, отдельных людей при которых человеческое общество в целом приобретает устойчивую стратегию развития. Стратегия “Устойчивого Развития”, - это такая стратегия, которая принимается большинством членов данного общества, и не может быть превзойдена по эффективности никакой альтернативной стратегией.
Любое человеческое общество состоит из отдельных людей, каждый из которых пытается максимизировать свой личный успех. При этом Стратегия “Устойчивого Развития” общества, не может быть улучшена ни одним отклоняющимся от нее человеком.
Конечно, в случае какого-либо крупного изменения в окружающем нас мире, может возникнуть короткий период нестабильности и колебаний численности и материального благополучия человеческого общества. Но Стратегия “Устойчивого Развития” будет сохранятся, потому что любое отклонение от нее будет наказываться поражением, через отбор, происходящий внутри человеческого общества.
Настоящая работа, которую представляет Дана Жол, основана на материалах Д. Прайса и Д. Паркера, Мэйнарда Смита, У. Гамильтона, Р. Докинза и Р. Мак-Артура.
Часть первая. “Кентавры” и “Вервoлфы”.
Представим, что человеческое общество состоит только из двух видов людей. Первый вид людей, это люди-волки, или "Bервoлфы". Их стратегия, всегда направлена на расширение своей территории, на захват чужой собственности, на подчинение других людей, на установление силой своих правил поведения. То есть это альфа-самцы, которые постоянно ведут бои за место главного в стае. Такие люди, всегда дерутся и воюют, с приложением максимального количества сил, и отступают только при серьезных ранениях.
Второй вид людей, - это люди-кони, или "Kентавры". Их стратегия состоит, в попытке ужиться с другими на одной территории, по возможности сглаживать наступающие конфликты, и никогда не вступать в смертельную схватку. Такие люди, при возникновении конфликта, ограничиваются угрозами, но никогда не наносят своему противнику никаких повреждений.
Эти два вида людей, ничем не отличаются друг от друга по внешнему виду. Различия между ними проявляются только в их стратегии поведения, и следовательно становятся очевидными только при столкновении.
Когда "Bервoлф", сталкивается с "Kентавром", то он всегда побеждает, потому что "Kентавр" не вступает в сражение, а просто отступает оставаясь невредимым. Если же "Bервoлф", сталкивается в жизни с другим "Bервoлфом", то драка между ними идет пока один из них не получить серьезную рану или не погибнет. При столкновении "Kентавра" с "Kентавром", никто из них не получает ни каких повреждений, так как они только пугают друг друга, но до реальной драки дело никогда не доходит. В конце концов, кто-то из них либо устает, либо решает, что не стоит продолжать противостояние и улаживает конфликтную ситуацию.
Как мы сказали, в процессе жизни, ни один из этих видов людей не может заранее знать, с кем ему предстоит столкнуться, с "Bервoлфом" или "Kентавром". Это можно понять только в процессе драки.
Под дракой, или конфликтом, мы понимаем столкновения за разного рода ресурсы, имеющиеся в человеческом обществе. В каждом обществе между людьми, возникают конфликты за обладание землей, деньгами, заводами, рынками сбыта и т.п.
При возникновении таких конфликтов, кто-то выигрывает, а кто-то проигрывает. Поэтому, произвольно установим условную бальную систему, оценивающую происходящие столкновения в человеческом обществе.
В случае захвата одним человеком какого-либо ресурса, мы условно будем давать такому победителю 50 очков. Если человек, при возникновении конфликта, сразу же отступает и не сражаться за какой-либо ресурс с другим, мы условно даем ему 0 очков. Человек также, может вступить в драку за какой-то ресурс и проиграть понеся серьезные потери. Здесь мы будем начислять ему -100 очков. За само участие в конфликте, за вступление в конфлкт - вне зависимости от победы, поражения или отступления, мы будем начислять -10 очков. Это своего рода штраф за то, что человек впустую потратил свое время на противостояние и битву за какой-либо ресурс, вместо того, чтобы направить свою энергии за созидание чего-то нового.
В итоге, человек получивший больше очков, становиться примером для всех остальных. И следовательно все остальные начинают применять его выигрышную стратегию. Условно говоря он передает свой "ген поведения" всем остальным людям.
Надо подчеркнуть, что нас не интересует, смогут ли "Bервoлфы" в битве победить "Kентавров". Мы уже знаем, что "Bервoлфы" всегда побеждают "Kентавров". Нам необходимо понять какая из стратегий, - "Bервoлфов" или "Kентавров", - является Стратегией “Устойчивого развития” человеческого общества.
Начнем с ситуации, в которой наше общество целиком состоит из "Kентавров". В таком обществе, не будет пострадавших в драках. Состязания среди людей, представляют собой длительные ритуальные турниры, что-то вроде игры в «гляделки», которые заканчиваются только тогда, когда один из противников отступает. Победитель получает 50 очков. Но в месте с этим, победитель, платит штраф, равный –10, за потерю производительного времени. В конечном счете, выигрыш победителя составит 40 очков. Побежденный тоже платит штраф (–10) за потерянное время. По теории вероятности, каждый "Kентавр", победит в половине сражений, а в другой половине проиграет. Таким образом, средний выигрыш “Kентавра” за один турнир равен среднему между +40 и –10, то есть +15. Эти цифры показывают, что общество состоящее только из "Kентавров", существует вполне благополучно.
Затем предположим, что один из людей живущих в обществе "Kентавров", решает начать применять стратегию "Bервoлфа". Поскольку, он единственный "Bервoлф" в этом обществе, во всех сражениях за ресурсы он будет сталкиваться только с "Kентаврами". Так как "Bервoлфы", всегда побеждают "Kентавров", то он будет получать 50 очков за каждое сражение. Средний выигрыш "Bервoлфа" составит 50 очков, и он будет обладать огромным преимуществом над "Kентаврами", у которых средний бал составляет 15 очков.
Видя эту успешную стратегию, остальные "Kентавры", начинают применять стратегию "Bервoлфов". То есть такой "ген поведения" становиться самым распространенным в обществе. Теперь первый человек, который применил стратегию "Bервoлфа", уже не может надеяться, что ему придется сталкиваться только с постоянно проигрывающими "Kентаврами". Скоро наступает момент, когда все общество начинает применять стратегию "Bервoлфа", и теперь все битвы идут только между "Bервoлфами". Исторической параллелью этого может служить наше общество, где до 1991 все применяли стратегию "Кентавра", а с началом 90-х, появились рэкетиры и пошло резкое преобладание стратегии "Верволфа".
В рассматриваемом нами обществе, положение вещей резко изменилось, потому что теперь большинство применяет стратегию "Верволфа". При драке "Bервoлфа" с "Bервoлфом", один из них получает сильные повреждения, оцениваемые как –100, тогда как выигрыш победителя составляет +50. По теории вероятности, каждый "Bервoлф" в обществе "вервoлфов", может рассчитывать выиграть половину сражений, и половину проиграть. Поэтому его средний бал за битву составляет –25 (средняя между +50 и –100).
Предположим, что в этом обществе "вервoлфов", остался только один человек, применяющий стратегию "Kентавра". Конечно, он оказывается побежденным во всех битвах, но при этом остаётся невредимым. Его средний выигрыш в обществе "вервулфов" равен 0. Но так как средний выигрыш "Bервoлфа" в обществе "вервoлфов" равен –25, стратегия "Kентавра" оказывается выигрышной. Такую стратегию, - "единственный "Кентавр" в обществе "Верволфов"", всегда применяет еврейская нация, живущая в стране населенной представителями другой нации.
Как мы видим, в обществе "Верволфов", средний выигрыш единственного "Кентавра" оказывается выше. Поэтому "гены кентавра" начинают распространиться среди людей. Это может создать впечатление, что в обществе непрерывно происходят колебания. Сначала "гены вервoлфа" достигают превосходства, затем, вследствие преобладания "вервoлфов" в обществе, преимущество получает стратегия "Kентавра", которая распространяется до тех пор, пока стратегия "Bервoлфа" опять не начнет процветать, и так далее. На самом деле, колебаний не существует, потому что между "Bервoлфами" и "Kентаврами", существует стабильное соотношение. Для примененной нами условной системы очков, стабильное соотношение между "Bервoлфами" и "Kентаврами" составляет 7/12 к 5/12. При достижении этого соотношения средний выигрыш "Bервoлфа" точно равен среднему выигрышу "Kентавра". Поэтому естественный отбор, происходящий в человеческом обществе, не оказывает предпочтения ни тем, ни другим.
Если число "Bервoлфов" в обществе начнет возрастать, и их доля превысит 7/12, тогда у "Kентавров" возникает дополнительное преимущество, и соотношение быстро вернется к стабильному состоянию. Стабильное соотношение в данном гипотетическом человеческом обществе составляет 7 "Bервулфов" на 5 "Kентавров". Даже если имеются колебания вблизи стабильной точки, то они не будут слишком сильными.
Это и сложившееся стабильное соотношение, и есть Стратегия “Устойчивого развития общества”. Она в чем-то напоминает Стратегию (теорию) “группового отбора”, но между ними, есть и существенное различие.
Различие заключается в том, что в таком стабильном обществе, состоящем на 7/12 из "Bервoлфов" и на 5/12 из "Kентавров", средний выигрыш для любого человека, в не зависимости от используемой им стратегии выживания (“Kентавра” или “Bервoлфа”), составляет 6,25 очков. Это гораздо меньше среднего выигрыша "Kентавра", живущего в обществе, состоящем только из "Kентавров", который равен 15 очкам.
Стратегия (теория) "группового отбора" тут же начнет диктовать, чтобы люди заключили между собой договор, и все стали бы использовать стратегию "Kентавра", которая гарантирует более высокий уровень жизни каждому человеку. Ведь действительно, в обществе, где подавлена агрессия и нет серьезных конфликтов, энергия людей используется только на созидание, а не на разрушение и отъем ресурсов у других. Поэтому, такое общество, использующее Стратегию "группового отбора", а значит состоящее только из "Kентавров", может достигнуть гораздо большего успеха, чем другое, соперничающие с ним общество, использующее конкурирующую с ним Стратегию "Устойчивого развития", а значит состоящее как из "Kентавров", так и из "Bервoлфов". То есть, Стратегия "группового отбора" должна побеждать Стратегию "устойчивого развития". На деле же все обстоит совсем наоборот.
Происходит это потому, что все соглашения между людьми, направленные для блага всех, не защищены от злоупотреблений. Ведь, оказаться единственным человеков, использующим стратегию "Bервoлфа", в обществе, состоящем только из "Kентавров", настолько великолепно, что появление "Bервoлфов" не возможно остановить ничем. Таким образом, договор между людьми, будет нарушен в результате измены в собственных рядах. Именно поэтому Стратегия “устойчивого развития” выигрывает у Стратегии “группового отбора”. Стратегия “устойчивого развития”, стабильна не потому, что она хороша для участвующих в ней людей, а просто потому, что она гарантирует от измены в собственных рядах.
Современные понятия мультикультуризма и толерантности, представляют собой стратегию "кентавра", в попытке заключить соглашение между людьми о не применении стратегии "вервoлфа" в человеческом обществе . То есть европейские политики-"кентавры", пытаются заставить "вервoлфов" есть травку.
В итоге, мы видим провал, такой политики, - потому что обществo где преобладают "кентавры", всегда привлекает "вервoлфов". И наоборот, - провалы в экономическом и общественном развитии многих стран Африки и Северного Кавказа, объясняются подавляющим применением стратегии "вервoлфа". То есть люди тратят свою энергии на постоянную борьбу между собой, и у них не остается времени и сил на создание чего-то нового. США до последнего времени, придерживались Стратегии "Устойчивого развития", но и в этой стране, уже начинает наблюдаться тенденция увеличения людей применяющих стратегию "кентавра".
Следовательно, обществу для стабильного и устойчивого развития, необходим смешанный тип. Если произойдет преобладание "вервoлфов", то общество не будет вылазить из конфликтов. Если общество, как Европейские страны, будет состоять только из "кентавров", и подавит появление собственных "вервoлфов", тогда "вервoлфы", придут из вне и захватят это общество.
Для Казахстана же, это означает создание собственной идеологии, собственного центра принятия решений, жесткой защиты собственного сознания и национальных интересов.
Часть вторая. Добро с кулаками.
Теперь, рассмотрим человеческое общество состоящее из пяти видов людей. Два вида, это уже знакомые нам "Кентавры" и "Верволфы". Третий вид, мы условно назовем "Защитник".
Этот третий вид людей, в начале каждого столкновения с другими людьми за ресурсы, действует как чистый "Кентавр". То есть он не предпринимает решительной и яростной атаки, не усиливает натиск при столкновении, как это делает "Верволф". Он просто ограничивается угрожающими позами, и пытается избежать конфликта и уладить дело миром, как это делает "Кентавр". Но как только "Верволф", нападает на него, этот третий тип людей, не убегает, как чистый "Кентавр", а сразу же вступает в драку. И в сражении, он бьется до конца, пока либо не уничтожит "Верволфа", либо пока не будет уничтожен сам.
То есть, если на "Защитника" нападает "Верволф", то он начинает вести себя как "Верволф", а при встрече с "Кентавром", "Защитник" ведет себя как "Кентавр". Когда "Защитник" встречается с человеком, тоже использующим стратегию "Защитника", они оба ведут себя по отношению к друг другу, как "Кентавры". Этот третий тип людей, который мы назвали "Защитник", является условным стратегом, и его поведение зависит от поведения соперника.
Четвертый тип, тоже является условным стратегом, мы назовем его "Перевертыш". Он ходит вокруг, выступая в роли "Верволфа", и задирает всех, пока кто-нибудь не даст ему сдачи, после чего он немедленно удирает.
Есть ещё один условный стратег, относящийся к пятому типу людей. Он применяет смесь стратегии "Верволфа" и "Кентавра". Мы назовем такого человека "Полукровка". В принципе, он сходен с "Защитником", но иногда в порядке эксперимента предпринимает попытку наращивания конфликта. Если его противник не оказывает сопротивления, то "Полукровка" продолжает вести себя как "Верволф", но получив отпор, он переходит только на традиционные угрозы, характерные для "Кентавра". Если же, на него нападают, он реагирует как обычный "Защитник".
Для проверки, какая из стратегий поведения людей, является наиболее стабильной и устойчивой, мы смоделируем в компьютерной программе, общество состоящее из всех этих пяти типов. А затем посмотрим, как их разные стратегиями поведения, помогут им выжить в этом обществе. После того, как мы «натравили» их друг на друга, выяснилось следующее.
Стратегия "Полукровки" почти стабильна. Стратегия "Кентавра" нестабильна, потому что такое общество, состоящее только из "Кентавров", наводнили бы "Верволфы" и "Перевертыши". Стратегия "Верволфа" нестабильна, потому что они бы перебили друг друга, и общество, состоящее из "Верволфов", наводнили бы "Кентавры" и "Перевертыши". Стратегия "Перевертышей" нестабильна, потому что их общество захватили бы настоящие "Верволфы". В итоге, оказалось, что только стратегия "Защитника", является стабильной стратегией развития человеческого общества.
Общество, состоящее только из "Защитников", не смогут захватить люди использующие другие стратегии. Потому что, ни одна другая стратегия не может быть более эффективной, чем стратегия "Защитника". Однако "Кентавр" действует столь же эффективно в обществе "Защитников", как и они сами . Это означает, что при прочих равных условиях число "Кентавров" могло бы медленно возрастать. Но когда численность "Кентавров" достигает сколько-нибудь значительного уровня, это создает благоприятную среду для появления, людей использующих стратегии "Полукровки", "Перевертыша", и "Верволфа". Которые сразу же начинают приобретать преимущество, поскольку они лучше справляются с "Кентаврами", чем "Защитники".
Следовательно для стабильного развития, необходимо подавлять агрессию внутри человеческого общества, не растрачивать энергию на внутрирупповое противостояние, а направлять ее на созидание чего-то нового и полезного для всех. И только, когда на общество происходит нападение, необходимо не вступая ни в какие переговоры с агрессором, давать жесткий отпор.
Часть третья. "Наивные Хлеборобы " VS "Пиявки".
Наше следующее человеческое общество будет состоять из "Наивных Хлеборобов" и "Пиявок".
"Наивные Хлеборобы", - производят продукцию, строят, транспортируют и продают все материальные товары и услуги имеющиеся в обществе. Это люди, которые используют стратегию создания материального достатка собственным трудом. Они постоянно делятся результатами своего труда со всеми людьми, населяющими общество.
"Пиявки", - сами ничего не создают, но постоянно пользуются результатами труда "Наивных Хлеборобов". То есть эти люди используют стратегию бесплатного получения благ. "Пиявки" сами никогда не оказывают равноценные услуги никому, даже тем, кто раньше оказал им какую-либо услугу.
Теперь, представим общество, состоящего только их "Наивных Хлеборобов". Все члены этого общества всегда помогают друг другу оказывая различные услуги, либо давая разные товары. И если в какой-то момент, у одного из "xлеборобов" вышел не удачный год, он может получить помощь от других "Наивных Хлеборобов". Поэтому, в таком обществе нет голодных, и в целом оно процветает. Средний выигрыш "xлеборобa", живущего в обществе "Наивных Хлеборобов", положительный.
Допустим, что через некоторое время, в этом обществе, появился один человек, использующий стратегию "Пиявки". Являясь единственным человеком, использующим стратегию "пиявки" в обществе "Наивных Хлеборобов", он будет получать помощь от каждого "xлеборобa", а сам никогда не будет за это расплачиваться. Следовательно, его средний выигрыш, будет намного превосходить средний выигрыш "Наивного Хлеборобa". После чего, его "ген" станет распространяться в обществе "Наивных Хлеборобов". Потому что, все будут видеть преимущество стратегии "пиявки" над стратегией "Наивного Хлеборобa".
К какому-то определенному моменту времени, это общество будет состоять уже на 50% из "Пиявок" и на 50% из "Наивных Хлеборобов". Средний выигрыш как для тех, так и для других будет ниже, чем для каждого отдельного человека, в обществе, состоящем только из "Наивных Хлеборобов". Потому что, вместо 100 "xлеборобов", теперь работают только 50. Поэтому, общее количество товаров и услуг, производимых и потребляемых обществом падает на половину. Но "Пиявки", все равно будут находятся в лучшем положении, чем "Наивные Хлеборобы", так как они извлекают все существующие в этом обществе выгоды, (какими бы они ни были), и при этом ничем за это не расплачиваясь.
Когда доля "Пиявок" достигнет 90%, средний выигрыш для всех людей живущих в этом обществе станет очень низким. Многие люди, использующие стратегию как "Пиявки", так и "Наивного Хлеборобa" будут погибать от голода. Но "Пиявки" опять-таки окажутся в лучшем положении, чем "xлеборобы". Независимо от соотношения "Наивных Хлеборобов" и "Пиявок" в обществе, последние всегда будут в более выгодном положении.
Исторической параллелью этого, может служить эпоха "военного коммунизма", когда крестьяне производившие хлеб умирали от голода, а не занятая в реальном производстве партноменклатура, не испытывала проблем с продовольствием. В отличие от исторической параллели, в нашем условном примере, мы не рассматриваем принуждение со стороны "Пиявок", и все действия совершаемые "Наивными Хлеборобaми" мы рассматриваем только как добровольные, и сделанные ими без всякого принуждения со стороны "Пиявок".
Период, когда средний выигрыш "Наивных Хлеборобов" превысит выигрыш "Пиявок" не может наступить никогда. Поэтому до тех пор, пока мы рассматриваем только эти две стратегии, ничто не может остановить вымирание и разрушения данного человеческого общества.
В итоге это конкретное человеческое общество вымрет от голода, потому что никто не будет хотеть работать, так как все его члены, предпочтут стратегию "Пиявки".
Следовательно, никогда не помогайте человеку, который ничего не дает вам взамен. Помогая таким людям, вы помогаете распространению гена "Пиявки" в человеческом обществе. Необходимо понимать, - мы всегда получаем то, что длительное время награждаем. Если вы будете постоянно награждать поведение "Пиявки" через постоянное оказание ему помощи, не удивляйтесь, что скоро вас будут окружать только "Пиявки", которые в конце концов вас съедят.
Часть четвертая. "Злопамятный Хлебороб" VS "Пиявки".
Теперь к нашему обществу состоящему из "Наивных Хлеборобов" и "Пиявок", добавим третий вид людей. Эти люди, используют стратегию называемую "Злопамятный Хлебороб". В целом они такие же "Наивные Хлеборобы", которые выбрали стратегию, создания материального достатка собственным трудом. Также как "Наивные Хлеборобы", они помогают незнакомцам и тем людям которые раньше оказали какую-либо услугу им самим. Но в отличие от "Наивных Хлеборобов", если какой-то человек их обманет, они запоминают этот инцидент и затаивают против него злобу, отказываясь в дальнейшем помогать ему едой или другими услугами.
В обществе, состоящем из Злопамятных и Наивных "хлеборобов", невозможно отличить одних от других. Люди, использующие эти две разные стратегии, проявляют альтруизм ко всем остальным и делятся едой и услугами со всеми членами общества.
В обществе, состоящем исключительно из "Пиявок", один "Злопамятный Хлебороб" не добился бы большого успеха. Он затратил бы много энергии, помогая каждому встречающемуся человеку едой и услугами, а взамен не получал бы ничего. Так как ему потребуется большое количество времени, чтобы выработать злопамятность по отношению ко всем. Здесь необходимо понимать, что мы опять не рассматриваем принуждение со стороны "Пиявок", и все действия совершаемые "Злопамятным Хлеборобом" мы рассматриваем только как добровольные, и сделанные ими без всякого принуждения со стороны "Пиявок".
Если же "Злопамятным Хлеборобам" удастся повысить свою численность до некоторого критического уровня, то их шансы встретиться друг с другом станут достаточно высокими, чтобы компенсировать напрасные усилия, затраченные на кормежку "Пиявок". То есть, "Злопамятные Хлеборобы", станут процветать, за счет того, что будут оказывать услуги друг другу. После достижения определенного критического уровня, "Злопамятные Хлеборобы" начнут получать в среднем больший выигрыш, чем "Пиявки", которые со все возрастающей скоростью будут двигаться к вымиранию. Это произойдет, потому что сами "Пиявки" работать не хотят, а "Злопамятные Хлеборобы", отказываются их кормить.
Когда "Пиявки" приблизятся к вымиранию почти вплотную, этот процесс замедлится и они могут довольно долго сохраняться в обществе как меньшинство. Это объясняется тем, что для каждого отдельного редко встречающейся "Пиявки" вероятность дважды столкнуться с одним и тем же "Злопамятным Хлеборобом" очень мала. Поэтому, в этом человеческом обществе, количество "Злопамятных Хлеборобов", затаивших злобу на каждую конкретную "Пиявку", будет небольшим.
Стратегия "Злопамятного Хлебороба" является эволюционно стабильной и успешной, по сравнению со стратегиями "Пиявки" и "Наивного Хлебороба".
Общество, в значительной степени состоящее из "Злопамятных Хлеборобов", не смогут захватить ни "Пиявки" ни "Навные Хлеборобы". Однако стратегия "Пиявки" также эволюционно стабильна, так как общество, в значительной степени состоящее из "Пиявок", не могут захватить ни Наивные ни "Злопамятные Хлеборобы". Конечно, при этом надо понимать, что общество состоящее только из "Пиявок", просуществует крайне не долго и умрет от голода.
Посмотрим какие из людей, использующих эти три разные стратегии победят, если мы представим себе общество состоящее из преобладающего количества "Наивных Хлеборобов", небольшого, чуть выше критического уровня, числа "Злопамятных Хлеборобов" и примерно такого же небольшого количества "Пиявок".
Прежде всего, в таком обществе, наступает крах людей, применяющих стратегию "Наивных Хлеборобов". Это происходит в результате отчаянной эксплуатации со стороны "Пиявок". Численность последних резко возрастает, достигая пика как раз в момент гибели последнего "Наивного Хлебороба". Но "Пиявкам", еще предстоит иметь дело со "Злопамятными Хлеборобами". Во время стремительной гибели "Наивных Хлеборобов", численность "Злопамятных Хлеборобов" медленно снижается под градом ударов со стороны процветающих "Пиявок". Но им все же удается удерживаться на границе исходного уровня. После того, как погибает последний "Наивный Хлебороб", "Пиявки" уже не могут так безнаказанно продолжать свою эгоистичную эксплуатацию.
В этот момент численность "Пиявок", начинает медленно снижаться от голода, потому что работать они не хотят, а жить за счет "Наивных Хлеборобов" уже не могут. "Злопамятные Хлеборобы" наоборот за счет взаимопомощи, начинают медленно повышать свое количество. Повышение численности "Злопамятных Хлеборобов" неуклонно набирает скорость. Ускорение идет круто вверх.
А количество "Пиявок" сокращается, приближаясь к вымиранию. Затем это сокращение несколько замедляется, поскольку "Пиявки" начинают пользоваться преимуществами своей низкой частоты в обществе и связанной с этим относительной свободой от "Злопамятных Хлеборобов", то есть редкими встречами с одним и тем же "Злопамятным Хлеборобом".
Однако медленно и неумолимо "Пиявки" гибнут и "Злопамятные Хлеборобы" остаются единственной силой в человеческом обществе. Парадоксальным образом в начальный период присутствие "Наивных Хлеборобов" фактически было опасным для "Злопамятных Хлеборобов", потому что они обеспечивали временное процветание "Пиявок".
Следовательно, для стабильного развития человеческого общества, необходима помощь друг другу на основе взаимности. И немедленное прекращение помощи людям, использующим стратегию "Пиявки", так как их безудержный рост приводит к гибели всего общества.
Часть пятая. "Парадокс заключенных".
Cамая выигрышная стратегия поведения людей в человеческом обществе, была построена на основе простенькой игры, называвшейся "Парадокс заключенных".
Игра заключается в следующем. В ней участвуют два игрока. На руках у каждого игрока по две карты с надписями "Помогаю" и "Паразитирую". Затем, каждый из игроков выбирает одну из двух своих карт и кладет её на стол рубашкой вверх. Это делается одновременно с другим игроком. То есть ни один из игроков не знает, как пошел другой. Далее игроки переворачивают карты. Выигрыш в игре, зависит не только от собственного хода, но и от хода противника.
Например, вы играете со своим товарищем, так как в игре участвуют 2×2 карты, то имеется только четыре возможных варианта:
Первый Вариант: Вы со своим товарищем оба сыграли "Помогаю". В этом случае, каждый из вас получает награду в 300 долларов. Это называется «Награда за взаимопомощь".
Второй Вариант: Вы со своим товарищем оба сыграли "Паразитирую". В этом случае, каждый из вас получает наказание в 10 долларов. Это называется «Наказание за взаимное паразитирование».
Третий Вариант: Вы сыграли "Помогаю", а ваш товарищ сыграл "Паразитирую". В этом случае, вы получаете наказание в 100 долларов. Это называется «Наказание за наивность». Ваш товарищ получает награду в 500 долларов, которая называется "Награда за наглость".
Четвертый Вариант: Вы сыграли "Паразитирую", а ваш товарищ сыграл "Помогаю". В этом случае, происходит наоборот, - вы получаете награду в 500 долларов, а ваш товарищ получает наказание в 100 долларов.
"Парадоксом заключенных", игра называется потому что была построена на следующей базе. Как-то раз, два человека были арестованы полицией по подозрению в совершении какого-то преступления. Затем обом было сделано предложение оговорить другого в совершении преступления. Следовательно у каждого из них были те же самые четыре варианта. Первый вариант не оговаривать друг друга. В терминах игры это будет означать, что двое положили на стол карту "Помогаю". И оба будут вознаграждены за это, потому что у полиции будет не достаточно оснований, и она отпустит их. Второй вариант, - оба пошли на сделку со следствием и оговорили друг друга. В терминах игры это будет означать, что оба положили на стол карту "Паразитирую". Оба будут наказаны за это, потому что у полиции появились веские основания посадить обоих. Третий вариант, - один из них идет на сделку со следствием и оговаривает другого. В терминах игры, это будет означать, что он сыграл карту "Паразитирую". Другой же не стал оговаривать, что в терминах игры означает сыграл карту "Помогаю". Поэтому, тот кто оговорил другого выходит из тюрьмы, по условиям сделки со следствием. А тот кого оговорили надолго садиться в тюрьму. Мы получаем "Награду за наглость" и "Наказание за наивность" соответственно.
А сам "парадокс", заключается в следующем. У игроков имеются только две карты или две возможности. Можно сыграть либо "Помогаю" либо "Паразитирую". Начнем с логических построений, которым будет следовать любой человек с которым вы будите играть, - например ваш товарищ. Если вы пошли "Паразитирую", то лучшее, что в этой ситуации может сделать ваш товарищ, это тоже сыграть "Паразитирую". Безусловно вам обоим придется получить "Наказание за взаимное паразитирование", но для вашего товарища, это в любом случае лучше, чем "Наказание за наивность", если бы он пошел с карты "Помогаю".
Допустим, теперь что вы пошли с карты "Помогаю". И снова вашему товарищу лучше всего играть "Паразитирую". Если бы он тоже сыграл "Помогаю", то вы оба получили бы довольно высокую премию - по 300 долларов. Если же ваш товарищ играет "Паразитирую", то он получит даже больше - 500 долларов. Отсюда следует вывод, что независимо от того, с какой карты вы пошли, лучшей тактикой вашего товарища будет всегда играть "Паразитирую".
Итак, путем безупречных логических рассуждений мы показали, что независимо от ваших действий, ваш товарищ должен всегда играть "Паразитирую". С помощью столь же безупречной логики, вы тоже придете к точно такому же выводу, к которому пришел ваш товарищ. Таким образом, когда встречаются два разумных игрока, они оба будут играть "Паразитирую", и оба в конечном счете либо будут наказаны штрафом, либо получат небольшую награду. При этом каждый из них прекрасно знает, что если бы только они оба играли "Помогаю", то каждый получил бы высокую "Награду за взаимопомощь" (в нашем случае 300 долларов). Поэтому, игра называется Парадоксом.
В жизни такие ситуации происходят повсеместно. Например вы постоянно помогаете какому-нибудь человеку, то есть играете "Помогаю", а этот человек, только принимает помощь от вас, и никогда не чем вам не помогает. То есть всегда играет "Паразитирую". Например государство, может идти на уступки террористам, то есть играть "Помогаю", но террористы будут продолжать совершать теракты, то есть играть "Паразитирую".
Из недавних примеров для Казахстана можно привести Таможенный союз, то есть мы сыграли "Помогаю". А затем Россия поставила сертификационные и санитарные барьеры для нашей продукции, то есть сыграла "Паразитирую".
Дальше, мы рассмотрим самую эффективную стратегию поведения людей, позволяющей получить максимальный эффект в условиях "Парадокса заключенных".
Часть шестая. "Око за око".
Решение задачи определения наиболее эффективной стратегии в человеческом обществе, было поставлено перед лучшими в мире программистами. В основу человеческого общества была положена игра "Парадокс заключенных". Следовательно та стратегия, которая набирала бы больше всех очков, стала бы самой эффективной стратегией в нашей жизни.
Количество очков, которые получали разные компьютерные стратегии поведения людей, в нашей обычной жизни представляют собой количество богатства, власти и подконтрольной территории, принадлежащий отдельному человеку либо обществу в целом.
Четырнадцать сильнейших программистов в мире, предложили четырнадцать стратегий, к которым добавили пятнадцатую, назвав ее "Случайной". Эта "Случайная" стратегия, просто без всякой системы играла то "Помогаю", то "Паразитирую" и служила своего рода базовой «анти-стратегией». Стратегию, дававшую худшие результаты, чем "Случайная", следовало признать самой плохой.
Каждая стратегия сравнивалась по эффективности поочередно с каждой из остальных (в том числе и с собственной копией) в игре "Парадокс заключенных". Поскольку стратегий было 15, то компьютер сыграл 15Х15, или 225, отдельных игр. После того, как каждая пара сделала по 200 ходов, все выигрыши были суммированы и был объявлен победитель.
Небольшое пояснение, для нас важно определить какая из стратегий наберет больше очков, а не какая именно стратегия вышла победителем в игре против каждого отдельного противника. Потому что именно общее количество очков, покажет наиболее эффективную стратегию в человеческом обществе.
Очки, присуждались по следующей схеме: "Взаимопомощь" = 3 очка, "Награда за наглость" = 5 очков, "Наказание за взаимное паразитирование" = 1 очко, "Наказание за наивность" = 0 очков.
Максимально возможный выигрыш, который могла бы получить та или иная стратегия, составляет 15 000 очков (200 партий по 5 очков за партию с каждым из 15 противников). Минимальный результат составляет 0. Ни один из этих крайних результатов на самом деле не имел места. Наибольший выигрыш, на который может надеяться каждая стратегия, не может значительно превысить 600 очков за одну игру. Потому что это максимум для каждого из двух игроков, если бы они оба всe время играли “Помогаю”, зарабатывая по 3 очка за каждую из 200 сыгранных партий. Если бы один из них поддался искушению отказаться, то число его очков, вероятно, оказалось бы меньше 600, так как другой игрок отплатил бы ему тем же (в большей части представленных стратегий в той или иной форме было заложено стремление к ответному удару). Мы будем использовать число 600 в качестве точки отсчета и выражать результаты в процентах от этого числа. Tеоретически можно довести выигрыш до 166% (1000 очков), но практически ни одна стратегия не заработала в среднем больше 600 очков.
Было предложено несколько очень хитроумных стратегий, хотя конечно они были не такими хитроумными, как их авторы. Но победила самая простая стратегия, которая называлась «Око за око» и была представлена профессором Рапопортом. Oн является известным психологом и специалистом по теории игр из Торонто. По этой стратегии первым ходом должно быть "Помогаю", а в дальнейшем следует просто повторять предыдущий ход соперника.
Сначала "Око за око" играла против самой себя, то есть второй игрок, - это тоже стратегия "Око за око". По правилам турнира, каждая стратегия играла не только против каждой из 14 других стратегий, но также против копии самой себя. Как в них и было заложено, обе стратегии "Око за око" начинают играть "Помогаю". При следующем ходе каждый игрок повторяет предыдущий ход противника, то есть играeт "Помогаю". Оба продолжают играть "Помогаю" до конца игры и заканчивают ее, достигнув на 100% суммы очков принятой за точку отсчета. То есть обе стратегии "Око за Око" зарабатывают по 600 очков.
Далее, "Око за око" играла против стратегии, названной "Наивный испытатель". "Наивный испытатель" практически идентичен программе "Око за око". Разница между ними заключается в том, что что время от времени, без всякой закономерности, "Наивный испытатель" совершенно беспричинно играл "Паразитирую" и требовал 5 очков, как "Награду за наглость". Пока "Наивный испытатель" не предпринимал один из своих зондирующих ударов, оба игрока ведут себя в соответствии со стратегией "Око за око".
Однако внезапно, без объявления войны, на 10-м ходу, "Наивный испытатель" наносит удар, - играет "Паразитирую". "Око за око", естественно сыграла "Помогаю", и поэтому получила "Наказание за наивность", - 0 очков. Можно подумать, что "Наивный испытатель", добился успеха, заработав за этот ход 5 очков. Но своим следующим ходом "Око за око" наносит ответный удар и мстит играя "Паразитирую", так как в ней заложен принцип копировать предыдущий ход противника.
Теперь "Наказание за наивность" получает стратегия "Наивный испытатель", потому что следуя заложенному в ней принципу, копировать противника, эта стратегия повторила предыдущий ход "Око за око", который был "Помогаю". В этом случае "Награду за наглость" получает стратегия "Око за око". Но на следующий ход, "Наивный испытатель", довольно несправедливо, — «мстит» за то что в предыдущем раунде, "Око за Око", сыграла "Паразитирую". Таким образом это взаимное чередование ответных ударов продолжается каждый этап. При этом оба игрока получают в среднем по 2,5 очка за ход (среднее между 5 и 0). Это меньше, чем 3 очка за ход, которые получают игроки, если они оба играют "Помогаю". В итоге, когда "Наивный испытатель" играет против стратегии "Око за око", оба выигрывают меньше, чем в игре "Око за око" против "Ока за око". Когда игра шла между двумя "Наивными испытателями", дела обоих были еще хуже, потому что они начинали играть "Паразитирую" намного раньше, и следовательно серия взаимных ответных ударов, наступала раньше.
После чего, стратегия "Око за око", играла против стратегии "Раскаивающийся испытатель". Принцип этой стратегии похож на стратегию "Наивный испытатель". Отличие заключается, в том что "Раскаивающийся испытатель" может различать и запоминает, момент при котором он сам спонтанно сыграл "Паразитирую". И если, его собственное случайное "Паразитирую", немедленно привело к быстрому ответному удару, тогда он, «полный раскаяния», предоставляет своему противнику право на один бесплатный ответный удар, за которым не следует возмездия со стороны "Раскаивающeгося испытателя". Такая стратегия приводит к тому, что серии взаимных ответных ударов прекращаются в самом начале. Поединок между стратегиями "Око за око" и "Раскаивающийся испытатель", показал, что взаимные удары прекратились довольно быстро. На протяжении большей части игры противники взаимно играют "Помогаю". Это обеспечивает им обоим большой выигрыш. "Раскаивающийся испытатель" играет более успешно против стратегии "Око за око", чем "Наивный испытатель", но не так успешно, как "Око за око" против самой себя.
Самое интересное, что наиболее сложные и тщательно разработанные стратегии, которые создали Пентагон и ЦРУ, набирали в среднем меньше очков, чем простая стратегия "Око за око". То есть наименее успешной и провальной стратегией является самая сложная. Простота всегда выигрывает.
Конечно, люди, это не компьютерные программы, но и в нашем человеческом обществе, наиболее выигрышной стратегией тоже становиться стратегия взаимнoй помощи и кооперирования людей друг с другом. Но одновременно с этим нельзя забывать, сразу же ставить "Пиявок", "Паразитов" и "Агрессоров" на место.
Часть седьмая. Четыре составляющих успеха.
Вышеуказанный эксперимент, выявил еще одно интересное правило достижения успеха в человеческом обществе.
Многие люди, живут с мнением, что наш мир несправедлив и жесток по отношению с порядочным, добрым, отзывчивым людям-альтруистам. И наоборот, плохие люди, мошенники, обманщики, лжецы и эксплуататоры процветают в нашем мире. Эксперимент показал, что это не так.
Мир жесток, не по отношению к хорошим и честным людям, мир жесток к глупцам, которые продолжают помогать тем, кто их постоянно обманывает и бесплатно пользуется плодами из труда. Естественный отбор происходящий в человеческом обществе требует уничтожения "гена глупцов", чтобы он не передавался следующим поколениям людей. Мир наказывает глупцов, постоянно ухудшая их условия жизни, потому что гены глупцов должны умереть вместе с ними. И наоборот, мир постоянно помогает порядочным людям, которые умеют отстаивать собственные интересы и не позволяют, разным пиявкам, и паразитам садиться себе на шею.
Наше утверждение, было доказано в приведенном выше эксперименте. Напомним, что на базе игры под названием "Парадокс заключенных", было создано человеческое общество, а также программы имитирующие различные стратегии людей, которые они используют для достижения успеха в жизни. Все участвовавшие в эксперименте стратегии, поведения людей, можно условно разделить на "порядочные" и "непорядочные".
Стратегию человека, который всегда первым играет "Помогаю" мы назовем "порядочной". Действительно, человек, который не пытается жить за счет другого (то есть не играет "Паразитирую"), а наоборот всегда готов помочь и поделиться с другим, и за счет взаимовыгодного сотрудничества добивается успеха в жизни, мы называем порядочным человеком. Примером порядочной стратегии является "Око за око". Конечно, эта стратегия, может сыграть "Паразитирую", но только в порядке ответного удара, чтобы наказать пиявок, паразитов или агрессоров.
Стратегия "Наивный" и "Раскаивающийся испытатель" являются непорядочными, потому что они иногда, хотя и редко, без всякого к тому повода играют "Паразитирую". То есть пытаются жить (получать очки), за счет проигрыша других людей.
Из 15 стратегий, участвовавших в турнире, 8 были порядочными. И все эти 8 стратегий набрали наибольшее число очков, а 7 непорядочных остались далеко позади. Стратегия "Око за око" набрала в среднем 504,5 очка, что составляет 84% от нашей точки отсчета (600 очков) и может считаться хорошим результатом. Другие порядочные стратегии набрали лишь немного меньше очков — от 83,4 до 78,6%, оставив далеко позади самую успешную из всех непорядочных стратегий, называвшуюся "Грааскамп", которая набрала 66,8% очков.
Еще один из важнейших моментов, которые показал эксперимент, была важность прощения другого за его непорядочность. У порядочных стратегий, которые использовали прощение, была "короткая память". То есть, порядочная стратегия, может наносить ответный удар, но в то же самое время, она очень быстро забывает о прошлых обидах. Например "Око за око" порядочная стратегия, прощающая своих противников. Она немедленно дает по рукам игроку сыгравшему "Паразитирую", но тут же забывает о нанесенной ей обиде.
Для противоположного примера, можно привести порядочную стратегию "Злопамятный Хлебороб", которая не использовала прощение по отношению к тому, кто хоть раз сыграл против нее "Паразитирую", когда она сама сыграла "Помогаю". Стратегия "Злопамятный Хлебороб", сохраняла в памяти все события до самого конца игры. Она никогда не забывает, если кто-то из игроков хотя бы один раз сыграл против него "Паразитирую". Но такой подход, не позволил "Злопамятному Хлеборобу" добиться хороших результатов. Причина, по которой неспособные прощать стратегии, а значит и люди применяющие их в жизни, не достигают хороших результатов, состоит в том, что этот подход не помогает остановить серию ответных ударов, даже в тех случаях, когда их противник «раскаивается».
В принципе, можно применить и более прощающую стратегию. Например, стратегия "Око за два ока", разрешает своим противникам два раза подряд сыграть "Паразитирую" и только потом следует ответный удар. Это может показаться слишком милостивым и великодушным, но в среде где количество людей, применяющих порядочные стратегии больше, "Око за два ока", превзойдет по эффективности "Око за око". Такой результат, объясняется способностью данной стратегии избегать серии ответных ударов.
Таким образом, мы определили два качества выигрывающих стратегий, - порядочность и способность к прощению. Такое почти утопическое заключение, что порядочность и всепрощение окупаются, вызвало удивление у многих экспертов, которые наоборот, пускались на всевозможные хитрости, предлагая стратегии, содержащие в себе скрытые элементы непорядочности. Интересно, что даже те, кто предложил порядочные стратегии, не решились на радикальное прощение, какое было заложено в стратегии "Око за два ока".
Таким образом, мы выяснили, что успешная стратегия выживания в человеческом обществе, должна включать следующие вещи:
- порядочность
- ответный удар агрессору или паразиту
- возможность прощать, чтобы предотвратить серию взаимных ответных ударов.
Eсть еще одна, четвертая составляющая, - это отсутствие зависти.
Зависть, это чувство когда человеку не нравиться, что кто-то выигрывает больше него. Это постоянное стремление выиграть больше денег, чем другой игрок. В жизни быть завистливым, означает например отобрать рынок у своего конкурента. Отсутствие зависти же, означает создать новый товар и следовательно получить новый никем не занятый рынок. Независтливый человек, будет чувствовать себя вполне удовлетворенным, если другой человек получает ровно столько же денег, сколько и он сам или даже больше, при условии, что этот другой человек, не действует за чужой счет.
Например, стратегия "Око за око" независтлива. "Око за око" никогда по-настоящему не «выигрывает» игру, она не может набрать больше очков, чем её «противник», в каждой отдельной игре, потому что она играет "Паразитирую" только при ответном ударе. Максимально возможный результат для нее, это сыграть вничью со своим противником. При этом, каждая ничья приносит обоим игрокам большое количество очков.
Конечно, в реальной жизни, люди практически не могут контролировать чувство зависти. И для многих важнее потопить своего соперника, чем скооперироваться с ним и создать совместными усилиями что-то ценное для обоих.
Но в итоге, надо понимать, что либо вы управляете своими эмоциями, либо ваши эмоции управляют вами.
Часть Восьмая. Пятый элемент.
Еще одна важная деталь, которую выявил поставленный эксперимент, это зависимость победы от начальной среды обитания, в которой происходит состязание. Например стратегия "Око за два ока", будет безусловным победителем, если большинство людей, ее окружающих, применяют порядочные стратегии для достижения успеха. Но как только, стратегию "Око за два ока" поместить в среду, где большинство применяет непорядочную стратегию, она тут же проиграет. Потому что, непорядочные стратегии, сразу начинают эксплуатировать какого "идиота".
Следовательно, для выбора правильной стратегии, очень важна среда, в которой находится человек. Всегда недо знать кто в большинстве своем окружает человека, - порядочные или непорядочные люди? В проведенном эксперименте, из 14 предложенных стратегий 6 были непорядочными. И в случае, если бы число непорядочных стратегий составило 13, то "Око за око" проиграло бы. Атмосфера оказалась бы для нее неподходящей.
Поэтому для выяснения зависимости выигрыша применяемой стратегии от окружающей среды обитания человека, следующий эксперимент усложнили. Теперь в эксперименте приняли участие уже 63 стратегии, сделанные лучшими программистами мира. Затем их в виде отдельных людей, равномерно распределили в человеческом обществе. После чего человек, получавший больше очков за свою стратегию, получал возможность распространять свой "ген" дальше, и увеличивать количество людей применяющих такую же стратегию. Те же люди, которые не набирали определенного минимального уровня очков в игре вымирали. Начавшаяся игра в режиме реального времени показывала, как по мере смены одного поколения другим, некоторые стратегии становились редкими и в конце концов вовсе исчезали. Другие стратегии стали встречаться чаще. Вслед за изменением этих соотношений изменялась и атмосфера, в которой происходило дальнейшее развитие игры.
В конце концов по прошествии примерно 1000 поколений дальнейшие изменения обстановки прекратились. Была достигнута стабильность. Некоторые стратегии пошли на убыль с самого начала, и к 200-му поколению большая часть стратегий вымерла. Одна или две из непорядочных стратегий стали встречаться все чаще, однако их процветание, было недолгим. Единственная непорядочная стратегия, сохранившаяся по прошествии 200 поколений, была стратегия под названием "Харрингтон". Выигрыши этой стратегии резко возрастали на протяжении первых 150 поколений, а затем довольно медленно снижались, и стратегия практически вымерла к 1000-му поколению. Стратегия "Харрингтон" была успешной в течение некоторого времени, пока эксплуатировала "идиотов" вроде стратегии "Око за два ока". Затем, после того как "идиоты" вымирли, стратегия "Харрингтон", лишившись легкой добычи, последовала за ними. Арена оказалась свободной для таких порядочных стратегий как "Око за око". После того как все непорядочные стратегии были доведены до вымирания, ни одну из порядочных стратегий нельзя было отличить от "Ока за око" или друг от друга, потому что все они, будучи порядочными, просто играли друг против друга "Помогаю".
Но пока оставалось неясным, как же можно выйти из ловушки, если человека окружают только представители непорядочных стратегий. Например в обществе, где доминирует стратегия "Всегда паразитирую" ни одна другая стратегия не может превзойти ее по эффективности. Также верно и другое, там где доминирует стратегия "Око за око" непорядочные стратегии не могут выжить. В итоге, каким же должно быть количество людей, применяющих стратегию "Око за око", чтобы они одолели людей со стратегией "Всегда паразитирую"? Так же как в физике, в обществе тоже существует понятие критическая масса, после достежения которой идет перелом. Если количество порядочных людей, перейдет этот рубеж, то они смогут обыграть представителей стратегии "Всегда паразитирую". Причем для людей применяющих стратегию "Всегда паразитирую", такого рубежа не существует, потому что они вместо помощи, постоянно топят друг друга.
Следовательно, все что нужно сделать последователям "Око за око", чтобы обыграть превосходящих их по численности людей "Всегда паразитирую", это сконцентрироваться в каком-нибудь небольшом месте. Эксперимент полностью это подтвердил. Как только представители "Око за око", находят друг друга в обществе, они начинают создавать собственные уютные анклавы. Они начинают кооперироваться между собой в пределах этих уютных маленьких территорий, и достигают такого процветания, что из небольших локальных скоплений превращаются в более крупные сообщества. Затем они начинают распространятся в другие области, где до того численно доминировали люди, придерживающиеся стратегии "Всегда отказываюсь". В самом конце представители "Всегда паразитирую" медленно но верно приходят к вымиранию, и порядочные люди полностью захватывают все общество целиком. Таким образом, мы увидели, что люди придерживающиеся стратегии "Око за око" могут преодолеть барьер, если они смогут создать собственное, хотя бы небольшое локальное скопление.
Подведем итоги статьи, которая показала нам, что наилучшая стратегия достижения успеха в человеческом обществе включает в себя следующие элементы:
1. Порядочность, то есть постоянную помощь ближнему, на условиях взаимности.
2. Быстрый Ответный удар, если вы столкнулись с пиявкой или агрессором.
3. Прощение, - которое позволяет избежать серии Ответных ударов, если человек первый раз непреднамеренно ошибся.
4. Отсутствие зависти, которое направляет вашу энергию на расширение и создание чего-то нового, вместо отъема собственности у других людей.
5. Концентрация, - которая требует собрать людей использующих порядочные стратегии, в одном месте, чтобы за счет совместной кооперации превзойти по силе непорядочных людей, и захватить весь ареал обитания.