Теория игр и экономическое поведение

Психология      Постоянная ссылка | Все категории

Дж. фон НЕИМАН 0.110 РГЕН ШТЕРН

ТГеория игр экономическое

поведение


ТЕОРИЯ PI Г Р

Дж. фон НЕЙМАН, О. МОРГЕНШТЕРН

ТЕОРИЯ ИГР И ЭКОНОМИЧЕСКОЕ ПОВЕДЕНИЕ

Перевод с английского под редакцией и с добавлением Н. Н. ВОРОБЬЕВА


ИЗДАТЕЛЬСТВО «НАУКА» ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ МОСКВ А 19 7 0


517.8 Н46

УДК 519.2

THEORY OF GAMES AND ECONOMIC BEHAVIOR

by JOHN von NEUMANN and

OSKAR MORGENSTERN

PRINCETON PRINCETON UNIVERSITY PRESS 1953

Теория игр и экономическое поведение. Дж. фон Ней м[а н, О. М о р - генштерн. Перев. с англ. под ред. и с доб. Н. Н. Воробьева. Главная редакция физико-математической литературы, изд-ва «Наука», 1970.

Монография является классическим, основополагающим трудом по теории игр. Большинство понятий и идей, разрабатываемых в настоящее время в теории игр, берут свое начало из этого труда. Многие направления теории игр, лишь намечен­ные в книге, не получили в дальнейшем по тем или иным причинам научного - развития и к настоящему времени оказались в стороне от традиционной теоретико - игровой проблематики. Привлечение внимания к этим вопросам представляется весьма желательным.

В качестве приложения помещен составленный редактором очерк «Развитие теории игр», в котором излагается история математических идей, приведших к соз­данию теории игр, комментируется содержание монографии, а также дается краткий обзор развития теории игр как математической дисциплины за время, прошедшее с момента опубликования книги Дж. фон Неймана и О. Моргенштерна. К книге приложен список литературы, составленный редактором перевода.

Библ. 181 назв. Илл. 81. Табл. 28.

2-2-3

31-70


Ют редактора русского перевода.......................................................................................... И

Предисловие к русскому переводу...................................................................................... 12

Предисловие к первому изданию................................................................................................ 21

Предисловие ко второму изданию...................................................................................... 22

Предисловие к третьему изданию...................................................................................... 23

Технические замечания................................................................................................................. 25

Глава I. Формулировка экономической задачи..................................................................... 27

§ 1. Математический метод в экономике........................................................................... 27

1.1. Вводные замечания 27

1.2. Трудности в применении математического метода 28

1.3. Необходимые ограничения целей исследования 32

1.4. Заключительные замечания 33

§ 2. Качественное обсуждение проблемы рационального поведения.................................. 34

2.1. Проблема рационального поведения 34

2.2. Экономика «Робинзона Крузо» и экономика общественного обмена 35

2.3. Число переменных и число участников 38

2.4. Случай многих участников. Свободная конкуренция 39

2.5. Лозаннская школа 41

§ 3. Понятие полезности................................................................................................................ 41

3.1. Предпочтения и полезности 41

3.2. Принципы измерения. Предварительные рассмотрения 42

3.3. Вероятность и численные полезности ^ ... . 43

3.4. Принципы измерения. Подробное рассмотрение 46

3.5. Принципиальная структура аксиоматического рассмотрения чис­ленных полезностей 50

3.6. Аксиомы и их интерпретация 51

3.7. Общие замечания об аксиомах 53

3.8. Роль понятия маргинальной полезности 55

§ 4. Структура теории. Решения и нормы поведения............................................................... 57

4.1. Простейшее понятие решения для одного участника 57

4.2. Обобщение на всех участников 59

4.3. Решение как множество дележей 60

4.4. Нетранзитивное понятие «превосходства», или «доминирования» 62

4.5. Точное определение решения 64

4.6. Интерпретация нашего определения в терминах «норм поведения» 66

4.7. Игры и общественные организации 68

4.8. Заключительные замечания 69

Глава II. Общее формальное описание стратегических игр............................... 72

§ 5. Введение.......................................................................................................................... 72

5.1. Перенесение центра внимания с экономики на игры 72

5.2. Общие принципы классификации и подхода 72

§ 6. Упрощенное понятие игры..................................................................................................... 74

6.1. Объяснение технических терминов 74

6.2. Элементы игры............................................................... 75

6.3. Информация и предварение 76

6.4. Предварение, транзитивность и сигнализация. ч. . * .. .... 77 § 7. Полное описание понятия игры 81


7.1. Переменность характеристик каждого хода.......................................................... 81

7.2. Общее описание................................................................................................ 83

§ 8. Множества и разбиения................................................................................................. 86

8.1. Желательность теоретико-множественного описания игры.... 86

8.2. Множества, их свойства и их графическое представление................................. 87

8.3. Разбиения, их свойства и их графическое представление.................................. 89

8.4. Логическая интерпретация множеств и разбиений................................... 92

§*9. Теоретико-множественное описание игры................................................................ 93

*9.1. Разбиения, описывающие игру. ............................................................................ 93

*9.2. Рассмотрение разбиений и их свойств................................................................... 96

§*10. Аксиоматическая формулировка........................................................................................ 99

*10.1. Аксиомы и их интерпретация......................................................................... 99

*10.2. Логическое обсуждение аксиом..................................................................... 101

*10.3. Общие замечания относительно аксиом...................................................... 102

*10.4. Графическое представление.................................................................................. 103

§ 11. Стратегии и окончательное упрощение описания игры........................................ 105

11.1. Понятие стратегии и его формализация..................................................... 105

11.2. Окончательное упрощение описания игры....................................................... 107

11.3. Роль стратегий в упрощенной форме игры........................................................ 109

11.4. Смысл ограничения, касающегося нулевой суммы................................... 110

Глава III. Игры двух лиц с нулевой суммой. Теория.............................................. 111

§ 12. Предварительный обзор.............................................................................................. 111

12.1. Общие соображения.............................................................................................. 111

12.2. Игра с одним игроком. . ,............................................................................... 111

12.3. Случай и вероятность..................................................................................... 112

12.4. Ближайшая цель............................................................................................. ИЗ

§ 13. Исчисление функций................................................................................................... 113

13.1. Основные определения.................................................................................. ИЗ

13.2. Операции шах и min...................................................................................... 115

13.3. Вопросы коммутативности............................................................................. 117

13.4. Смешанный случай. Седловые точки................................................................. 120

13.5. Доказательства основных фактов........................................................................ 122

§ 14. Вполне определенные игры....................................................................................... 124

14.1. Формулировка проблемы.............................................................................. 124

14.2. Минорантная и мажорантная игры..................................................................... 126

14.3. Рассмотрение вспомогательных игр.................................................................... 127

14.4. Выводы..................................................................................................................... 131

14.5. Анализ полной определенности................................................................... 133

14.6. Перемена ролей игроков. Симметрия......................................................... 135

14.7. Игры, не являющиеся вполне определенными......................................... 136

14.8. Программа детального анализа полной определенности....................... 138

§*15. Игры с полной информацией............................................................................................ 139

* 15.1.Постановка задачи. Индукция....................................................................... 139

* 15.2.Точное условие (основание индукции) ....................................................... 140

*15.3.Точное условие (индуктивный переход).............................................................. 143

* 15.4.Точное исследование индуктивного перехода........................................... 144

*15.5.Точное исследование индуктивного перехода (продолжение) . . . 147

*15.6.Результат для случая полной информации................................................. 149

*15.7.Применение к шахматам................................................................................ 151

*15.8.Другой подход. Словесные рассуждения..................................................... 152

§16. Линейность и выпуклость................................................................................................... 155

16.1. Геометрические основания............................................................................ 155

16.2. Операции над векторами............................................................................... 156

16.3. Теорема об опорной гиперплоскости................................................................... 160

16.4. Теорема об альтернативах для матриц....................................................... 163

§17- - Смешанные стратегии. Решение всех игр...................................................................... 168

17.1. Два элементарных примера.................................................................................. 168

17.2. Обобщение изложенной точки зрения........................................................ 169

17.3. Оправдание процедуры применительно к отдельной партии. . . 170

17.4. Минорантная и мажорантная игры (для смешанных стратегий) 172

17.5. Полная определенность в общем случае............................................................ 174

17.6. Доказательство основной теоремы................................................................... 176

17.7. Сравнение подходов для чистых и для смешанных стратегий. . 179

17.8. Исследование полной определенности в общем случае.............................. 181

17.9. Дальнейшие свойства оптимальных стратегий............................................. 183

17.10. Ошибки и их следствия. Перманентная оптимальность............................. 185

17.11. Перемена ролей игроков. Симметрия............................................................. 188

Глава IV. Игры двух лиц с нулевой суммой. Примеры.......................................... 192

§ 18. Некоторые элементарные игры....................................................................................... 192

18.1. Простейшие игры................................................................................................. 192

18.2. Подробное количественное рассмотрение этих игр....................................... 193

18.3. Качественное описание................................. .............................................. 196

18.4. Обсуждение некоторых конкретных игр (обобщения игры в «орлянку») 198

18.5. Рассмотрение несколько более сложных игр.................................................. 201

18.6. Случай и неполная информация...................................................................... 205

18.7. Интерпретация этого результата.................................................................. 207

§*19. Покер и блеф................................................................................................................ 208

*19.1. Описание покера.................................................................................................... 208

*19.2. Блеф......................................................................................................................... 210

*19.3. Описание покера (продолжение)........................................................................ 211

*19.4. Точная формулировка правил............................................................................. 213

*19.5. Описание стратегий......................................................................................... 213

*19.6. Формулировка задачи...................................................................................... 217

*19.7. Переход от дискретной задачи к непрерывной............................................ 218

*19.8. Математическое построение решения.......................................................... 221

*19.9. Детальный анализ решения........................................................................... 225

*19.10. Интерпретация решения.............................................................................. 226

♦19.11. Более общие формы покера.............................................................................. 229

*19.12. Дискретные расклады................................................................................... 230

*19.13. т возможных ставок......................................................................................... 231

*19.14. Чередующиеся ставки................................................................................... 232

*19.15. Математическое описание всех решений................................................... 237

*19.16. Интерпретация решений. Заключение...................................................... 239

Г л а в а V. Игры трех лиц с нулевой суммой............................................................. 241

§ 20. Предварительный обзор.............................................................................................. 241

20.1. Общие соображения....................................................................................... 241

20.2. Коалиции .............................................................................................................. 242

§ 21. Простая мажоритарная игра трех лиц................................................................... • 243

21.1. Описание игры................................................................................................ 243

21.2. Анализ игры. Необходимость «соглашений»................................................... 244

21.3. Анализ игры. Коалиции. Роль симметрии.................................................. 245

§ 22. Дальнейшие примеры...................................................................................................... 246

22.1. Несимметричное распределение. Необходимость компенсаций. 246

22.2. Коалиции различной силы. Обсуждение......................................................... 248

22.3. Одно неравенство. Формулы......................................................................... 250

§ 23. Общий случай............................................................................................................... .... 251

23.1. Исчерпывающее обсуждение. Несущественные и существенные игры 251

23.2. Окончательные формулы............................................................................... 252

§ 24. Обсуждение одного возражения..................................................................................... 254

24.1. Случай полной информации и его значимость......................................... 254

24.2. Детальное обсуждение. Необходимость компенсаций между тремя

или более игроками........................................................................................ 255

Г л а в а VI. Общая теория. Игры п лиц с нулевой суммой.................................... 258

§ 25. Характеристическая функция..................................................................................... 258

25.1. Мотивировка и определение.............................................................................. 258

25.2. Обсуждение введенного понятия................................................................. 260

25.3. Фундаментальные свойства........................................................................... 260

25.4. Непосредственные математические следствия.......................................... 262

§ 26. Построение игры с заданной характеристической функцией.................................. 263

26.1. Построение........................................................................................................ 263

26.2. Резюме............................................................................................................... 265

§ 27. Стратегическая эквивалентность. Несущественные и существенные игры 265

27.1. Стратегическая эквивалентность. Редуцированная форма............................ 265

27.2. Неравенства. Величина у.............................................................................. 268

27.3. Несущественность и существенность................................................................ 269

27.4. Различные критерии. Неаддитивные полезности........................................... 270

27.5. Неравенства в случае существенности....................................................... 272

27.6. Векторные операции над характеристическими функциями. . ............ 273 § 28. Группы, симметрия и безобидность 274

28.1. Подстановки, их группы и их воздействие на игру.......................................... 274

28.2. Симметрия и безобидность.................................................................................. 278

§ 29. Повторное рассмотрение игры трех лиц с нулевой суммой.................................. 279

29.1. Качественные рассмотрения................................................................................ 279

29.2. Количественные рассмотрения........................................................................... 281

§ 30. Точная форма общих определений................................................................................. 283

30.1. Определения.......................................................................................................... 283

30.2. Обсуждение и обзор результатов........................................................................ 284

*30.3. Понятие насыщенности................................................................................... 285

30.4. Три непосредственных црли............................................................................ 290

§ 31. Первые следствия......................................................................................................... 291

31.1. Выпуклость, линейность и, некоторые критерии доминирования 291

31.2. Система всех дележей. Одноэлементные решения......................... . . 297

31.3. Изоморфизм, соответствующий стратегической эквивалентности 299 § 32. Нахождение всех решений существенной игры трех лиц с нулевой суммой 301

32.1. Математическая формулировка задачи. Графический метод.... 301

32.2. Нахождение всех решений.................................................................................. 303

§ 33. Выводы................................................................................................................................. 306

33.1. Множественность решений. Дискриминация и ее смысл.... 306

33.2. Статика и динамика............................................................................................... 307

Глава VII. Игры четырех лиц с нулевой суммой............................................................. 308

§ 34. Предварительный обзор.............................................................................................. 308

34.1. Общая точка, зрения............................................................................................. 308

34.2. Формализация существенной игры четырех лиц с нулевой суммой 308

34.3. Перестановки игроков. . . ,................................................................................... 310

§ 35. Обсуждение некоторых специальных точек куба Q.............................. 312

35.1. Вершина I (и V, VI, VII)................................................................................. 312

35.2. Вершина VIII (и II, III, IV). Игра трех лиц и «болвана»......................... 315

35.3. Некоторые замечания, касающиеся внутренности Q................................ 318

§ 36. Рассмотрение главных диагоналей.......................................................................... 320

36.1. Участок, примыкающий к вершине VIII. Эвристическое описание 320

36.2. Участок, примыкающий к вершине VIII. Точное описание................... 322 *36.3. Другие участки главной диагонали 327

§ 37. Центр и его окрестности............................................................................................. 328

37.1. Первоначальная ориентировка в отношении условий около центра 328

37.2. Две альтернативы и роль симметрии.......................................................... 329

37.3. Первая альтернатива в центре..................................................................... 330

37.4. Вторая альтернатива в центре..................................................................... 331

37.5. Сравнение двух центральных решений............................................................ 332

37.6. Несимметричные центральные решения................................................... 333

§*38. Семейство решений для окрестности центра................................................................ 335

*38.1. Преобразование решения, принадлежащего первой альтернативе 335

в центре........................................................................................................... 335

*38.2. Строгое рассмотрение.................................................................................... 337

*38.3. Интерпретация решений..................................................................................... 342

Глав а VIII. Некоторые замечания, касающиеся п ^ 5 участников.... 344

§ 39. Число параметров в различных Классах игр.......................................................... 344

39.1. Ситуация для п = 3, 4............................................................................................ 344

39.2. Ситуация для всех п ^ 3........................ -...................................................... 344

§ 40. Симметричная игра пяти лиц..................................................................................... 346

40.1. Формализация симметричной игры пяти лиц................................................... 346

40.2. Два крайних случая............................................................................................... 346

40.3. Связь между симметричной игрой пяти лиц и 1, 2, 3-симметричными играми четырех лиц 348

Глава IX. Композиция и разложение игр................................................................... 352

§ 41. Композиция и разложение................................................................................................. 352

41.1. Поиски игр п лиц, для которых можно найти все решения. . . 352

41.2. Первый тип. Композиция и разложение............................................................ 353

41.3. Точные определения. *................................. . .... ....................................... 354

41.4. Анализ разложимости.................................................................................... 356

41.5. Желательность модификации....................................................................... 358

§ 42. Модификация теории................................................................................................... 358

42.1. Неполный отказ от условия равенства суммы нулю...... 358

42.2. Стратегическая эквивалентность. Игры с постоянной суммой. . 359

42.3. Характеристическая функция в новой теории........................................... 361

42.4. Дележи, доминирование, решения в новой теории................................. 362

42.5. Существенность, несущественность и разложимость в новой теории.. 364 § 43. Разлагающее разбиение 365

43.1. Разлагающие множества. Компоненты игры............................................. 365

43.2. Свойства совокупности всех разлагающих множеств............................... 366

43.3. Описание совокупности всех разлагающих множеств. Разлагающее разбиение 367

43.4. Свойства разлагающего разбиения..................................................................... 370

§ 44. Разложимые игры. Дальнейшее развитие теории......................................................... 371

44.1. Решение разложимой игры и решения ее компонент.................................... 371

44.2. Композиция и разложение дележей и множеств дележей.... 372

44.3. Композиция и разложение решений. Основные возможности и пред­положения 373

44.4. Обобщение теории. Внешние источники................................................... 375

44.5. Эксцесс ..................................................................................................................... 377

44.6. Ограничения на эксцесс. Неизолированный характер игры

в новой теории................................................................................................. 379

44.7. Рассмотрение новых понятий Е (е0), F (е0)......................................................... 379

§ 45. Ограничения на эксцесс. Структура обобщенной теории..................................... 381

45.1. Нижняя граница эксцесса.............................................................................. 381

45.2. Верхняя граница эксцесса. Исключенные и вполне исключенные дележи 382

45.3. Рассмотрение двух границ | Г |ь | Г |2. Их отношение................................ 385

45.4. Исключенные дележи и различные решения. Теорема, связываю­щая Е (е0) и F (е0) 387

45.5. Доказательство теоремы....................................................................................... 389

45.6. Подведение итогов и заключение....................................................................... 393

§ 46. Нахождение всех решений в разложимой игре............................................................. 395

46.1. Элементарные свойства разложений................................................................. 395

46.2. Разложение и его связь с решениями. Первоначальные результаты относительно F (е0) 397

46.3. Продолжение.................................................................................................... 399

46.4. Продолжение.................................................................................................... 401

46.5. Окончательный результат для F (е0)................................................................... 404

46.6. Окончательный результат для Е (е0).................................................................. 406

46.7. Графическое представление части результатов......................................... 408

46.8. Интерпретация: нормальная зона. Наследование различных свойств 409

46.9. «Болваны»......................................................................................................... 411

46.10. Погружение игры.......................................................................................... 411

46.11. Важность нормальной зоны................................................................................ 414

46.12. Первое возникновение явления передачи: п — 6 .......................................... 415

§ 47. Существенные игры трех лиц в новой теории......................................................... 416

47.1. Необходимость рассмотрения этого вопроса............................................... 416

47.2. Предварительные замечания.............................................................................. 416

47.3. Рассмотрение шести случаев. Случаи (I) — (III)............................................. 419

47.4. Случай (IV). Первая часть.................................................................................... 419

47.5. Случай (IV). Вторая часть.................................................................................... 421

47.6. Случай (V)........................................................................................................ 424

47.7. Случай (VI) .......................................................................................................... 426

47.8. Интерпретация результатов. Кривые (одномерные части) в решении 427

47.9. Продолжение. Области (двумерные части) в решении............................ 428

Глава X. Простые игры.......................................................................................................... 430

§ 48. Выигрывающие и проигрывающие коалиции и игры, в которых они встре­чаются 430

48.1. Второй случай п. 41.1. Решения, принимаемые коалициями. . . 430

48.2. Выигрывающие и проигрывающие коалиции........................................... 431

§ 49. Характеризация простых игр........................................................................................... 433

49.1. Общие понятия выигрывающих и проигрывающих коалициц. . 433

49.2. Особая роль одноэлементных множеств.......................................................... 435

49.3. Характеризация семейств W и L в реальных играх.................................. 436

49.4. Точное определение простоты........................................................................... 438

49.5. Некоторые элементарные свойства простоты............................................. 438

49.6. Простые игры и их W и L. Минимальные выигрывающие коали­ции Wm 439

49.7. Решения простых игр..................................... -.............................................. 440

§ 50. Мажоритарные игры и главное решение................................................................. 441

50.1. Примеры простых игр. Мажоритарные игры............................................. 441

50.2. Однородность........................................................................................................ 443

50.3. Более прямое использование понятия дележа при образовании решений 445

50.4. Обсуждение описанного прямого подхода................................................. 446

50.5. Связь с общей теорией. Точная формулировка......................................... 447

50.6. Переформулирование полученного результата............................................. 450

50.7. Интерпретация полученного результата......................................................... 452

50.8. Связь с однородными мажоритарными играми.............................................. 453

§ 51. Методы перечисления всех простых игр.................................................................. 454

•51.1. Предварительные замечания............................................................................ 454

51.2. Метод насыщения. Перечисление посредством W.................................... 455

51.3. Основание для перехода от If к Wm. Трудности использования Wm кЫ

51.4. Измененный подход. Перечисление посредством Wm.............................. 45&

51.5. Простота и разложение.................................................................................. 461

51.6. Несущественность, простота и композиция. Рассмотрение эксцесса 463

51.7. Критерий разложимости в терминах Wm. . . 1............................................. 464

§ 52. Простые игры для небольших значений п.................................................................... 466

52.1. Случаи л = 1,2 интереса не представляют. Описание случая п = 3 460

52.2. Процедура для п ^ 4. Двухэлементные множества и их роль

в классификации Wm........................................................................................... 466

52.3. Разложение в случаях С*, Сп_Сд-i............................... .............................. 468

52.4. Простые игры, отличные от [1, . . 1, п — 2]^ (с «болванами»). Случаи Oft, к = 0, 1, . . ., п — 3 470

52.5. Описание случаев п = 4, 5……………………………………………………………………….. 470

§ 53. Новые возможности для простых игр при п ^ 6………………………………………………. 472

53.1. Закономерности, обнаруженные для я<6 …………………………………………… 472

53.2. Шесть основных контрпримеров (для п = 6, 7)…………………………………………. 472

§ 54. Нахождение всех решений в соответствующих играх……………………………………. 479′

54.1. Основания для рассмотрения в простых играх решений, отличных

от главного решения……………………………………………………………………………….. 47&

54.2. Перечисление тех игр, для которых все решения известны. . . 480

54.3. Основания для рассмотрения простой игры [1, . . ., 1, п — 2]h……………. 481 §*55. Простая игра [1, . . 1у п — 2]h 482

*55.1. Предварительные замечания………………………………………………………….. 482

*55.2. Доминирование. Главный игрок. Случаи (I) и (II)…………………….. 482

*55.3. Описание случая (I)……………………………………………………………………. 483

*55.4. Случай (II). Нахождение У……………………………………………………………… 486

*55.5. Случай (II). Нахождение V……………………………………………………………… 48&

*55.6. Случай (И). и S*………………………………………………………………………………. 491

*55.7. Случаи (1Г) и (II”). Описание случая (II’)………………………………….. 492

*55.8. Случай (II”), ^и V. Доминирование…………………………………………………….. 494

*55.9. Случай (И”). Нахождение У………………………………………………………………………. 495

*55.10. Описание случая (II”)………………………………………………………………………………. 501

*55.11. Другая формулировка полного результата………………………………………… 503

*55.12. Интерпретация полученного результата……………………………………………. 505

Глава XI. Общие игры с ненулевой суммой…………………………………………………….. 510

§ 56. Распространение теории………………………………………………………………………………… 510

56.1. Постановка задачи…………………………………………………………………… • •

56.2. Фиктивный игрок. Расширение до игры с нулевой суммой Г. . 511

56.3. Вопросы, касающиеся свойств JF…………………………………………………………….. 512

56.4. Ограничения в использовании Г……………………………………………………………… 514

56.5. Две возможные процедуры………………………………………………………………………. 516

56.6. Дискриминирующие решения…………………………………………………………… 517

56.7. Альтернативные возможности…………………………………………………………………. 518

56.8. Новое построение…………………………………………………………….. ^^

56.9. Возвращение к случаю, когда Г является игрой с нулевой суммой 521

56.10. Анализ понятия доминирования…………………………………………………………….. 524

56.11. Строгие рассуждения………………………………………………………………………………. 528

56.12. Новое определение решения…………………………………………………………………… 530

§ 57. Характеристическая функция и связанные с ней понятия…………………………….. 531

57.1. Характеристическая функция. Расширенная и ограниченная формы 531

57.2. Основные свойства……………………………………………………………………………… 532

. 57.3. Нахождение всех характеристических функций………………………………………….. 534

57.4. Устранимые множества игроков…………………………………………………………. 537

57.5. Стратегическая эквивалентность. Игры с нулевой и постоянной суммой 539

§ 58. Интерпретация характеристической функции………………………………………………. 542

58.1. Анализ определения…………………………………………………………………………… 542

58.2. Желание выиграть или нанести ущерб……………………………………………… 543

58.3. Обсуждение………………………………………………………………………………………… 544

§ 59. Общие рассмотрения……………………………………………………………………………………… 546

59.1. Обсуждение программы……………………………………………………………………… 546

59.2. Редуцированная форма. Неравенства………………………………………………… 547

59.3. Различные вопросы……………………………………………………………………… i • 550

§ 60. Решения всех общих игр для п ^ 3 ………………………………………………………………………. 552

60.1. Случай п = 1 ………………………………………………………………………………………. 552

60.2. Случай п = 2 ………………………………………………………………………………………. 552

60.3. Случай п = 3………………………………………………………………………………………………. 554

60.4. Сравнение с играми с нулевой суммой………………………………………………. 556

§ 61. Экономическое истолкование результатов для п — 1, 2……………………………………….. 558

61.1. Случай п = 1 ………………………………………………………………………………………. 558

61.2. Случай п — 2. Рынок двух лиц……………………………………………………………. 558

61.3. Рассмотрение рынка двух лиц и его характеристической функции 559

61.4. Обоснование точки зрения, высказанной в § 58 ………………………………… 561

61.5. Делимые продукты. «Маргинальные пары»………………………………………………. 562

61.6. Цена. Обсуждение…………………………………………………………………………………….. 565

§ 62. Экономическая интерпретация результатов для п = 3; частный случай 567

62.1. Случай п — 3, частный случай. Рынок трех лиц…………………………………. 567

62.2. Предварительное обсуждение……………………………………………………………. 568

62.3. Решения. Первый подслучай……………………………………………………………… 568

62.4. Решения. Общая форма……………………………………………………………………… 570

62.5. Алгебраическая форма результата……………………………………………………… 571

62.6. Обсуждение………………………………………………………………………………………………. 573

§ 63. Экономическая интерпретация результатов для п — 3; общий случай 574

63.1. Делимые товары………………………………………………………………………………………… 574

63.2. Анализ неравенств……………………………………………………………………………… 576

63.3. Предварительное обсуждение…………………………………………………………………… 578

63.4. Решения……………………………………………………………………………………………… 578

63.5. Алгебраическая форма результата…………………………………………………………….. 580

63.6. Обсуждение………………………………………………………………………………………… 581

§ 64. Общий рынок………………………………………………………………………………………………………. 583

64.1. Постановка задачи…………………………………………………………………………………… 583

64.2. Некоторые частные свойства. Монополия и монопсония…. 584

Глава XII. Обобщения понятий доминирования и решения……………………………. 587

.§ 65. Обобщение. Частные случаи…………………………………………………………………………. 587

65.1. Постановка задачи……………………………………………………………………………… 587

65.2. Общие замечания………………………………………………………………………………. 588

65.3. Упорядочения, транзитивность, ацикличность………………………………….. 589

65.4. Решения для симметричного отношения и для линейного упорядо­чения 591

65.5. Решения для частичного упорядочения………………………………………………….. 592

65.6. Ацикличность и строгая ацикличность………………………………………………. 594

65.7. Решения для ациклического отношения………………………………………………… 597

65.8. Единственность решений, ацикличность и строгая ацикличность 599

65.9. Применение к играм. Дискретность и непрерывность……………………….. 602

^ 66. Обобщение понятия полезности…………………………………………………………………………. 603

66.1. Обобщение. Два этапа теоретического исследования………………………… 603

66.2. Обсуждение первого этапа…………………………………………………………………. 604

66.3. Обсуждение второго этапа………………………………………………………………….. 605

66.4. Желательность унификации двух этапов………………………………………………… 607

§ 67. Обсуждение примера……………………………………………………………………………………… 608

67.1. Описание примера………………………………. …………………………………………… 608

67.2. Решение и его интерпретация………………………………………………………………… 610

67.3. Обобщение; различные дискретные шкалы полезностей………………….. 612

67.4. Выводы о соглашении…………………………………………………………………………….. 614

Приложение. Аксиоматическое построение теории полезности…. 616

А.1. Постановка задачи……………………………………………………………………………………… 616

А.2. Выводы из аксиом………………………………………………………………………………………. 617

А. З. Заключительные замечания…………………………………………………………………. 626

Добавление. Развитие теории игр (Я. Н. Воробьев)………………………………………………… 631

Введение…………………………………………………………………………………………………………… 633

Глава I. До монографии……………………………………………………………………………………….. 634

§ 1. Неопределенность исхода игры и ее источники……………………………………. 634

§ 2. Комбинаторные игры……………………………………………………………………………. 636

§ 3. Азартные игры……………………………………………………………………………………….. 639

§ 4. Стратегические игры. Работы Э. Бореля……………………………………………………. 642

§ 5. К теории стратегических игр……………………………………………………………………… 645

Глава II. Теория игр и экономическое поведение…………………………………………… 650

§ 1. Постановка экономической проблемы…………………………………………………… 650

§ 2. Общее формальное описание стратегических игр………………………………… 654

§ 3. Игры двух лиц с нулевой суммой. Теория…………………………………………………. 656

§ 4. Игры двух лиц с нулевой суммой. Примеры……………………………………………… 658

§ 5. Игры трех лиц с нулевой суммой……………………………………………….. .; • • ^60

§ 6. Формулировка общей теории. Игры п лиц с нулевой суммой. . 661

§ 7. Игры четырех лиц с нулевой суммой…………………………………………………….. 663

§ 8. Некоторые замечания, касающиеся случая п >- 5 участников 664

§ 9. Композиция и разложение игр…………………………………………………………………. 664

§ 10. Простые игры…………………………………………………………………………………………… 666

§ И. Общие игры с нулевой суммой…………………………………………………………….. 666

§ 12. Обобщение понятий доминирования и решения……………………………………. 668

Глава III. Теория игр — раздел математики………………………………………………………… 670

§ 1. Матричные игры…………………… #………………………………………………………………… 670

§ 2. Бесконечные антагонистические игры………………………………………………….. 674

§ 3. Кооперативная теория…………………………………………………………………………… 679

§ 4. Бескоалиционные и коалиционные игры……………………………………………… 687

§ 5. Динамические игры………………………………………………………………………………. 690

Библиография ………………………………………………………………………………………………………… 695

Предметный указатель……………………………………………………………………………………………. 703


Настоящий перевод сделан по последнему (третьему) американскому изданию монографии. В него включены почти полностью все три авторских предисловия, входящие в оригинал, а также специальное предисловие к русскому изданию, любезно написанное одним из авторов книги, О. Моргенштерном.

К переводу приложен написаннЬш редактором очерк «Развитие теории игр», в котором излагается история математических идей, привед­ших к созданию теории игр, комментируется содержание данной моно­графии, а также дается краткий обзор развития теории игр как математи­ческой дисциплины за время, прошедшее с момента опубликования книги Дж. фон Неймана и О. Моргенштерна. Перевод снабжен также библиографией, составленной редактором.

Авторы склонны сопровождать написанные на языке формул мате­матические построения параллельным чисто словесным изложением суще­ства дела. Это достигается ими ценой известной тяжеловесности оборотов, которая неизбежно сохранилась и в переводе ввиду стремления перевод­чиков и редактора добиться наибольшей близости его к оригиналу.

Этим же стремлением объясняются и отдельные терминологические особенности текста. Некоторые употребляемые авторами теоретико-игро­вые термины за последнее время в английском языке изменились. Для соответствующих понятий нами введены в переводе русские термины, отличающиеся от принятых в отечественной литературе в той же мере, в какой авторская терминология отличается от современной английской.

Ввиду перегруженности текста авторскими сносками было принято решение отказаться от подстрочных примечаний переводчиков и редак­тора. Некоторые обширные авторские сноски по техническим причинам были перенесены в соответствующие места текста, набраны петитом и снаб­жены заголовком «Замечание». Все комментарии, касающиеся отдельных мест книги, приведены в заключающем данное издание очерке редактора. Разделы текста, обозначенные в оригинале одним числом, названы в пере­воде «параграфами». Разделам, обозначенным двумя или тремя числами, приписано название «пункт».

Перевод монографии выполнили А. А. Корбут (предисловия и гла – вы I и II), В. В. Малинников (§§ 12—14 из главы III и глава V), JI. И. Горь – ков (глава IV), Л. А. Петросян (§§ 15—17 из главы III), А. С. Михайлова (глава VI), Е. Б. Яновская (главы VII и VIII), А. Н. Ляпунов (глава^ГХ), А. И. Соболев (§§ 48—53 из главы X), И. Н. Врублевская (§§ 54 и 55 из главы X) и О. Н. Бондарева (главы XI, XII и Приложение).

Н. Н. Воробьев

ПРЕДИСЛОВИЕ К РУССКОМУ ПЕРЕВОДУ

С большим удовольствием принимаю я переданное мне профессором Н. Н. Воробьевым любезное предложение написать небольшое введение к русскому изданию этой книги. Перевод «Теории игр и экономического поведения» на русский язык следует всячески приветствовать; его можно рассматривать как важный шаг в области международного научного сотрудничества и обмена идеями.

Основой для перевода послужило третье издание, опубликованное в Принстоне в 1953 г. Джон фон Нейман и я написали к нему новое преди­словие; в остальном — помимо исправления некоторых опечаток — оно тождественно со вторым изданием, вышедшим в 1947 г. В этом предисло­вии мы отмечали, что за шесть лет, прошедших между двумя изданиями,, появилось столько публикаций по теории игр, что мы вынуждены были ограничиться простым перечислением книг по данному вопросу. За 16 ми­нувших с тех пор лет во многих странах и на многих языках появилась целая лавина публикаций.

1. 8 февраля 1957 г. после длительной болезни фон Нейман скончалсяу будучи еще сравнительно молодым. Невозможно оценить сейчас, каким был бы его собственный дальнейший вклад в теорию игр. Эта облает^ была особенно близка его сердцу, и в ней он добился некоторых из наи­более важных научных достижений в своей жизни — жизни, в течение которой он обогатил много отраслей чистой и прикладной математики,, построил излагаемую дисциплину, дал математические основания кванто­вой механики и изложил логические основы теории электронных вычис­лительных машин и автоматов. Я опубликовал краткий некролог о покой­ном друге в «Экономическом журнале» (The Economic Journal 68, March 1958). Полная оценка работ фон Неймана со стороны многих специалистов дана в специальном выпуске «Бюллетеня Американского математического общества» (The Bulletin of the American Mathematical Society 64, May 1958); там же приведена полная библиография его работ. Его труды собраны в шеститомнике Collected works (А. Н. Taub, ed.), Pergamon Press, New York — London, 1961—1963.


2. Здесь было бы уместно дать детальный обзор развития теории игр с 1953 г. Однако это задача такого объема и сложности, что для меня невозможно выполнить ее адекватным образом при имеющихся у меня сроках и объеме. Одна из основных трудностей состоит в том, что литера­тура по теории игр проникла в столь разнообразные области — от алгебра­ической топологии до приложений даже к таким дисциплинам, как биология и метеорология,— что мало кто может свободно ориентировать­ся во всех этих областях. Поэтому, следуя примеру предыдущего преди­словия, я ограничусь перечислением — по возможности с максималь­ной полнотой — лишь книг по теории игр, появившихся с 1953 г. г снабжая каждое название книги краткими комментариями относительно ее цели и содержания. Затем последует небольшой раздел, описывающий некоторые принципиальные тенденции в развитии теории игр и рассматри­вающий несколько широких областей, которые в настоящее время можно выделить.

В этом библиографическом обзоре я, естественно, опускаю работы, выполненные в Советском Союзе и восточноевропейских странах. Любая попытка такого рода была бы с моей стороны необоснованной, ибо я, к сожалению, незнаком с соответствующими языками, а на английский язык переведено далеко не столько этих книг и статей, как того хотелось бы. Кроме того, это было бы излишним, так как означало бы попросту «привозить сов в Афины». Библиография этих работ (в основном русских), составленная в США в июне 1964 г., насчитывает 74 названия, и с тех лор этот список, без сомнения, существенно вырос. Названия этих работ указывают на тот широкий диапазон интересов, о котором мне еще придет­ся сказать. Разумеется, некоторые из этих работ уже хорошо известны на Западе, в частности важные результаты, полученные редактором этого перевода профессором Н. Н. Воробьевым, а также О. Н. Бондаревой и другими авторами. Очевидно, с тех пор в Советском Союзе выполнено много дальнейших важных работ; как показало мне мое участие в Между­народном конгрессе математиков в Москве в августе 1966 г., эти исследо­вания интенсивно проводятся и сейчас.

3. Следующий список книг, опубликованных после 1953 г., упоря­дочен хронологически, хотя, по-видимому, можно было бы разделить их на теоретические и прикладные, произведя дальнейшее подразделение внутри этих классов. Одной из причин предпочтения нами хронологиче­ского порядка является сильная взаимозависимость между чисто мате­матическими и прикладными работами. Это само по себе является весьма характерным: новые вопросы, возникающие из стремления приложить теорию игр (например, к экономике) и в связи с попытками согласовать теорию игр с классической теорией экономического равновесия, порюдили новые и весьма интересные математические теоремы. С другой стороны, новые математические результаты открыли возможности новых приложе­ний. Я считаю, что подобное взаимодействие имеет огромное значение и характерно для развития любой полноценной математико-прикладной дисциплины. Это может быть не вполне очевидно из названий цитируемых ниже книг или комментариев к ним, хотя в некоторых случаях это взаим­ное оплодотворение теории и практики совершенно явственно.

Предлагаемый список содержит только книги, которые полностью гили в большей своей части посвящены теории игр. Имеется много других книг, особенно учебников по экономике, линейному программированию, управлению, статистике и т. п., в которые включены главы по теории игр вводного характера; несмотря на всю полезность этих изданий, мы исклю­чили их из нашего списка по соображениям экономии места. Хотя некото­рые из указываемых книг уже хорошо известны в Советском Союзе, мы тем те менее сочли удобным привести эту библиографию.

В 1 а с k w е 1 1 D., G i г s h i к М. A., Theory of games and statistical decisions, London, 1954, xi + 355 стр. x).

Это первая книга, в которой авторы, следуя А. Вальду, изла­гают и используют теорию игр в качестве основы для теории ста­тистических решений, ограничиваясь дискретными распределениями.

Русский перевод: Д. Б л е к у э л л, М. Гиршик, Теория игр и статисти­ческих решений, М., ИЛ, 1958.— Прим. ред.

Decision proceses. Ed. by R. М. Т h г а 1 1 С. Н. Coombs, R. L. D a v i s, New York, 1954, viii + 332 стр.

Сборник содержит 18 докладов, представленных на семинаре в 1952 г.; многие доклады посвящены теории игр. Особо выделяется доклад Джона Милнора «Игры против природы», в котором он иссле­дует относительную приложимость критериев Вальда (использовав­шего минимакс), Лапласа, Сэвиджа, Гурвица и формулирует ря& приемлемых с точки зрения здравого смысла аксиом, которым ни один из этих подходов не удовлетворяет.

Braithwaite R. В., Theory of games as a tool for the moral philo­sopher, Cambridge, 1955, 76 стр.; 2-е изд., 1963.

Философское исследование полезности теории игр для спра­ведливого разрешения общечеловеческих конфликтных ситуаций.

Linear inequalities and related systems. Ed. by H. W. Kuhn and A. W. Tucker, Princeton, 1956, xxi + 322 стр.[1]).

Проблематика собранных здесь 18 статей достаточно тесно свя­зана с теорией игр, чтобы оправдать включение книги в настоящий список. Эта связь осуществляется посредством известной эквивалент­ности игр двух лиц с нулевой суммой и пар двойственных задач, линейного программирования, а также путем изучения модели расширяющейся экономики фон Неймана, которой посвящено несколько статей. Имеется библиография, содержащая 298 названий. Berge С., Theorie generale des jeux a n personnes, Paris, 1957, 144 стр. [2]).

Строго математическое и весьма сжатое руководство с отчетливо выраженной теоретико-множественной ориентацией, суммирующее известные к тому времени результаты. В последующих работах Берж развил теорию графов и разработал ее приложения к специальным задачам теории игр и родственных областей.

Luce R. D., R a i f f а Н., Games and decisions: Introduction and cri­tical survey, New York, 1957, xix + 509 стр. [3]).

По-видимому, это наиболее известный общий вводный труд по теории игр. Книга в большей части нематематична, но тем не менее требует от читателя высокого уровня сосредоточенности. Она является примером того, сколь далеко можно развить словесные описания без чрезмерных уступок популярности. Изложение весьма полно-и ведет от теории полезности к новым формам устойчивости решений игр п лиц (введение ^-устойчивости, рассмотрение «ядра» и т. п.). Имеется обширная библиография.

Contributions to the theory of games III, ed. by M. D r e s h e r, A. W. T u – с k e r, Ph. W о 1 f e, Princeton, 1957, 435 стр.; IV, ed. byA. W. Tucker and R. D. Luce, Princeton, 1959.

Следуя традиции, установленной I и II томами серии, эти две книги содержат некоторые из наиболее фундаментальных работ, полученных в данной области. Каждому/тому предпослан подроб­ный вступительный обзор, написанный редакторами. В томе III развивается теория игр двух лиц, а том IV посвящен теории игр тг лиц; последний содержит также библиографию, насчитывающую 1009 названий.

Burger Е., Einfiihrung in die Theorie der Spiele. Mit Anwendung und Beispielen, inbesondere aus Wirtschaftslehre und Sociologie, Berlin, 1959, 169 стр.

В этой краткой книге теория игр рассматривается с большой строгостью как раздел прикладной математики; автор подробно излагает теорию игр п лиц и проводит тщательное рассмотрение значения в смысле Шепли, модели расширяющейся экономики и т. п.

К а г 1 i n S., Mathematical methods and theory in games, programming and economics I: Matrix games, programming and mathematical economics II: The theory of infinite games, Reading Mass, London, 1959, I, x + 433 стр.; II, xi + 386 стр.

В этом чисто математическом трактате автор пытается унифициро­вать методы. В первом томе рассматриваются конечные пространства стратегий, во втором — бескоцечные. Автор занимается исключитель­но ситуациями, в которых участвуют два лица. Подробно рассматри­ваются экономические модели и теория математического программи­рования. Весьма ценным является подробное исследование покера, который, возможно, представляет собой прообраз экономического и политического поведения.

S h u b i k М., Strategy and market structure: competition, oligopoly and the theory of games, New York, 1959, xviii + 387.

Подзаголовок этой книги (конкуренция, олигополия и теория игр) указывает на тот круг проблем, к которым намечаются подходы с точки зрения идей и методов теории игр. Вводится много новых идей, например: игра на экономическое выживание, роль начальных активов фирмы, поток и стоимость информации и т. д. Эта работа стала краеугольным камнем в теоретико-игровой трактовке экономи­ческих проблем. Автор продолжает изложение совершенно новых результатов по экономическому равновесию в выходящей вскоре книге (написанной совместно с Л. Шепли), отдельные разделы кото­рой уже опубликованы корпорацией РЭНД в форме брошюр.

Suzuki М., Gemu no riron, Tokio, 1959, 242 стр.

Учебник, в котором большое внимание уделено играм п лиц, в том числе рассмотрению ^-устойчивости, бескоалиционных игр, ситуаций равновесия.

Gale D., The theory of linear economic models, New York — Toronto — London, 1960, xxi + 330 стр. [4]).

Хотя Гейл рассматривает, по существу, линейную математиче­скую! экономику, много места уделено теории игр, особенно рас­смотрению модели расширяющейся экономики фон Неймана, о кото­рой еще^будет идти речь.

Rapoport A., Fights, games and debates, Ann. Arbor, 1960, xvi + 400 стр.

Популярное, ясное, точное описание игровых ситуаций и под­ходов к ним. В последнем разделе («Споры») рассматриваются инди­видуалистический и коллективистский варианты организации общества.

Dresher М., Games of strategy: Theory and applications, Englewood Cliffs, New York, 1961, xii + 186 стр.

Развитие и применение (преимущественно к играм военного содержания) методов решения игр двух лиц. Приводится также много иллюстраций применения к играм с бесконечными множе­ств ами к стр атегий.

Recent advances in games theory. Papers delivered at a Princeton University Conference, Oct. 4—6, 1961, Princeton, Econometric Research Program, 1962, 282 стр.

Этот неформальный отчет охватывает все области теории игр; большое внимание уделено играм п лиц, проблемам торгов, коопера­тивным играм без побочных платежей. Некоторые из этих статей были впоследствии опубликованы в других местах.

Martin R. М., Intension and decision, a philosophical study, Englewood Cliffs, 1963, 159 стр.

Автор, являющийся специалистом по математической логике, развивает теорию субъективных намерений (этот термин употреб­ляется в смысле Фреге), основанную в значительной степени на тео­рии предпочтений и полезности фон Неймана — Моргенштерна. Эта теория црименяется для определения рациональности и, в част­ности, для определения полезности высказываний в языковой системе.

Morgenstern О., Spieltheorie und Wirtschaftswissenschaft, Olden- bourg – Wien, 1963, 200 стр.

Сборник статей (включающий некрологи фон Нейману и Вальду), частично носящих вводный характер, частично посвященных прило­жениям теории игр — в особенности к теории спроса. Развернутое обсуждение совершенного предсказания и теории равновесия.

Vogelsang R., Die mathematische Theorie der Spiele, Bonn, 1963. 254 стр.

Вводное руководство, написанное ясно и со знанием дела, адре­сованное широкому кругу читателей, обладающих лишь минималь­ной математической подготовкой.

Русский перевод: М. Д р е ш е р, Стратегические игры. Теория и приложения. «Сов. радио», 1964.— Прим. ред.

Advances in game theory. Ed. by M. D г e s h e r, L. S. S h a p 1 e y, A. W. Tucker, Princeton, 1964, 679 стр.

Собранные здесь 29 статей показывают, что фундаментальные исследования по теории игр активно продолжаются одновременно во многих направлениях. В первых 13 статьях рассматриваются игры двух лиц; представляется, что преобладающими здесь являются проблемы, связанные с состоянием информации у игроков. Остальные 16 работ посвящены играм п лиц. Здесь делаются попытки ввести новые понятия решения для бесконечных позиционных игр, в кото­рых имеется континуум альтернатив и допускаются партии бесконеч­ной длины.

S\h u b i k M. (ed.), Game theory and related approaches to social beha­viour, New York, 1964, xi + 390 стр.

Эта книга является собранием 23 отрывков, взятых из книг и статей, охватывающих все области фактических и потенциальных приложений теории игр к социальным наукам. Шубик написал введение (80 страниц), в котором дается широкий обзор социальных ситуаций, поддающихся теоретико-игровому анализу.

Isaacs R., Differential games: A mathematical theory with applications to warfare and pursuit, control and optimization, New York, 1965, xxii + + 384 стр. x).

Автор развивает широкую теорию игр преследования, уклоне­ния, соперничества и т. д., описывая непрерывное и дискретное поведение. Многие из рассмотренных здесь задач аналогичны про­блемам, изучавшимся в работах Понтрягина, Келенджеридзе и дру­гих советских авторов. Указан ряд трудных, до сих пор не решен­ных задач.

Rapoport A., Chammah А. М., Prisoner’s dilemma, Ann. Arbor, 1965.

Наиболее подробный анализ знаменитой проблемы; освещены также многочисленные тщательно продуманные эксперименты, включающие обучение в повторяющихся партиях, цепи Маркова и т. д.

Rapoport A., Two-person game theory: the essential ideas, Ann. Arbor, 1966, 229 стр.

Популярная книга, в которой приведены также многочислен­ные интересные примеры.

Theory of games, techniques and applications. Ed. by A. M e n s с h, Lon­don, 1966, 490 стр.

Труды конференции, состоявшейся в 1964 г. в Тулоне (Франция) и организованной Комитетом по научным делам при НАТО. Рас­сматривается широкий круг проблем: информация, преследование, угрозы, экспериментальные игры, распределение ресурсов и т. п.

х) Русский перевод: Р. А й з е к с, Дифференциальные игры, М., «Мир», 1967.— Прим. ред.

2 Дш. Нейман, О. Моргенштерн

S h u b i к М. (ed.), Essays in mathematical economics, in honor of Oskar Morgenstern, Princeton, 1967, xx + 475 стр.

Первая часть этой книги содержит шесть статей по теории игр. Ауман дает подробный обзор кооперативных игр без побочных платежей. Кун обобщает игру справедливого разделения на слу­чай п лиц. Дэвис, Машлер и Пелег приводят важные доказательства для теории множеств договоров и устойчивых конфигураций выигры­шей, а Шепли и Шубик дают исчерпывающее рассмотрение связей теории игр с теорией свободной конкуренции.

В дополнение к этим книгам я упомяну еще книгу, N у b 1 е n G. r The problem of summation in economic science, Lund, 1951, хотя она и вышла до 1953 г. Это первая книга, в которой теория игр применяется к экономике. Дается, в частности, обоснование экономической оценки клас­сической неаддитивности характеристической функции для игр п лиц. Проводится теоретико-игровой анализ денежной инфляции.

‘ Аналогично К. Эрроу (Arrow К., Social choice and individual values, New York, 1951; 2nd ed. 1964) доказал — при некоторой системе разумных аксиом о предпочтениях — неаддитивность индивидуальных предпочтений при попытке построения функции предпочтения для сооб­щества. Это — основная проблема экономики благосостояния, по которой имеется обширная литература.

Наконец, имеются две книги Зигеля и Фурэйкера (S i е g е 1 S., Fouraker L. Е., Bargaining and group decision making, New York, 1960; Bargaining behaviour, New York, 1963), в которых описаны важные эксперименты, касающиеся в основном рыночных ситуаций. Большое внимание в этих экспериментах уделялось психологическим аспектам поведения при торгах.

4. Приведенный здесь список основных книг показывает, что в рам­ках нескольких абзацев нет никакой возможности адекватно отразить основные тенденции развития теории игр после 1953 г. Поэтому я огра­ничусь перечислением следующих основных вопросов.

а) Исследование игр двух лиц как с нулевой, так и с ненулевой сум­мой достигло весьма высокого уровня развития. Однако здесь все еще остаются большие вычислительные проблемы, а также вопросы, касающие­ся состояния информации игроков, знания ими правил игры, выгодности или невыгодности раскрытия собственной функции полезности в некото­рых условиях переговоров и т. п.

Интересной разработкой явилось использование теории игр для обобщения модели расширяющейся экономики фон Неймана, предложен­ное Кеменем, Моргенштерном и Томпсоном (Econometrica 24) (1956), 115—127), а также Моргенштерном и Томпсоном (Kyklos, XX (1967), 387—409). В этих работах теория игр используется как математический аппарат, а не как модель реальной действительности; это применение представляется во многих отношениях неожиданным. В первой работе вводится понятие подэкономики и доказывается, что экономика не обяза­тельно будет идти к эффективной точке.


б) В теории кооперативных игр п лиц предпринималось много попы­ток выработать новые понятия решения — в перспективе прийти тем самым к более простым понятиям и, может быть, даже найти такие реше­ния, которые окажутся единственными. Имелась надежда, что любая игра п лиц в форме характеристической функции должна обладать реше­нием. Эта гипотеза была основана на том факте, что каждая из изучавших – ся до сих пор игр таким решением действительно обладала, даже если п было сколь угодно велико, как, например, в интересном случае простой игры [1, . . ., 1, п — 2]h с главным игроком (см. § 55, гл. X). Однако в октябре 1967 г. У. Лукас нашел игру 10 лиц в форме характеристической функции, которая не имеет решения (устойчивого множества). С точки зрения решений эта игра эквивалентна некоторой игре с супер аддитивной характеристической функцией (см. Lucas W. F., A game with no solu­tion, RAND Corp., Memorandum RM-5518-PR, 1967). Это исключительно важное открытие будет стимулировать поиск других понятий решения по их математической и эмпирической значимости и откроет новые направ­ления для дальнейшего развития теории игр.

Одним из возможных подходов к проблеме решений является выделе­ние из всех множеств, описывающих исходы игры, некоторых особых множеств, которые могут считаться в каком-то смысле «устойчивыми». Другой подход заключается в погружении кооперативной игры в бескоа­лиционные модели переговоров; тем самым кооперативный случай сводит­ся к более простому бескоалиционному. Первый подход, црийадлежащий в основном Ауману и Машлеру, представляется весьма обещающим; в частности, он дает возможность для экспериментов, которые стали весьма важными и значение которых несомненно будет возрастать, ибо они уже сейчас ведут за собой теоретические исследования.

Теория кооперативных игр с побочными платежами обобщена на слу­чай игр без побочных платежей. Это привело ко многим новым результа­там; например, показано, что существуют игры, не имеющие решения, а также игры без побочных платежей и коалиций, для которых множе­ство М{1) устойчивых конфигураций пусто (мы используем обозначения Машлера, которому принадлежит много работ в этой области). Это могло бы привести к пересмотру системы аксиом, при котором осталось бы выполненным требование о том, что любая игра имеет решение.

Важные работы были проделаны (и ведутся в настоящее время) в направлении исследования с-ядра. Это понятие было введено фон Нейма­ном и Моргенштерном и развито Джил лисом (1953). Было показано (впер­вые, очевидно, О. Н. Бондаревой в 1963 г. и повторно Шепли в 1965 г.), что принадлежащие некоторому классу игры с побочными платежами в форме характеристической функции имеют непустое с-ядро; с-ядра выпук­лых игр изучались Шепли, который обнаружил их специфическую регу­лярную структуру; Ауман ввел понятие с-ядра игры без побочных плате­жей, а Скарф нашел необходимое и достаточное условие того, что послед­няя обладает непустым с-ядром.

Эти результаты имеют особую ценность для приложений к экономике, и сейчас в этом направлении ведется интенсивная работа. Особо отметим приведенную выше ссылку на совместные публикации Шепли и Шубика.

в) Бескоалиционные игры п лиц основаны на идее ситуаций равно­весия, введенных первоначально Нэшем, который показал, что любая конечная игра п лиц имеет ситуацию равновесия в смешанных стратегиях. Этот результат широко признан и получил применения во многих обла­стях. Были найдены его чисто алгебраические доказательства, которые привели даже к эффективным схемам вычисления ситуаций равно­весия.

Рассмотрение этих игр естественным образом привело к идее (пред­восхищенной Вальрасом еще в 1874 г.) использования континуума игро­ков. Эти усилия выявляют по крайней мере одну точку соприкосновения теории игр и классической лозаннской школы общего экономического равновесия, хотя теория игр существенно отличается от последней как по своей общей ориентации, так и по направлениям своего развития.

г) Особого упоминания заслуживает множество устойчивых конфи­гураций, о котором мы уже говорили выше. Большинство результатов этой теории установлено Машлером и Дэвисом (Essays in mathematical economics, M. S h u b i k, ed.) с использованием топологических мето­дов. Распространение на общую коалиционную структуру дано Пелегом. С вычислительной точки зрения эта весьма многообещающая теория наталкивается на огромные трудности, однако путем введения понятия /с-ядра (некоторого непустого подмножества множества устойчивых кон­фигураций) некоторые из них удается преодолеть.

5. Эти немногие замечания едва позволили нам просто упомянуть некоторые из направлений, в которых развивается теория игр. Их сле­дует воспринимать лишь как иллюстрацию существования многих раз­личных тенденций. Имеются чисто математические проблемы большой сложности, возникающие из анализа эмпирических социальных явлений. Последние в свою очередь заметно проясняются новыми математическими приемами. Это взаимодействие весьма плодотворно; оно положило начало лучшему пониманию некоторых основных аспектов человеческого пове­дения. Перед теорией игр большой путь, и здесь возможно много сюр­призов.

Оскар Моргенштеря

Принстон, апрель 1967 г. (дополнено в январе 1968 г.).


Эта книга содержит изложение математической теории игр и различ­ных ее приложений. Теория игр развивалась одним из нас начиная с 1928 г. и теперь впервые публикуется во всей своей полноте. Приложения имеют двоякий характер: с одной стороны, к играм в собственном смысле слова, с другой стороны, к экономическим и социологическим пробле­мам. Мы надеемся показать, что подход к ним с этого направления являет­ся наилучшим.

Приложения, которые мы будем развивать применительно к играм, будут служить как для подкрепления самой теории, так и для исследо­вания этих игр. Характер этих взаимных отношений станет ясным по ходу исследования. Наши основные интересы лежат, разумеется, в экономиче­ском и социологическом направлениях. Здесь мы сможем рассмотреть лишь простейшие вопросы. Однако эти вопросы имеют фундаментальный характер.

Кроме того, наша цель состоит прежде всего в том, чтобы показать, что существует строгий подход к вопросам, охватывающим проблемы совпа­дающих или противоположных интересов, полной или неполной инфор­мации, свободных разумных решений или случайных воздействий.

Джон фон Нейман, Оскар Моргенштерн

Принстон, январь 1943 г.


Второе издание отличается от первого лишь некоторыми незначи­тельными изменениями. Мы добавили приложение, содержащее аксиома­тический вывод численной полезности. Этот вопрос обсуждался весьма подробно, но в основном лишь качественно, в § 3. Мы планировали также написать несколько приложений о применениях к теории размещения отраслей и об играх четырех и пяти лиц; однако эту мысль пришлось оставить из-за перегруженности другой работой.

Со времени публикации первого издания появилось несколько статей, посвященных основной теме этой книги.

Обратим внимание читателя, интересующегося математической сто­роной проблемы, на следующие работы. А. Вальд развил новую теорию оснований статистических оценок, которая тесно связана с теорией игр двух лиц с нулевой суммой и основана на ней (Statistical decision functions which minimize the maximum risk, Annals of Math. 46 (1945), 265—280). Он распространил также основную теорему об играх двух лиц с нулевой суммой (п. 17.6) на некоторые непрерывные случаи (Generalization of а theorem by von Neumann concerning zero-sum two-person games, Annals of Math. 46 (1945), 281—286). Новое, очень простое и элементарное дока­зательство этой теоремы (охватывающее также и более общую теорию, упомянутую в замечании на стр. 177—178) было дано Л. Лумисом (On а theorem of von Neumann, Proc. Nat. Acad. Sci. USA 32 (1946), 213—215). Далее, интересные результаты относительно роли чистых и смешанных стратегий в играх двух лиц с нулевой суммой были получены И. Каплан – ским (A contribution to von Neumann’s theory of games, Annals of Math. 46 (1945), 474—479). Мы также’ предполагаем вернуться к различным математическим аспектам этой проблемы. Теоретико-групповая проблема, сформулированная в замечании на стр. 177—178, была решена К. Шевалле.

Читатель, интересующийся экономической стороной вопроса, найдет более простое изложение рассмотренных в этой книге проблем в работах Л. Гурвица (The theory of economic behavior, American Economic Review 35 (1945), 909—925) и Дж. Маршака (Neumann’s and Morgenstern’s new approach to static economics, Journal of Political Economy 54 (1946), 97-115).

Джон фон Нейман, Оскар Моргенштерн

Принстон, сентябрь 1946 г.


Со времени публикации второго издания литература по данной про­блеме выросла весьма существенно. Полная библиография к настоящему моменту содержит несколько сотен названий; поэтому мы не будем пытать­ся привести ее здесь. Мы перечислим лишь следующие книги:

1) Contributions to the theory of games, vol. I (ed. by H. W. Kuhn and A. W. Tucker). Annals of Mathematics Stadies, No. 24, Princeton, Princeton Univ. Press, 1950. Сборник содержит пятнадцать статей тринадцати авторов.

2) Contributions to the theory of games, vol. II (ed. by H. W. Kuhn and A. W. Tucker). Annals of Mathematics Stadies, No. 28, Princeton, Prin­ceton Univ. Press, 1953. Сборник содержит двадцать одну статью двадцати двух авторов х).

3) McDonald J., Strategy in poker, business and war, New York, 1950.

4) M с К i n s e у J. С. С., Introduction to the theory of games, New York, 1952 [5]).

5) W a 1 d A., Statistical decision functions, New York, 1950 [6]).

6) Williams J., The compleat strategyst being a primer on the theory of games of strategy, New York, 1953 [7]).

Во всех этих книгах, кроме 6), содержится библиография по теории игр. Интенсивная работа в этом направлении была проведена за последние годы сотрудниками корпорации РЭНД (Санта-Моника, Калифорния). Библиографию этих работ можно найти в публикации RM-950 корпора­ции РЭНД.

В теории игр п лиц имели место дальнейшие разработки в направле­нии изучения бескоалиционных игр. В связи с этим следует особо отметить работу Дж. Нэша [8]) (J. Е. Nash, Non-cooperative games, Annals of Math. 54 (1951), 286—295). Дальнейшие ссылки на соответствующие работы можно найти в книгах 1), 2), 4).

Из разработок в области математической экономики мы выделим «линейное программирование» и «задачу о назначениях», связи которых с теорией игр оказываются все более многочисленными. Указания на это читатель найдет в тех же книгах 1), 2) и 4).


Предложенная в п. 3.1 и в приложении ко второму изданию теория полезности подверглась значительному развитию как с теоретической, так и с экспериментальной стороны. В связи с этим читатель может обра­титься, в частности, к следующим работам:

М. Friedman, L. J. Savage, The utility analysis of choices involving risk, Journal of Political Economy 56 (1948), 279—304.

J. Marschak, Rational behaviour, uncertain prospects, and mea­surable utility, Econometrica 18 (1950), 111—141.

F. M о s t e 11 e r, P. N о g e e, An experimental measurement of uti­lity, Journal of Political Economy 59 (1951), 371—404.

M. Friedman, L. J. Savage, The expected-utility hypothesis and the measurability of utility, Journal of Political Economy 60 (1952), 463-474.

Обращаем внимание читателя также на симпозиум по кардинальным полезностям (Econometrica 20 (1952)):

Н. Wold, Ordinal preferences or cardinal utility?

A. S. M a n n e, The strong independence assumption — gasoline blends and probability mixtures.

P. A. S a m u e 1 s о n, Probability, utility, and the independence axiom.

E. Malinvaud, Note on von Neumann-Morgenstern’s strong inde­pendence axiom.

В связи с критическими замечаниями методологического характера, высказанными некоторыми участниками упомянутого симпозиума, мы хотели бы отметить, что мы применяли аксиоматический метод обычным образом и с обычными предосторожностями. Так, строгое аксиоматическое рассмотрение понятия полезности (п. 3.6 и Приложение) было дополнено введением эвристического характера (в пп. 3.1—3.5). Его роль заключает­ся в сообщении читателю некоторых исходных положений, позволяющих оценить пригодность последующего аксиоматического построения и очер­тить границы его применимости. В частности, наше рассмотрение и выбор «естественных операций» в этих пунктах покрывают то, что представляет­ся нам существом «аксиомы независимости» Самуэльсона — Маленво.

Джон фон Нейман, Оскар Моргенштерн

Принстон, январь 1953 г.


Сама природа рассматриваемых в этой книге проблем и применяемых в ней методов требует рассуждений, которые во многих случаях являются чисто математическими. Используемые нами математические приемы эле­ментарны в том смысле, что они не используют высшей алгебры, матема­тического анализа и т. п. (Имеются лишь два довольно несущественных исключения: часть исследования примера в п. 19.7 и далее, а также заме­чание в п. А. 3.3 х) используют некоторые простые интегралы.) Важную роль играют понятия теории множеств, линейной геометрии и теории групп; однако они неизменно касаются начальных глав этих дисциплин и, кроме того, анализируются и разъясняются в специальных вводных параграфах. Тем не менее книгу нельзя считать вполне элементарной, так как математические выводы нередко оказываются весьма тонкими, а логи­ческие возможности рассматриваются при этом детально.

Таким образом, от читателя не требуется знания никаких конкретных разделов высшей математики. Однако читатель, который захочет более глубоко изучить излагаемую здесь теорию, должен будет освоить приемы математических рассуждений, далеко выходящие за рамки примитивных и стандартных. Характер наших методов близок по духу к математической логике, теории множеств и функциональному анализу.

Мы пытались изложить предмет таким образом, чтобы читатель, недо­статочно искушенный в математике, мог приобрести необходимые навыки в ходе изучения книги. Мы надеемся, что эта наша попытка не кончилась полной неудачей.

В соответствии со сказанным изложение здесь вовсе не таково, каким оно было бы в чисто математическом руководстве. Все определения и выво­ды значительно более развернуты, чем они были бы там. Кроме того, значительное место занимают чисто словесные обсуждения и рассмотрения. В частности, мы попытались дать для каждого математического вывода там, где это возможно, параллельное словесное описание. Мы надеемся, Что такой способ изложения разъяснит на нематематическом языке смысл того или иного математического приема и, кроме того, покажет, где этот прием дает нам больше, чем мы могли бы добиться без его использо­вания.

В этом, равно как и в наших исходных методологических предпосыл­ках, мы пытаемся следовать лучшим образцам из области теоретической физики.

26

ТЕХНИЧЕСКИЕ^. ЗАМЕЧАНИЯ

Читатель, не обладающий чисто математическими интересами, может при первом чтении пропускать те параграфы книги, которые, по его мнению, окажутся слишком математичными. Мы предпочитаем не давать конкретного перечня таких параграфов, так как подобное мнение неизбежно должно быть субъективным. Однако наиболее вероятно, что параграфы, отмеченные в оглавлении звездочкой, будут выделены в этой связи обычным читателем. Во всяком случае, он найдет, что такие про­пуски мало помешают пониманию последующих частей, хотя логическая цепь может при этом, строго говоря, претерпеть разрыв. По мере продви­жения такие провалы будут постепенно приобретать все более серьезный характер и лакуны в выводах будут становиться все более и более зна­чительными. В|этом случае мы советуем читателю начать сначала, ибо более свободное владение материалом облегчает лучшее понимание.

ВЫРАЖЕНИЕ ПРИЗНАТЕЛЬНОСТИ

Авторы хотели бы выразить свою благодарность Принстонскому университету и Институту перспективных исследований за их щедрую помощь, сделавшую возможной настоящую публикацию.

Они весьма признательны также издательству Принстонского уни­верситета, которое приложило все силы для публикации этой книги, несмотря на трудности военного времени. Издатель на всех этапах про­явил самое глубокое понимание пожеланий авторов.


ФОРМУЛИРОВКА ЭКОНОМИЧЕСКОЙ ЗАДАЧИ

§ 1. МАТЕМАТИЧЕСКИЙ МЕТОД В ЭКОНОМИКЕ 1.1. Вводные замечания

1.1.1. Целью настоящей книги является рассмотрение некоторых фундаментальных вопросов экономической теории, требующих изуче­ния, отличного от того, которое до сих пор проводилось в литературе. Дальнейший анализ будет затрагивать некоторые основные проблемы, возникающие при изучении экономического поведения, которые в течение долгого времени находились в центре внимания экономистов. Эти про­блемы имеют в своей основе попытки точного описания стремления инди­видуума к извлечению максимальной пользы или, в случае предприни­мателя, к получению максимальной прибыли. Общеизвестно, сколь зна­чительны — а фактически и непреодолимы — встречающиеся на пути решения этой задачи трудности, имеющие место даже при ограничен­ном числе типичных ситуаций, как, например, в случаях прямого или непрямого обмена товарами между двумя или более лицами, двусторон­ней монополии, дуополии, олигополии и свободной конкуренции. Будет выяснено, что структура этих проблем, известных каждому изучавшему экономику, является во многих отношениях существенно иной, чем это представлялось до сих пор. Кроме того, окажется, что точная поста­новка и последующее решение этих задач могут быть достигнуты только при помощи таких математических методов, которые существенным образом отличаются от технических средств, применявшихся экономи­стами-математиками прошлого и современности.

1.1.2. Наши рассмотрения приведут к приложению математической теории «стратегических игр», развитой одним из авторов последовательно в несколько приемов в 1928 и в 1940—41 гг. х). После изложения этой теории будет предпринято ее приложение к экономическим задачам в указанном выше смысле. Будет выяснено, что теория игр дает новый подход к ряду еще не решенных к настоящему времени экономических вопросов.

Сначала нам следует выяснить, каким образом эту теорию можно поставить в соответствие экономической теории и что общее имеется у этих теорий. Наилучший путь для этого состоит в кратком описании природы некоторых фундаментальных экономических проблем с тем, чтобы это общее стало очевидным.

После того, как это будет сделано, станет ясным, что в установлении этого соответствия не только нет ничего искусственного, но что, напротив, теория стратегических игр является адекватным аппаратом для развития теории экономического поведения.

Первые этапы этой работы были опубликованы: J. von Neumann, Zur Theorie der Gesellschaftspiele, Math. Annalen 100 (1928), 295—320 (русский перевод: Дш. Нейман, К теории стратегических игр, сб. «Матричные игры», Физматгиз, 1961, 173—204). Дальнейшее развитие теории, равно как и более детальная разработка подхода, предложенного в цитированной статье, публикуются здесь впервые.

Было бы неправильным считать целью наших рассуждений одно лишь установление аналогии между двумя указанными теориями. После разбора нескольких правдоподобных схематизаций мы надеемся доста­точно удовлетворительно показать, что типичные задачи экономического поведения оказываются вполне тождественными с математическими поня­тиями соответствующих стратегических игр.

1.2. Трудности в применении математического метода

1.2.1. Уместно начатЁ с некоторых замечаний, касающихся природы экономической теории, и кратко обсудить вопрос о роли, которую может сыграть математика в ее развитии.

Прежде всего отдадим себе отчет в том, что в настоящее время в эко­номической теории не существует универсальной системы и что если она и будет создана, то едва ли это произойдет в ближайшее время. При­чина этого кроется просто в том, что экономика является слишком слож­ной наукой для того, чтобы можно было быстро осуществить построение такой системы, особенно если иметь в виду крайнюю ограниченность знаний, а также несовершенство описания фактов, с которыми приходится иметь дело экономисту. Только тот, кто недооценивает эти обстоятель­ства, может склоняться к попыткам построения универсальной систе­мы. Даже в науках, ушедших по сравнению с экономикой далека вперед, как, например, в физике, в настоящее время нет универсальной системы.

Продолжим сравнение с физикой. Иногда кажется, будто та или иная физическая теория дает базис для универсальной системы; однако каждый раз вплоть до настоящего времени такие иллюзии сохранялись в лучшем случае в течение десятка лет. Повседневная работа физиков, конечно, не связана со столь высокими целями, а касается скорее тех задач, которые уже достаточно «созрели». По-видимому, в физике вообще не было бы прогресса, если бы делались серьезные попытки форсированно принуждать физиков к построению общей теории. Работа физиков свя­зана с решениями конкретных задач большей или меньшей практической значимости. Этот стиль работы дополняется объединением отраслей науки, считавшихся прежде разобщенными и далекими друг от друга. Однако явления последнего типа редки и происходят лишь после того, как каждая из отраслей уже оказывается достаточно изученной. Учиты­вая тот факт, что экономика является значительно более трудной и менее изученной наукой, находящейся к тому же на гораздо более ранней сту­пени своего развития, чем физика, не следует ожидать в экономике боль­шего, чем разработок указанного типа.

Отметим, далее, что различия в научных вопросах делают необхо­димым использование различных методов, которые в дальнейшем могут быть отброшены, как только будут предложены лучшие. Отсюда выте­кают два следствия. В некоторых отраслях экономики наиболее плодотвор­ным является тщательное, заботливое описание фактов; действительно, это является наиболее обширной областью исследования как в настоящее время, так и в ближайшем будущем. С другой стороны, уже может ока­заться возможным развитие точной теории, и для этого требуется исполь­зование математики.

Фактически математика уже использовалась в экономической тео­рии, быть может, даже в большей степени, чем это следовало бы. Во вся – ком случае, ее использование не было особенно успешным. Это явление противоположно тому, что наблюдалось в других науках, где математика применялась с большим успехом, так что большинство наук теперь едва ли может успешно развиваться без ее применения. Однако объяснить это явление можно совсем просто.

1.2.2. Дело отнюдь не в том, что существуют какие-то кардинальные причины, по которым математику нельзя использовать в экономике. Часто аргументация против применения математики состоит из ссылок на субъективные элементы, психологические факторы и т. п., а также на то, что для многих важных факторов до сих пор нет способов количе­ственного измерения. Эту аргументацию следует отбросить, как совер­шенно ошибочную. Почти все эти возражения уже приводились или могли приводиться несколько столетий тому назад по поводу тех наук, в которых ныне математика является основным средством анализа. Выра­жение «могли приводиться» понимается в следующем смысле. Предста­вим себе, что мы живем в период, предшествующий математической или почти математической фазе развития физики, т. е. в XVI веке, или в ана­логичную эпоху для химии и биологии, т. е. в XVIII веке.

Для тех, кто относится скептически к применению математики в экономике, заметим, что положение дел в физических или биологиче­ских науках на этих ранних этапах едва ли было лучше, чем в настоящее время в экономике.

По поводу отсутствия способов измерения большинства важных факторов достаточно сослаться на пример теории теплоты, который является наиболее поучительным; до развития математической теории возможности количественных измерений здесь были еще менее благоприят­ными, чем теперь в экономике. Точные измерения количества и качества тепла (энергия и температура) были следствием, а не предпосылкой математической теории. Это должно представляться особенно наглядным при сопоставлении с тем фактом, что количественные и точные понятия цен, денег и процента с капитала выработались уже несколько столетий тому назад.

Следующая группа возражений против возможностей количествен­ных измерений в экономике сосредоточивается вокруг невозможности безграничного дробления экономических величин. Это, дескать, несов­местимо с применением инфинитезимальных исчислений и, следователь­но (!), математики. Трудно поверить, что эти возражения поддерживаются одновременно с существованием атомистических теорий в физике и химии, квантовой теории в электродинамике и т. д. и наличием общеизвестных успехов математики в этих дисциплинах.

Здесь же уместно упомянуть другой часто встречающийся в экономи­ческой литературе аргумент, который также можно рассматривать как возражение против математических методов.

1.2.3. Для освещения концепций, которые мы будем прилагать к экономике, мы приводим и будем приводить далее некоторые иллюстра­ции из физики. Многие социологи возражают против проведения таких параллелей по различным причинам, среди которых обычно приводится и утверждение о том, что экономические теории не могут моделироваться по образцу физических, так как в экономических теориях учитываются социальные, человеческие явления, так как в них приходится принимать в расчет психологические факторы и т. д. Подобные утверждения по меньшей мере незрелы. Несомненно, представляется разумным вскрыть, что именно привело к прогрессу в других науках, и исследовать, почему применение этих принципов не может привести к прогрессу и в экономике. Если же – действительно возникнет необходимость приложения к экономике каких – то иных принципов, то это может обнаружиться только в процессе факти­ческого развития экономической теории. Это само по себе будет перево­ротом в науке. Но так как почти наверно мы еще такого состояния не достигли и никоим образом не ясно, что возникает необходимость использования совершенно новых научных принципов, было бы неразум­ным рассматривать что-либо иное, чем трактовку задач тем способом, который уже привел к построению физической науки.

1.2.4. Итак, причины, в силу которых применение математики к эко­номике не давало успеха, лежат в чем-то другом. В значительной мере отсутствие реальных успехов в этом направлении объясняется комбина­цией неблагоприятных обстоятельств, части которых мы будем постепенно касаться. Начнем с того, что экономические задачи не формулируются ясно, а приводятся часто в столь неопределенных терминах, что их мате­матическая трактовка априори становится безнадежной, так как неясно даже, о какой проблеме идет речь. Точки приложения точных методов, не может быть там, где нет ясности ни в концепциях, ни в вопросах, к которым эти методы должны прилагаться. Следовательно, первая задача состоит в прояснении знаний о предмете посредством дальнейшей тща­тельной описательной работы. Однако даже в тех разделах экономики, в которых задача описания разрешалась более удовлетворительно, мате­матический аппарат редко используется адекватно. Либо он применяется несоответствующим образом (например, в попытках определить общее – экономическое равновесие путем простого подсчета числа уравнений и числа неизвестных), либо он сводится к простому переводу с лите­ратурного языка на язык математических символов без последующего математического анализа.

Далее, эмпирическая основа экономической науки совершенно неудовлетворительна. Наши знания о существенных фактах в области экономики несравненно меньше, чем знания, которыми мы располагали в физике к тому моменту, когда была достигнута ее математизация. В самом деле, решающий перелом, который произошел в физике* в XVII веке (особенно в механике), был возможен единственно благодаря предшествующему развитию астрономии. Он опирался на несколько тысячелетий систематических научных астрономических наблюдений, достигших апогея в таком несравненном наблюдателе, как Тихо Браге. Ничего подобного в экономической науке не происходило. В физике было бы абсурдным ожидать появления Кеплера и Ньютона без Тихо,— и нет никаких оснований надеяться на более легкое развитие в эко­номике.

Эти очевидные соображения не следует рассматривать как дискре­дитацию статистико-экономических исследований, которые дают реаль­ную надежду на прогресс в соответствующих направлениях.

Вследствие перечисленных выше обстоятельств математическая эко­номика не достигла особенно многого. Лежащие в существе дела неопре­деленность и незнание не были рассеяны неадекватным и несоответствую­щим делу использованием мощного инструмента, с которым к тому же очень трудно работать.

В свете этих замечаний мы можем описать нашу позицию следующим образом. Цель настоящей книги далека от направления эмпирических исследований. Прогресс этой стороны экономической науки в необходи­мом направлении, очевидно, является задачей весьма большой важности.

Можно надеяться, что в результате успехов научной методики, а также опыта, полученного в других областях, развитие описательной экономики не потребует такого большого времени, как это может показаться, если иметь в виду пример астрономии. Однако, во всяком случае, представ­ляется, что эта задача по своей трудности превосходит пределы любой индивидуально планируемой программы.

Мы попытаемся воспользоваться некоторым общественным опытом, касающимся человеческого поведения, который поддается математической интерпретации и важен с экономической точки зрения.

Мы считаем, что возможность математического истолкования этих явлений опровергает «фундаментальные» возражения, приведенные в п. 1.2.2.

Однако далее будет видно, что этот процесс математизации вовсе не является тривиальным. Действительно, приведенные выше возражения отчасти имеют своим источником очевидные трудности, которые возни­кают при всяком непосредственном математическом подходе. Мы счи­таем необходимым изложить математический аппарат, не употреблявший­ся до сих пор в математической экономике, и может случиться, что даль­нейшие исследования в этой области приведут в будущем к созданию новых математических дисциплин.

В заключение отметим, что чувство неудовлетворенности математиче­скими интерпретациями экономической теории в значительной степени объясняется тем, что они часто дают не столько доказательства, сколько утверждения, которые не лучше, чем те же утверждения, высказанные в словесной форме. Обычно доказательства отсутствуют потому, что математический аппарат применяется к областям, которые настолько обширны и сложны, что еще в течение долгого времени — до тех пор, пока не будет накоплено больше эмпирических фактов,— едва ли можно ожидать серьезного прогресса от одного только увеличения дозы матема­тики. Тот факт, что эти области атакуются таким путем (например, теория экономических флуктуаций, временная структура производства и т. д.), показывает только, что сопровождающие этот процесс трудности недо­оцениваются. В действительности эти трудности огромны, и мы не чув­ствуем себя достаточно подготовленными для их преодоления.

1.2.5. Мы останавливались на природе и возможностях тех измене­ний в математическом аппарате — и, по существу, в самой математике,— которые может вызвать успешное приложение математики к новым пред­метам. Представляется важным бросить перспективный взгляд на эти изменения.

Не следует забывать, что эти изменения могут быть весьма значитель­ными. Решающая фаза приложений математики в физике — создание Ньютоном рациональной механики — не может быть отделена от откры­тия инфинитезимальных исчислений. (Имеются и другие примеры, хотя ни один из них не является более ярким.)

Важность социальных явлений, обилие и многообразие их проявлений, а также сложность их структуры по меньшей мере такие же, как и в физи­ке. Поэтому следует ожидать (или опасаться), что для достижения в этой области решающих успехов потребуются математические открытия, сопоставимые с открытием инфинитезимальных исчислений. (Между прочим, с этой точки зрения наши предлагаемые попытки должны рас­сматриваться с известной скидкой). Тем более маловероятно, что простое повторение тех математических приемов, которые нам помогали в физике, поможет нам и в экономике. Вероятность этого покажется еще меньше,» когда мы увидим, что в наших рассуждениях появляются матема­тические задачи, совершенно отличные от задач, встречающихся в физике.

Эти соображения следует иметь в виду в связи с имеющим место в наши дни злоупотреблением в использовании дйфференциального и интегрального исчислений, дифференциальных уравнений и т. д. как основного метода в математической экономике.

• 1.3. Необходимые ограничения целей исследования

1.3.1. Вернемся к высказанному ранее положению о том, что необ­ходимо начинать с тех задач, которые описаны отчетливо, даже если они окажутся не столь уж важными с любой другой точки зрения. Кроме того, следует добавить, что изучение этих «удобоваримых» задач может привести к результатам, которые уже хорошо известны, но точные дока­зательства которых тем не менее не были еще найдены. Пока эти доказа­тельства не даны, соответствующая теория попросту не существует как научная теория. Движения планет были известны задолго до того, как их траектории были вычислены и объяснены теорией Ньютона. То же справедливо для многих более узких и менее драматических ситуаций. Аналогично этому многие результаты экономической теории — ска­жем, неопределенность двусторонней монополии — могут быть уже известны. Тем не менее весьма интересно вывести их снова из неко – торойлточной теории. То же самое может и должно быть сказано практи­чески’ обо всех установленных к настоящему времени экономических теоремах.

1.3.2. Наконец, можно было бы добавить, что мы не предлагаем поднимать вопрос о практической значимости рассматриваемых проблем. Это согласуется с тем, что было сказано выше о выборе областей для приложения теории. Здесь положение дел не отличается от положения в других науках. В них наиболее важные с практической точки зрения вопросы также могли Доставаться вне сферы досягаемости в течение дли­тельных и плодотворных периодов развития этих наук. Подобное поло­жение, конечно, все еще имеет место и в экономике, где проблемами перво­степенной важности являются стабилизация занятости, увеличение национального дохода или его справедливое распределение. Никто не может по-настоящему ответить на эти вопросы, и мы не должны претен­довать на то, чтобы дать на них научно обоснованные ответы уже в бли­жайшее время.

Подлинный прогресс в любой науке наступал тогда, когда в ходе изучения задач, которые были скромными по сравнению с окончатель­ными целями, развивались методы, которые можно было обобщать все дальше |jn дальше. Свободное падение является весьма простым физиче­ским явлением; однако именно изучение этого чрезвычайно простого факта и его сравнение с накопленным в астрономии материалом вызвало к жизни механику.

Нам кажется, что к экономике следует подходить с таким же уров­нем скромности. Было бы несерьезно пытаться объяснять — и притом «систематическим» образом — все экономическое. Правильный подход состоит в том, чтобы добиться сначала наибольшей возможности точности и совершенства в некоторой ограниченной области, затем перейти к другой, несколько более широкой области и т. д. Это покончило бы также с нездоровой практикой применения так называемых теорий к эконо­мическим и социальным реформам, где они никоим образом не могут быть полезными.

Мы считаем, что необходимо знать как можно больше о поведении индивидуума и о простейших формах обмена. Эта точка зрения была в дей­ствительности принята с примечательным успехом основателями школы маргинальной полезности, но тем не менее она не является общепринятой. Экономисты часто нацеливаются на более широкие, более животрепещу­щие проблемы и отмахиваются от всего, что мешает им высказывать утверждения относительно этих проблем. Опыт более развитых наук, например физики, показывает, что подобное нетерпение только тормозит продвижение вперед, включая продвижение в исследовании этих живо­трепещущих проблем. Нет никаких оснований предполагать существо­вание коротких путей.

1.4. Заключительные замечания

1.4. Важно осознать, что экономисты не могут надеяться на более легкую судьбу, чем та, которая постигла ученых других специальностей. Представляется разумным ожидать, что они должны будут прежде всего рассмотреть проблемы, заключающиеся в самых простых фактах эконо­мической жизни, и пытаться построить теории, объясняющие их и дей­ствительно соответствующие нормам научной строгости. Мы можем иметь достаточную уверенность в том, что, начав с этого, экономиче­ская наука будет развиваться дальше, постепенно охватывая области, все более значительные по сравнению с теми, с которых нужно начинать

Область, охватываемая этой книгой, весьма ограничена, и мы под­ходим к ней со всей скромностью. Мы совершенно не заботимся о том, согласуются ли результаты наших исследований со взглядами, высказан­ными недавно или принятыми в течение долгого времени, ибо по-настоя­щему важным является постепенное развитие теории, основанное на тща­тельном анализе обычной, повседневной интерпретации экономических фактов. Этот предварительный этап по необходимости является эвристи­ческим. Иначе говоря, он состоит в переходе от нематематических правдо­подобных рассмотрений к формальному математическому аппарату. Полученная в результате теория должна быть математически строгой и концептуально целостной. Ее первые приложения необходимо должны ограничиваться элементарными задачами, в которых окончательный результат не подвергается никакому сомнению и где фактически никакой теории не требуется. На этом раннем этапе приложения служат лишь для подтверждения теории. Следующий этап начинается, когда теорию применяют к несколько более сложным ситуациям; здесь теория уже в определенных пределах может вывести за рамки очевидного и привыч­ного. И уже вслед за этим простирается область подлинного успеха — правильные теоретические предсказания. Хорошо известно, что все математизированные науки прошли через эти последовательные этапы развития.

Подобное начало имеет и определенный практический смысл, поскольку формы обмена между несколькими индивидуумами в точности совпадают с теми, которые наблюдаются на некоторых важнейших рынках современной промышленности или же при товарообмене между странами в международной торговле.

3 Дж. Нейман, О. Моргенштерн

§ 2. КАЧЕСТВЕННОЕ ОБСУЖДЕНИЕ ПРОБЛЕМЫ РАЦИОНАЛЬНОГО ПОВЕДЕНИЯ

2.1. Проблема рационального поведения

2.1.1. Основным предметом экономической теории является весьма сложный механизм цен и производства, а также получения и распределе­ния доходов. В ходе развития экономики было обнаружено — и это является теперь почти общепризнанным,— что один из подходов к этой обширной проблеме состоит в анализе поведения индивидуумов, образую­щих экономическое сообщество. Этот анализ был продвинут довольно далеко во многих отношениях; и хотя все еще имеется немало разногласий, важность этого подхода несомненна, вне зависимости от того, насколько большие трудности могут здесь встретиться. Препятствия эти несомненно значительны, даже если ограничить объект исследования на первых порах экономической статикой. Одна из основных трудностей лежит в правильном описании предположений, которые должны быть сделаны относительно побудительных мотивов индивидуума. Традиционная поста­новка этой проблемы заключалась в предположении, что потребитель желает получить максимум полезности или удовлетворения, а предпри­ниматель — максимум прибыли.

Принципиальные и практические трудности, связанные с понятием полезности и, в частности, с попытками представить ее числом, хорошо известны, и их рассмотрение не принадлежит к основным целям настоя­щей работы. Тем не менее в некоторых случаях мы будем вынуждены рас­смотреть их, в частности в п. п. 3.3 и 3.5. Оговорим сразу же, что исходные позиции настоящей книги по этому весьма важному и весьма интересному вопросу будут в основном приспособленческими. Мы хотим сосредото­читься на одной задаче, которая не является задачей измерения полезно – стей и предпочтений, и поэтому мы будем пытаться в разумных пределах максимально упростить все другие характеристики. С этой целью мы предположим, что целью всех участников экономической системы — как потребителей, так и предпринимателей — являются деньги или, чтб эквивалентно, некоторый единый монетарный товар. Последний пред­полагается неограниченно делимым и заменимым, свободно передавае­мым и тождественным (даже в количественном смысле) с любым «удовле­творением» или «полезностью», которых желает каждый участник. (По поводу количественного характера полезности см. упоминавшийся выше п. 3.3.)

В экономической литературе иногда высказывается мнение, что обсуждение понятий полезности и предпочтения является совершенно ненужным, так как эти определения являются чисто словесными и не имеют эмпирически наблюдаемых последствий, иначе говоря, они являют­ся просто тавтологическими. Нам не кажется, что эти понятия в коли­чественном отношении стоят ниже таких общепринятых и бесспорных физических понятий как сила, масса, заряд и т. п. Это значит, что, хотя в своей первоначальной форме они и являются просто определе­ниями, они становятся объектом эмпирического контроля через посред­ство теорий, которые строятся на их основе,— и только таким путем. Таким образом, понятие полезности поднимается над уровнем простой тавтологии посредством тех экономических теорий, которые используют это понятие, и результаты которых можно сравнивать с данными опыта или хотя бы со здравым смыслом.


2.1.2. Мы говорим, что индивидуум, пытающийся получить эти соответствующие максимумы, действует «рациональным» образом. Однако можно с уверенностью сказать, что в настоящее время не существует удовлетворительного рассмотрения вопросов рационального поведения. Может существовать, например, несколько путей достижения оптималь­ной позиции; они могут зависеть от осведомленности и понимания инди­видуума, а также от имеющихся в его распоряжении способов действия. Анализ всех этих вопросов в качественных терминах не исчерпает их, поскольку из них, очевидно, вытекают количественные соотношения. Поэтому необходимо сформулировать их в количественных терминах так, чтобы принять во внимание все элементы качественного описания. Это исключительно трудная задача, и мы можем уверенно утверждать, что в обширной литературе по данному вопросу она не доведена до конца. Основная причина этого лежит, несомненно, в неудачных попытках развития и применения подходящих для этой модели математических методов; при этом выяснилось бы то, что задача максимизации, которая предполагается отвечающей понятию рациональности, отнюдь не форму­лируется недвусмысленным образом. Действительно, более детальный анализ (который будет проведен в пп. 4.3—4.5) показывает, что суще­ственные соотношения гораздо более сложны, чем это отражено в обще­принятом и «философском» использовании слова «рациональный».

Полезное предварительное качественное описание поведения инди­видуума дается австрийской школой, в частности, при анализе экономики изолированного «Робинзона Крузо». Мы будем иметь также случай отме­тить некоторые рассуждения Бем-Баверка, касающиеся обмена между двумя или более лицами. Более позднее изложение теории выбора инди­видуума в форме анализа кривых безразличия основывается на точно тех же или на малодостоверных фактах, но использует метод, который часто принято считать во многих отношениях более совершенным. По этому поводу мы отсылаем читателя к рассмотрениям в пп. 2.1.1 и 3.3.

Мы надеемся, однако, добиться реального понимания проблемы обмена, изучая ее с совершенно иной позиции, иначе говоря, с точки зрения «стратегической игры». Наш подход вскоре станет ясным, особенно после того, как некоторые идеи, развивавшиеся, скажем, Бем-Баверком, взгляды которого можно рассматривать только как прототип настоящей теории, получат правильную количественную формулировку.

2.2. Экономика «Робинзона Крузо» и экономика общественного обмена

2.2.1. Рассмотрим подробнее тот тип экономики, который описы­вается моделью «Робинзона Крузо». Она представляет собой экономику одного;изолированного индивидуума, илидже нечто, управляемое единой волей. Такая экономика имеет дело с определенными количествами пред­метов и рядом желаний, кбторые они должны удовлетворять. Задача состоит в получении максимального удовлетворения. В действительности она представляет собой — с учетом, в частности, сделанного нами выше предположения о численном характере полезности — обычную задачу максимизации. Ее трудность зависит, очевидно, от “числа переменных и от характера функции, подлежащей максимизации; однако эта трудность является более практической, нежели теоретической *). Если

г) Для дальнейшего не имеет значения выяснение полноты теории во всех ее аспектах. 1 абстрагироваться от непрерывного характера производства и от того факта, что потребление также является протяженным во времени (и часто направлено на потребительские товары длительного пользования), мы получим простейшую из возможных моделей. Считалось возможным исполь­зовать ее в качестве отправного пункта экономической теории; однако эта попытка, являвшаяся одной из наиболее характерных черт австрийской школы, часто оспаривалась. Основное возражение против использования этой весьма упрощенной модели изолированного индивидуума в теории экономики общественного обмена заключалось в том, что она не отражает индивидуума, подвергающегося многообразным общественным воздейст­виям. Поэтому она анализирует индивидуума, который мог бы вести себя совершенно по-иному, если бы он производил свои выборы в обще­ственном мире, где он был бы подвержен факторам подражания, рекламы, обычаев и т. п. Эти факторы, несомненно, вносят большие изменения; но изменяют ли они формальные свойства процесса максимизации — в этом следует усомниться. Но последнее в действительности никогда не утверждалось, и, поскольку мы рассматриваем эту проблему изоли­рованно, мы можем вообще отбросить упомянутые выше социальные рассмотрения.

Мы не будем рассматривать также и некоторые другие отличия «Робинзона» от участника экономики общественного обмена. Одним из таких отличий является отсутствие денег как средства обмена в первом случае, когда имеется лишь некоторый всеобщий эквивалент, в качестве которого может выступать любой товар. В действительности мы преодоле­ваем эту трудность, вводя в п. 2.1.2 количественное и даже монетарное понятие полезности. Подчеркнем еще раз следующее обстоятельство. Нам важно то, что даже после всех этих решающих упрощений перед «Робинзоном» стоит формальная задача, совершенно отличная от той, с которой сталкивается участник социальной экономики.

2.2.2. Робинзону даются определенные физические данные (желания и блага), и его задача заключается в комбинировании и применении их таким образом, чтобы получить в итоге максимальное удовлетворение. Не может быть сомнений в том, что он контролирует абсолютно все пере­менные, от которых зависит результат — скажем, распределение ресур­сов, определение вариантов использования одного и того же блага для различных желаний и т. п. [9]).

Таким образом, перед Робинзоном стоит обычная задача максимиза­ции, трудности которой, как уже отмечалось, носят чисто технический, а не принципиальный характер.

2.2.3. Рассмотрим теперь участника экономики общественного обме­на. Разумеется, его задача имеет много общих элементов с задачей макси­мизации. Но она содержит также некоторые, и притом весьма существен­ные, элементы совершенно иной природы. Он также пытается получить оптимальный результат. Однако для его достижения он должен войти в отношения обмена с другими. Если два лица (или большее их число) обмениваются товарами друг с другом, то результат для каждого из них будет зависеть, вообще говоря, не только от его собственных действий, но также и от действий других. Таким образом, каждый участник пытает­ся максимизировать некоторую, функцию (упоминавшийся выше «резуль­тат»), не все аргументы которой находятся под его контролем. Это, конечно, уже не задача максимизации, а своеобразная и приводящая в замешательство смесь нескольких конкурирующих задач максимиза­ции. Каждый участник руководствуется своим собственным принципом, и ни один из них не устанавливает значений всех переменных, влия­ющих на его интересы.

Такого рода задачи никогда не рассматривались в классической математике. Подчеркнем, рискуя быть педантичными, что эта задача не является ни задачей на условный максимум, ни задачей вариационного исчисления, ни функционального анализа и т. д. Это проявляется с пол­ной ясностью даже в самых элементарных ситуациях, например, когда каждая из переменных может принимать только конечное число значений.

Особенно ярким примером распространенного непонимания существа этой задачи псевдомаксимизации является выражение, согласно которому целью общественных усилий является получение «наибольших возмож­ных благ для наибольшего возможного числа людей». Ведущий принцип не может формулироваться в виде требования одновременной максимиза­ции двух или более функций.

Любой подобный принцип, если его понимать буквально, является внутренне противоречивым. (Одна функция, вообще говоря, не будет иметь максимума там, где его имеет другая). Это ничем не лучше, чем сказать, например, что фирма должна получить максимальные цены при максимальном обороте или же максимальный доход при минимальных издержках. Если подразумевается некоторый порядок важности этих прин­ципов или некоторое их взвешенное среднее, то это следует оговаривать явным образом. Однако в ситуации участников социальной экономики не имеется в виду что-либо подобное, а достижение всех максимумов желается — разными участниками — одновременно.

Было бы заблуждением считать, что эту трудность легко устранить (подобно трудности в случае Робинзона, упомянутой в сноске на стр. 36) простым обращением к приемам теории вероятностей. Каждый участник может задать параметры, описывающие его собственные действий, но не те, которые описывают действия остальных. Тем не менее эти «чужие» переменные нельзя, с его точки зрения, описать путем статистических предположений. Это происходит потому, что другие участники руковод­ствуются, так же как и он сам, рациональными принципами — как бы их ни понимать — и никакой способ подхода, не пытающийся вскрыть эти принципы и взаимодействия конфликтных интересов всех участников, не может считаться корректным.

Иногда некоторые из этих интересов могут быть более или менее параллельными. В этом случае мы подходим ближе к простой задаче максимизации. Но они равным образом могут быть и противоположными. Общая теория должна охватывать все эти возможности, все промежуточ­ные стадии и любые их комбинации.

2.2.4. Разницу между положением Робинзона и участника экономики общественного обмена можно проиллюстрировать еще и следующим обра­зом. Помимо тех переменных, которые управляются его волей, Робинзону известен ряд данных, которые задаются «намертво» в том смысле, что они составляют неизменное физическое описание ситуации. (Даже когда они являются очевидным образом переменными, ср. сноску на стр. 36, они в действительности управляются фиксированными статистическими законами.) Никакие из данных, с которыми ему приходится иметь дело, не отражают воли или намерения другого лица, носящих экономический характер и основанных на мотцвах той же природы, что и его собствен­ные. Участник экономики общественного обмена, напротив, сталкивается и с данными последнего типа; они (подобно, например, ценам) являются продуктом действий и волеизъявлений других участников. На его дей­ствия будут оказывать влияние его ожидания этих чужих действий, а они в свою очередь отражают ожидание другими участниками его соб­ственных действий.

Таким образом, изучение экономики Робинзона и использование применимых к ней методов имеет гораздо более ограниченную ценность для экономической науки, чем это до сих пор предполагалось даже наи­более радикальными ее критиками. Причины этой ограниченности лежат не в области общественных взаимоотношений, о которых мы упоминали, хотя мы и не оспариваем их значимости. Они возникают из принципиаль­ных различий между исходной задачей максимизации (задачей Робин­зона) и более сложной проблемой, очерченной нами выше.

Мы надеемся, что все сказанное убедит читателя в том, что здесь мы сталкиваемся с поистине принципиальной, а не просто с технической трудностью. Именно на изучение этой проблемы и направлена в основ­ном теория стратегических игр

2.3. Число переменных и число участников

2.3.1. В формальных рассуждениях, которые мы проводили в преды­дущих параграфах, для описания хода событий в экономике обществен­ного обмена использовалось некоторое количество переменных, представляв­ших действия участников этой экономики. Таким образом, каждый участ­ник располагает некоторым множеством переменных («своих» переменных), значения которых в совокупности полностью описывают его действия, т. е. точно выражают проявления его воли. Мы будем называть эти множе­ства частичными множествами переменных. Частичные множества всех участников вместе образуют множество всех переменных, которое мы будем называть полным множеством. Поэтому общее число переменных1 опре­деляется, во-первых, числом участников, т. е. частичных множеств, и, во-вторых,- числом переменных в каждом частичном множестве.

С чисто математической точки зрения вполне допустимо рассматри­вать все переменные любого частичного множества как единственную переменную, именно, как переменную участника, соответствующего этому частичному множеству. В дальнейшем мы будем часто использовать именно этот прием в наших математических рассуждениях; не внося никаких принципиальных отличий, он значительно упрощает обозна­чения.

Однако пака мы будем отличать друг от друга различные переменные внутри каждого частичного множества. Это подсказывается теми эконо­мическими моделями, к которым мы естественным образом приходим: желательно, чтобы для каждого участника количество каждого кон­кретного товара, который он хочет получить, описывалось отдельной переменной.

2.3.2. Теперь мы должны подчеркнуть, что любое увеличение числа переменных внутри частичного множества участника может усложнить нашу задачу технически и только технически. Таким образом, в экономике Робинзона, где имеется только один участник и только одно частичное множество, совпадающее с полным множеством, это может сделать опре­деление нужного максимума технически более сложным, но не изменит «чисто максимизационного» характера задачи. Если, с другой стороны, увеличивается число участников, т. е. число частичных множеств пере­менных, то происходит нечто совершенно иное. Используя терминологию теории игр, которая оказывается весьма полезной, можно сказать, что это приводит к увеличению числа игроков в игре. Между тем, если ограни­читься рассмотрением простейших случаев, игра трех лиц имеет фунда­ментальные отличия от игры двух лиц, игра Четырех лиц — от игры трех лиц и т. д. Комбинаторные усложнения нашей задачи (которая, как мы видели, вовсе не является задачей максимизации) растут чудовищным образом с любым увеличением числа игроков. Наши последующие рас­смотрения явственно это покажут.

Мы рассмотрели это обстоятельство с такой подробностью, в частно­сти, и потому, что в большинстве моделей экономики происходит специфи­ческое смешивание этих двухЦявлений. Когда число игроков, т. е. участ­ников экономики общественного обмена, увеличивается, то обычно воз­растает и сложность экономической системы, например число обменивае­мых товаров и услуг, применяемых производственных процессов и т. д. Таким образом, число переменных в частичном множестве каждого уча­стника вполне может увеличиться. Но число участников, т. е. частичных множеств, также увеличилось. Таким образом, оба рассмотренных нами источника содействуют — каждый по-своему — общему увеличению •числа переменных. Существенно представлять себе каждый из этих источ – нйков в его подлинной роли.

2.4. Случай многих участников. Свободная конкуренция

2.4.1. Анализируя в пп. 2.2.2—2.2.4 различие мейеду экономикой Робинзона и экономикой общественного обмена, мы подчеркивали те черты последней, которые становятся более рельефными, когда число участ­ников, будучи большим единицы, не слишком велико. Тот факт, что на каждого участника влияют предвидимые реакции других участников на его собственные мероприятия и что это справедливо для всех участни­ков, лежит в самом существе дела (в части, касающейся продавцов) в классических задачах дуополии, олигополия и т. п. Когда число участ­ников становится действительно большим, появляется некоторая надежда, •что влияние каждого конкретного участника станет пренебрежимым и тем самым указанные выше трудности отступят на задний план. Поэтому станет возможной более традиционная теория. Это будут, конечно, клас­сические условия свободной конкуренции. Фактически именно это состав­ляло отправную точку многих лучших достижений экономической тео­рии. В сравнении с этим случаем большого числа участников — свободной конкуренцией — случаи небольшого числа продавцов (монополия, дуо­полия, олигополия) считались даже исключениями и отклонениями ют нормы. (Даже в этих случаях число участников все еще остается весьма большим из-за конкуренции между покупателями. Случаями, содержа­щими действительно небольшое число участников, будут случаи дву­сторонней монополии или обмен между Монополией и олигополией либо же между двумя олигополиями|и т. п.) Ф


2.4.2. Справедливость к традиционной точке зрения требует отме­тить следующее обстоятельство. Во многих областях точных и физиче­ских наук хорошо известно, что очень большие числа часто легче рассматривать, чем числа умеренной величины. Почти точная теория газа, содержащего около 10[10] свободно движущихся частиц, является несрав­ненно более простой, чем теория солнечной системы, состоящей из 9 основ­ных тел, и еще более простой, чем теория кратной звезды, состоящей из трех или четырех тел примерно одних и тех же размеров. Причина этого состоит, разумеется, в превосходных возможностях применения законов статистики и теории вероятностей в первом случае.

Для нашей задачи, однако, эта аналогия далека от совершенства. Теория механики для двух, трех, четырех и т. д. тел хорошо известна и в ее общей теоретической (в отличие от специальной и вычислительной) форме является основанием статистической теории для больших чисел. Для экономики общественного обмена, т. е. для соответствующих стра­тегических игр, теория при двух, трех, четырех и т. д. участниках до сих пор отсутствовала. Наши предыдущие рассмотрения были направлены именно на установление этой потребности, а наши последующие исследо­вания будут иметь целью ее удовлетворение. Иными словами, лишь после построения удовлетворительной теории для умеренного числа участни­ков станет возможным решить, упрощает ли ситуацию черзвычайно боль­шое число участников. Подчеркнем снова, что мы разделяем надежду — главным образом благодаря упомянутой выше аналогии в других обла­стях,— что подобные упрощения действительно будут иметь место. Совре­менные утверждения относительно свободной конкуренции представляют­ся весьма ценными догадками и многообещающими предвидениями резуль­татов. Но сами они не являются пока результатами, и с научной точки зрения было бы ошибочно считать их таковыми, пока не будут выполнены упомянутые нами выше условия.

В литературе имеется немалое количество теоретических^ рассмотре­ний, имеющих целью показать, что области неопределенности (уровней обмена) — которые несомненно существуют, когда число участников невелико,— сужаются и исчезают с ростом их числа. Тогда это обеспе­чило бы непрерывный переход к идеальному случаю свободной конкурен­ции — для очень большого числа участников,— где все решения будут точно и единственным образом определены. И хотя следует надеяться, что это действительно будет иметь место в достаточно общих случаях, мы все же не можем утверждать, что к настоящему времени достоверна установлено что-либо похожее на это утверждение. Иного пути нет: задача должна быть сформулирована, решена и осмыслена для небольших количеств участников, прежде чем можно будет доказать что-либо об изме­нениях ее характера в любом предельном случае большого числа участ­ников, таком; как свободная конкуренция.

2.4.3. Весьма тщательный анализ этого вопроса особенно желате­лен еще и по следующей причине. Тот факт, что одно лишь увеличение числа участников всегда будет приводить в конечном счете к условиям свободной конкуренции, не является ни достоверным, ни даже вероятным. Все классические определения свободной конкуренции содержат помима большой величины числа участников еще и другие постулаты. Ясно, например, что если определенные большие группы участников будут но тем или иным причинам действовать совместно, то величина числа участников может и не сказаться; основные акты обмена могут совершать­ся непосредственно между небольшим количеством крупных «коалиций» х), а не между многочисленными индивидуумами, действующими независимо. Наше последующее рассмотрение стратегических игр покажет, что роль и размеры коалиций являются решающими во всей этой теории. Следова­тельно, отмеченная выше трудность, не будучи новой, остается по-преж­нему узловой проблемой. Любая удовлетворительная теория «предель­ного перехода» от малого числа участников к большому должна будет объяснить, при каких обстоятельствах будут или не будут образовываться подобные большие коалиции, иначе говоря, когда большая величина числа участников проявится на деле и приведет к более или менее свободной конкуренции. Какая из этих альтернатив осуществится с большей вероят­ностью, зависит от конкретных данных рассматриваемой ситуации. Ответ на этот вопрос является, на наш взгляд, подлинным вызовом для любой теории свободной конкуренции.

2.5. Лозаннская школа

2.5. Этот параграф был бы неполон без упоминания теории равнове­сия лозаннской школы, а также различных других систем, которые зани­маются рассмотрением «индивидуального планирования» и согласования индивидуальных планов. Все эти системы уделяют внимание взаимозави­симости участников общественной экономики. Однако это неизменно делается при далеко идущих ограничениях. Иногда предполагается сво­бодная конкуренция, после введения которой участники образуют фикси­рованные коалиции и действуют подобно нескольким Робинзонам, стре­мясь единственно в максимизации удовлетворения своих индивидуальных потребностей, которые при этих условиях снова оказываются независи­мыми. В других случаях используются иные ограничивающие приемы. Все они равносильны исключению свободной игры коалиций, образуемых некоторыми или всеми типами участников. Имеются часто определенные — а иногда скрытые — предположения относительно путей, по которым интересы, частично параллельные, частично противоположные, будут влиять на участников и заставлять их — в зависимости от обстоятельств — либо кооперироваться, либо не кооперироваться. Как мы надеемся, мы показали, что подобная процедура приводит к некоторой подмене тезиса, по крайней мере в той плоскости, в которой мы хотели бы прово­дить наши рассмотрения. Она избегает подлинных трудностей и рассмат­ривает словесную проблему, которая не является эмпирически заданной. Разумеется, мы не хотим оспаривать значение этих исследований — просто они не дают ответа на наши вопросы.

§ 3. ПОНЯТИЕ ПОЛЕЗНОСТИ 3.1. Предпочтения и полезности

3.1.1. В п. 2.1.1 мы уже говорили о том, каким образом мы хотим описать фундаментальное понятие индивидуальных предпочтений путем использования гораздо более далеко идущего понятия полезности. Мно­гие экономисты почувствуют, что мы делаем слишком много предположе­ний (ср. перечисление свойств, которые мы постулировали в п. 2.1.1) и что наши исходные положения представляют собой шаг назад по срав­нению с более осторожным современным методом «кривых безразличия».

Прежде чем предпринимать какие-либо конкретные рассмотрения, поясним, что наш подход в худшем случае является лишь приложением обычных приемов всякого предварительного научного анализа. Он заклю­чается в разделении трудностей, т. е. в концентрации внимания на одной из них (на основном предмете исследования) и в пренебрежении — в разум­но возможных пределах — всеми остальными за счет некоторых упро­щающих и схематизирующих предположений. Мы хотели бы также добавить, что это дерзкое рассмотрение предпочтений и полезностей исполь­зуется в подавляющем большинстве наших построений. Однако в даль­нейшем мы исследуем (в определенных пределах) и те изменения, кото­рые вызовет в нашей теории снятие рассматриваемых предположений (см. §§ 66 и 67).

Мы чувствуем, однако, что по крайней мере одна часть наших пред­положений — именно, трактовка полезностей как количественно оцени­ваемых величин — вовсе не является сталь радикальной, как это часто утверждается в литературе. Мы попытаемся далее обосновать это поло­жение. Надеемся, что читатель простит нам столь беглое и сжатое обсужде­ние такого принципиально важного вопроса, как понятие полезности. Однако даже немногочисленные замечания окажутся здесь уместными, ибо вопрос об измеримости полезностей во многом аналогичен соответ­ствующим вопросам в физических науках.

3.1.2. В историческом плане полезность была впервые осознана именно как количественно измеримая величина, т. е. как число. Против этой точки зрения в ее первоначальной, наивной форме могут быть выска­заны — и действительно были высказаны — серьезные возражения. Ясно, что любое измерение (или даже любое провозглашение измеримо­сти) должно в конечном счете основываться на некотором непосредствен­ном ощущении, которое, возможно, не может и, разумеется, не должно анализироваться сколько-нибудь дальше г). В случае полезности непо­средственное ощущение предпочтения одного объекта или совокупности объектов по сравнению с другими дает необходимую основу. Но это позволяет нам сказать лишь, что для некоторого лица одна полезность больше, чем другая. Само по себе это не может быть основой для числен­ного сравнения полезностей для одного лица, равно как и для их сравне­ния для разных лиц. Поскольку не имеется интуитивно ясного способа сложения двух полезностей для одного и того же лица, предположение о том, что полезности не имеют численного характера, может показаться даже правдоподобным. Современный метод анализа кривых безразличия представляет собой математический прием для описания этой ситуации.

3.2. Принципы измерения. Предварительные рассмотрения

3.2.1. Все сказанное сильно напоминает положение дел, сложившееся перед созданием теории теплоты: оно также основывалось на интуитивно ясном представлении о том, что одно тело теплее другого, хотя не суще­ствовало еще никакого непосредственного способа выразить содержа­тельно — насколько, или во сколько раз, или в каком смысле.

Сравнение с теплотой показывает также, сколь мало можно пред­сказать априори, каковы будут возможные очертания подобной теории. Приведенные выше грубые соображения никоим образом не раскрывают того, что, как мы знаем, произошло впоследствии. Оказалось, что теплота допускает количественное описание не одним числом, а двумя — количе-

Подобно ощущениям света, теплоты или мускульного усилия в соответствую­щих разделах физики.

ством теплоты и температурой. Первая из бтих величин является даже более непосредственно численной, так как/ она оказалась аддитивной и, кроме того, неожиданным образом связанной с механической энергией, которая уж во всяком случае является числекной. Вторая также является численной, но гораздо более деликатным образом: она не является адди­тивной в каком-либо непосредственном смысле. Строгий численный мас­штаб для нее возник из изучения согласованного поведения идеальных газов и роли абсолютной температуры в связи с теоремой об энтропии.

3.2.2. Историческое развитие теории теплоты показывает, что следует ^ыть чрезвычайно осторожным в негативных высказываниях по какому – либо поводу, да еще с претензией на окончательность. Даже если сегодня полезности выглядят весьма неколичественно, история и опыт теории теплоты могут повториться, притом с совершенно непредсказуемыми разветвлениями и видоизменениямиИ это, разумеется, не должно отбивать у нас охоту к теоретическим объяснениям формальных свойств количественно выраженной полезности.

3.3. Вероятность и численные полезности

3.3.1. Мы можем пойти даже на один шаг дальше сделанных ранее двойных отрицаний, которые были лишь предостережениями против непродуманных утверждений о невозможности численного выражения полезности. Можно показать, что для достижения численной характери­стики полезности нам понадобятся лишь самые незначительные дополнения к тем предположениям, на которых основан анализ кривых безразличия.

Мы неоднократно подчеркивали, что численная полезность зависит ют возможности сравнения разностей полезностей. Это может показаться гораздо более далеко идущим предположением, чем простая возможность устанавливать предпочтения, и в действительности это так и есть. Однако окажется, что альтернативы, к которым должны применяться экономиче­ские предпочтения, могут стереть эти различия.

3.3.2. Представим себе на мгновение индивидуума, система пред­почтений которого является всеохватывающей и полной, иначе говоря, для любых двух объектов или для любых двух мыслимых событий у него имеется отчетливое ощущение предпочтения. Точнее говоря, мы предпола­гаем, что для любых двух альтернативных событий, которые преподносят­ся ему как возможности, он может указать, какую из них он предпочитает.

Самым естественным обобщением этой картины является допущение о том, что наш индивидуум может сравнивать не только события, но и ком­бинации событий с заданными вероятностями [11]).

Под комбинацией двух событий мы понимаем следующее. Пусть два – события обозначены через В и С\ рассмотрим для простоты соотношение вероятностей 50% к 50%. Тогда их комбинацией является возможность наблюдать реализацию В с вероятностью 50% и (если В не происходит) реализацию С с оставшейся вероятностью 50%. Подчеркнем, что эти две альтернативы являются взаимно исключающими, так что здесь не остается возможности для чего-либо третьего. Кроме того, имеется абсолютная уверенность в том, что либо В, либо С произойдет.

Поясним еще раз наши позиции. Мы ожидаем, что рассматриваемый индивидуум обладает четким представлением о том, предпочитает ли он событие А равновероятной комбинации событий В и С или наоборот. Ясно, что если для него А является более предпочтительным, чем В и чем С, то А будет также более предпочтительным, чем указанная комбинация; аналогично если В и С предпочтительнее, чем А, то он предпочтет эту комбинацию. Однако если бы для него А было предпочтительнее, чем Вг а С предпочтительнее, чем А, то любое утверждение о его предпочтении А по отношению к комбинации содержит существенную новую информа­цию. Более конкретно: если он предпочитает теперь А равновероятной комбинации В и С, то это дает нам правдоподобные основания для числен­ной оценки того, что его предпочтение А по сравнению с В превышает его предпочтение С по сравнению с А.

Замечание 1. Приведем простой пример. Пусть некий индивидуум пред­почитает потребление стакана чаю потреблению чашки кофе, а потребление чашки кофе — потреблению стакана молока. Если мы захотим теперь узнать, насколько последнее предпочтение, т. е. разность полезностей, превышает первое, достаточно поставить его в положение, когда он должен будет решить, предпочитает ли он чашку кофе некоему стакану, содержимое которого с равной вероятностью может оказаться чаем или молоком.

Замечание 2. Отметим, что мы постулировали лишь индивидуальное представление, позволяющее решить, какое из двух «событий» предпочтительнее. Однако мы не постулировали явным образом никакой интуитивной оценки относи­тельных величин двух предпочтений, или, придерживаясь употребляемой в дальней­шем терминологии, двух разностей полезностей.

Это существенно, так как информация о первом предпочтении должна подда­ваться получению воспроизводимым образом путем простого опроса.

Если принять эту точку зрения, то мы получаем критерий, по которо­му можно сравнивать предпочтение С по отношению к А с предпочтением А по отношению к В. Хорошо известно, что вследствие этого полезности — или скорее разности полезностей — становятся численно измеримыми.

То, что возможность сравнения между А, В и С только в этих преде­лах является уже достаточной для измерения «расстояний», впервые было в экономике отмечено Парето. В точности те же рассуждения проводились, однако, и Евклидом для расположения точек на прямой; фактически именно это и является первоосновой его классического вывода для вычисления расстояний.

К введению численных измерителей можно прийти еще более непо­средственным путем, если использовать все возможные вероятностные распределения. Действительно, рассмотрим три события С, А, В, для которых порядок предпочтения их индивидуумом совпадает с тем порядком, в котором они записаны. Пусть а — вещественное число, заключенное между 0 и 1 и обладающее тем свойством, что Л в точности столь же жела­тельно, как и комбинированное событие, составленное из В с вероятностью 1 — а и С с остающейся вероятностью а. Тогда мы предлагаем использо­вать а в качестве численной оценки для отношения предпочтения А над В к предпочтению С над В Точное и исчерпывающее развитие этих идей

х) Сказанное дает нам хороший повод привести другой иллюстративный пример. Описанный прием позволяет непосредственно определить отношение q полезности от обладания одной единицей определенного товара к полезности от обладания двумя единицами того же товара. Индивидууму должен быть предоставлен выбор между получением одной единицы наверняка и игрой со случаем, в результате которой он получает две единицы с вероятностью а и не получает ничего с вероятностью 1 — а. Если он предпочтет первую возможность, то а С q; если он предпочтет вторую, то а > q\ если же он не может определить своего предпочтения, то а = q.

требует использования аксиоматического метода. На этой основе возможно фактически провести достаточно простое рассмотрение. Мы проведем его jb пп. 3.5—3.7.

3.3.3. Во избежание недоразумений подчеркнем, что «события», которые мы использовали выше в качестве носителей предпочтений, рас­сматриваются нами как будущие события с тем, чтобы сделать все логиче­ски возможные альтернативы в равной мере допустимыми. Однако в рам­ках наших непосредственных целей было бы излишним усложнением запу­тываться в задачах о предпочтениях между событиями в различные периоды будущего [12]). Представляется тем не менее, что подобного рода трудности можно обойти, помещая все события, которые нас интересуют, в один и тот же стандартизованный момент времени — желательно в ближайшем будущем.

Все перечисленные рассмотрения настолько по существу основаны на численном понятии вероятности, что будет весьма уместно сказать несколь­ко слов относительно этого понятия.

Вероятность часто представляют себе как некоторое субъективное понятие — нечто вроде оценки. Так как мы предполагаем использовать это понятие при построении индивидуальной численной оценки полезно­сти, указанная точка зрения будет для наших целей неподходящей. Поэто­му простейший подход состоит в принятии другой альтернативы — доста­точно хорошо обоснованной интерпретации вероятности как частоты в длинных сериях испытаний. Это непосредственно дает нам необходимый численный плацдарм [13]).

3.3.4. Эта процедура численного измерения полезностей для инди­видуума, разумеется, опирается на предположение о полноте системы индивидуальных предпочтений [14]). Мыслимо допустить случаи — это может оказаться даже более реалистичным,— когда индивидуум не может ни указать, какую из двух альтернатив он предпочитает, ни констатировать, что обе они одинаково желательны. В этом случае анализ с помощью кривых безразличия также становится неосуществимым[15]).

Вопрос о том, насколько реальна эта возможность (как для индиви­дуумов, так и для коллективов), является чрезвычайно интересным, но это действительно вопрос. Он определенно заслуживает дальнейшего изучения. К его рассмотрению мы ненадолго вернемся в п. 3.7.2.

Во всяком случае, мы надеемся, что мы показали, что анализ посред­ством кривых безразличия требует либо слишком многого, либо слишком малого: если не все предпочтения индивидуума сравнимы, то кривые безразличия не существуют [16]). Если все предпочтения индивидуума срав­нимы, то мы можем получить даже единственным образом определенную численную полезность, которая делает кривые безразличия излишними.

Разумеется, для предпринимателя, который может проводить каль­куляцию в терминах денежных издержек и прибылей, все это становится беспредметным.

3.3.5. Можно выдвинуть то возражение, что для нас вовсе не обязатель­но входить во все эти запутанные детали, относящиеся в измерениям по­лезности, поскольку, очевидно, рядовой индивидуум, поведение которого мы хотим описать, не измеряет свои полезности точно; скорее он проводит свою экономическую деятельность в довольно густом тумане. То же, разумеется, справедливо для значительной части его поведения по отно­шению к свету, теплоте, мускульным усилиям и т. п. Но для построения физической науки эти явления должны были подвергнуться измерений. Впоследствии наш индивидуум пришел даже к использованию — прямому или косвенному — результатов этих измерений в своей повседневной жизни. То же самое может в будущем произойти и в экономике. Если с помощью теории, использующей этот аппарат, будет достигнуто более полное понимание экономического поведения, то это сможет оказать влия­ние и на материальную жизнь индивидуума. Поэтому изучение этих проблем вовсе не является бесполезным отступлением от темы.

3.4. Принципы измерения* Подробное рассмотрение

3.4.1. Из сказанного выше читатель может почувствовать, что мы получим численный масштаб для полезности, лишь выдвинув соответ­ствующий принцип, иначе говоря, постулировав существование подобного масштаба. В п. 3.3.2 мы говорили, что если индивидуум предпочитает А равновероятной комбинации В ж С (считая, что С для него является более предпочтительным, чем А, а А — более предпочтительным, чем В), то это дает правдоподобное основание для численной оценки того, что его предпочтение А по сравнению с В превышает предпочтение С по сравне­нию с А. Не постулируем ли мы здесь — или считаем само собой разу­меющимся,— что одни предпочтения могут превышать другие или хотя бы что подобные утверждения имеют смысл? Такая точка зрения была бы полным непониманием нашего подхода.

3.4.2. Мы не постулируем и не предполагаем ничего подобного. Мы предполагаем только одну вещь — и это является достаточно обосно­ванным эмпирически,— что мыслимые события могут комбинироваться с некоторыми вероятностями. Поэтому то же самое следует предполо­жить для связанных с этими событиями полезностей, каковы бы они ни были. Выскажем это более математическим языком.

В естественных науках часто появляются величины, которые априори не являются математическими и соотнесены некоторым сторонам физиче­ского мира. Иногда эти величины можно группировать в области, на кото­рых возможны некоторые естественные, физически осмысленные опера­ции. Так, физически определенная величина «масса» допускает операцию сложения. Ту же операцию допускает определенное в физике и геометрии понятие «расстояния»г). С другой стороны, определяемая физически и геометрически величина «положение» не допускает этой операции [17]), но допускает операцию образования «центра тяжести» двух положений *). Другие физико-геометрические понятия, обычно именуемые векторными — например, скорость и ускорение,— снова допускают операцию сложения.

3.4.3. Во всех тех случаях, когда подобной «естественной» операции приписывается наименование, напоминающее нам о некоторой математиче­ской операции,— подобно упомянутому выше примеру «сложения»,— следует всячески избегать недоразумений. Эта терминология не имеет своей целью провозглашение тождественности двух операций с одним и тем же названием, да это, очевидно, и не имеет места; она выражает лишь мнение о том, что они обладают сходными чертами, и надежду на то, что в конечном счете будет установлено некоторое соответствие между ними. Разумеется, это — если это вообще осуществимо — делается путем нахождения некоторой математической модели для рассматриваемой физи­ческой области, в рамках которой эти величины будут представляться числами, так что в модели математическая операция описывает синонимич­ную с ней «естественную» операцию.

Возвратимся к нашим примерам. «Энергия» и «масса» в подходящих математических моделях становятся числами, а «естественное» их сложе­ние — обычным сложением. «Положение», равно как и векторные величи­ны, становится тройками чисел[18]), именуемых соответственно координатами или компонентами. Естественное понятие «центра тяжести» двух положе­ний [19]) {#1, х2, х3} и {х[, хг, aQ с «массами» а и 1 — а (см. сноску 1 на стр. 47) реализуется в виде

{axt + (1 — а) х[, ах2 + (1 — а) х2, ах3 + (1 — а) х3} [20]).

«Естественная» операция «сложения» векторов {х^ х2, #3} и #3}

описывается как {,х± + #2 + ^ хз + #3} [21])-

Все сказанное выше об «естественных» и математических операциях равным образом применимо к естественным и математическим отношениям. Хорошими примерами являются различные встречающиеся в физике ва­рианты понятия «больше»: большая энергия, сила, теплота, скорость и т. д.

Эти «естественные» отношения являются наилучшей основой для построения математических моделей и согласования с ними физических данных.

Замечание 1. Наилучшей, но не единственной. Хорошим контрпримером является температура. «Естественное» понятие «больше» оказалось бы недостаточным для установления современной математической модели — шкалы абсолютной тем­пературы. В действительности здесь использовались другие приемы. См. п. 3.2.1.

Замечание 2. Мы не хотим создавать у читателя ложного впечатления, что картина формирования математических моделей, т. е. создания физических теорий, описана здесь исчерпывающим образом. Не нужно забывать, что этот процесс весьма индивидуален и содержит множество этапов, которые трудно предвидеть. Одним из важных этапов является, например, «распутывание» понятий, т. е. расщепление некоторых вещей, которые при поверхностном рассмотрении кажутся представляющи­ми одну физическую величину, на несколько математических понятий. Скажем, в соот­ветствующих областях решающее значение имело «распутывание» силы и энергии или количества теплоты и температуры.

В настоящее время совершенно невозможно предвидеть, сколько подобных дифференциаций нам еще предстоит проделать в экономической теории.

3.4.4. Здесь следует сделать еще одно замечание. Пусть для некоторой физической области найдена удовлетворительная математическая модель в указанном выше смысле и рассматриваемые физические величины согла­сованы с числами. В этом случае вовсе не обязательно, чтобы описание математической модели давало нам единственный путь согласования физических величин с числами. Иначе говоря, модель может давать целое семейство подобных соответствий — называемых в математике отображе­ниями,— любое из которых можно использовать для целей теории. Пере­ход от одного из этих соответствий к другому приводит к некоторому преобразованию числовых данных, описывающих физические вели­чины. В этом случае мы говорим, что рассматриваемые физические вели­чины описываются числами с точностью до этой системы преобра­зований. В математике подобные системы преобразований называются группами

Примеры подобных ситуаций весьма многочисленны. Так, геометри­ческое понятие расстояния является числом с точностью до умножения на положительные постоянные множители [22]). Такова же ситуация с физи­ческой величиной массы. Физическое понятие энергии описывается числом с точностью до линейного преобразования, т. е. прибавления любой постоянной и умножения на любую положительную постоянную [23]). Поня­тие положения определено с точностью до неоднородного ортогонального линейного преобразования [24]> [25]). Векторные понятия определены с точ­ностью до однородных преобразований того же типа 5′ [26]).

3.4.5. Возможны также случаи, когда физическая величина пред­ставляет собой число с точностью до любого монотонного преобразования. Так обстоит дело с величинами, для которых существует только «есте­ственное» отношение «больше»—и ничего другого. Так было, например, с температурой, пока было известно только понятие «теплее» [27]); то же справедливо для шкалы Мооса твердости минералов; то же справедливо и для полезности, если это понятие основано на идее предпочтения. При виде такого произвола в числовом описании в подобных случаях напра­шивается мнение о том, что рассматриваемая величина вовсе не является численной. Представляется, однако, более целесообразным воздержаться от подобных качественных утверждений и вместо этого установить объек – тивным образом, с точностью до какой системы преобразований определено это численное описание. Случай, когда эта система преобразований состоит из всех монотонных преобразований, является, конечно, довольно край­ним; различные градации на другом конце этой шкалы даются упомянуты­ми выше системами преобразований: неоднородными или однородными линейными преобразованиями в пространстве, линейными преобразова­ниями одной числовой переменной, умножением этой переменной на постоянную [28]). В общем, может представиться и случай, когда численное описание является абсолютно строгим, т. е. когда не нужно допускать вообще никаких преобразований [29]).

3.4.6. Система преобразований, с точностью до которой данная физическая величина описывается числами, может изменяться во времени, т. е. в зависимости от этапа развития предмета. Так, температура первона­чально описывалась числом лишь с точностью до произвольного монотон­ного преобразования [30]). С развитием термометрии (в частности, термо­метрии гармоничного идеального газа) класс этих преобразований был сужен до линейных, т. е. не хватало лишь абсолютного нуля и абсолютной единицы. Последующее развитие термодинамики зафиксировало даже абсолютный нуль, так что система преобразований в термодинамике состоит только из умножения на постоянные. Эти примеры могут быть дополнены другими, но, по-видимому, нам нет нужды вдаваться в более подробные обсуждения.

Гй Представляется, что ситуация с полезностью имеет сходную природу. Мы можем встать на ту точку зрения, что единственным «естественным» видом данных в этой области является отношение «больше», т. е. понятие предпочтения. В этом случае полезности представляют собой числа с точ­ностью до некоторого монотонного преобразования. В действительности эта точка зрения является в экономической литературе общепринятой; наиболее полное свое отражение она находит в методе кривых безраз­личия.

Для сужения системы преобразований необходимо обнаружить даль­нейшие «естественные» операции или отношения в области полезности. Так, еще Парето [31]) отметил, что достаточно было бы отношения равенства для разностей полезностей; в нашей терминологии это свело бы систему преобразований к линейным преобразованиям [32]). Однако поскольку это соотношение не кажется нам в полной мере «естественным»— иначе говоря, поддающимся интерпретации путем воспроизводимых наблюде­ний,— это предположение не достигает своей цели.

3.5. Принципиальная структура аксиоматического рассмотрения численных полезностей

3.5.1. Неудача одного конкретного приема не исключает возможности достижения той же цели посредством другого приема. Наше основное утверждение состоит в том, что область полезности содержит некоторую» «естественную» операцию, суживающую систему преобразований в точно­сти до такого предела, как это могло бы быть достигнуто при помощи другого приема. Этой операцией является комбинирование двух полезно­стей с двумя заданными альтернативными вероятностями а, 1 — а. (0<C<X<C1), как это было описано в п. 3.3.2. Этот процесс столь сходен с образованием центров тяжести, упомянутым в п. 3.4.3, что может ока­заться выгодным использовать здесь ту же терминологию. Таким образом, для полезностей и и v мы имеем «естественное» отношение и > и (читается: и предпочтительнее v) и «естественную» операцию аи + (1 — a) v (читает­ся: центр тяжести и и v с весами а, 1 — а, или: комбинация и и г; с аль­тернативными вероятностями а, 1 — а). Если признать существование – и воспроизводимую наблюдаемость этих понятий, то наш путь становится ясным — нужно найти соответствие между полезностями и числами, кото­рое переводит отношение и > v и операцию аи + (1 — a) v для полез­ностей в синонимичные понятия для чи:сел.

Обозначим это соответствие через

и —> р = v (и),

где и —полезность, a v (и) — число, которое наше соответствие ей сопо­ставляет. Наши требования заключаются в следующем:

(3:1:а) Из u>v следует v (u)>v (и),

(3:1 :Ь) v (аи + (i — a)v)= av (и) + (1 — a) v (v)

Если существуют два таких соответствия:

(3:2:а) и—>p = v(u),

(3:2:Ь) и->р’ = у’(и),

то они устанавливают соответствие между числами (3:3) р^р’,

которое можно записать также в виде (3:4) v Р’ = Ф(Р).

Так как соответствия (3:2:а) и (3:2:Ь) удовлетворяют соотношениям (3:1:а) и (3:1:Ь), соответствие (3:3), т. е. функция ф (р) в (3:4), должно сохранять Отношение[33]) р > а и операцию ар + (1 — а) сг (ср. сноску 1 на этой стр.). Это означает, что

(3:5:а) Из р>а следует ф(р)>ф(а),

(3:5:Ь) Ф (ар+ (1 — а) а) = аф (р) + (1 — а) ф (а).

Следовательно, функция ф (р) должна быть линейной, т. е.

(3:6) р’ = ф (р) = со0р +

где со0 и о)! — фиксированные числа (постоянные), причем со0 > 0.


Итак, мы видим, что если подобное численное представление полезно­стей г) вообще существует, то оно определяется с точностью до линейного преобразования[34]»[35]). Это значит, что полезность является числом с точ­ностью до линейного преобразования.

Для того чтобы численное представление полезности в указанном смысле существовало, необходимо постулировать*определенные свойства отношения и> v и операции аи + (1 — а) и для полезностей. Выбор этих постулатов, или аксиом, и их последующий анализ приводит к зада­чам, представляющим определенный математический интерес. Для пра­вильной ориентации читателя мы дадим сейчас лишь общую картину ситуации; полное рассмотрение вопроса можно найти в Приложении.

3.5.2. Выбор аксиом не является вполне*объёктивной задачей. Обыч­но мы ожидаем достижения некоторой определенной цели — скажем, выводимости некоторой конкретной теоремы или теорем из данной систе­мы аксиом — и наша задача является точной и объективной только в этих пределах. Но помимо этого всегда имеются другие важные пожелания менее формального характера. Аксиомы не должны быть слишком много­численными, их система должна быть максимально простой и прозрачной, и каждая аксиома должна иметь интуитивно ясный смысл, на основании которого можно непосредственно оценить ее>]пригодность [36]). В ситуации, подобной нашей, последнее требование является|особенно существенным, несмотря на свою неопределенность: мы хотим сделать интуитивное поня­тие поддающимся математическому изучению и увидеть с максимальной ясностью, каких предположений это требует.

Объективная часть нашей задачи ясна: из постулатов должно следо­вать существование соответствия (3:2: а), обладающего, как отмечалось в п. 3.5.1, свойствами (3 :1: а) и (3:1: Ь). Высказанные выше дальней­шие эвристические и даже эстетические пожелания не определяют един­ственного пути получения аксиоматической трактовки. Далее мы сформу­лируем некоторую систему аксиом, которая представляется достаточно удовлетворительной.

3.6. Аксиомы и их интерпретация

3.6.1. Наши аксиомы заключаются в следующем. Мы рассматриваем систему U величин [37]) u, v, w, . . . На U задано отношение и > v и для любого числа а (0 < а < 1) определена операция

а и + (1 — a) v = w.

Эти понятия удовлетворяют следующим аксиомам:

(3:А) Отношение и > и является линейным упорядочением[38]) на U.

Поэтому мы пишем и<Си, когда и>и. Тогда

(3:А:а) ‘ Для любых двух и, и имеет место одно и только одно из следующих трех отношений: и = v, и>и, u<v.

(3:A:b) Из u>v, u>w следует u>w[39]).

(3:В) Упорядочение и комбинирование[40]).

(3:В:а) Из u<iv следует и < аи + (1 — а) и.

(3:В:Ь) Из и > и следует и > аи + (1 — а) v.

(3:В:с) Из u<C. w<t’v следует существование такого а, что

аи-У-(\—a)v <lw. (3:B:d) Из u>w>v следует существование такого а, что

аи-\- (1 — a) u>w.

(3:С) Алгебраические правила комбинирования.

(3:С:а) аи-\- (1 — а)и= (1 — а) и-\-аи\

(3:С:Ь) а фи + (1 — (3) v) – f (1 — а) и = уи + (1 — у) v, гдеу^ар.

Можно показать, что из этих аксиом вытекает существование соответ­ствия (3:2:а), обладающего свойствами (3:1:а) и (3:1:Ь), как это описыва­лось в п. 3.5.1. Следовательно, выводы п. 3.5.1 сохраняют силу: система U (т. е. в нашей интерпретации система абстрактных полезностей) пред­ставляет собой систему чисел с точностью до линейного преобразования.

Построение (3:2:а) на основе (3:1:а) и (3:1:Ь) при помощи аксиом (3:А) — (3:С) является чисто математической задачей, правда, несколько кропотливой, хотя она решается обычными путями и не доставляет осо­бенных трудностей. (По этому поводу см. Приложение.)

Равным образом нам представляется излишним проводить здесь обыч­ное логическое обсуждение этих аксиом [41]). Однако мы скажем несколько слов об их интуитивном смысле, т. е. о подтверждении каждой из наших аксиом (3:А) — (3:С).

3.6.2. Дадим анализ наших постулатов.

(3:А:а*) Это утверждение о полноте системы индивидуальных пред­почтений. Его обычно принимают при рассмотрении полезностей или предпочтений, например, в анализе кривых безразличия. Эти вопросы уже рассматривались в пп. 3.3.4 и 3.4.6.

(3: А:Ь*) Это «транзитивность» предпочтений — правдоподобное и обще­принятое свойство.

(3:В:а*) Здесь утверждается, что если v предпочтительнее и, то более предпочтительным по сравнению с и является даже v с некоторой вероятностью 1 — а. Это предположение законно, так как мы исключаем какую бы то ни было дополнительность (или противо­положное). См. начало п. 3.3.2.

(3:В:Ь*) Является двойственным к (3:В:а*) с заменой отношения «предпочтительнее» на «менее предпочтительно, чем».

(3:В:с*) Здесь утверждается следующее. Если w предпочтительнее и и дано также еще более предпочтительное v, то комбинация и и у, взятого с вероятностью 1 — ос, не повлияет на предпочти­тельность w по сравнению с и, если эта вероятность достаточно мала. Иными словами, сколь бы предпочтительно ни было v само по себе, его влияние можно сделать сколь угодно слабым, придавая ему достаточно малую вероятность. Это правдоподобное предполо­жение «непрерывности».

(3:B:d*) Является двойственным к (3:В:с*) с заменой отношения «предпочтительнее» на «менее предпочтительно, чем».

(3:С:а*) Это утверждение говорит о том, что порядок, в котором упоми­наются составляющие и и и некоторой комбинации, безразличен. Такое предположение законно, в частности, потому, что составляю­щие суть альтернативные события (см. (3:В:а*)).

(3:С:Ь*) Безразлично, получена ли комбинация двух составляющих в два последовательных приема — сначала с вероятностями а, 1 — а, затем с вероятностями (3, 1 — |3 — или же в один прием — с вероятностями 7, 1 — 7, где у = а|3. Здесь можно сказать то же самое, что и в (3:С:а*). Может случиться, однако, что этот постулат будет иметь и более глубокое значение; некоторый намек на это делается в п. 3.7.1.

3.7. Общие замечания об аксиомах

3.7.1. Сейчас уместно будет остановиться и обозреть ситуацию. Не показали ли мы слишком много? Мы можем вывести из постулатов (3:А) — (3:С) численный характер полезности в смысле (3:2:а), а также свойства (3:1:а) и (3:1:Ь) из п. 3.5.1. При этом (3:1:Ь) утверждает, что численные значения полезности сочетаются (с вероятностями) подобно математическим ожиданиям! Но ведь и само понятие математического ожидания до сих пор оспаривается, и его законность определенным обра­зом зависит от некоторых предположений, касающйхся природы «ожи­дания» [42]). Не считаем ли мы здесь решенным этот спорный вопрос? Не вводят ли наши постулаты — быть может, некоторым косвенным путем — предположений, которые определяют математическое ожидание?

Говоря более конкретно, не может ли для индивидуума существовать полезность, положительная или отрицательная, от самого акта «испытания случая», от участия в азартной игре, которая затушевывается при исполь­зовании математического ожидания?

Как обходили эту возможность наши аксиомы (3:А) — (3:С)?

Насколько мы можем судить, наши постулаты (3:А) — (3:С) не пытаются избежать ее. Даже тот из них, который ближе всего подходит к исключению «полезности от азарта» — (3:С:Ь) (см. его обсуждение в п. 3.6.2),— представляется правдоподобным и законным, если не исполь­зовать гораздо более утонченную психологическую систему, чем та, кото­рой мы в настоящее время располагаем для целей экономики. Представ­ляется, что возможность построения на основе (3:А) — (3:С) численной полезности вместе с формулой, приводящей к использованию математиче­ских ожиданий, говорит о следующем. Мы практически определили численную полезность как объект, для которого подсчет математических ожиданий является законным х). Так как аксиомы (3:А) — (3:С) обеспе­чивают нам осуществимость необходимого построения, на этом уровне нельзя формулировать такие понятия, как «величина полезности от азар­та», не впадая при этом в противоречие [43]).

3.7.2. Как мы уже указывали — последний раз в п. 3.6.1 — наши аксиомы основаны на отношении и > v и операции аи + (1 — a) v для полезностей. Примечательно, что можно считать более непосредственно заданной именно эту операцию, а не отношение. Действительно, вряд ли можно усомниться в том, что некто, могущий вообразить себе две альтер­нативные ситуации с соответствующими им полезностями u, v, не мог бы представить себе перспективу осуществления обеих ситуаций с вероят­ностями а и 1 — а. С другой стороны, для отношения и > v можно оспа­ривать постулат (3:А:а), т. е. линейность этого упорядочения.

Остановимся бегло на этом вопросе. Мы признали сомнительность того положения, что индивидуум всегда может решить, какую из двух альтернатив с полезностями и и у он предпочитает[44]). Но, каковы бы ни были достоинства такого сомнения, эта возможность, т. е. полнота системы индивидуальных предпочтений, должна предполагаться даже для целей «метода кривых безразличия» (см. наши замечания по поводу (3:А:а) в п. 3.6.2). Но если предположить наличие этого свойства[45]) у отношения и > v, то использование нами гораздо менее сомнительной операции [46]) аи + (1 — a) v также приведет к численным полезностям!

Замечание. Здесь читатель может вспомнить известное рассуждение, в соответствии с которым рассмотрение полезностей, не являющееся численным (при помощи «кривых безразличия»), предпочтительнее любого численного их рассмотре­ния, так как оно проще и основывается на меньшем числе допущений. Это возраже­ние могло бы быть законным, если бы численное рассмотрение основывалось на пред­ложенном Парето отношении равенства для разностей полезностей (см. конец п. 3.4.6). Действительно, это отношение является более сильным и более сложным допущением, добавляемым к исходным гипотезам о неограниченной сравнимости полезностей (линейность отношения предпочтения).

Вместо этого мы однако использовали операцию аи + (1 — а)и. Мы надеемся, что читатель согласится с нами в том, что это дает нам даже более надежное допуще­ние, чем линейность предпочтения. Поэтому мы считаем, что наш подход, в отли­чие от подхода Парето, может считаться свободным от возражений, основанных на утрате простоты и необходимости искусственных допущений.

Если не делать общего предположения о сравнимости *), то построе­ние математической теории, основанной на операции аи + (1 — a) v и на том, что остается от отношения u>v, все еще остается возможным [47]). Это приводит к понятию полезности как многомерного вектора. Такое построение является более|сложным и менее удовлетворительным, и мы не предполагаем подвергать его сейчас систематическому рассмотрению.

3.7.3. Это краткое введение вовсе не претендует на то, чтобы исчер­пать данный вопрос; однако мы надеемся, что наиболее существенные положения нами отражены. Следующие замечания помогут избежать каких бы то ни было недоразумений.

1) Подчеркнем еще раз, что мы рассматриваем только полезности, относящиеся к одному лицу. Из наших рассмотрений не вытекает никаких результатов, касающихся сравнения полезностей, которые принадлежат различным индивидуумам.

2) Нельзя отрицать, что анализ методов, использующих математиче­ское ожидание (по поводу литературы см. сноску 2 на стр. 53), в настоя­щее время далек от завершенности. Наши замечания в п. 3.7.1 направлены именно на это, хотя по данному поводу следовало бы сказать еще весьма много. Здесь мы сталкиваемся с весьма интересными вопросами, которые, однако, выходят за пределы настоящей работы. Для наших целей вполне достаточно отметить, что справедливость простых и правдоподобных акси­ом (3:А) — (3:С) из п. 3.6.1 для отношения и > v и операции аи + + (1 — а) и превращает полезности в числа с точностью до линейного преобразования — в том смысле, как это оговаривалось в этих пунктах.

3.8. Роль понятия маргинальной полезности

3.8.1. Из предыдущих рассуждений ясно, что мы вправе свободно пользоваться|понятием численной полезности. С другой стороны, наши дальнейшие рассмотрения покажут, что мы не можем избежать предполо­жения о том, что все участники рассматриваемой экономики полностью информированы о физических характеристиках ситуации, в которой они действуют, и могут выполнять все статистические, математические и т. п. операции, которые эти знания делают возможными. В литературе уделя­лось большое внимание природе и важности этого предположения, и вопрос, вероятно, еще далек от исчерпания. Мы не предполагаем оста­навливаться на нем. Эта проблема слишком обширна и сложна, и мы счи­таем, что лучше всего здесь будеть«поделить трудности». Иначе говоря, мы хотим избежать этого усложнения, которое, будучи само по себе интересным, должно рассматриваться отдельно от нашей основной проблемы.


В действительности мы считаем, что наши исследования — хотя в них и предполагается без всяких дальнейших дискуссий наличие «полной информации»— вносят некоторый реальный вклад в f изучение данного вопроса. Мы увидим, что многие экономические и социальные явления, обычно приписываемые «неполной информации» у индивидуума, появляют­ся и в нашей теории и с ее помощью могут быть удовлетворительным образом интерпретированы. Так как в нашей теории предполагается «полная информация», мы заключаем, что указанные явления на деле не имеют ничего общего с «неполной информацией» индивидуума. Некоторые особенно яркие примеры можно найти в понятиях «дискриминирования» в п. 33.1, «неполной эксплуатации» в п. 38.3 и «передачи» или «дани» в п. 46.11 и 46.12.

Исходя из сказанного, мы решились бы даже оспаривать важность роли, обычно приписываемой неполной информации в ее общепринятом смысле *) в экономических и социальных теориях. Далее будет выяснено, что некоторые явления, которые на первый взгляд следовало бы отнести на счет этого фактора, на деле не имеют с ним ничего общего [48]).

3.8.2. Рассмотрим теперь изолированного индивидуума с определен­ными физическими характеристиками, располагающего определенными количествами товаров. В силу сказанного перед ним стоит задача нахожде­ния максимальной полезности, которая в этой ситуации может быть получена. Так как этот максимум представляет собой вполне определен­ную величину, вполне определенным будет и то увеличение, которое будет иметь место при добавлении одной единицы любого товара к запасу всех товаров, находящихся в распоряжении индивидуума. Разумеется, это и есть классическое понятие маргинальной полезности единицы рассматри­ваемого товара [49]).

Ясно, что эти величины имеют решающее значение в экономике Робин­зона Крузо. Упомянутая выше маргинальная полезность соответствуетг очевидно, максимальным усилиям, которые он согласится предпринять — если он ведет себя в соответствии с обычными критериями рационально­сти — для получения еще одной единицы этого товара.

Вовсе не ясно, однако, какое значение имеет это понятие при определе­нии поведения участника экономики общественного обмена. Мы видели, что в этом случае принципы рационального поведения все еще ждут своей формулировки и что они вовсе не выражаются посредством требования максимальности робинзоновского типа. Таким образом, сомнительно, имеет ли в этом случае маргинальная полезность вообще какой-либо смысл [50]).

Положительные утверждения по этому вопросу станут возможными только после того, как нам удастся построить теорию рационального пове­дения в экономике общественного обмена. Как мы указывали выше, такая возможность открывается теорией стратегических игр. Мы увидим, что маргинальная полезность действительно играет важную роль и в этом случае, но гораздо более тонким образом, чем это обычно предпо­лагается.

§ 4. СТРУКТУРА ТЕОРИИ. РЕШЕНИЯ И НОРМЫ ПОВЕДЕНИЯ 4.1. Простейшее понятие решения для одного участника

4.1.1. Теперь мы достигли того момента, когда становится возможным дать положительное описание предлагаемой нами процедуры. Это означа­ет, прежде всего, краткий очерк и разъяснение основных технических поня­тий и приемов.

Как мы уже говорили, мы хотим найти математически полные прин­ципы, которые определяют «рациональное поведение» для участников экономики общественного обмена, и вывести из них общие характеристики такого поведения. Хотя подобные принципы должны быть достаточно общими, т. е. справедливыми во всех ситуациях, мы можем в настоящее время удовольствоваться лишь нахождением решений для некоторых характерных частных случаев.

Прежде всего мы должны составить ясное представление о том, что можно принять в качестве решения задачи, иначе говоря, какое количе­ство информации должно нести в себе решение и чего следует ожидать в отношении его формальной структуры. Точный анализ станет возможным только после выяснения этих вопросов.

4.1.2. Весьма правдоподобно, что непосредственное понятие решения должно сводиться к набору правил для каждого участника, предписы­вающих ему способ поведения в любой ситуации, которая только может возникнуть. На это можно возразить, что такая точка зрения излишне широка. Поскольку мы хотим теоретизировать по поводу «рационального поведения», представляется излишним давать индивидууму советы относи­тельно его поведения в тех ситуациях, которые отличны от ситуаций, возникающих в рациональном сообществе. Это было бы справедливо в предположении рационального поведения и со стороны всех других участников — независимо от того, каким образом мы собираемся его характеризовать. Подобная процедура, вероятно, привела бы к некоторо­му единственному набору ситуаций, к которым только и должна была бы относиться наша теория.

Это возражение представляется неверным по двум причинам. Во-пер­вых, «правила игры», т. е. физические законы, определяющие фактические условия рассматриваемой экономической деятельности, могут быть явно стохастическими. Действия участников экономики могут определять исход только в связи с событиями, зависящими от случая (с известными вероят­ностями); см. сноску 1 на стр. 36 и п. 6.2.1. Если принять это во внима­ние, то правила поведения даже для вполне рационального сообщества должны предусматривать великое множество ситуаций, часть которых будет весьма далека от оптимума [51]).

Во-вторых, что еще более важно, правила рационального поведения должны предусматривать возможность нерационального поведения со сто­роны других участников. Иными словами, пусть мы нашли набор правил, именуемых «оптимальными» или «рациональными», каждое из которых действительно оптимально при условии, что остальные участники ведут себя соответствующим образом. Тогда остается вопрос: что произойдет, если некоторые из участников отступят от этого образа действий? Если это оказалось бы для них выгодным — и, в частности, невыгодным для конформистов, — то указанное решение показалось бы весьма сомнитель­ным. Пока что мы еще не в состоянии дать положительное обсуждение этих вопросовмы хотим лишь подчеркнуть, что при таких условиях «решение» или по крайней мере его мотивация должны считаться несовер­шенными и неполными. Каким бы образом мы ни формулировали ведущие принципы и объективное оправдание «рационального поведения», при этом должны быть сделаны оговорки на все мыслимые случаи поведе­ния «остальных». Тблько в этом случае можно построить удовлетворитель­ную и исчерпывающую теорию. Однако если должно быть установлено превосходство «рационального поведения» над любыми другими типами поведений, то его описание должно включать правила поведения для всех мыслимых ситуаций, включая и те из них, когда «остальные» ведут себя нерациональным образом в смысле норм, которые эта теория им пред­писывает.

4.1.3. На этой стадии читатель подметит большое сходство с повсе­дневным понятием игры. Мы считаем, что это сходство весьма существенно и что в действительности здесь имеет место нечто большее, чем простое сходство. Для экономических и социальных проблем игры выполняют — или должны выполнять — ту же роль, которую различные геометрические и математические модели с успехом осуществляют в физических науках. Подобные модели представляют собой теоретические построенця с точны­ми, исчерпывающими и не слишком сложными определениями; они должны быть сходными с реальностью в тех сторонах, которые существенны для проводимого исследования. Резюмируем: для того чтобы сделать возмож­ным математическое рассмотрение, определение должно быть точным и исчерпывающим. Построение не должно быть чрезмерно сложным с тем, чтобы это математическое рассмотрение могло быть продвинуто за рамки простого формализма до того момента, когда оно даст полные численные результаты. Сходство с действительностью нужно для осмысленности всех проводимых операций. Что же касается этого сходства, то оно обычно может быть ограничено несколькими сторонами, которые в данную минуту считаются «существенными», ибо в противном случае высказанные выше требования вступили бы в противоречие друг с другом *).

Ясно, что если модель экономической деятельности будет строиться в соответствии с этими принципами, то в реэультате получится описание игры. Особенно ярко это утверждение проявляется в описании рынков, которые, в конце концов, являются ядром экономической системы, однако оно справедливо во всех случаях и без ограничений.

4.1.4. В п. 4.1.2 мы описывали, из чего, по нашему мнению, должно состоять решение, т. е. характеристика «рационального поведения». Оно свелось к полному набору правил поведения во всех мыслимых ситуа­циях. Это справедливо равным образом и для общественной экономики, и для игр. Таким образом, весь результат в указанном выше смысле заклю­чается в чудовищно сложном комбинаторном переборе. Однако мы приня­ли упрощенное понятие полезности, в соответствии с которым все побужде­ния индивидуума полностью описываются одной численной величиной (см. пп. 2.1.1 и 3.3). Таким образом, сложное комбинаторное перечисле­ние случаев, которого мы ожидаем от решения, допускает сжатое и содер – жательное синтезирование — выяснение того, сколько *» [52]) рассматривае­мый участник может получить, если он ведет себя рациональным образом. Разумеется, под этим «может получить» имеется в виду некоторый мини­мум; он может получить и больше, если остальные будут делать ошибки (т. е. вести себя нерационально).

Следует отдавать себе отчет в том, что все эти рассуждения проводятся в указанных выше направлениях, предварительно, перед построением удовлетворительной теории. Мы лишь формулируем пожелания, которые послужат нам своеобразным критерием успешности наших последующих рассмотрений. Однако и предварительные рассуждения об этих пожела­ниях полностью согласуются с обычным эвристическим подходом — даже до того, как мы будем в состоянии их осуществить. Действительно, эти предварительные рассуждения составляют существенную часть процесса нахождения удовлетворительной теории [53]).

4.2. Обобщение на всех участников

4.2.1. Пока мы рассматривали лишь то, каким должно быть решение для одного участника. Представим теперь всех участников одновременно. Иначе говоря, рассмотрим общественную экономику или, что то же самое, игру с фиксированным числом участников (скажем, п). Полная инфор­мация, которую должно нести в себе решение, имеет, как мы уже говори­ли, комбинаторный характер. Кроме того, указывалось, каким образом одно количественное утверждение может вобрать в себя решающую часть – этой информации. Это утверждение заключается в указании того, сколько лолучает каждый участник при рациональном поведении. Рассмотрим те количества, которые получают несколько участников. Если бы решение не давало нам в количественном отношении ничего, кроме указания этих количеств [54]), то оно совпало бы с известным понятием дележа — оно определяло бы, каким образом имеющиеся суммы должны быть распре­делены между участниками [55]).

Подчеркнем, что проблема дележа как для случая, когда имеющиеся суммы в действительности тождественно равны нулю, так и для случая, когда они являются переменными, в экономической литературе не была в своей общей форме ни надлежащим образом сформулирована, ни решена.

4.2.2. Мы не видим причин, по которым нельзя было бы удовлетво­риться решением такого типа, т. е. единственным дележом, удовлетворяю­щим определенным требованиям для оптимального (рационального) поведения, — при условии, что такое решение может быть найдено. (Конечно, эти требования мы еще не сформулировали. Подробное обсуж­дение дано в указываемых ниже пунктах.) В этом случае структура рас­сматриваемого общества была бы чрезвычайно простой: существовало бы некоторое абсолютное состояние равновесия, в котором количественная доля каждого участника была бы точно определена.

Однако далее мы увидим, что подобного решения, обладающего всеми необходимыми свойствами, вообще говоря, не существует. Понятие реше­ния должно быть значительно расширено; мы увидим, что это тесно связа­но с некоторыми неотъемлемыми сторонами общественной организации, которые, будучи весьма прозрачными с точки зрения «здравого смысла»т не подвергались до сих пор рассмотрению под надлежащим углом зрения. (См. пп. 4.6 и 4.8.1.)

4.2.3. Наше математическое исследование проблемы покажет, что в действительности существует не столь уж малочисленный класс игр, в которых может быть определено и найдено решение в указанном выше смысле, т. е. в виде единственного дележа. В таких случаях каждый участник, точно придерживаясь надлежащего, рационального поведения, получает по меньшей мере количество, приписываемое ему этим дележом. Он получает в точности это количество, если другие участники также ведут себя рациональным образом; если они отходят от рационального поведе­ния, то он может получить даже больше.

Таковы игры двух участников, в которых сумма всех платежей равна нулю. Хотя эти игры и не вполне типичны для основных экономических процессов, они содержат некоторые всеобщие и важные черты всех игр вообще, и подучаемые для них результаты являются основой для общей теории игр. Мы подробно рассмотрим эти игры в гл. III.

4.3. Решение как множество дележей

4.3.1. Если снять любое из двух указанных выше ограничений, то ситуация существенно изменится.

Простейшей игрой, в которой снято второе требование, является игра двух лиц, в которой сумма всех платежей переменна. Это соответ­ствует общественной экономике с двумя участниками и допускает как их взаимозависимость, так и переменность суммарной полезности в зависимо­сти от их поведения *). В сущности, это в точности случай двусторонней монополии (см. пп. 61.2—61.6). Известная «зона неопределенности», возникающая в современных попытках решения проблемы дележа, указы­вает, что здесь следует искать более широкое понятие решения. Этот случай будет рассматриваться в указанных выше пунктах. Пока же мы хотим использовать его лишь в качестве своеобразного индикатора трудно­сти и перейти к другому случаю, который более подходит в качестве основы для первого конструктивного шага.

4.3.2. Простейшей игрой, в которой отброшено первое требование, является игра трех лиц с равной нулю суммой всех платежей. В отличие от названной выше игры двух лиц, эта игра не соответствует никакой фундаментальной экономической проблеме, но тем не менее она пред­ставляет некоторую важную сторону человеческих отношений. Существен­ной ее чертой является то, что любые два игрока, объединяющиеся и дей – ствующие совместно против третьего, могут тем самым обеспечить себе некоторую выгоду. Проблема заключается в том, каким образом в этой комбинации распределить выгоду между обоими партнерами. Любая такая схема дележа должна будет принимать во внимание то, что объе­диняться могут любые два партнера; это значит, что в процессе формиро­вания любого объединения каждый партнер должен считаться с тем, что ого предполагаемый союзник может отколоться и примкнуть к третьему участнику. ^

Разумеется, правила игры будут предписывать, каким образом доходы коалиции должны делиться между партнерами. Однако подробное рассмот­рение, которое будет приведено в п. 22.1, показывает, что такой приговор не будет, вообще говоря, окончательным. Представим себе игру (трех или более лиц), где два участника могут образовать весьма выгодную коали­цию, в которой, однако, правила игры предусматривают передачу львиной доли выигрыша первому участнику. Предположим, кроме того, что второй участник этой коалиции может войти также в коалицию с третьим, менее эффективную в целом, но обещающую ему больший индивидуальный выигрыш, чем предыдущая. В этой ситуации для первого участника явля­ется, очевидно, разумным передать часть выигрыша, который он мог бы получить в первой коалиции, второму участнику с тем, чтобы спасти эту коалицию. Иными словами, можно ожидать, что в определенных условиях один участник коалиции будет согласен выплатить своему партнеру неко­торую компенсацию. Таким образом, распределение доходов внутри коали – ‘ ции зависит не только от правил игры, но и от указанных принципов — под влиянием других возможных коалиций *).

Здравый смысл подсказывает, что мы не можем ожидать каких-либо теоретических утверждений, согласно которым будут создаваться союзы [56]); речь может идти лишь об информации, касающейся того, каким образом партнеры в возможной комбинации должны делить прибыли, что­бы избежать случая, когда один из них дезертирует и образует объедине­ние с третьим игроком. Все это будет подробно рассматриваться с количе­ственной точки зрения в гл. V.

Здесь нам достаточно лишь сформулировать результат, который проведенные выше качественные рассуждения делают вполне правдоподоб­ным и который будет установлен более строго в указанной главе. Разумное понятие решения сводится в этом случае к системе из трех дележей. Они соответствуют упомянутым выше трем объединениям (союзам) и выражают разделение прибылей между соответствующими союзниками.

4.3.3. Последний результат окажется прототипом общей ситуации. Мы увидим, что понятие решений, представляющих собой не отдельные дележи, а системы дележей, приведет к некоторой согласованной теории.

Ясно, что в описанной игре трех лиц никакой отдельный дележ, при­надлежащий решению, сам по себе не представляет ничего похожего на реше­ние. Любой конкретный союз описывает только одно конкретное соображе­ние, завладевающее умами участников, когда они планируют свое поведе­ние. Даже если в конечном счете некоторый конкретный союз оказывается


сформированным, то на разделение доходов между союзниками будут* оказывать существенное влияние другие союзы, в которые каждый из них мог бы вступить. Таким образом, только эти три объединения и их дележи образуют в совокупности некоторое разумное целое, которое определяет – все свои детали и само по себе обладает устойчивостью. Именно эта сово­купность является подлинно значимым объектом, гораздо более значимым* чем составляющие его дележи. Даже если один из этих дележей будет фактически осуществлен, т. е. будет фактически образовано некоторое» конкретное объединение, другие дележи будут «потенциальным» образом присутствовать: хотя они и не реализовались, но они все же существенно* повлияли на формирование и определение реальной действительности.

Рассматривая общую проблему, экономику общественного обмена или, что то же самое, игру с п участниками, мы с оптимизмом, который может быть оправдан только последующими успехами, будем ожидать аналогичного: решение должно представлять собой систему дележей х), обладающую в совокупности своего рода уравновешенностью, или устой­чивостью, природу которой мы еще попытаемся определить. Подчеркнем, что эта устойчивость — чем бы она в конце концов ни оказалась — будет свойством системы в целом, а не отдельных составляющих ее дележей. Наши краткие рассмотрения игры трех лиц уже проиллюстрировали это положение.

4.3.4. Точные критерии, характеризующие систему дележей как решение нашей проблемы, имеют, разумеется, математический характер. Поэтому за четким и исчерпывающим рассмотрением мы должны отослать читателя к последующему математическому развитию теории. Точное – определение сформулировано в п. 30.1.1. Тем не менее мы дадим здесь предварительное качественное описание. Мы надеемся, что это поможет пониманию идей, на которых основано количественное рассмотрение. Кроме того, при этом более отчетливо будет обрисовано место наших рас­смотрений в общей структуре социальных теорий.

4.4. Нетранзитивное понятие «превосходства» , или «доминирования»

Щ1 4.4.1. Вернемся к более примитивному понятию решения, которое, как мы уже знаем, должно быть отвергнуто. Мы имеем в виду идею реше­ния как единственного дележа. Если бы решение такого рода существова­ло, то оно должно было бы представлять собой дележ, в некотором разум­ном смысле превосходящий все остальные дележи. Это понятие превосход­ства для дележей должно формулироваться с учетом физической и социаль­ной структуры окружающего мира. Иначе говоря, мы должны были бы сказать, что дележ х превосходит дележ г/, если происходит следующее. Предположим, что общество, т. е. совокупность всех участников, должно рассмотреть вопрос о том, принять или отвергнуть статическое решение всех вопросов распределения, описываемое дележом у. Предположим, кро­ме того, что в этот же момент рассматривается также и альтернативное решение этого вопроса, даваемое дележом х. Тогда эта альтернатива х будет достаточной для исключения у. Под этим мы понимаем то, что, с точки зрения личных интересов достаточного количества участников, х является более предпочтительным, чем у, и они убеждены или могут быть, убеждены в возможности получения выгод от дележа х. В этом сравнении

х) Они снова могут включать компенсации между партнерами в коалиции, как это описывалось в п. 4.3.2.

х с у на участников не должно влиять рассмотрение какого-либо третьего дележа. Иначе говоря, мы считаем отношение превосходства элементарным отношением, связывающим только два дележа х и у. Дальнейшее сравне­ние трех или более — а в конечном счете и всех — дележей является предметом теории, которая должна быть построена. Она должна пред­ставлять собой как бы надстройку, воздвигнутую над элементарным поня­тием превосходства.

Сможет ли возможность получения определенных выгод в результате отказа от у в пользу х, рассмотренная в этом определении, быть сделана убедительной для заинтересованных сторон,— зависит от физических фактов данной ситуации, или, говоря языком теории игр, от правил игры.

Мы предпочитаем использовать вместо термина «превосходство» с его многочисленными ассоциациями другое слово, более подходящее в каче­стве технического термина. Когда имеет место описанное выше отношение между двумя дележами х и у мы будем говорить, что’а; доминирует у.

Если переформулировать несколько более тщательным образом то, что мы вправе ожидать от решения, состоящего из одного дележа, то можно сказать, что такой дележ должен доминировать все остальные и не должен сам доминироваться никаким другим дележом.

4.4.2. Понятие доминирования, сформулированное — или скорее намеченное — выше, носит, очевидно, характер некоторого упорядочения, аналогичного вопросу о предпочтении или же о размере в любой количест­венной теории. Понятие решения, состоящего из единственного дележа [57]), соответствует понятию первого элемента в условиях этого упорядо­чения 3).

Поиск такого первого элемента был бы правдоподобным, если бы рас­сматриваемое упорядочение, т. е. понятие доминирования, обладало бы важным свойством транзитивности; иначе говоря, если бы из того, что х доминирует у, а у доминирует z, следовало бы, что х доминирует В этом случае мы могли бы действовать следующим образом: начиная с произвольной х, искать у, которое доминирует х; если подобное у суще­ствует, то взять его и искать z, которое доминирует у; если такое z суще­ствует, то взять его и искать и, которое доминирует z, и т. д. В большин­стве практических проблем имеются хорошие шансы на то, что либо этот процесс закончился за конечное число шагов нахождением элемента w, не доминируемого никаким другим, либо же последовательность х, у, 2, и, .. . будет продолжаться бесконечно, но эти х, у, z, и, .. . будут стремиться к предельному элементу w, не доминируемому никаким другим. При этом, благодаря указанной выше транзитивности, окончательное w будет в любом из этих случаев доминировать все ранее полученные X,, у, Z, и, . . .

Мы не будем здесь входить в более тонкие детали, которые могли бы и должны были бы быть затронуты при более подробном рассмотрении.

Читателю должно быть ясно, что продвижение вдоль последовательности х, г/, z, и, . . . соответствует последовательным «улучшениям», завер­шающимся нахождением «оптимума», т. е. «первого» элемента w, который доминирует все остальные и не доминируется никакими другими эле­ментами.

В случае, когда транзитивность не имеет места, положение дел стано­вится совершенно иным. В этом случае любая попытка достижения «опти­мума» путем последовательных улучшений может оказаться тщетной. Может случиться, что х доминируется элементом г/, у доминируется эле­ментом а 2 в свою очередь доминируете я элементом х 1).

4.4.3. В действительности отношение доминирования, на котором мы основываемся, не является транзитивным. В нашем пробном описании этого понятия мы указывали, что х доминирует у, когда существует груп­па участников, каждый из которых предпочитает свою индивидуальную ситуацию в х соответствующей ситуации в г/, причем эти участники убежде­ны в том, что, действуя как одна группа, т. е. как некоторый союз, они могут провести свои предпочтения в жизнь. Подробно мы рассмотрим эти вопросы в п. 30.2. Мы будем называть эту группу участников «эффектив­ным множеством» для доминирования х над у. Но если х доминирует у и у доминирует то эффективные множества для этих двух доминирова­ний могут быть непересекающимися, и поэтому никаких заключении по поводу отношения между z их сделать нельзя. Может случиться даже, что 2 доминирует х при помощи некоторого третьего эффективного множе­ства, быть может, не пересекающегося с первыми двумя.

Это отсутствие транзитивности, особенно в приведенном выше фор­мальном изложении, может показаться досадным усложнением. Может даже представиться желательной попытка освободить теорию от него. Однако читатель, который посмотрит на последний абзац с несколько другой точки зрения, отметит, что он содержит лишь описание в общих терминах одного в высшей степени типичного для социальных организаций явления. Соотношения доминирования между различными дележами х, у, 2, . . т. е. между различными состояниями общества, соответству­ют различным путям, которыми они могут вывести из равновесия, т. е. расстроить планы друг друга. Тот факт, что различные группы участников, действуя в качестве эффективных множеств в различных соотношениях подобного рода, могут вызвать появление «циклических» доминирований (т. е. доминирования у над х, z над у их над z), является в действительно­сти одной из наиболее характерных трудностей, с которыми придется, столкнуться теории этих явлений.

4.5. Точное определение решения

* 4.5.1. Таким образом, наша задача состоит в замене понятия оптиму­ма, т. е. первого элемента, некоторым другим понятием, которое может взять на себя его функции в состоянии статического равновесия. Это ста­новится необходимым потому, что первоначальное понятие стало несостоя­тельным. Впервые мы подметили его провал на конкретном примере игры трех лиц в пп. 4.3.2, 4.3.3. Однако теперь мы получили возможность более глубокого проникновения в причины его неудачности: эти причины

В случае транзитивности это невозможно, так как — если есть нужда в дока­зательстве — х никогда не доминирует себя. Действительно, если, скажем, у домини­рует х, z доминирует у и х доминирует z, то из транзитивности мы можем заключить, что х доминирует х.

заключаются в самой природе нашего понятия доминирования и особенно в его нетранзитивности.

Этот тип отношения вовсе не является присущим исключительно нашей проблеме. Другие его примеры хорошо известны во многих обла – . стях, и достойно сожаления, что они никогда не подвергались общему математическому рассмотрению. Мы имеем в виду все те понятия, которые носят общий характер сравнения предпочтений, «превосходства» или порядка, но не обладают транзитивностью; таковы, например, сила игро­ков в шахматном турнире или гандикапы в спортивных состязаниях и скачках и т. п. *).

4.5.2. Обсуждение игры трех лиц в пп. 4.3.2, 4.3.3 показало, что решение будет, вообще говоря, уже не единственным дележом, а некото­рым множеством дележей. Иначе говоря, нам придется заменить понятие первого элемента понятием множества элементов (дележей) с надлежащи­ми свойствами. При подробном рассмотрении этой игры в § 32 (см. также ее интерпретацию в п. 33.1.1, в которой обращается внимание на некото­рые отклонения) мы дадим точный вывод с помощью системы постулатов из п. 30.1.1 той системы трех дележей, которая была введена в качестве решения игры трех лиц в пп. 4.3.2, 4.3.3. Эти постулаты будут весьма сходны с постулатами, характеризующими первый элемент. Разумеется, они представляют собой условия, налагаемые на некоторое множество элементов (дележей); однако если это множество окажется состоящим толь­ко из одного элемента, то наши постулаты перейдут в характеризацию первого элемента в общей системе всех дележей.

Пока что мы не будет вдаваться в детальное обоснование этих посту­латов; однако мы сформулируем их сейчас же в надежде, что читатель найдет их достаточно правдоподобными. В следующих абзацах мы приве­дем некоторые мотивы качественного характера или, точнее говоря, одну возможную интерпретацию предлагаемых постулатов.

4.5.3. Наши постулаты заключаются в следующем. Множество S эле­ментов (дележей) является решением, если оно обладает следующими дву­мя свойствами.

(4:Afa) Ни одно г/, содержащееся в 5, не доминируется каким бы то ни было х, содержащимся в S.

(4:А:Ь) Любое г/, не содержащееся в S, доминируется некоторым х, содержащимся в S.

(4:А:а) и (4:А:Ь) можно сформулировать в виде одного условия:

(4:А:с) Элементами S являются в точности те элементы, которые не доминируются элементами самого S [58]).

Читатель, который заинтересуется упражнением подобного рода, может теперь проверить наше предыдущее утверждение о том, что для множества S, состоящего из*одного элемента^, написанные выше условия представляют собой точной выражение того факта, что х является первым элементом.

4.5.4. Часть беспокойства, которое приведенные выше постулаты могут внушить с первого взгляда, вызвана, вероятно, их «круговым»; характером. Это особенно очевидно в условии (4:А:с), в котором элементы множества S характеризуются некоторым отношением, в свою очередь .зависящим от S. Весьма существенно не допускать недоразумений относи­тельно значения этого обстоятельства.

Так как наши определения для S (4:А:а) и (4:А:Ь) или (4:А:с) являют­ся «круговыми», т. е. неявными, то вовсе не очевидно ни существование удовлетворяющего им множества ни, в случае его существования, era единственность. В действительности эти вопросы, остающиеся на этом этапе без ответа, являются основным предметом последующей теории. Ясно, однако, что эти определения недвусмысленным образом говорят, является ли любое конкретное множество S решением или нет. Если настаивать на придании к определяемому понятию еще и свойств суще­ствования и единственности, то мы должны сказать следующее. Мы дали не определение S, а определение некоторого свойства S — мы не опре­делили решение, но охарактеризовали все возможные решения. Содержит ли совокупность всех очерченных таким образом решений в точности одно множество несколько таких множеств или же ни одного —этот вопрос является предметом дальнейших исследований *).

4.6. Интерпретация нашего определения в терминах «норм поведения»

4.6.1. Единственный дележ представляет собой часто используемое и хорошо понимаемое понятие экономической теории, тогда как множества дележей, к рассмотрению которых мы пришли, являются довольно непри­вычными объектами. Поэтому желательно увязать их с какими-либо понятиями, занимающими вполне определенное место в наших рассужде­ниях, касающихся общественных явлений.

Действительно, представляется, что рассматриваемые нами множе­ства дележей S соответствуют «нормам поведения», связанным с обществен­ной организацией. Рассмотрим это утверждение более подробно.

Пусть нам дан физический базис общественной экономики или, говоря более широко, .общества [59]). В соответствии с традициями и опытом челове­ческие существа придерживаются некоторого характерного способа при­способления самих себя к подобным обстоятельствам. Он заключается не только в установлении некоторой жесткой системы распределения, т. е. дележа, но и в некотором многообразии альтернатив, которые будут выражать некоторые общие принципы, но тем не менее отличаться друг от друга многими конкретными чертами [60]). Система дележей описывает «установленный порядок общества», или «принятую норму поведения».


Очевидно, никакая случайная группировка дележей не сможет служить такой «нормой поведения»: она должна будет удовлетворять определенным условиям, характеризующим ее как некоторый возможный порядок вещей. Ясно, что это понятие возможности должно предусматривать условия устойчивости. Читатель, несомненно, заметит, что наш подход, развитый в предыдущих пунктах, выдержан целиком в этом духе. Множества S дележей х, г/, z, … соответствуют тому, что мы теперь называем «норма­ми поведения», а условия (4:А:а) и (4:А:Ь) или (4:А:с), характеризующие решение S, как раз и выражают устойчивость в указанном выше смысле.

4.6.2. Разделение нашего условия на (4:А:а) и (4:А:Ь) оказывается в этом случае особенно подходящим. Напомним, что доминирование у со стороны х означает, что включение в рассмотрение дележа х исклю­чает принятие дележа у\ при этом*вовсе не предсказывается, какой дележ будет в конечном счете принят — ср. пп. 4.4.1 и 4.4.2. Таким образом, (4:А:а) выражает тот факт, что норма поведения свободна от внутренних противоречий: никакой дележ г/, принадлежащий S (т. е. согласующийся с «принятой^нормой поведения»), не может отменяться (т. е. доминировать – ся) другим дележом х того же типа. С другой стороны, условие (4:А:Ь) выражает, что «норма поведения» может быть использована для дискреди­тации любой не согласующейся с нормами процедуры: любой дележ г/, не принадлежащий S, может отменяться (т. е. доминироваться) некоторым дележом х, принадлежащим S.

Отметим, что в п. 4.5.3 мы не постулировали, что дележ у, при­надлежащий S, не должен доминироваться каким-либо дележом хх). Разумеется, если это произойдет, то в силу (4:А:а) х должен будет лежать вне S. В терминологии общественных организаций это означает, что дележ г/, согласующийся с «принятой нормой поведения», может отменять­ся другим дележом х\ однако в этом случае можно с уверенностью сказать, что сам дележ х с этими нормами не согласуется [61]). Из других наших требований следует, что х в свою очередь отменяется некоторым третьим дележом z, который снова будет согласовываться. Так как дележи у и z согласуются с нормами поведения, z не может отменить у — дальнейшая иллюстрация нетранзитивности отношения доминирования. Таким обра­зом, наши решения S соответствуют тем «нормам поведения», которые обладают внутренней устойчивостью: если только они приняты, они аннулируют все остальное, причем никакая их часть не может быть аннулирована в рамках принятых норм. Это, очевидно, совпадает с поло­жением вещей в реальных общественных организациях, чем еще раз под­тверждается приемлемость кругового характера наших условий из п. 4.5.3.

4.6.3. Мы уже упоминали одно важное возражение, сознательно отложив его анализ. Именно ни существование, ни единственность реше­ния S в смысле условий (4:А:а) и (4:А:Ь) или (4:А:с) из п. 4.5.3 не являют­ся очевидными или хотя бы установленными.

Разумеется, в том, что касается существования, нельзя идти ни на какие уступки. Если бы оказалось, что требования, предъявляемые нами к решению S, в каком-то частном случае невыполнимы, то это, разумеется,

потребовало бы серьезного изменения теории. Таким образом, общее дока­зательство существования решений для всех частных случаев х) является весьма желательным. Из наших дальнейших исследований будет видно, что это доказательство еще не проведено в полной общности, но что во всех рассмотренных до сих пор случаях решения были найдены.

Положение с единственностью оказывается совершенно иным. Часто упоминавшийся выше «круговой» характер наших требований делает неединственность решений в общем случае весьма вероятной. Действи­тельно, в большинстве случаев мы будем сталкиваться с множественностью решений [62]). С учетом того, что было сказано выше об интерпретации реше­ний как устойчивых «норм поведения», эта множественность имеет простой и вполне разумный смысл. Именно, в одних и тех же физических условиях можно построить различные «установленные порядки общества», или «принятые нормы поведения», причем все они будут обладать рассмотрен­ными выше характеристиками внутренней устойчивости. Так как это понятие устойчивости носит «внутренний» характер — т. е. действует лишь в предположении, что рассматриваемые нормы поведения являются общепринятыми,— то эти различные нормы поведения вполне могут ока­заться противоречащими друг другу.

4.6.4. Наш подход следовало бы сравнить с широко распространен­ным мнением о том, что построение социальной теории возможно лишь на основе некоторых априорных принципов, касающихся целеустремлен­ности общества. Эти принципы должны охватывать количественные утвер­ждения как относительно целей, которых нужно в конечном счете достиг­нуть, так и относительно пропорционального распределения между инди­видуумами. Если эти принципы приняты, то возникает простая задача максимизации.

Отметим, что никакое провозглашение принципов не является само по себе удовлетворительным, а приводимые в его пользу аргументы сводятся либо к внутренней устойчивости, либо к еще менее четко определенным видам желательности. Последнее главным образом касается вопросов распределения.

О мотивировках последнего типа можно сказать немногое. Наша задача заключается не в определении того, что должно произойти при следовании некоторому набору произвольных априорных принципов, а в исследовании того, где лежит равновесие сил.

Что же касается мотивировок первого типа, то наша цель состояла в придании этим аргументам точной и удовлетворительной формы в отно­шении как глобальных целей, так и индивидуальных распределений. Это привело к необходимости рассмотрения всего вопроса о внутренней устойчивости как самостоятельной проблемы. Теория, являющаяся непро­тиворечивой в этом отношении, не может не дать нам точной картины полного взаимодействия экономических интересов, влияний и сил.

4.7. Игры и общественные организации

4.7. Теперь может оказаться своевременным возобновить аналогию с играми, которую мы намеренно скрывали в предыдущих пунктах (см. сноску 2 на стр. 66). Параллелизм между решениями в смысле п. 4.5.3, с одной стороны, и устойчивыми «нормами поведения», с другой, может быть использован для подтверждения различных утверждений в обоих направлениях. По крайней мере мы надеемся, что это предложение будет иметь для читателя некоторую привлекательность. Мы считаем, что мате­матическая теория стратегических игр сильно выигрывает в своей правдо­подобности благодаря тому соответствию, которое существует между игро­выми понятиями и понятиями общественных организаций. С другой сторо­ны, почти любое утверждение относительно организации общества, которое мы (или кто-либо другой) высказывали до сих пор, имеет своим источником существующее мнение. Большинство же мнений в силу самой природы вещей до сих пор вряд ли могло быть доказано или опровергнуто в рамках социальной теории. Поэтому большой помощью для нас является то, что все наши утверждения могут быть подкреплены конкретными примерами из теории стратегических игр.

В сущности, в этом и заключается один из стандартных приемов при использовании моделей в физических науках. Эта двусторонняя процедура выявляет некоторую существенную функцию моделей, не подчеркивавшую­ся при их рассмотрении в п. 4.1.3.

Проиллюстрируем сказанное. Вопрос о том, возможно ли наличие нескольких устойчивых «порядков общества», или «норм поведения», основанных на одних и тех же физических данных, является весьма дискуссионным. Мало надежды на то, что он будет выяснен обычными методами. Одна из главных причин этого — чрезвычайная сложность поставленной проблемы. Однако мы приведем конкретные примеры игр трех или четырех лиц, в которых игра обладает несколькими решениями в смысле п. 4.5.3. Мы увидим, что некоторые из этих примеров оказывают­ся моделями определенных простых экономических задач (см. § 62).

4.8. Заключительные замечания

4.8.1. В заключение нам остается сделать несколько замечаний более формального характера.

Начнем со следующего соображения. Исходным пунктом наших рас­смотрений был единственный дележ, который первоначально являлся количественным экстрактом из более сложного комбинаторного набора правил. Отсюда мы были вынуждены перейти к множествам дележей S, которые при определенных условиях выступали в качестве решений. Так как представляется, что эти решения не обязательно будут единственными, полный ответ на любую конкретную задачу будет заключаться не в нахож­дении решения, а в определении множества всех решений. Таким образом, объект, который мы ищем в любой конкретной задаче, в действительности представляет собой множество множеств дележей. Само по себе это может показаться неестественно усложненным; кроме того, не видно никакой гарантии того, что этот процесс не придется продолжить дальше. По пово­ду этих сомнений достаточно сказать следующее. Во-первых, математиче­ская структура теории стратегических игр дает формальное обоснование нашей процедуры. Во-вторых, обсуждавшиеся ранее связи с «нормами поведения» (соответствующими множествам дележей), а также множе­ственность «норм поведения» в тех же физических условиях (что отвечает множествам множеств дележей) делают именно такую степень усложненно­сти желательной.


Нашу интерпретацию множеств дележей как «норм поведения» можно подвергнуть критике. В пп. 4.1.2 и 4.1.4 мы ввели более элементарное понятие, которое может произвести на читателя впечатление непосред – ственной формулировки «нормы поведения». Это было предварительное комбинаторное понятие решения как набора правил для каждого участни­ка, говорящих ему, как вести себя в любой возможной ситуации в игре. (Затем из этих правил в качестве некоторого их количественного резюме извлекался единственный дележ.) Однако столь простую точку зрения на «норму поведения» можно проводить лишь в играх, в которых коалиции и компенсации между партнерами по коалиции не играют роли (см. п. 4.3.2), так как описанные выше правила не предусматривают подоб­ных возможностей. Существуют игры, в которых коалиции и компенсации можно не принимать во внимание: таковы, например, игры двух лиц с нулевой суммой, упоминавшиеся в п. 4.2.3, и более общие «несуществен­ные» игры, которые будут рассматриваться в п. 27.3 и в (31 :Р) из п. 31.2.3. Однако общие, типичные игры, в частности, все существенные проблемы экономики общественного обмена, не могут рассматриваться без этих приемов. Таким образом, те же аргументы, которые заставили нас рас­сматривать множества дележей вместо отдельных дележей, вынуждают нас отвергнуть такое узкое понимание «нормы поведения». В действитель­ности мы будем называть эти наборы правил «стратегиями» игры.

4.8.2. Следующий вопрос, заслуживающий упоминания, касается статического или динамического характера теории. Мы вееьма настойчиво повторяем, что наша теория является целиком статической. Несомненно, динамическая теория была бы более полной и поэтому более предпочти­тельной. Однако другие отрасли науки с полной очевидностью показыва­ют, что попытки построения такой теории до полного проникновения в статическую сторону вопроса являются тщетными. С другой стороны, читатель может оспаривать некоторые проводившиеся нами в ходе наших рассмотрений соображения, носящие отчетливо выраженный динамиче­ский характер. Это относится, в частности, ко всем рассуждениям, касающимся взаимодействия различных дележей под влиянием «домини­рования» (см. п. 4.6.2). Мы считаем, что это вполне законно. Статическая теория рассматривает состояния равновесия х). Существенной характери­стикой состояния равновесия является отсутствие тенденций к изменени­ям, иначе говоря, равновесие не приводит к динамическому развитию. Разумеется, анализ этой стороны вопроса немыслим без использования определенных элементарных динамических понятий. Здесь важно то, что они являются элементарными. Иными словами, для создания настоящей динамики, исследующей точные движения, обычно являющиеся далекими от состояний равновесия, требуется гораздо более глубокое понимание этих динамических явлений [63]»[64]).

4.8.3. Отметим, наконец, один вопрос, в котором теория обществен­ных явлений, по-видимому, весьма существенно разойдется с существую­щими образцами математической физики. Разумеется, это лишь некоторая догадка, ибо здесь преобладает еще полная неясность.

Наша статическая теория определяет состояния равновесия, т. е. решения в смысле п. 4.5.3, представляющие собой множества дележей. Динамическая теория, когда она будет построена, вероятно, будет описы­вать изменения в терминах более простых понятий, например отдельного дележа, имеющего место в рассматриваемый момент времени, или чего-либо аналогичного. Это показывает, что формальная структура этой части теории — соотношение между статикой и динамикой — может существен­но отличаться от положения дел в классических физических теориях х).

Все эти соображения еще раз иллюстрируют нам, сколь сложных теоретических форм мы можем ожидать от социальных теорий. Уже наш статический анализ сделал необходимым создание идейного и формального аппарата, совершенно отличного от используемого, например, в матема­тической физике. Так, мы убедились, что общепринятая точка зрения на решение как на единственным образом определенное число или систему чисел является для наших целей слишком узкой, несмотря на ее успех в других областях. Представляется, что в отношении математического аппарата главенствующая роль должна принадлежать уже не теории дифференциальных уравнений, пронизывающей всю математическую физи­ку, а комбинаторике и теории множеств.

Особенно от классической механики. Аналогии, подобные приводившимся т сноске 2 на стр. 70, здесь уже не имеют места.

Глава II

ОБЩЕЕ ФОРМАЛЬНОЕ ОПИСАНИЕ СТРАТЕГИЧЕСКИХ ИГР

§ 5. ВВЕДЕНИЕ 5.1. Перенесение центра внимания с экономики на игры

5.1. Из рассуждений гл. I должно стать ясно, что теория рациональ­ного поведения, т. е. теория оснований экономики и основных механизмов социальных организаций, требует глубокого изучения «стратегических игр». Следовательно, теперь мы должны рассматривать теорию игр как независимый предмет. При изучении ее как самостоятельной проблемы наши исходные позиции необходимо должны претерпеть серьезный сдвиг. В гл. I наши основные интересы лежали в области экономики. Лишь убе­дившись в невозможности продвижения в этом вопросе без предваритель­ного основательного проникновения в игровые проблемы, мы постепенно подошли к формулировкам и задачам, которые являются частью этого предмета. Тем не менее экономические точки зрения оставались в гл. I преобладающими. Начиная с настоящей главы, мы, однако, должны будем рассматривать игры как таковые. Поэтому нас не будет особенно беспо­коить то, что некоторые рассматриваемые нами вопросы вообще не будут иметь связей с экономикой,— в противном случае было бы невозможно отдать должное самой теории. Разумеется, большинство основных понятий будет уже знакомо нам по экономической литературе (см. следующий п. 5.2), хотя детали при этом часто будут чуждыми для экономики и, как обычно, могут загромождать изложение и затемнять ведущие принципы.

5.2. Общие принципы классификации и подхода

5.2.1. Некоторые аспекты стратегических игр, которые уже стали играть существенную роль в последних параграфах гл. I, не будут затра­гиваться на начальных этапах предпринимаемых нами рассуждений. Точнее говоря, вначале мы не будем упоминать о коалициях между. игро­ками и о компенсациях, которые они друг другу выплачивают. (Относи­тельно этих понятий см. пп. 4.3.2 и 4.3.3|из гл. I.) Причины этого мы сей – час вкратце рассмотрим; это прольет также некоторый свет на наш общий подход к предмету.

Одним из важных признаков при классификации игр является сле­дующий: равна или не равна нулю сумма всех выплат, получаемых всеми игроками в конце игры. Если эта сумма равна нулю, то мы можем сказать, что игроки платят только друг другу и что никакого создания или уничто­жения благ не происходит. Именно таковы все игры, в которые играют для развлечения. Однако большинство экономически содержательных схем существенно отличается от описанной. В этих схемах сумма всех платежей — совокупный общественный продукт — будет, вообще говоря, отлична от нуля и может даже не быть постоянной. Иначе говоря, она будет зависеть от поведения игроков, т. е. участников общественной эконо­мики. Это различие уже упоминалось в п. 4.2.1, особенно в сноске 5 на стр. 59. Мы будем называть игры первого из названных типов играми с нулевой суммой, а игры второго типа — играми с ненулевой суммой.


В первую очередь мы построим теорию игр с нулевой суммой; в даль­нейшем, однако, будет найдена возможность рассматривать с ее помощью все без исключения игры. Именно, мы покажем, что общую игру п лиц (в частности, и игру с переменной суммой) можно свести к игре п + 1 лица с нулевой суммой. (По этому поводу см. п. 56.2.2.) После этого тео­рия игр п лиц с нулевой суммой будет строиться на основе частного случая игры двух лиц с нулевой суммой (см. п. 25.2). Поэтому мы начнем наше исследование с теории таких игр; это будет проделано в гл. III.

Итак, в играх двух лиц с нулевой суммой коалиции и компенсации не могут играть никакой роли х). Проблемы, существенные для этих игр, носят иной характер. Основные вопросы заключаются в следующем. Каким образом каждый игрок планирует свои действия, иначе говоря, как сформулировать точное понятие стратегии? Какая информация доступ­на каждому игроку на любом этапе игры? Какую роль играет информи­рованность игрока о стратегии другого игрока? Что можно сказать о тео­рии этой игры в целом?

5.2.2. Разумеется, все эти вопросы существенны в любых играх и при любом количестве игроков, в том числе и тогда, когда для них оказываются доступными коалиции и компенсации. Однако, как покажут наши последующие рассмотрения, для игр двух лиц с нулевой суммой только эти вопросы и представляют интерес. С другой стороны, важ­ность всех этих вопросов уже признана в экономике; однако мы считаем, что в теории игр они возникают более элементарным образом. Поэтому они могут быть совершенно точно рассмотрены и, как мы надеемся пока­зать, разрешены. Вместе с тем в процессе этого исследования нам будет выгодно (с чисто технической точки зрения) опираться на образы и приме­ры, довольно далекие от экономической области и принадлежащие, строго говоря, к области игр в общепринятом понимании этого слова. Таким обра­зом, в дальнейшем будут преобладать иллюстрации, заимствованные из шахмат, игры в орлянку, покера, бриджа и т. п., а не из структуры карте­лей, рынков, олигополий и т. п.

Здесь уместно также напомнить, что мы считаем все расчеты в конце игры чисто денежными, иначе говоря, всем игрокам приписываются побуждения, связанные исключительно с денежной прибылью. Смысл этого допущения анализировался в терминах понятия полезности в п. 2.1.1 из гл. I. Пока что — особенно для игр двух лиц с нулевой суммой, кото­рые будут рассматриваться сначала (см. обсуждение в п. 5.2.1),— это упрощающее предположение является совершенно необходимым. Мы будем придерживаться его в большей части нашей теории, хотя, далее будут рассмотрены и некоторые его варианты (см. гл. XII и особенно § 66).

5.2.3. Наша первая задача состоит в точном определении того, что составляет игру. Пока понятие игры не описано с абсолютной математи­ческой точностью, мы не можем ожидать по лучения^ точных и исчерпы­вающих ответов на вопросы, сформулированные в конце п. 5.2.1. Хотя нашей ближайшей целью будет, как это объяснялось в п. 5.2.1, построение

Единственное вполне удовлетворительное «доказательство» этого утверждения состоит в построении полной теории всех игр двух лица нулевой суммой без исполь­зования этих понятий. Это будет проделано в гл. III, причем основной результат будет приведен в § 17. Однако и из соображений здравого смысла|ясно, что ^«соглашения» и «коалиции» здесь не могут играть роли. Действительно, любое такое объединение должно охватывать хотя бы двух игроков — в данном случае всех игроков, — для которых сумма всех платежей тождественно равна нулю. Иначе говоря, при этом уже не остается противников и не представляется возможным сформулировать какие – либо цели.

теории игр двух лиц с нулевой суммой, все же представляется нецеле­сообразным ограничивать точное описание составляющих игру компонент именно этим случаем. Следовательно, мы можем начать с описания общей игры п лиц. Здесь мы попытаемся отразить все мыслимые тонкости и усложнения, которые могут возникнуть в игре, за исключением явно несущественных. Встав на этот путь, мы за несколько последовательных шагов придем к довольно сложной, но исчерпывающей и математически точной схеме. Затем мы увидим, что эту общую схему можно заменить существенно более простой, являющейся тем не менее полной и строго эквивалентной исходной схеме. Кроме того, математический прием, кото­рый приводит к такому упрощению, также имеет непосредственное значе­ние для нашей теории: он заключается во введении точного понятия стратегии.

Следует отдавать себе отчет в том, что этот обходный маневр, ведущий в конечном счете от сложных формулировок проблемы к значительно более простой, является неизбежным. Необходимо прежде всего показать, что все мыслимые усложнения приняты во внимание и что используемый математический аппарат действительно обесЦечивает эквивалентность слож­ного построения простому.

Все сказанное может быть и должно быть проделано для всех игр, с лю­бым числом игроков. Однако после того, как эта цель будет во всей своей общности достигнута, следующая задача нашей теории будет заключаться, как уже упоминалось, в нахождении полного решения для игры двух лиц о нулевой суммой. В связис этим в настоящей главе будут рассматриваться все игры, а в следующей — только игры двух лиц с нулевой суммой. После анализа этих игр и рассмотрения некоторых важных примеров мы снова начнем расширять объект исследования — сначала до игр п лиц с нулевой суммой, а затем до всех игр вообще.

Коалиции и компенсации появятся вновь только на дальнейших этапах.

§ 6. УПРОЩЕННОЕ ПОНЯТИЕ ИГРЫ

6.1. Объяснение технических терминов

6.1. До того, как давать точное определение комбинаторного понятия игры, следует прежде всего уяснить использование основных терминов. Некоторые фундаментальные для изучения игр понятия используются в повседневном языке весьма двусмысленным образом. Описывающие их слова иногда употребляются в одном смысле, иногда в другом, а подчас, что хуже всего, они используются как синонимы. Поэтому мы должны ввести определенное использование технических терминов и строго при­держиваться его в дальнейшем.

Во-первых, следует различать абстрактное понятие игры и индиви­дуальные партии этой игры. Игра представляет собой попросту совокуп­ность описывающих ее правил. Каждый конкретный пример разыгрывания игры некоторым конкретным образом от начала и до конца представляет собой партию 1).

Во многих спортивных играх партии называются в обиходе играми. В бридже партия соответствует робберу, в теннисе — сету; к сожалению, в этих играх некоторые компоненты партии снова называются играми. Французская терминология совершенно недвусмысленна: «игра» = «jeu», «партия» = «partie».

Во-вторых, следует проводить соответствующее различие и для ходов, которые служат составляющими элементами игры. Ход представляет собой возможность выбора между различными альтернативами, произво­димого либо одним из игроков, либо некоторым случайным устройством, в условиях, точно определяемых правилами игры. Ход является не чем иным, как этой абстрактной «возможностью» с соответствующими деталями описания, т. е. некоторой компонентой игры. Конкретная альтернатива, выбранная в конкретной ситуации, т. е. в конкретной партии, называется *выбором. Таким образом, ходы относятся к выборам точно таким же обра­зом, как игра — к партии. Игра состоит из последовательйости ходов, а партия — из последовательности выборов х).

Наконец, правила игры не следует смешивать со стратегиями игро­ков. Точные определения будут приведены позднее, но подчеркиваемое нами различие должно быть ясно с самого начала. Каждый игрок выбирает свою стратегию (т. е. общие принципы, которым подчинены его выборы) свободно. В то время как любая конкретная стратегия может быть хоро­шей или цлохой — при условии, что эти понятия могут быть интерпрети­рованы точным образом (см. пп. 14.5 и 17.8—17.10),— принятие или непринятие этой стратегии полностью находится в распоряжении игрока. Правила игры, однако, представляют собой абсолютные предписания. Если они когда-либо нарушаются, то, по определению, все мероприятие уже перестает быть игрой, описываемой этими правилами. Во многих случаях нарушение правил игры невозможно даже физически [65]).

6.2. Элементы игры

6.2.1. Рассмотрим теперь игру п игроков Г. Для краткости игроки ‘%ДУт обозначаться через 1, . . ., п. Привычные представления говорят нам о том, что эта игра представляет собой некоторую последовательность ходов; мы будем предполагать, что как число, так и чередование этих ходов заданы с самого начала. Впоследствии мы увидим, что эти ограниче­ния не являются в действительности существенными и могут быть без труда сняты. Пока что обозначим фиксированное число ходов игры Г через v; оно является целым числом: v = 1, 2, . , . Сами ходы обозначим через о/И 1, . . ., зпредположим, что они уже выписаны в том хроноло­гическом порядке, в котором они согласно предписанию должны выпол­няться.

Каждый ход к = 1, . . ., v, в действительности состоит из ряда альтернатив, среди которых происходит выбор, составляющий ход Обозначим число этих альтернатив через ах, а сами альтернативы — через

(1), . . ., (&}{)•

Ходы могут быть двух типов. Ходы первого типа, или личные ходы, представляют собой выборы, производимые конкретным игроком, т. е. зависящие от свободного решения последнего и больше ди от чего. Ходы второго типа, или случайные ходы, представляют собой выборы, зависящие от некоторого механического устройства, которое производит свои выборы случайным образом с некоторыми вероятностями *). Таким образом, для каждого личного хода должно быть указано, решение какого игрока определяет этот ход,— иначе говоря, чей это ход. Обозначим рассматривае­мого игрока (т. е. его номер) через к%. Таким образом, = 1, . . ., п. Условимся полагать для случайного хода кК — 0. В этом случае должны быть заданы вероятности различных альтернатив (1), . . ., Jb^ (ах). Мы обозначим эти вероятности [66]) соответственно через рК (1), . . ., р„ (ах).

6.2.2. Выбор в ходе о£х состоит в указании некоторой альтернативы из Лх (1), . . ., Л-к (осх), т. е. ее номера 1, . . ., ах. Обозначим выбранное таким образом число через ах. Таким образом, этот выбор характеризуется числом ax = 1, . . ., ах. Партия в целом описывается указанием всех выборов, соответствующих всем ходам oMi, . . Иначе говоря, она

описывается последовательностью <т4, . . ., av.

Правила игры Г должны указать, каким будет исход партии для каждого игрока к = 1, . . ., я, если партия описывается данной после­довательностью а1? . . ., av. Иначе говоря, должно быть известно, какие выигрыши получает каждый игрок при окончании партии. Обозначим выигрыш для к-то игрока через (JFk > 0? если игрок к получает – выигрыш, JFu < 0, если он сам должен платить, и = 0, если ни то, ни другое не имеет места). Таким образом, каждое JFn должно быть задано* как функция от at, . . ., av:

= …, av), к = 19…, п.

Подчеркнем еще раз, что правила игры Г определяют функцик> k • • •» av) лишь как функцию [67]), т. е. как абстрактную зависимость jFft от переменных аь . . av. Но каждое сгх представляет собой|перемен – ную с областью изменения 1, . . ., ах. Указание конкретных численных значений для сгх, т. е. выбор конкретной последовательности. . ., oVr не является частью игры Г. Оно’является, как; мы отмечали выше, зада­нием партии.

6.3. Информация и предварение

6.3.1. Наше описание игры Г пока что не является полным. Нам еще не удалось включить в него сведения о состоянии информации каждого* игрока при каждом решении, которое он должен принять, т. е. при на наступлении очереди его личного хода. Поэтому мы сейчас обратимся к этому вопросу.

Лучше всего проводить это рассмотрение, прослеживая ходы оМi, . . . . . ., o/flv по мере осуществления соответствующих выборов.

Сосредоточим поэтому наше внимание на некотором конкретном ходе Если оМк является случайным ходом, то прибавить больше нечего: выбор производится случайным образом, ничья воля и ничье знание дру­гих вещей не могут на него повлиять. Однако, если о/Их является личным ходом игрока к^, то весьма важным является состояние информации этого игрока в процессе формирования его решения относительно оМт. е. фор­мирования его выбора (Ух.

Единственное, о чем он может быть информирован, это о выборах, соответствующих ходам, которые предшествуют о/И^, т. е. ходам. . . . . ., Иначе говоря, он может знать значения <гь . . ., orx-i. Но он

может всего этого и не знать. Важной особенностью игры Г является объем информации относительно сг1? . . ., o^-i, которой игрок кк располагает в момент, когда ему предстоит выбрать ак. Вскоре мы выясним на несколь­ких примерах природу подобных ограничений.

Простейший тип правил, описывающих состояние информации игрока к к при ходе заключается в следующем. Указывается множество состоящее из некоторых чисел, взятых из Я = 1, …, к — 1. Принимает­ся, что игрок кп знает значения сгя, если X принадлежит Лх, и совершенно не располагает информацией относительно ох при любом другое Я.

Если Я принадлежит Лх, то будем говорить, что Я предваряет х. Отсюда следует, что Я принимает одно из значений 1, . . ., % — 1, т. е. X <Ск; однако обратное заключение не обязательно будет верно. Иными словами, если рассматривать вместо Хик соответствующие ходы оМ % ивМ^ то можно сказать, что из предварения следует предшествование *), но обратное может быть и неверным.

6.3.2. Несмотря на свой несколько ограничительный характер, поня­тие предварения заслуживает более подробного рассмотрения. Рассматри­ваемое как само по себе, так и в своем отношении к предшествованию {см. последнюю сноску), оно дает почву для возникновения различных комбинаторных возможностей. Эти возможности имеют различный смысл в тех играх, в которых они возникают; сейчас мы проиллюстрируем их на нескольких примерах особенно характерных ситуаций.

6.4. Предварение, транзитивность и сигнализация

6.4.1. Мы начнем со следующего замечания. Существуют игры, в которых предварение и предшествование совпадают. Например, ими будут те игры, в которых игрок к^, совершающий свой личный ход оМ^, информи­рован об исходах выборов на всех предшествующих’ходах <MU. . ., Типичным представителем этого класса игр с «полной» информацией являются шахматы. Обычно считается, что подобные игры носят особенно рациональный характер. В § 15, особенно в п. 15.7, мы увидим, в каком смысле можно точно интерпретировать это утверждение.

Шахматы обладают еще и той характерной чертой, что все ходы в этой игре являются личными. Однако отмеченное выше свойство, т. е. экви­валентность предварения и предшествования, можно сохранить даже в играх, в которых производятся* случайные ходы. Примером такой игры

является трик-трак Можно высказать некоторые сомнения по поводу того, не нарушает ли наличие случайных ходов «рационального харак­тера» игр, упомянутых в связи с предыдущими примерами.

В п. 15.7.1 мы увидим, что этого не произойдет, если придерживаться некоторого весьма правдоподобного толкования этого «рационального* характера». Неважно, являются ли все ходы личными или нет; существен­ным является совпадение предварения и предшествования.

6.4.2. Рассмотрим теперь игры, в которых из предшествования не следует предварения. Так бывает, когда игрок /сх, делающий свой лич­ный ход о^и, не информирован обо всем происшедшем ранее. Существует обширный класс игр, в которых это имеет место. Эти игры обычно содержат как случайные, так и личные ходы. Обычно считается, что эти игры носят смешанный характер: хотя их исход существенно зависит от случая, сильное влияние на него оказывают также и стратегические способности игроков.

Удобными примерами являются покер и бридж. Эти две игры показы­вают также, какие характерные черты понятия предварения могут обна­ружиться, если оно обособлено от понятия предшествования. Этот момент, по-видимому, заслуживает несколько более подробного рассмотрения.

Предшествование, т. е. хронологическое упорядочение ходов, обла­дает свойством транзитивности [68]). В наших же примерах предварение не * обязано быть транзитивным. Действительно ни в покере, ни в бридже это не так, и условия, при которых это имеет место, довольно характерны.

Рассмотрим в связи с этим покер. Пусть оМ^ — случайный ход, состоя­щий в сдаче игроку 1 его карт; — первая ставка игрока 1, его личный ход; <#х — первая последующая ставка игрока 2, личный ход второго игрока. Тогда оМ^ предваряет оМ% и предваряет с#х, но оМ^ не пред­варяет оЖ% [69]). Таким образом, мы встретили нетранзитивность, но в ней участвуют оба игрока. Действительно, на первый взгляд может показаться неправдоподобным, что предварение может оказаться в какой-либо игре нетранзитивным по отношению к личным ходам одного и того же игрока. Для этого требовалось бы, чтобы этот игрок между ходами gI^ и gIx «забывал» исход выбора, связанного с оМ^ 4). Трудно представить себе, каким пут^м могло бы реализоваться или тем более вынуждаться подобное – забывание. Тем не менее следующий наш пример иллюстрирует именно^ эту ситуацию.

Обратимся к бриджу. Хотя в бридже участвуют четыре игрока, которых можно обозначить через А, Б, В, Г, эту игру следует считать игрой двух лиц. Действительно, А и В образуют объединение, которое- является более чем добровольной коалицией; то же относится к игро-


кам Б ж Г. Для игрока А объединение с Б или Г вместо объединения с В было бы «жульничеством» в том же самом смысле, в каком было бы жульни­чеством подглядывание в карты игрока Б или ход не в масть. Иначе гово­ря, это было бы нарушением правил игры. Если три (или более) игрока играют в покер, то вполне допустимо для двух (или более) из них, если их интересы параллельны, объединиться против оставшегося игрока. Однако в бридже должны объединяться игроки А и В и аналогично Б ж Г, в то время как объединение А и Б запрещено. Естественный способ описания этого факта состоит в обозначении А жВ одним игроком 1, а Б ж Г — одним игроком 2. Можно привести следующую” равносильную формулировку: бридж является игрой двух лиц, но оба игрока 1 и 2 не действуют в нем самостоятельным образом. Игрок 1 действует4 посредством своих предста­вителей А ж В, а игрок 2 — посредством своих представителей Б ж Г.

Рассмотрим теперь представителей А ж В игрока 1. Правила игры ограничивают их общение, т. е. обмен информацией между ними. Напри­мер, пусть — случайный ход, состоящий в сдаче игроку А его карт,

— первая карта, с которой ходит А, т. е. личный ход игрока 1; — карта, с которой ходит при розыгрыше этой взятки В, т. е. личный ход игрока 1. Тогда М^ предваряет и о/И’% предваряет но оМ^ не пред­варяет оМ к х). Таким образом, мы снова сталкиваемся с нетранзитивностью, но на этот раз она относится уже только к одному игроку. Отметим, что нужное нам «забывание» хода оМ^ между ходами оМу, ж qM% было достигнуто здесь путем «раздвоения личности» игрока 1 на А ж В.

6.4.3. Приведенные примеры показывают, что^нетранзитивность отно­шения предварения соответствует хорошо известной компоненте практиче­ской стратегии, а именно возможности «сигнализации». Если при ходе не имеется никаких сведений о оМ^ но оказывается возможным наблюдать при ходе оМ’к исход хода М^ ана оказывает влияние Л^ (из-за знания об исходе оМу), то (М% в действительности является сигналом от qjH^ к gMi, т. е. некоторым косвенным носителем информации. Теперь могут возник­нуть две противоположные ситуации в зависимости от того, явля­ются ли о/И%, ж оМ>ъ ходами одного и того же игрока или двух различных игроков.

В первом случае, который, как мы видели, имеет место в бридже, интересы игрока (который есть = клежат в содействии «сигнализа­ции», т. е. в распространении информации «в пределах своей фирмы». Это стремление находит свою реализацию в широкой системе «условных сигналов» в бридже [70]). Они являются частями стратегии, а не правил игры (см. п. 6.1) и, следовательно, могут варьироваться [71]), в то время как сама игра в бридж остается неизменной.


Во втором случае, который, как мы видели, имеет место в покере, интересы игрока (теперь мы имеем в виду игрока кзаметим, что здесь уже /с*, Ф кк) лежат в предотвращении этой «сигнализации», т. е. получе­ния информации противником кн. Это обычно достигается путем беспоря­дочного и на первый взгляд нелогичного поведения при совершении выбо­ра на ходе оМ%. Оно делает для противника затруднительным извлечение из наблюдаемого исхода оМ% информации относительно исхода оМц, о кото­ром у него нет никаких непосредственных сведений Иначе говоря, эти действия делают «сигнал» ненадежным и двусмысленным. В п. 19.2.1 мы увидим, что в действительности в этом и заключается функция блефа в покере *).

Мы будем называть эти две процедуры прямой и обратной сигнализа­цией. К этому стоит добавить, что обратная сигнализация, т. е. сбивание противника с толку, имеет место почти во всех играх, включая бридж. Так происходит потому, что она основана на нетранзитивности предваре­ния в случае нескольких игроков. С другой стороны, прямая сигнализация является более редкой: покер, например, не содержит ни малейшего наме­ка на нее. Действительно, как мы уже отмечали выше, из нее следует нетранзитивность предварения, когда мы имеем дело только с одним игро­ком. Иначе говоря, она требует надлежащим образом урегулированной «забывчивости» этого игрока, которая достигается в бридже путем «рас­щепления» игрока на два лица.

Во всяком случае, бридж и покер представляются достаточно харак­терными примерами этих двух типов нетранзитивности — соответственно при прямой и обратной сигнализации.

Оба типа сигнализации приводят к деликатной проблеме разумного их сочетания при фактическом разыгрывании игры, т. е. при попытках нахождения «хороших», «рациональных» способов игры. Всякая попытка сигнализировать больше или меньше, чем этого требует «бесхитростная» игра, неизбежно приводит к отклонениям от «бесхитростного» способа игры. А это обычно оказывается возможным лишь ценой определенных затрат, т. е. прямыми последствиями здесь являются убытки. Таким образом, задача состоит в том, чтобы установить эту дополнительную сигнализацию на таком уровне, при котором ее преимущества — передача или сокрытие информации — перевесили бы непосредственно вызываемые ею потери. Чувствуется, что это приводит к чему-то похожему на поиск оптимума, хотя все это никоим образом не является четко определенным. Мы увидим, какцм \ образом теория игр двух лиц уже позаботилась об этой проблеме; она будет подробно рассмотрена на одном харак­терном примере, представляющем собой упрощенную форму покера (см. § 19).

Отметим, наконец, что все важные примеры нетранзитивности пред­варения доставляются нам играми, содержащими случайные ходы. Это довольно странно, поскольку видимой связи между этими двумя явления­ми нет [72]»[73]). В действительности дальнейшее исследование покажет, что наличие или отсутствие случайных ходов лишь в малой мере влияет на существенные аспекты стратегий в этой ситуации.


§ 7. ПОЛНОЕ ОПИСАНИЕ ПОНЯТИЯ ИГРЫ

7.1. Переменность характеристик каждого хода

7.1.1. В п. 6.2.1 мы ввели альтернатив (1), . . ., Jk^ (ах) хода оМк, а также индекс характеризующий ход как личный или как случайный и в первом случае определяющий того игрока, чья очередь ходить, а во втором — задающий вероятности р* (1), . . ., рп (ах) ука­занных выше альтернатив. В п. 6.3.1 мы описали понятие предварения с помощью множеств Л*, представляющих собой множество всех тех X (из значений Я = 1, . . ., х — 1), которые предваряют х. Мы не указали, однако, зависят ли все эти объекты — а*, Л* и Jb^ (а), рх (о) для ст = 1, . . — только от х или также и от других вещей. Разумеется, этими «другими вещами» могут быть только исходы выборов, соответствую­щих ходам, которые предшествуют оМИначе говоря, речь идет о числах а1? . . ., (см. п. 6.2.2).

Эта зависимость требует более подробного рассмотрения.

Во-первых, зависимость самих альтернатив Л^ (о) (в отличие от их числа aj от а1? . . а^ несущественна. Мы можем с полным основанием предположить, что выбор, соответствующий ходу производится не среди самих альтернатив Л^ (а), а среди их номеров о. В конце концов в выражениях, описывающих исход игры, т. е. в функ­циях ЗРъ (оь. . ., ах), к = 1, . . ., п [74]), появляется только а, соответ­ствующее ходу g, т. е. ох (см. п. 6.2.2).

Во-вторых, все зависимости от аь. . ., о^-ь которые имеют место, когда о£х оказывается случайным ходом, т. е. когда к„ = 0 (см. конец п. 6.2.1), не вызывают никаких усложнений. Они не препятствуют нашему анализу поведения игроков. Это относится, в частности, ко всем вероят­ностям рК (сг), так как они возникают только в связи со случайными хода­ми. С другой стороны, множества при случайных ходах никогда не появляются.

В-третьих, мы должны рассмотреть зависимости кК, АК от аь . . . . . ., когда оМъ оказывается личным ходом[75]). Теперь эта возмож­

ность действительно является источником затруднений. К тому же воз­можность эта весьма реальна [76]). Причина состоит в следующем.

7.1.2. Игрок кК на ходе <Мх должен быть информирован о значениях ах, Лх, поскольку они составляют теперь часть правил игры, которых он должен придерживаться. В той части, в какой они зависят от. . . • • •> ^ – ь он может вывести из них определенные заключения относитель­но значений аь. . ., ах Но мы предположили, что он абсолютно ничего не знает о значениях для X, не принадлежащих Лх! Вовсе не ясно, каким образом можно здесь избежать противоречий.

Выскажемся более точно. Противоречие не будет иметь места в сле­дующем случае. Пусть Лх не зависит ни от одного из с^, . . ., cr^-i» а и зависят только от сгя для X, принадлежащих Лх. Тогда игрок кх не может извлечь никакой информации из к^ и Лх, помимо той, которой он уже располагает (т. е. о значениях с^ для X из Лх). Если это имеет место, то мы будем говорить, что перед нами частная форма зависимости.

Но всегда ли мы имеем частную форму зависимости? Возьмем край­ний случай: что будет, если Лх всегда пусто — т. е. если игрок кн пред­полагается совершенно неинформированным на ходе о/Их — и все же, скажем, ах явным образом зависит от некоторых из аи. . ., ог^

Это, очевидно, недопустимо. Мы должны потребовать, чтобы все количественные выводы, которые можно сделать, зная кх и Лх, были бы явным образом и с самого начала определены как информация, имею­щаяся у игрока кх при ходе Было бы, однако, ошибочным пытаться достичь этого путем включения в Ах индексов X всех тех ая, от которых ах, и Лх явным образом зависят. Что касается Лх, то следует, прежде всего, проявить большую аккуратность, чтобы избежать кругового харак­тера в этом требовании Но даже если эта трудность и не возникает в силу того, что Лх зависит только от х и не зависит от ои . . ., ах т. е. в случае, когда информация, имеющаяся у любого игрока в любой момент игры, не зависит от предыдущего течения партии, указанный выше подход может все-таки быть недопустимым. Предположим, напри­мер, что ах зависит от определенной комбинации некоторых из значе­ний А, = 1, …, х — 1и что правила игры предусматривают, что игрок кх на ходе знает значение этой комбинации, но не разрешают ему знать большего (т. е. значения индивидуальных а4, . . ., o^-i). Он может, например, знать значение сг^ + ая, где [л и X предшествуют х (fx, X < х), но ему не разрешается знать значения и по отдельности.

Можно было бы испытать различные приемы сведения описанной ситуации к нашей прежней, более простой схеме, которая описывает состояние информации игрока кК посредством множества Лх [77]). Однако становится совершенно невозможным распутать различные компоненты информации игрока кх на ходесли сами они происходят от личных ходов разных игроков или одного и того же игрока, но на различных этапах его информированности. В приведенном выше примере это про­изойдет, если к„ Ф кх или если кц — но состояние информации этого игрока на ходах оМ^ и о/И^ является различным[78]).

7.2. Общее описание

7.2.1. В нашем распоряжении все же имеются различные более или менее искусственные приемы, при помощи которых мы могли бы пытаться обойти эти трудности. Однако представляется, что наиболее естественный подход состоит в их принятии и в соответствующем видоизменении наших определений.

Мы сделаем это, пожертвовав множеством Лх, как средством описания состояния информации. Вместо этого мы опишем состояние информации игрока к к при его личном ходе оМ х явным образом, а именно путем пере­числения тех функций переменных аь предшествующих по отношению к этому ходу, т. е. переменных <У1? . . ., ох _1? численные значения кото­рых предполагаются в данный момент известными этому игроку. Эта система функций будет обозначаться нами через Фх.

Таким образом, Фх представляет собой множество функций

h(oi, ..ax_i).

Так как элементы Фх описывают зависимость от <т1? . . ., стх _1? само Фх является фиксированным, т. е. зависящим только от % ах и могут зависеть от а1? . . ., ах _ь и, поскольку их значения известны игроку кК при ходе оМк, эти функции

осх — ах (а1? …, cr^-i), кх = кх (о1, …, ах_4)

должны принадлежать Фх. Разумеется, когда оказывается, что кх = О (для конкретного набора значений <т1? . . ., этот ход оМп является

случайным (см. выше) и ФК вообще не будет использоваться. Однако это уже несущественно.

Наш предыдущий способ описания с помощью множеств Лх является, очевидно, частным случаем изложенного [79]).

7.2.2. Читатель может сейчас ощутить некоторую неудовлетворен­ность тем направлением, которое приняли наши рассуждения. Действи­тельно, этот анализ получил такую направленность из-за тех усложнений, которые возникают в конкретных и типичных играх (см. сноску 3 на стр. 81). Однако необходимость замены Лх на Фх возникла благодаря наше­му стремлению сохранить абсолютно формальную (математическую) общность. По существу, мы экстраполировали те решающие трудности (рассмотренные в п. 7.1.2 и, в частности, проиллюстрированные в приве­денных там сносках), которые заставили нас предпринять этот шаг. Иначе говоря, они не были характерны для первоначальных примеров, представ­лявших собой действительные игры. Скажем, шахматы и бридж могут быть описаны с помощью множеств Лх.

Игры, требующие рассмотрения с помощью Фх, действительно суще­ствуют. Однако в большинстве этих игр мы могли бы верцуться к множе­ствам Лх посредством различных посторонних приемов. Весь этот вопрос требует довольно тонкого анализа, вдаваться в который здесь не представляется целесообразным[80]). Бесспорно то, что существуют экономи­ческие модели, в которых рассмотрение Фк является необходимым [81]).

Однако наиболее существенный момент заключается в следующем.

Преследуя поставленные перед собой цели, мы должны быть уверены в том, что все комбинаторные возможности, связанные со всеми взаимодей­ствиями различных решений игроков, изменениями их состояний инфор­мации и т. п., нами исчерпаны. Эти проблемы широко обсуждались в эко­номической литературе. Мы надеемся показать, что они могут быть пол­ностью проанализированы. Но для этого мы хотим обезопасить себя от любых возможных обвинений в том, что из-за чрезмерной специализации моделей некоторые существенные возможности нами упущены.

Кроме того, мы увидим, что все формальные элементы, вводимые нами в рассмотрение игры, не усложняют ее окончательного анализа. Иначе говоря, они усложняют только настоящий, предварительный этап фор­мального описания. Окончательный вид задачи оказывается не зависящим от них (см. п. 11.2).

7.2.3. Нам еще остается рассмотреть только один вопрос, а именно сформулированное в самом начале этого обсуждения (в начале п. 6.2.1) предположение о том, что как число, так и расположение ходов заданы (т. е. фиксированы) с самого начала. Мы сейчас увидим, что это ограниче­ние несущественно.

Рассмотрим сначала «расположение» ходов. Возможная переменность характера каждого хода, т. е. соответствующего была уже полностью рассмотрена (особенно в п. 7.2.1). Упорядочение ходов х = 1, . . ., v, было с самого начала попросту хронологическим. Таким образом, здесь обсуждать больше нечего.

Обратимся теперь к числу ходов v. Эта величина также может быть переменной, т. е. зависящей от развития партии. Описание этого перемен­ного характера v требует определенной аккуратности.

Замечание. Это имеет место в большинстве игр (шахматы, трик-трак, покер, бридж). В случае бриджа эта переменность появляется, во-первых, из-за пере­менной длины этапа торгов и, во-вторых, из-за изменяющегося числа соглашений, необходимых для завершения роббера (т. е. партии). Сложнее указать примеры игр с фиксированным v. Мы увидим, что в любой игре можно сделать v фиксированным при помощи некоторого искусственного приема, но те игры, в которых v фиксировано с самого начала, как правило, скучноваты.


Развитие партии характеризуется последовательностью выборов аи. . <rv (см. п. 6.2.2). Теперь нельзя утверждать попросту, что v может быть некоторой функцией от переменных аи. . ., crv, поскольку всю последовательность, . ау нельзя представить себе, не зная наперед, какой будет ее длина v [82]). Правильной формулировкой будет следующая. Предположим, что переменные сг1? сг2, сг3, … выбираются одна за другой Если эта последовательность выборов осуществляется неопределенно долго, то правила игры должны в некоторый момент пре­рвать этот процесс. Тогда то v, на котором процесс остановится, будет, разумеется, зависеть от всех выборов, сделанных к этому моменту. Это будет число ходов в данной конкретной партии.

Далее это правило остановки должно гарантировать нам, что любая мыслимая партия когда-нибудь закончится. Иначе говоря, должно быть невозможно расположить последовательные выборы а1? а2, сг3, . . . таким образом (при ограничениях, приведенных в данной здесь сноске), чтобы остановка никогда не наступила. Очевидным способом гарантиро­вания этого является создание правила остановки, обеспечивающего, что остановка произойдет до некоторого фиксированного момента, скажем до v*. Иначе говоря, в то время как v может зависеть от аь а2, а3, . . наверняка будет v ^ v*, где v* не зависит от аь а2, сг3, … Если это так, то мы будем говорить, что правило остановки ограничено числом v*. Для рассматриваемых нами игр мы предположим, что они имеют правила остановки, ограниченные (подходящими, но фиксированными) числами v*.

Замечание 1. Это правило остановки действительно является существен­ной частью любой игры. В большинстве игр легко найти фиксированную верхнюю границу v* для v. Иногда, однако, общепринятая форма правил игры не исключает того, что игра в отдельных исключительных условиях может продолжаться до беско­нечности. Во всех подобных случаях в правила игры впоследствии были включены некоторые практические предосторожности, имеющие целью обеспечить существо­вание границы v*. Следует, однако, сказать, что эти предосторожности не всегда оказываются абсолютно эффективными, хотя идея их в каждом случае достаточно ясна. Если даже существуют исключительные бесконечные партии, они не имеют большого практического значения. Тем не менее будет весьма поучительным, по край­ней мере с чисто математической точки зрения, рассмотреть несколько типичных примеров.

Мы приведем четыре примера, расположив их в порядке убывания эффектив­ности.

Экарте. Партия представляет собой «роббер», «роббер» состоит в выигрыше двух «игр» из трех (см. сноску на стр. 74), «игра» состоит из выигрыша пяти «пунк­тов», а каждая «сдача» дает одному из игроков один или два пункта. Следовательно, «роббер» заканчивается не позднее, чем после трех «игр», «игра»— после самое боль­шее девяти «сдач», и легко проверить, что «сдача» состоит из 13, 14 или 18 ходов. Сле­довательно, v* = 3*9 «18 = 486.

Покер. В принципе два игрока могли бы «торговаться» друг с другом до бесконечности. Поэтому к правилам обычно добавляется некоторое соглашение, огра­ничивающее допустимое число «переторговываний». Суммы ставок также ограничи­ваются, чтобы сделать число альтернатив при этих личных ходах конечным. Это, разумеется, обеспечивает существование конечного v*.

Бридж. Партия представляет собой «роббер», который мог бы продолжаться, до бесконечности, если бы обе стороны (игроки) неизменно отказывались вступить в соглашение. Вполне можно себе представить, что сторона, стоящая перед опасностью проигрыша «роббера», могла бы, таким образом, неизменно препятствовать оконча­нию партии путем назначения абсурдно высоких ставок. На практике этого не проис­ходит, хотя правилами игры и не предусматривается ничего, что явным образом пре­дотвращало бы указанную возможность. Во всяком случае, теоретически в бридж должно быть введено некоторое правило остановки.

Шахматы. Легко построить последовательности выборов (или, придержи­ваясь обычной терминологии,— ходов), особенно в эндшпиле, которые могли бы продолжаться до бесконечности, не давая окончания партии, т. е. не приводя к мату. Простейшими из таких последовательностей являются периодические, т. е. бесконеч­ные повторения одного и того же цикла выборов, хотя существуют и непериодические последовательности. Все они дают игроку, находящемуся под угрозой проигрыша, весьма реальную возможность добиться в некоторых случаях ничьей. По этой причине для предотвращения указанного явления используются различные «ничейные прави­ла», т. е. правила остановки.

Одним из известных «ничейных правил» является следующее. Любой цикл выбо­ров (т. е. «ходов»), повторенный трижды, приводит к ничьей. Это правило не является вполне эффективным, так как оно исключает большинство бесконечных последователь­ностей, но не все.

Другое «ничейное правило» состоит в следующем. Если в течение 40 ходов ни одна пешка не была сдвинута с места и ни одна фигура не была взята (эти операции являются необратимыми в том смысле, что после их осуществления первоначальная позиция уже не может быть восстановлена), то партия считается закончившейся вничью. Легко видеть, что это правило эффективно, хотя соответствующее v* оказывается чудовищно большим.

Замечание 2. С чисто математической точки зрения можно поставить сле­дующий вопрос. Пусть правило остановки эффективно только в том смысле, что невоз­можно расположить последовательные выборы а1? а2? • • • таким образом, чтобы остановка никогда не наступила. Иначе говоря, пусть всегда существует конечное v, зависящее от а1? сг2, а3, … Гарантирует ли это само по себе существование некоторого фиксированного конечного v*, ограничивающего правило остановки, т. е. такого, что v V*?

Этот вопрос является весьма академическим, так как все практические правила игры имеют в виду непосредственное установление v*. (См., однако, предыдущее заме­чание.) Тем не менее с математической точки зрения он весьма интересен

Теперь мы можем использовать эту границу v* для того, чтобы пол­ностью избавиться от переменного характера v.

Это делается попросту путем такого расширения схемы игры, при котором всегда будут иметься v* ходов оМ. . ., о/И^*. Для любой после­довательности о и ст2, а3, … ничего не меняется вплоть до хода а все ходы, следующие за оМv, считаются фиктивными. Иначе говоря, если рассматривается ход к = 1, . . ., v*, для последовательности

а2, аз> • • ч гДе v < и, то мы делаем о£к случайным ходом только с одной альтернативой [83]), т. е. ходом, на котором ничего не происходит.

Таким образом, предположения, сделанные в начале п. 6.2.1, особенно предположение о том, что v задано с самого начала, оказываются в конеч­ном счете оправданными.

§ 8. МНОЖЕСТВА И РАЗБИЕНИЯ

8.1. Желательность теоретико-множественного описания игры

8.1. Мы получили удовлетворительное и достаточно общее описание понятия игры, которое можно теперь переформулировать с аксиоматиче­ской точностью и строгостью и сделать его тем самым основой для после­дующего математического изучения. Однако прежде чем к этому перейти, представляется заслуживающим внимания дать некоторую другую форму­лировку. Эта формулировка строго эквивалентна той, к которой мы при­шли в предыдущих пунктах, но, будучи высказана в общей форме, является более единообразной и простой; кроме того, она приводит к более изящным и простым обозначениям.

Для того чтобы прийти к этой формулировке, мы должны использо­вать символику теории множеств — особенно разбиения — более широко, чем мы это пока делали. Это требует некоторых объяснений и иллюстра­ций, к которым мы сейчас и перейдем.

8.2, Множества, их свойства и их графическое представление

8.2.1. Множеством называется произвольная совокупность объек­тов (на природу и количество которых не накладывается абсолютно ника­ких ограничений), называемых элементами рассматриваемого множества. Элементы образуют и определяют множество как таковое; никакого упоря­дочения или отношений иного рода между ними не предполагается. Иначе говоря, если два множества А ж В таковы, что любой элемент А является также элементом В и наоборот, то эти множества тождественны во всех отношениях, т. е. А = В. Тот факт, что а является элементом множе­ства А, мы выражаем также, говоря, что а принадлежит А х).

Нас будут интересовать главным образом (хотя и не всегда) только конечные множества, т. е. множества, состоящие из конечного числа эле­ментов.

Пусть даны произвольные объекты ос, |3, у, . . .; множество, элемента­ми которого они являются, будет обозначаться через (а, р, у, . . .). Будет также удобно ввести множество, которое вовсе не содержит элементов,— пустое множество [84]). Мы будем обозначать пустое множество через 0. В частности, мы можем образовывать множества, состоящие в точности из одного элемента,— одноэлементные множества. Одноэлементное мно­жество (а) и ег<э единственный элемент а представляют собой вовсе не одно и то же и поэтому никогда не должны смешиваться [85]).

Подчеркнем еще раз, что элементами множества могут быть любые объекты. Разумеется, мы ограничимся математическими объектами. Эти элементы вполне могут быть, например, множествами, что приведет к рас­смотрению множеств множеств и т. д. Последние нередко называются, например, системами или классами множеств, хотя это и не обязательно.

8.2.2. Перечислим основные понятия и операции, связанные с множе­ствами.

(8:А:а) А является подмножеством В (В является надмножеством А), если любой элемент А является также элементом В. Символически это записывается в виде А ^ В или В з А. А является собствен­ным подмножеством В, а В — собственным надмножеством А, если сказанное выше верно, но В содержит элементы, не являющиеся элементами А. В символах: А а В или В zd А. Мы видим, что если А является подмножеством В ж В является подмножеством А, то А — В. (Это представляет собой переформулировку прин­ципа, высказанного в начален. 8.2.1.) Отметим еще, что А является

собственным подмножеством В в том и только в том случае, когда А является подмножеством В и не имеет места равенство А = В.

(8:А:Ь) Суммой или объединением двух множеств А и В называется множество всех элементов А вместе со всеми элементами В. Объеди­нение А ж В будет обозначаться через А [) В. Аналогично обра­зуются объединения более чем двух множеств 1).

(8:А:с) Произведением или пересечением двух множеств А и В назы­вается множество всех общих элементов А и В. Пересечение А и В будет обозначаться через А П В. Аналогично образуются пересечения более чем двух множеств 1).

(8:A:d) Разностью двух множеств А и В называется множество всех тех элементов А, которые не принадлежат Б. Разность А ж В будет обозначаться через А — В

(8:А:е) Если В является подмножеством А, то мы будем называть разность А — В дополнением В в А. Иногда будет настолько очевидным, какое множество А имеется в виду, что мы будем писать просто —В и говорить просто о дополнении множества В без всяких дальнейших уточнений.

(8:A:f) Два множества А ж В называются непересекающимися (<дизъ­юнктными), если они не имеют общих элементов, т. е. если А (\В = 0.

(8: A:g) Система (множество) 'А множеств называется системой попарно непересекающихся множеств, если все пары различных элементов системы Л представляют собой дизъюнктные множества, т. е. для А, В £ Jb из А ф В следует A f] В = 0.

8.2.3. Здесь могут оказаться по­лезными некоторые графические ил­люстрации.

Мы будем обозначать объекты, являющиеся в этих рассмотрениях элементами множеств, точками (рис. 1). Множество будет обозначаться путем обведения принадлежащих ему точек (элементов), причем обозначающий мно­жество символ будет писаться в разры­ве обводящей линии в одном или в Рис. 1. нескольких местах. Изображенные на

рис. 1 множества А и С являются не­пересекающимися, а множества А л В таковыми не являются.

С помощью этого приема можно проиллюстрировать также понятия объединений, пересечений и разности множеств (рис. 2). На этом рисунке

А не является подмножеством В, равно как и В не является подмноже­ством А; следовательно, ни разность А —В, ни разность В —А не


Рис. 2,

Рис. 3.


являются дополнением одного из этих множеств до другого. На следующем рисунке, однако, В является подмножеством А, так что А — В является дополнением В в А (рис. 3).

8.3. Разбиения, их свойства и их графическое представление

8.3.1. Пусть дано множество Q и система множеств Л. Мы будем говорить, что Л является разбиением в Q, если оно удовлетворяет следую­щим двум требованиям:

(8:В:а) Любой элемент А системы Л является непустым подмноже­ством множества Q.

(8:В:Ь) Л представляет собой систему попарно непересекающихся множеств.

Это понятие также породило обширную литературу *).

Если даны два разбиения Л и 98, то мы будем говорить, что Л являет­ся подразбиением 98, если они удовлетворяют следующему условию:

(8:В:с) Любой элемент А разбиения Л является подмножеством неко­торого элемента В разбиения 98 [86]). Отметим, что если Л является подразбиением 98 и 98 является подразбиением Л, то Л = 98 [87]).

Сформулируем теперь следующее определение.

(8:B:d) Пусть даны два разбиения Л и 98. Образуем систему всех непустых пересечений A f| Б, где А пробегает все элементы Л, а В — элементы 98. Очевидно, мы снова получим разбиение, называемое суперпозицией Л и J? г).


Рис. 4. Рис. 5.


Определим, наконец, описанные выше соотношения для двух разбие­ний Л и на данном множестве С.

(8:В:е) Л является подразбиением на множестве С, если любое А, принадлежащее Л и являющееся подмножеством С, является так­же подмножеством некоторого 5, которое принадлежит 98 и является подмножеством С.

(8:B:f) Л равно 98 на множестве С, если элементами Л и 98 являются одни и те же подмножества множества С.

Рис. 6.

Очевидно, сноска 3 со стр. 89 снова применима — с соответствую­щими изменениями. Кроме того, определенные сейчас понятия на множе­стве £2 совпадают с первоначальны­ми понятиями.

8.3.2. Приведем снова некоторые графические иллюстрации в смысле п. 8.2.3.

Начнем с изображения разбие­ния. Мы не будем обозначать эле­менты разбиения, представляющие собой множества, буквами, а будем обводить каждое из них пунктиром (рис. 4).

Далее мы изобразим два разбие­ния Л и 98 \ для различения их усло­вимся изображать обводящие линии элементов Л «длинным» пунктиром, а элементов J? —«коротким» пунк­тиром. На рис. 5 Л является подразбиением 98. На следующем рис. 6 Л не является подразбиением 93 и 9В не является подразбиением Л. Предо­ставляем читателю определить суперпозицию Л и 98 на рис. 6.

Легко показать, что суперпозиция разбиений и & является подразбиением как Л, так и & и что любое разбиение представляющее собой подразбиение как так и оказывается также подразбиением их суперпозиции. Отсюда происходит и название. См. гл. I и II цитированной выше книги Г. Биркгофа.

Другое, более схематичное описание разбиений можно получить, представляя множество Q одной точкой, а любой элемент разбиения, представляющий собой подмножество Q, отрезком, идущим из этой точки вверх. Тогда разбиение А (рис. 5) будет представлено гораздо более про­стым чертежом (рис. 7). Такое представление не указывает элементов,



составляющих элементы разбиения, и не может быть использовано для изображения одновременно нескольких разбиений в Q, как это было про­делано на рис. 6. Этот недостаток, однако, может быть устранен, если два разбиения А и 98 в Q соотносятся так, как на рис. 5, а именно если А является подразбиением 98. В этом случае мы снова можем представить £2 точкой внизу, каждый элемент 98 — отрезком, идущим вверх от этой точки, как на рис. 7, а каждый элемент А — другим отрезком, идущим


дальше вверх и начинающимся в верхнем конце того отрезка 98 % который представляет элемент 98, подмножеством которого является этот элемент А. Мы можем таким образом представить два разбиения А и 98, изобра­женные на рис. 5 (см. рис. 8). Это представление опять-таки является менее наглядным, чем соответствующее ему изображение на рис. 5. Однако его простота позволяет продолжить его гораздо дальше, чем могут практически зайти картинки в духе рис. 4—6. Именно, мы можем изобра­зить при помощи этого приема последовательность разбиений А и. . . . . ., А^, в которой каждое разбиение является подразбиением своего непосредственного предшественника. На рис. 9 изображен пример для jli — 5.

Конфигурации такого типа уже изучались в математике; они назы­ваются деревьями.


8.4. Логическая интерпретация множеств и разбиений

8.4.1. Описанные в пп. 8.2.1, 8.3.2 понятия будут полезными в после­дующем рассмотрении игр в силу той логической интерпретации, которая может быть им приписана.

Начнем с интерпретации множеств.

Если £2 представляет собой множество объектов любой природы, то любое мыслимое свойство, которым некоторые из этих объектов могут, а другие не могут обладать, можно полностью охарактеризовать указа­нием множества тех элементов £2, которые этим свойством обладают. Иначе говоря, если два свойства соответствуют в этом смысле одному и тому же множеству (одному и тому же подмножеству Q), то этими двумя свойства­ми будут обладать одни и те же элементы £2. Сказанное означает, что эти свойства эквивалентны-в £2 в том смысле, как это понимается в логике.

Теперь уже не только свойства (элементов Q) находятся в этом про­стом соответствии с множествами (подмножествами Q), но и элементарные логические операции над этими свойствами оказываются находящимися в соответствии с теоретико-множественными операциями, рассмотренными нами в п. 8.2.2.

Так, дизъюнкция двух свойств, т. е. утверждение о том, что справед­ливо по крайней мере одно из них, соответствует, очевидно, образованию объединения их множеств — операции A (J В. Конъюнкция двух свойств, т. е. утверждение о том, что оба они справедливы, отвечает образованию пересечения соответствующих множеств — операции A f| В. Наконец, отрицание некоторого свойства, т. е. утверждение противоположного, отвечает образованию дополнения соответствующего множества, опера­ции —А х).

Вместо сопоставления подмножеств множества £2 свойствам объектов из £2, как это было проделано выше, мы можем равным образом сопоста­вить их всем возможным объемам информации, относящимся к некоторому, в остальном неопределенному, элементу из £2. Действительно, любая такая информация сводится к утверждению о том, что этот неизвестный элемент из £2 обладает определенным конкретным свойством. Эту информацию можно эквивалентным образом представить при помощи множества всех тех элементов из £2, которые этим свойством обладают; иначе говоря, при помощи множества, до которого данная информация сужает область возможного изменения этого неизвестного элемента из £2.

Отметим, в частности, что пустое множество 0 соответствует свой­ству, которое никогда не имеет места, т. е. абсурдной информации. Два непересекающихся множества отвечают двум несовместным свойствам, т. е. двум взаимно исключающим объемам информации.

8.4.2. Обратимся теперь к разбиениям.

Возвращаясь к определениям (8:В:а) и (8:В:Ь) из п. 8.3.1 и перефор­мулируя их в нашей новой терминологии, мы видим, что разбиение пред­ставляет собой систему попарно взаимно исключающих объемов информа­ции (относительно некоторого неизвестного элемента из £2), ни один из кото­рых не является сам по себе абсурдным. Другими словами, разбиение является предварительным сообщением, которое говорит, сколько инфор­мации будет впоследствии дано по поводу некоторого (в остальном неиз­вестного) элемента из £2, т. е. до какой степени будет в дальнейшем сужена область возможного изменения для этого элемента. Однако разбиение не дает нам фактической информации — это свелось бы к выбору некото­рого элемента этого разбиения, так как такой элемент является подмноже­ством Q, т. е. дает фактическую информацию.

Поэтому мы можем сказать, что разбиение в Q является информацион­ной схемой. Что касается подмножеств Q, то в п. 8.4.1 мы видели, что каждое из них соответствует определенной информации. Чтобы избежать путаницы с терминологией, используемой для разбиений, мы будем в этом случае (т. е. для подмножества Q) употреблять термин фактическая информация.

Рассмотрим теперь определение (8:В:с) из п. 8.3.1 и сопоставим его с нашей теперешней терминологией. Оно выражает для двух разбиений Л и 98 в Q смысл того утверждения, что Л является подразбиением 38. Это сводится к утверждению о том, что информация, даваемая разбиением Л, содержит всю информацию, даваемую разбиением Ж (а возможно, еще и больше); иными словами, информационная схема Jh содержит инфор­мационную схему 98.

Эти замечания показывают значение рис. 4—9 из п. 8.3.2 в некотором новом свете. Представляется, в частности, что дерево, изображенное на рис. 9, описывает последовательность непрерывно возрастающих инфор­мационных схем.

§ 9. ТЕОРЕТИКО-МНОЖЕСТВЕННОЕ ОПИСАНИЕ ИГРЫ 9.1. Разбиения, описывающие игру

9.1.1. Пусть число ходов фиксировано — мы теперь знаем, что такое допущение] правомерно. Обозначим это число снова через v, а сами ходы — через. . qMv.

Рассмотрим все возможные партии игры Г и составим множество Q, элементами которого они являются. Если воспользоваться описанием, данным в предыдущих пунктах, то всевозможные партии будут попросту всевозможными последовательностями а4, . . ov [88]). Таких последова­тельностей существует лишь конечное число [89]), так что Q является конеч­ным множеством.

Однако имеются также и более непосредственные пути формирова­ния Q. Мы можем, например, образовать это множество, описывая каждую партию как последовательность v + 1 последовательных позиций, возни­кающих при ее протекании [90]). В общем, разумеется, не всякая позиция может следовать за данной позицией, но позиции, возможные в дан­ный момент, ограничены предыдущими позициями некоторым специаль­ным образом, который должен быть точно описан правилами игры [91]). Так как наше описание правил игры начинается с образования Q, может оказаться нежелательным допускать столь жзсткую зависи­мость самого Q от всех деталей этих правил. Отметим поэтому, что нет никаких возражений против включения в Q также и абсурдных последова­тельностей позиций [92]). Таким образом, было бы вполне допустимо даже образовывать Q из всех последовательностей v + 1 последовательных позиций без всяких ограничений.

Наши дальнейшие описания покажут, как следует выбирать реально возможные партии из этого, возможно избыточного, множества Q.

9.1.2. Задавшись v и Q, приступим к рассмотрению более сложных деталей развития партии.

Рассмотрим определенный момент в этом развитии, скажем тот, кото­рый непосредственно предшествует данному ходу е/#х. В этот момент правила игры должны давать следующие общие сведения.

Во-первых, необходимо описать, до каких пределов события, которые привели к ходу оМу[93]), определили развитие партии. Любая конкретная последовательность этих событий сужает множество Q до некоторого подмножества А у, представляющего собой множество всех тех партий из Q, развитие которых до хода оМу совпадает с указанной последователь­ностью. В терминологии предыдущих пунктов Q является, как отмечалось в п. 9.1.1, множеством всех последовательностей а1? . . ., av; тогда Ак будет множеством тех последовательностей ai9 . . av, для которых cTi, . . ., сГи_1 имеют данные численные значения (см. сноску 1). Однако с нашей теперешней более широкой точки зрения нам достаточно лишь указать, что Ау должно быть некоторым подмножеством Q.

Теперь различные возможные развития, которые игра может принять до хода оМю должны быть представлены различными множествами А у. Любые два таких развития, если они отличны друг от друга, порождают два совершенно различных множества партий; это значит, что никакая партия не может начаться (т. е. дойти до о£к) обоими путями одновремен­но. Отсюда следует, что любые два различных множества Ах должны быть дизъюнктными.

Таким образом, полные формальные возможности развития всех мыслимых партий нашей игры вплоть до хода оМу описываются семей­ством попарно непересекающихся подмножеств множества Q. Это и есть семейство всех множеств А упомянутых выше. Мы обозначим его через Ак.

Объединение всех множеств Аю содержащихся в А ю должно содер­жать все возможные партии. Но так как мы явным образом допустили избыточность Q (см. конец п. 9.1.1), их объединение не обязано при этом быть равным Q.

Резюмируем сказанное:

(9:А) Ах является разбиением в Q.

Мы могли бы сказать также, что разбиение А у описывает информа­ционную схему лица, которое знает все, что произошло до хода оМу[94]), т. е. схему некоего посредника, наблюдающего за развитием партии [95]).

9.1.3. Во-вторых, должно быть известно, какой характер будет иметь ход (My.. Это выражается введенным в п. 6.2.1 индексом к у. Именно ку — = 1, . . ., п, если ход является личным и принадлежит игроку к у, кх = О, если ход является случайным. ку может зависеть от развития партии до хода о$ю т. е. от информации, заключенной в А у [96]). Это означает, что к у на каждом множестве А у из Л у должно быть постоянным, но что оно может меняться от одного А у к другому.

Соответственно мы можем образовать для каждого к = О, 1, . . п множество В к (к), которое содержит все множества А у для кК = к, причем различные By (к) дизъюнктны. Таким образом, By (к), к = 0, 1, . . п, образуют семейство непересекающихся подмножеств множества Q. Обо­значим это семейство через 98

(9:В) у снова является разбиением в Q. Так как каждое А% из А у

является подмножеством некоторого Ву {к) из разбиение Jky является подразбиением 98

У нас не было повода привести какое-либо перечисление множеств А К из Jky, с разбиением $ у дело обстоит иначе. 98 х состоит ровно из п – f – 1 множеств В у, (к), к = 0, 1, . . ., п, которые, таким образом, входят сюда в некотором фиксированном перечислении посредством индекса к = О, 1, . . п [97]). И это перечисление существенно, так как оно заменяет функ­цию ку (см. сноску 4 на стр. 94).

9.1.4. В-третьих, следует подробно описать условия, в которых должен иметь место выбор, связанный с ходом оМу.

Предположим сначала, что о/Иу является случайным ходом, т. е. что мы находимся в пределах множества By (0). Тогда существенными вели­чинами будут число альтернатив аК и вероятности р% (1), . . ру (ах) этих альтернатив (см. конец п. 6.2.1). Как отмечалось в п. 7.1.1 (там это было вторым предметом рассмотрения), все эти величины могут зависеть от всей информации, заключенной в А у (см. сноску 4 на стр. 94), посколь­ку является теперь случайным ходом. Это значит, что аК и р% (1), . . . • • •> Р% (<Хх) должны быть постоянными на каждом множестве Ах из АК [98]), но могут меняться от одного А у к другому.

На каждом из этих множеств А „ происходит выбор одной из альтерна­тив, т. е. выбор числа Оу = 1, . . ., (см. п. 6.2.2). Это можно описать, указав а% дизъюнктных подмножеств множества Акоторые отвечают выражаемому А у ограничению, плюс имевший место выбор а у. Мы обо­значим эти множества через Сх, а их систему, состоящую из всех под­множеств С к множеств А которые являются подмножествами By (0), через %у (0). Таким образом, %у (0) представляет собой разбиение в В к (0), а поскольку каждое Су из %у (0) есть подмножество некоторого АК из А у, то %у (0) будет подразбиением А у.

Величины а% определяются разбиением %у (0) [99]), поэтому мы можем больше о них не упоминать. Описание ру (1), . . рК (ах) напрашивается само собой: с каждым Су из %у (0) должно быть связано число рК (Су) (его вероятность), причем должны выполняться ограничения, эквивалент­ные указанным в сноске 2 на стр. 76 [100]).

9.1.5. Предположим теперь, что оЛ1у является личным ходом, скажем, игрока к = 1, . . ., п, т. е. что мы находимся в пределах множества By (к). В этом случае мы должны определить состояние информации игро­ка к при ходе Му. В п. 6.3.1 оно описывалось посредством множества Ах, в п. 7.2.1 — при помощи семейства функций Фх, причем последнее описа­ние было более общим и окончательным. Согласно этому описанию игрок к при ходе оМ-у знает значения всех функций h (04, . . ., 0V1) из Фу и ничего больше. Этот объем информации определяет некоторое разделение В у (к) на несколько непересекающихся подмножеств, соответствующих различ­ным возможным содержаниям информации игрока к при ходе оМу. Обо­значим эти подмножества через Dy, а их систему — через 3 % (к). Таким образом, 3)у (к) является разбиением в В% (к).

Разумеется, информация игрока к при ходе oflly является частью общей информации, имеющейся в этот момент (в смысле п. 9.1.2), которая воплощена в А у. Следовательно, ни в одном множестве А у из А у, являю­щемся подмножеством By (к), не может проявиться никакой двусмыслен­ности, т. е. это А у не может иметь общих элементов более чем с одним Dy из 3) у (к). Это означает, что рассматриваемое А у должно быть подмноже­ством некоторого Dy из Зу (к). Иными словами, на множестве By (к) семейство А у представляет собой подразбиение Зу (к).

В действительности развитие партии сужается при ходе My до множе­ства А у из А у. Но игрок к, которому принадлежит ход оМ-у, этого не знает; насколько ему известно, партия находится попросту в пределах множе­ства Dy из 33у (к). Теперь он должен произвести выбор одной из альтер­натив Ay, (1), . . Ау (аК), т. е. выбор Оу — 1, . . ., Как отмеча­лось в пп. 7.1.2 и 7.2.1 (особенно в конце п. 7.2.1), а% вполне может быть переменным, но оно может зависеть только от информации, заключенной в 3 у (к). Это значит, что оно должно быть постоянным на том множестве D* из 3)у (к), которым мы ограничились. Таким образом, выбор Оу = 1, . . .

. ., ах можно описать путем указания ах дизъюнктных подмножеств мно­жества Dy, которые отвечают выражаемому Dy ограничению, плюс имев­ший место выбор Оу. Обозначим эти множества через Су, а их систему, состоящую из всех подмножеств Су множеств Dy из Зу (к), через %у (к). Таким образом, (к) есть разбиение в By (к), а поскольку любое Су из <ёу (к) является подмножеством некоторого Dy из Зу (к), то (к) будет подразбиением Зу{к).

Величины определяются разбиением (к) *); следовательно, мы можем больше о них не упоминать, аК не должно быть нулем, т. е. для данного D уШ 3 у {к) должно существовать некоторое Су из %у (к), являю­щееся подмножеством Dy[101]).

9.2. Рассмотрение разбиений и их свойств

9.2.1. В предыдущих пунктах мы полностью описали положение дел в момент, предшествующий ходу Му. Теперь мы перейдем к рассмо­трению того, что будет происходить, когда мы продвигаемся по ходам х = 1, . . v. Нам будет удобно добавить к этим ходам еще один ход

с номером х = v + 1; он соответствует завершению партии, т. е. следует за последним ходом gSv.

Как уже говорилось в предыдущих пунктах, для х = 1, . . ., v мы имеем разбиения

А„, #х = (Ях(0), Ву(1), …, Вн(п))9

Все они, за единственным исключением Аю относятся к ходу <Жу, следо­вательно, их не нужно определять для х = v + 1, да и это невозможно. Но разбиение Av+\ имеет вполне ясный смысл, как показывает его рас­смотрение в п. 9.1.2; оно представляет полную информацию, которая вооб­ще может существовать применительно к партии, т. е. описывает инди­видуальное развитие этой партии г).

Здесь напрашиваются два замечания. В смысле приведенных выше соображений разбиение Ау соответствует моменту, в который не имеется вообще никакой информации. Следовательно, А\ должно состоять из единственного множества Q. С другой стороны, Av+\ соответствует воз­можности фактической идентификации имевшей место партии. Следова­тельно, Av+i представляет собой систему одноэлементных множеств.

Теперь мы займемся описанием перехода от х к х + 1, когда х = = 1, …. V.

9.2.2. Об изменении 9Sw (к), 3)К (к) при замене х на х + 1 нельзя сказать ровно ничего. Наши предыдущие рассуждения показали, что при такой замене с этими объектами (т. е. с тем, что они представляют) может произойти все что угодно.

Однако можно описать, каким образом Ay+t получается из А у.

Информация, заключенная в A^+i, получается из информации, заклю­ченной в А у, добавлением к последней сведений об исходе выбора, связан­ного с ходом о/Ну [102]). Это должно быть ясно из рассуждений п. 9.1.2. Таким образом, информация в AK+i, выходящая за рамки информации в А^ является как раз информацией, заключенной в (0), ^ (1), . . . • (п). .

Это означаем что разбиения A^+i получаются путем суперпозиции разбиения А у, со всеми разбиениями (0), Чоу (1), . . ., %у (к), т. е. путем образования пересечений любого из с каждым Су из всех *ёу (0), Чоу (1), . . <&y (к) и последующего отбрасывания пустых множеств.

Благодаря связи А у и %у (к) с множествами By (к), которая рассма­тривалась в предыдущих пунктах, мы можем сказать об этом процессе суперпозиции даже несколько больше. В В

у (0) разбиение (0) является подразбиением Ау, (см. обсуж­дение в п. 9.1.4). Следовательно, Ay+i попросту совпадает там с %у (0). В By {к), к = 1, . .

тг, как ffiy (к), так и А^ являются подразбиениями 3)у (к) (см. обсуждение в п. 9.1.5). Это значит, что Ay+i получается там путем взятия сначала любого з 2$ у (к), затем для любого такого Dy — всех А у из АК и всех Су из *ёу (к), являющихся подмножествами этого и путем образования всех пересечений А у f|

Любое такое множество Ау [) Су описывает те партии, которые воз­никают, когда игрок к, располагая информацией из Dy, но находясь


фактически в положении из А у (некоторого подмножества D^), делает при ходе Му выбор Су так, чтобы ограничить положение дел множеством Су.

Так как этот выбор, в соответствии со сказанным выше, возможен, такие партии существуют. Иначе говоря, множество А у П Су должно быть непустым. Переформулируем это утверждение:

(9:С) Если А у из Jhy и Су из %у (к) являются подмножествами

одного и того же Dy из 3)у (к), то пересечение А у П Су должно быть непустым.

9.2.3. Существуют игры, в которых можно поддаться искушению отбросить это требование. Это те игры, в которых игрок может сделать вполне законный выбор, который, однако, впоследствии оказывается запрещенным. Таковы, например, «закрытые шахматы», упоминавшиеся в сноске 1 на стр. 84: в них игрок может сделать на первый взгляд воз­можный выбор («ход») на своей доске и (возможно) лишь после этого узнает от «посредника», что этот выбор является «невозможным».

Этот пример, однако, является незаконным. Рассматриваемый ход лучше всего разложить в последовательность нескольких альтернативных ходов. По-видимому, лучше всего привести предполагаемые правила «закрытых шахмат» полностью.

Игра состоит из последовательности ходов. На каждом ходе «посред­ник» объявляет обоим игрокам о том, был ли предыдущий ход «возможным». Если он таковым не был, то следующий ход будет личным ходом того же игрока, что и предыдущий; если же он был возможным, то следующий ход будет личным ходом другого игрока. На каждом ходе игрок информирован обо всех своих предшествующих выборах, о всей последовательности «возможностей» или «невозможностей» всех предшествующих выборов обоих игроков, а также обо всех предшествовавших позициях, когда один из игроков объявлял шах или брал какую-либо фигуру. Но он знает точ­ный состав только собственных потерь. При определении развития игры «посредник» не принимает во внимание «невозможные» ходы. В остальном игра разыгрывается по тем же правилам, что и шахматы, причем приме­няется правило остановки, описанное в замечании 1 на стр. 85, дополненное - еще одним требованием: ^и один из игроков не может делать («испытывать») один и тот же выбор дважды в непрерывающейся последовательности своих личных ходов. (На практике, разумеется, для обеспечения этих условий, налагаемых на информацию, каждый игрок нуждается в отдельной шах­матной доске, невидимой для его оппонента, но находящейся в поле - зрения «посредника».)

Во всяком случае, мы будем придерживаться сформулированного выше требования. Мы увидим, что оно весьма удобно для наших после­дующих рассмотрений (см. п. 11.2.1).

9.2.4. Теперь нам остается сделать только одно: ввести в нашей новой терминологии величины JF&, к = 1, . . ., п, из п. 6.2.2. jFk пред­ставляет собой исход партии для игрока к. должно быть функцией от фактически имевшей место партии Если для обозначения этой партии использовать символ л, то мы можем сказать: является функцией переменной л с областью изменения Q, т. е.

= .Pk {л), JtgQ, А=1,

§ 10. АКСИОМАТИЧЕСКАЯ ФОРМУЛИРОВКА * 10.1. Аксиомы и их интерпретация

10.1.1. Наше описание общего понятия игры новыми средствами, с использованием множеств и разбиений, теперь закончено. Все построе­ния и определения уже были в достаточной мере объяснены, и поэтому мы можем перейти к строгому аксиоматическому определению игры. Разумеется, оно будет представлять собой лишь сжатую переформулиров­ку идей, которые мы более широко обсуждали в предыдущих параграфах.

Сначала мы сформулируем точное определение без каких-либо ком­ментариев *).

Игра п лиц Г, т. е. полная система ее правил, определена, если ука­заны следующие данные:

(10:А:а) Число v.

(10:A:b) Конечное множество Q.

(10:А:с) Функция <Fh = (я), я £ Q, к = 1, . . п.

(10:A:d) Разбиение Лу в Q, х = 1, . . ., v, v + 1.

(10:А:е) Разбиение в Q, х = 1, v. % состоит из п + 1

множеств By (к), к = 0, 1, . . ., п, занумерованных таким образом.

(10:A:f) Разбиение %у (к) в By (к), х = 1, . . ., v, к = 0, 1, . . ., п. (10:A:g) Разбиение 3)у (к) в By (к), х = 1, . . ., v, к = 1, . . ., п. (10:A:h) Число ру (Су), заданное для любого Су из %% (0), х = 1, . . .

. . ., v.

Перечисленные объекты должны удовлетворять следующим требо­ваниям:

(10:1:а) Лу является подразбиением $ у.

(10:1 :Ь) %у (0) является подразбиением Л у.

(10:1:с) %у (к) является подразбиением St)у (к), к = 1, . . ., п):

(10:l:d) На By (к) разбиение Л у является подразбиением (к), к = 1, . . ., п.

(10:1:е) Для всех х = 1, . . ., v и для любого А% из Л у, являющегося подмножеством By (0), справедливо следующее условие. Для всех Су из %у (0), которые являются подмножествами этого А%, числа ру (Су) неотрицательны и 2 Ру. (Су) = 1» где сумма распро­странена на эти подмножества.

(10:1 :f) Ci состоит из одного множества Q.

(10:1 :g) Лч+i состоит из одноэлементных множеств.

{10:1 :h) Лу+i получается из Л у путем его суперпозиции со всеми (к), к = 0, 1, . . ., п, х = 1, . . ., v. (Детали изложены в п. 9.2.2).

(10:1:i) р Если Ay из А у и Су из %у (к), к = 1, . . п являются под­множествами одного и того же Dy из 3)у (к), то пересечение fl Су должно быть непустым, к = 1, . . ., v.

(10:1:j) Для к = 1, . . v и к = 1, . . п и для любого Dy из 3D у (к) должно существовать некоторое Су из %у (к), являющее­ся подмножеством Dy.

К этому определению следует подходить прежде всего в духе совре­менного аксиоматического метода. Мы избегали даже давать названия математическим понятиям, введенным в (10:А:а) — (10:A:h), с тем, чтобы не устанавливать каких бы то ни было соответствий с возможными толко­ваниями, которые эти названия могут подсказывать. В своей абсолютной чистоте эти понятия могут теперь стать предметом точного математического исследования *).

Этот подход наилучшим образом приспособлен для развития строго определенных понятий. Приложение к объектам, заданным чисто интуи­тивным образом, будет дано впоследствии, после завершения точного ана­лиза. В связи с этим напомним также то, о чем уже было сказано в п. 4.1.3 (гл. I),— о роли моделей в физике: аксиоматические модели интуитивных систем аналогичны математическим моделям физических систем (заданных столь же интуитивно).

Если это осознано, то нелишним будет напомнить, что это аксиома­тическое определение было выкристаллизовано из детальных эмпириче­ских обсуждений, проведенных в предшествующих параграфах. Если мы снабдим входящие в это определение понятия соответствующими назва­ниями, указывающими, по возможности, на их интуитивное происхожде­ние, то это облегчит нам использование нашего определения и сделает его структуру более прозрачной. Кроме того, будет полезно пояснить в том же духе смысл наших-постулатов (10:1:а) — (10:1: j), т. е. разъяс­нить те интуитивные соображения, из которых они возникли.

Все это будет, разумеется, попросту сжатым резюме интуитивных рассуждений предыдущих пунктов, которые привели к этой аксиома­тизации.

10.1.2. Дадим сначала технические названия понятиям, введенным в (10:А:а) - (10:A:h) из п. 10.1.1.

(10:А:а*) v есть длина игры Г.

^10:А:Ь*) £2 есть множество всех партий в Г.

(10:А:с*) (я) есть исход партии я для игрока к.

(10:A:d*) А* есть информационная схема посредника: Ак из Ак пред­ставляет собой фактическую информацию посредника при ходе аМу (т. е. непосредственно перед этим ходом), а для х = v + 1 — в конце игры.

(10:А:е*) $ у есть схема распределения: Ву(к)жз$у представляет собой фактическое распределение хода <Жу.

(10:A:f*) (к) есть схема выбора: СК из (к) представляет собой фактический выбор игрока к при ходе <М% (при к = 0 — слу­чайный выбор).

(10:A:g*) 33у (к) есть информационная схема игрока k: из 3^ (к) представляет собой фактическую информацию игрока к при ходе оМу.

(10:A:h*) (Сх) есть вероятность фактического выбора С% при ходе оМу, если он является случайным.

Теперь с помощью введенных наименований мы поясним «смысл» требований (10:1:а) — (10:l:j) в духе заключительных замечаний из п. 10.1.1.

(10:1:а*) Информационная схема посредника при ходе оМу содержит распределение этого хода.

(10:1:Ь*) Схема выбора при случайном ходе содержит информа­ционную схему посредника при этом ходе.

(10:1:с*) Схема выбора при личном ходе o/ft% игрока к содержит инфор­мационную схему игрока к при этом ходе.

(10:l:d*) Информационная схема посредника при ходе <з/Жх содержит — в той мере, в какой этот ход является личным ходом игрока к,— информационную схему игрока при этом ходе.

(10:1:е*) Вероятности выбора различных альтернатив при случайном ходе оМ% ведут себя как вероятности, соответствующие дизъюнкт­ным исчерпывающим альтернативам.

(10:l:f*) Информационная схема посредника при первом ходе пуста.

(10:l:g*) Информационная схема посредника в конце игры определяет партию полностью.

(10:l:h*) Информационная схема посредника при ходе oM%+i (в конце игры для х = v) получается из его информационной схемы при ходе оМ% путем ее суперпозиции со схемой выбора при ходе^к.

(10:l:i*) Пусть дан ход оМявляющийся личным ходом игрока А, а также задана любая фактическая информация игрока к при этом ходе. Тогда любая фактическая информация посредника при этом ходе и любой фактический выбор игрока к при этом ходе, которые принадлежат этой фактической информации игрока (т. е. являются ее размельчениями), также будут совместимыми друг с другом. Иначе говоря, они имеют место в фактических партиях.

(10:l:j*) Пусть дан ход oMw являющийся личным ходом игрока

а также задана любая фактическая информация игрока к при этом ходе. Тогда число фактических альтернативных выборов, имеющихся в распоряжении игрока А, отлично от нуля.

Этим наша формализация общей схемы игры заканчивается 10.2. Логическое обсуждение аксиом

10.2. Мы еще не рассматривали вопросов, которые в формальной логике обычно связываются с любой аксиоматической системой, именно непротиворечивость, категоричность (полнота) и независимость аксиом

Наша система обладает первым и последним из названных свойств, но не обладает вторым. Эти факты легко проверяются, причем нетрудно видеть, что ситуация в точности такова, какой ей следовало бы быть. Резю­мируем относящиеся к этому соображения.

Непротиворечивость. В реальном существовании игр не может быть никаких сомнений; мы же попросту дали их точное формаль­ное описание. В дальнейшем мы подробно рассмотрим формализацию нескольких игр; см., например, примеры из §§ 18, 19. Со строго математи­ческой, логической точки зрения для установления непротиворечивости можно использовать даже самые простые игры. Но, разумеется, наши реальные интересы лежат в области более сложных игр, которые пред­ставляют действительный интерес.

Замечание. Самая простая игра состоит в следующем: v = 0, ай состоит только из одного элемента, скажем я0. Следовательно, никаких (к), (к) и (к) здесь вообще нет, а единственным с&у является состоящее из одного Q. Положим ^k Ю = 0, к = 1, . . ., п. Описание этой игры очевидно: никто ничего не делает, и ничего не происходит. Это показывает также, что в данном случае непротиворечи­вость не является особенно интересным вопросом.

Категоричность (полнота) здесь не имеет места, посколь­ку существует много различных игр, удовлетворяющих этим аксиомам. Ссылки на содержательные примеры указаны выше.

Читатель может заметить, что в этом случае мы и не добивались полно­ты, так как наши аксиомы должны определять целый класс объектов (игр), а не единственный объект х).

Независимость нашей системы аксиом может быть легко уста­новлена, но мы здесь не будем этим заниматься.

10.3. Общие замечания относительно аксиом

10.3. В связи с приведенной аксиоматизацией стоит сделать еще два замечания.

Во-первых, наш подход следует классическим путям получения точ­ной формулировки для интуитивно, эмпирически заданных идей. В повсе­дневной практике существует практически удовлетворительное понятие игры, являющееся тем не менее слишком неопределенным для точного рассмотрения. Читатель, следивший за нашими рассуждениями, должен был заметить, как постепенно эта неопределенность устранялась, «зона сумерек» отступала и шаг за шагом складывалась точная формулировка.

Во-вторых, мы надеемся, что это может послужить примером реали­зации следующего широко дискутировавшегося предложения: возможно математическое описание и изучение человеческих действий, в которых основной акцент лежит в психологической области. В нашем случае психологический элемент был привнесен необходимостью анализировать решения, информацию, на базе которой они принимаются, и взаимосвязь таких комплексов информации (на различных ходах) друг с другом. Эта взаимосвязь происходит из связи различных комплексов информации во времени, причинности, а также в силу умозрительных предположений, делаемых игроками друг относительно друга.

Разумеется, существует еще много — и притом весьма важных — психологических аспектов, которых мы здесь не касались. Тем не менее «факт остается фактом: группа явлений, носящих в основном психоло­гический характер, аксиоматизирована.

10.4. Графическое представление

10.4.1. Графическое представление многочисленных разбиений, кото­рые нам пришлось использовать для описания игры, является нелегким делом. Мы не будем пытаться рассматривать этот вопрос систематически: .даже сравнительно простые игры приводят к столь сложным и отпугиваю­щим диаграммам, что обычные преимущества графического метода уже не могут проявиться.

Однако графическое представление имеет некоторые, хотя и ограни­ченные, возможности, и мы скажем о них несколько слов.

В первую очередь, из (10:l:h) п. 10.1.1 (или, равным образом, если судить по смыслу, из (10:l:h*) п. 10.1.2) ясно, что А^л-1 является подразбиением А Иначе говоря, каждое из разбиений в последовательности^, . . ., А^ Av+i является подразбиением своего непосредственного предшествен­ника. Следовательно, все это можно изобразить при помощи приема, изображенного на рис. 9 из п. 8.3.2, т. е. посредством дерева. (Рис. 9 не является характерным с одной точки зрения: так как длина игры Г предполагается фиксированной, все ветви этого дерева должны быть продолжены на полную высоту. См. приводимый в п. 10.4.2 рис. 10.) Мы не будем пытаться добавить к этой картинке Вw (к), 3)^ (к).

Существует, однако, один класс игр, в которых последовательность. А{, . . ., Ач, Av+1 уже описывает практически всю историю. Это важ­ный класс (он уже обсуждался в п. 6.4.1, а более подробно о нем будет ска­зано в § 15), в котором предварение и предшествование эквивалентны. Его характеристики могут быть просто выражены в рамках выполняемой нами формализации.

10.4.2. Как показывают обсуждения в пп. 6.4.1, 6.4.2 и интерпрета­ция в п. 6.4.3, предварение и предшествование эквивалентны в том й только в том случае, когда игрок, совершающий личный ход, знает в этот момент всю предыдущую историю партии. Пусть этот игрок есть

а ход — оМу,. Утверждение о том, что оМу представляет собой личный ход игрока к, означает, что мы находимся в пределах множества Вх (к). Следовательно, утверждение заключается в том, что на By (к) информа­ционная схема игрока к совпадает с информационной схемой посредника, т. е. что 35у (к) равно Ау на (к). Но 3)^ {к) является разбиением в By (к); следовательно, приведенное выше утверждение означает, что 3D у (к) является попросту той частью Ау, которая лежит в By (к).

Переформулируем сказанное

{10: В) Предварение и предшествование совпадают, т. е. каждый игрок, совершающий свой личный ход, полностью информирован в этот момент обо всей предшествующей истории партии, в том и только в том случае, когда 3)н(к) является. той частью Аw которая лежит в By (к).


Если это имеет место, то мы можем рассуждать следующим образом. В силу (10:1:с) из п. 10.1.1 и сказанного выше, (к) должно теперь быть подразбиением АЭто справедливо для личных ходов, т. е. для к = 1, . . ., п, а для к = 0 это сразу следует из (10:1:Ь) п. 10.1.1. Теперь (10:l:h) из п. 10.1.1 позволяет вывести отсюда (за деталями мы отсылаем к п. 9.2.2), что 1 совпадает с (к) на ВК (к) для к = 0, 1, . . ., п. (Мы могли бы равным образом использовать соответствующие форму­лировки со звездочками из п. 10.1.2, разъясняющие смысл этих понятий. Словесное выражение этих рассуждений мы предоставляем


читателю.) Но (к) представляет собой разбиение в В * (&); следователь­но, приведенное выше утверждение означает, что (к) является попросту той частью??к+11 которая лежит в В% (к).

Переформулируем сказанное:

(10:С) Если выполнено условие (10:В), то (к) является той частью

которая лежит в ВК (к).

Таким образом, если предварение и предшествование совпадают^ то в нашей теперешней формализации последовательность. . .

. . Jkv, 1 и множества В%(к), к = 0, 1, . . ., п, для каждого х = 1, . . ., v описывают игру полностью. Иначе говоря, картинку, изображенную на рис. 9 из п. 8.3.2, следует дополнить лишь объедине­нием тех элементов каждого которые принадлежат одному и тому же множеству В% (к). (См^, однако, замечания, сделанные в п. 10.4.1.) Мы можем сделать это, обведя их линией, в разрыве которой будет стоять число к из В% (к). Пустые ВК (к) можно опустить. Пример этого для v = 5 и ть = 3 изображен на рис. 10.

Во многих играх этого класса даже и такой дополнительный прием не является необходимым, так как для каждого к непустым оказывается только одно В к (к). Это значит, что характер каждого хода оМ * не зависит от предыдущего развития партии х). В этом случае достаточно указать при каждом Jb% характер хода т. е. единственное к = 0/1, . . nf для которого В у (к) Ф 0.

Это справедливо для шахмат. Правила трик-трака допускают как ту, так и Другую интерпретацию.

§ 11. СТРАТЕГИИ И ОКОНЧАТЕЛЬНОЕ УПРОЩЕНИЕ ОПИСАНИЯ ИГРЫ

11.1. Понятие стратегии и его формализация

11.1.1. Вернемся к развитию фактической партии я игры Г.

Ходы оМу следуют друг за другом в порядке к = 1, . . v. На каж­дом ходе производится выбор, либо случайный — если партия нахо­дится в Вк (0),— либо выбор игрока k = 1, . . п — если партия нахо­дится в В у (к). Выбор состоит в фиксации некоторого из (к) (как указывалось выше, к = 0 или к— 1, . . ., п), которое и является очередном ограничением партии. Если выбор производится игроком то следует принять меры предосторожности с тем, чтобы информационная схема этого игрока была бы в этот момент именно (к). (Как показывают примеры бриджа (см. конец п. 6.4.2) и «закрытых шахмат» (см. п. 9.2.3), это может доставлять известные практические затруднения.)

Представим себе теперь, что каждый игрок к = 1, . . ., п вместо того, чтобы принимать каждое решение по мере того, как в этом возникает необходимость, заранее принимает решение на все возможные случаи. Иначе говоря, игрок к, начиная партию, уже имеет исчерпывающий план, указывающий, какие выборы он будет совершать в любой возможной ситуации и для любой возможной фактической информации, которой он в этот момент сможет располагать в соответствии с информационной схемой, предусматриваемой для него правилами игры в этом случае. Мы назовем такой план стратегией.

Отметим следующее обстоятельство. Если мы требуем, чтобы каждый игрок начинал игру с исчерпывающим планом такого рода, т. е. с некото­рой стратегией, то мы никоим образом не ограничиваем его свободы дей­ствий. В частности, мы тем самым не заставляем его принимать решения на основе меньшей информации, чем та, которая была бы ему доступна в любом практическом случае в фактической партии. Дело здесь в следую­щем. Мы предполагаем, что стратегия определяет каждое конкретное решение только как функцию именно того объема фактической информа­ции, которая была бы доступна для этой цели в фактической партии. Единственным дополнительным бременем, которое возлагает на игроков» наше предположение, является интеллектуальная нагрузка: игрокам сле­дует запастись правилами поведения на все возможные случаи, хотя в действительности им предстоит пройти только через одну партию. Но в рамках математического исследования такое предположение выгля­дит вполне безобидно (см. также п. 4.1.2).

11.1.2. Случайную компоненту игры можно рассмотреть точно такими же образом.

В самом деле, представляется достаточно очевидным, что вовсе не обяза­тельно производить выборы, которые предоставляются случаю (т. е. выбо­ры при случайных ходах), только тогда, когда до этих ходов доходит дело. Все эти выборы мог бы заранее произвести некоторый посредник, сообщая затем их результаты игрокам в те моменты и в той мере, в какой правила игры предусматривают подобную информацию.

Правда, посредник не может заранее знать, какие ходы окажутся случайными и с какими вероятностями; это будет, вообще говоря, зависеть от фактического развития партии. Но, как и в рассмотренных выше стратегиях, он мог бы предусмотреть все возможные случаи. Он мог бы заранее решить, каким должен быть исход выбора при любом возможном случайном ходе, для любого возможного предшествующего развития партии, т. е. для любой возможной фактической информационной схемы посредника при рассматриваемом ходе. В этих условиях вероятности, предписываемые правилами игры для каждой из указанных возможно­стей, были бы полностью определены, так что посредник мог бы связать с каждым из нужных выборов, которые должны регулироваться случаем, соответствующие им вероятности.

После этого посредник мог бы, как об этом говорилось выше, опове­щать игроков об исходах в надлежащие моменты и в надлежащей мере.

Такое предварительное решение относительно выборов при всех мыслимых случайных ходах мы назовем выбором посредника.

В последнем пункте мы видели, что замена выборов при всех личных ходах игрока к на стратегию игрока к вполне законна; иначе говоря, она не меняет общего характера игры Г. Очевидно, проводимая нами теперь замена выборов при всех случайных ходах на выбор посредника является законной в том же самом смысле.

11.1.3. Нам остается формализовать понятия стратегии и выбора посредника. Качественное обсуждение, проведенное в последних двух пунктах, делает эту задачу совершенно недвусмысленной.

Стратегия игрока к производит следующее. Рассмотрим некоторый ход My. Предположим, что он оказался личным ходом игрока к, т. е. что партия находится в пределах В% (к). Рассмотрим возможную фактиче­скую информацию игрока к в этот момент, т. е. некоторое D^mSDy (к). Тогда стратегия, о которой идет речь, должна определять его выбор в сложившейся обстановке, т. е. некоторое Су из Су (к), являющееся подмножеством указанного Dy.

Выскажем это формально:

{11:А) Стратегия игрока к есть функция (х; Dy), которая опре­делена для любого х = 1, . . ., v и для любого Dy из Dy (к) и значение которой (х; Dy) = Су всегда обладает следующими свойствами: Су принадлежит %у (к) и является подмножеством Dy.

То, что стратегии, т. е. функции (х; Dy), удовлетворяющие напи­санному требованию, вообще существуют, в точности совпадает с нашим постулатом (10:1:j) из п. 10.1.1.

Выбор посредника производится так. Рассмотрим некоторый ход My. Предположим, что он оказался случайным ходом, т. е. что партия нахо­дится в By (0). Рассмотрим возможную фактическую информацию посред­ника в этот момент, т. е. некоторое А у из Л у, являющееся подмножеством By (0). Тогда рассматриваемый выбор посредника должен определить случайный выбор в этих обстоятельствах, т. е. некоторое Сх из Чэу (0), являющееся подмножеством указанного А у.

Формулируем:

{11:В) Выбор посредника есть функция 20(х; Ау), которая определена

для любого х = 1, ..., v и для любого Ау из Лу, являющегося подмножеством Ву(0), и значение которой 20 (х; Ау) = Су всегда обладает следующими свойствами: Су принадлежит %у (0) и яв­ляется подмножеством Ау.

По поводу существования выбора посредника, т. е. функции 2о (и; Ах), удовлетворяющей указанному требованию, см. замечание, сделанное выше после (11:А), и сноску 2 на стр. 96.

Так как исход выбора посредника зависит от случая, должны быть указаны соответствующие вероятности. Теперь выбор посредника являет­ся системой независимых случайных событий. Как указывалось в п. 11.1.2, такое случайное событие имеется для любого х = 1, . . v и для любого А у из Л у, являющегося подмножеством By (0), т. е. любой пары х, А у из области определения 20 (х; А н). Что касается этого события, вероятность конкретного исхода 20 (х; A J = Су равна ру (Су). Следовательно, вероятность всего выбора посредника, представляемого функцией 2 о (и; А у), равна произведению отдельных вероятностей

j>* (с,)

Выскажем это формально:

(11:С) Вероятность выбора посредника, представляемого функцией Я0(х;Ау), равна произведению вероятностей ру (Су), где 2 о (х; А у) = Су, а х и А у пробегают всю область определения 2 о (и; A J (см. (11:В)).

Если рассмотреть условия (10:1:е) из п. 10.1.1 для всех таких пар 'X, А у и перемножить их, то получится следующее. Все указанные в (11:С) вероятности неотрицательны, и их сумма, взятая по всем выборам посред­ника, равна единице. Так оно и должно быть, ибо совокупность всех выборов посредника представляет собой систему дизъюнктных исчерпы­вающих альтернатив.

11.2. Окончательное упрощение описания игры

11.2.1. Если каждым игроком k = 1, . . ., п принята определенная ^стратегия и если указан определенный выбор посредника, то эти объекты единственным образом определяют все развитие партии и соответственно ее исход для каждого игрока. Это должно быть ясно из словесного описа­ния всех этих понятий, однако можно дать и простое формальное доказа­тельство.

Обозначим рассматриваемые стратегии через 2 k(x;Dy), к = = 1, . . ., п, а выбор посредника — через 20 (и; Ау). Мы будем опре­делять фактическую информацию посредника во все моменты х = 1, . . . . . ., v, v + 1. Чтобы не смешивать ее с переменной А у, мы будем обо­значать ее через Ах. Разумеется, At равно самому Q (см. (10:1 :f) из п. 10.1.1).

Рассмотрим теперь некоторое х = 1, . . ., v и предположим, что соответствующее А у уже известно. Тогда АК является подмножеством в точности одного By (к), к — 0, 1, . . ., п (см. (10:1:а) из п. 10.1.1). Если к — 0, то с/Ну является случайным ходом, так что исходом выбора будет 20 (х; А^). Соответственно Ay+i = 20(x; Ay) (см. (10:l:h) из п. 10.1.1 и детали в п. 9.2.2). Если к = 1, . . ., п, то оМу является личным ходом игрока к. А у является подмножеством ровно одного Dy из Э) у (к) (см. (10:l:d) из п. 10.1.1). Тем самым исход выбора есть 2ft (х; Dy). Соответственно Ay+i — А у f) (х\ Dy) (см. (10:l:h) из п. 10.1.1 Jh детали в п. 9.2.2).

Таким образом* мы последовательно определяем по индукции Аи А2, А3, . . Av, Ay+i. Но Av+i представляет^ собой одноэлементное

г) Рассматриваемые случайные события должны считаться независимыми»

множество (см. (10:l:g) из п. 10.1.1); обозначим его единственный эле­мент через л.

Это к представляет собой фактически имевшую место партию [103]). Следовательно, для игрока k = 1, . . ., п исходом этой партии будет

& К (я).

11.2.2. Тот факт, что стратегии всех игроков и выбор посредника определяют в совокупности фактическую партию — и тем самым ее исход для каждого игрока,-— открывает возможность нового и значи­тельно более простого описания игры Г.

Рассмотрим данного игрока к (= 1, . . ., п) и множество всех его возможных стратегий (х; Dy)’, для краткости будем обозначать его через 2k. Число стратегий, будучи чудовищным, очевидно, все же являет­ся конечным. Обозначим его через а сами стратегии — через…

• • м

Образуем аналогично все возможные выборы посредника 20 (и; Л и) или, для краткости, 20. Их число снова будет конечным. Обозначим его через р0> а сами выборы — через 2J, . . ., Обозначим вероятно­сти этих выборов соответственно через р1, . . ., (см. (11:С) из п. 11.1.3). Все эти вероятности неотрицательны, и их сумма равна единице (см. конец п. 11.1.3).

Фиксированный выбор всех стратегий и выборов посредника, скажем 2^, соответственно для к = 1, . . ., п и для к = 0, где

тА= 1, . . ., k = Q, 1, . . ., п,

определяет партию я (см. конец п. 11.2.1) и ее исход (л) для каждого игрока к— 1, …, п. Положим

(11:1) = т0, т1? …, тд), к= 1, п.

Вся партия состоит теперь из выбора каждым игроком к своей стра­тегии т. е. числа xk = 1, . . ., и из случайного выбора посред­ника т0 = 1, . . Ро соответственно с вероятностями р1, . . .,

Игрок к должен выбирать свою стратегию, т. е. свое %k, без какой – либо информации относительно выборов других игроков или относительно случайных событий (выбора посредника). Это должно быть так, поскольку вся информация, которой он может в какой-либо момент располагать, заключена уже в его стратегии 2ft = hxkh, т. е. в функции 2Д = (х; Dy), (См. рассуждения в п. 11.1.1.) Даже если он имеет определенное мнение по поводу того, какими, вероятно, будут стратегии других игроков,, то и оно должно уже содержаться в функции 2ft (х; Dy).

11.2.3. Все это, однако, означает, что мы вернули игру Г к ее про­стейшему описанию в рамках наиболее простых исходных положений, развитых в пп. 6.2.1—6.3.1. Мы имеем п – f – 1 ходов — один случайный ход и один личный ход для каждого из игроков к = 1, . . ., п; каждый ход имеет фиксированное число альтернатив: (30 для случайного хода и Pi? • • •» Ьп Для личных ходов; каждый игрок должен сделать свой выбор, не располагая абсолютно никакой информацией об исходе всех других выборов *).

Теперь мы можем избавиться даже от случайного хода. Если выборы игроков уже произведены, причем каждый игрок к выбрал свое то влияние случайного хода сводится к следующему. Исход партии для игрока к может быть любым из чисел

3k (т0, т4, . • • » тл), то = 1, …, Ро

соответственно с вероятностями р[104], Следовательно, математиче­

ское ожидание исхода равно

00

<И:2) &Ch (т4, .. ., тп) = S рх*&к (т0, т4, …, тп).

Суждения игрока должны направляться единственно этим матема­тическим ожиданием, так как различные ходы и, в частности, случайный ход никак не связаны друг с другом [105]). Таким образом, единственными ходами, имеющими существенное значение, оказываются п личных ходов игроков к = 1, . . п.

Поэтому окончательная формулировка будет такой:

{11:D) Игра п лиц Г, т. е. полная система ее правил, задается указа­нием следующих данных:

«(ll:D:a) Чисел для каждого к — 1, . . п.

<ll:D:b) Функций Ж^ (т4, . . %п) Для каждого к= 1, . . п,

Причем Т; =1, . . ., (/ ==1, . . п).

Развитие партии игры Г заключается в следующем: Каждый игрок к выбирает число %k = 1, . . ., Каждый игрок должен произвести свой выбор, не зная абсолютно ничего о выборах других. После совершения всех выборов они сообщают­ся посреднику, который определяет, что исход партии для игро­ка к есть (т4, . . %п).

11.3. Роль стратегий в упрощенной форме игры

11.3. Отметим, что в построенной схеме не остается места для каких *бы то ни было других «стратегий». Каждый игрок имеет один и только •один ход; он должен его сделать, будучи в абсолютном неведении относи­тельно чего-либо другого[106]). Эта полная кристаллизация проблемы в такой строгой и окончательной форме была достигнута в результате наших манипуляций, начиная с п. 11.1.1, где был осуществлен переход от перво­начальных ходов к стратегиям. Поскольку мы теперь рассматриваем сами эти стратегии как ходы, в стратегиях более высокого порядка уже* нет нужды.

11.4. Смысл ограничения, касающегося нулевой суммы

11.4. Мы завершим эти рассмотрения, определив в нашей оконча­тельной схеме место игр с нулевой суммой (см. п. 5.2.1).

То, что игра Г является игрой с нулевой суммой, означает в обозна­чениях п. 10.1.1, что

(11:3) S JFA(n) = 0

k=i

для всех я из Й. Если перейти от ЗРъ (я) к §k (т0, т4, …, тл) в смысле п. 11.2.2, то это выражение перейдет в

п

(11:4) S £*(т0, т4, тл)=0

k= 1

для всех т0, т4, …, тп. Если окончательно ввести (т4, …, тп) в смысла п. 11.2.3, то мы получим

п

(11:5) 2 ^а(т1,…,т„) = 0

k= 1

для всех т4, .. ., тп.

Наоборот, ясно, что условие (11:5) делает игру Г, которую мы опре­делили в п. 11.2.3, игрой с нулевой суммой.


»

Глава III


ИГРЫ ДВУХ ЛИЦ С НУЛЕВОЙ СУММОЙ.

ТЕОРИЯ

§ 12. ПРЕДВАРИТЕЛЬНЫЙ ОБЗОР 12.1. Общие соображения

12.1.1. В предыдущей главе мы пришли к исчерпывающей формаль­ной характеристике общей игры п лиц (см. п. 10.1). Разработав точное понятие стратегии, мы, как это было показано, получили возможность заменить довольно сложную общую схему игры эквивалентной ей гораздо более простой частной схемой (см. п. 11.2). В дальнейшем мы будем поль­зоваться иногда одной формой, а иногда — другой, как нам будет удобно. Поэтому желательно дать этим формам конкретные названия. Мы будем их называть соответственно позиционной и нормальной формами игры.

Так как эти две формы эквивалентны, в нашей власти пользоваться в каждом конкретйом случае той из них, которая технически более удобна. Мы действительно будем широко пользоваться такой возможностью и поэтому должны еще раз подчеркнуть, что это ничуть не затрагивает строгой обоснованности всех наших рассуждений.

Фактически нормальная форма более удобна для вывода общих теорем, в то время как позиционная форма более предпочтительна при анализе конкретных случаев; иными словами, нормальную форму выгодно использовать для установления свойств, общих всем играм, в то время как позиционная форма выявляет характерные различия игр и важнее структурные свойства, которые определяют эти различия (см. для пер­вой формы § 14, § 17, а для второй, например, § 15).

12.1.2. Поскольку формальное описание всех игр завершено, мы должны перейти к построению содержательной теории. Естественно ожидать, что систематическим методом для этой цели будет переход от простых игр к более сложным. Поэтому желательно упорядочить все игры по степени их сложности.

Мы уже классифицировали игры по числу их участников (при этом игры с п участниками назывались играми п лиц), а также по тому, явля­лись ли они играми с нулевой суммой или нет. Поэтому мы должны раз­личать игры п лиц с нулевой суммой, с одной стороны, и общие игры п лиц — с другой. Далее будет показано, что общая игра п лиц тесно связана с игрой п + 1 лица с нулевой суммой: фактически теория пер­вых будет получена как частный случай теории последних (см. п. 56.2.2.).

12.2. Игра с одним игроком

12.2.1. Мы начнем с нескольких замечаний, касающихся игры с одним игроком. В нормальной форме эта игра состоит в выборе числа т = 1, . . ., р, после чего первый (и единственный) игрок получает Ж(х) х). Очевидно, что случай игры с нулевой суммой с одним игроком бессодержателен[107]) и по поводу него сказать нечего. Общий случай

соответствует общей функции $£(%), и «лучший», или «рациональный», <способ действия, т. е. поведения в игре, очевидно, состоит в следующем: первый игрок должен выбрать т= 1, . . |3 так, чтобы максимизи­ровать

Это крайнее упрощение игры с одним игроком, конечно, обусловли­вается тем, что наша переменная т представляет не выбор (в ходе), а стра­тегию игрока, т. е. выражает полную его «теоршр» относительно поведе­ния во всех мыслимых ситуациях, которые могут встретиться в развитии игры. Необходимо помнить, что даже игра с одним игроком может иметь очень сложную структуру: она может содержать случайные ходы, так же как и ходы (единственного) игрока, каждый из которых может иметь большое число альтернатив, а объем информации, имеющейся в распоря­жении игрока при каждом конкретном ходе, может изменяться любым предписанным способом.

12.2.2. Многочисленные хорошие примеры большого числа сложно­стей и тонкостей, которые могут возникнуть на этом пути, даются различ­ными играми типа пасьянса или солитера. Однако существует важная возможность, которая, насколько нам известно, не отражается обычными играми с одним игроком. Это касается случая неполной информации, т. е. неэквивалентности предшествования и предварения ходов отдель­ного игрока (см. п. 6.4). Для того чтобы эквивалентность отсутствовала, необходимо, чтобы у игрока были два собственных хода оМ% и о/Ну,, ни в одном из которых он не был бы информирован “о результатах выбора в другом. Такого состояния отсутствия информации достичь нелегко, но мы обсуждали в п. 6.4.2, как это можно осуществить путем «расщепле­ния» игрока на два или более лица с идентичными интересами и несовер­шенными средствами общения между ними. Мы видели, в соответствую­щем месте, что бридж дает нам пример такого явления в игре двух лиц. Нетрудно построить аналогичную игру и для одного лица, но, к сожале­нию, известные виды «солитеров» таковыми [108]) не являются.

Тем не менее эта возможность имеет практическое значение для некоторых экономических ситуаций.

12.2.3. Проведенные рассуждения показывают также ограничен­ность чисто максимизационного подхода, т. е. подхода в духе «Робинзона Крузо». Для того чтобы получить задачу максимизации, необходимо было включить всю схему распределения в число правил игры, которые являют­ся абсолютными, неприкосновенными и не подлежащими критике. Для того чтобы перенести распределение в сферу столкновений и конкурен­ции, т. е. стратегии игры, необходимо рассмотреть игры п лиц с п 2== 2 и в связи с этим пожертвовать простым максимизационным аспектом проблемы.

12.3. Случай и вероятность

12.3. Прежде чем продвигаться далее, мы хотим упомянуть, что обширная литература по «математическим играм», которые были развиты в основном в XVIII и XIX столетиях, имела дело преимущественно с тем аспектом теории, который является для нас уже пройденным этапом. Этим аспектом являлась оценка влияния случая. Конечно, это стало возможным в результате разработки и надлежащего применения теории вероятностей и в особенности понятия математического ожидания. Мы осу­ществили необходимые для этой цели построения в п. 11.2.3 [109]).

Поэтому мы не будем больше интересоваться теми играми, в которых математическая задача состоит только в оценке роли случая, т. е. в вычис­лении вероятностей и математических ожиданий. Такие игры время от времени приводят к интересным упражнениям в теории вероятностей [110]), но мы надеемся, что читатель согласится с тем, что они не принадлежат к теории игр в собственном смысле слова.

12.4. Ближайшая цель

12.4. Теперь мы приступим к анализу более сложных игр. Общая игра с однйм игроком нами уже рассмотрена, и простейшей среди остав­шихся является игра двух лиц с нулевой суммой. Поэтому перейдем к ее рассмотрению.

В дальнейшем нам представится выбор: иметь ли дело с общей игрой двух лиц или же с игрой трех лиц с нулевой суммой. Окажется, что наша методика изложения сделает необходимым рассмотрение в первую очередь именно игры трех лиц с нулевой суммой. После этого мы распространим теорию на игры п лиц с нулевой суммой (для всех п — 1, 2, 3, . . .), и только после этого нам будет удобно перейти к исследованию общих игр п лиц.

§ 13. ИСЧИСЛЕНИЕ ФУНКЦИЙ

13.1. Основные определения

13.1.1. Нашей ближайшей целью является, как это было упомянуто в п. 12.4, исчерпывающее рассмотрение игр двух лиц с нулевой суммой. Для того чтобы проделать это математически строго, необходимо исполь­зовать символику исчисления функций (или по крайней мере некоторой его части) более широко, чем мы это делали до сих пор. Нам понадобятся понятия функции, переменной, максимума и минимума, а также исполь­зование двух последних как функциональных операций. Все это потре­бует определенных объяснений и примеров, которые будут здесь при­ведены.

После того, как это будет сделано, мы докажем некоторые теоремы относительно максимумов, минимумов, а также некоторой их комбина­ции — седлового значения. Эти теоремы будут играть важную роль в тео­рии игр двух лиц с нулевой суммой.

13.1.2. Функцией ср является зависимость, которая указывает, как некоторые объекты х, у, . . ., называемые аргументами ф, определяют объект и, называемый значением ф. Таким образом, и определяется через ф и через х, у, . . .; эту зависимость мы будем обозначать символическим равенством

u = q>(x, y, …).

В принципе необходимо различать саму функцию ф, которая являет­ся абстрактным объектом, выражающим только общую зависимость и = ф (х, у, . . .) от х, у, . . и ее значение ф (х, г/, . . .) для любых конкретных х, г/, . . . Однако при практическом использовании часто удобно писать ф (х, у, . . .), но с неопределенными х, у, . . вместо простого ф (см. приводимые ниже примеры (с) — (е); примеры (а), (Ь) записаны даже хуже; см. сноску 1 ниже).

Для того чтобы описать функцию ф, конечно, необходимо наряду с прочими вещами точно определить число переменных х, г/, … Так, существуют функции от одной переменной ф (#), функции от двух пере­менных ф (х, у) и т. д.

Несколько примеров:

(a) Арифметические операции х + 1 их[111] являются функциями от одной переменной *).

(b) Арифметические операции сложение и умножение х – j – у и ху являются функциями от двух переменных *).

(c) При любом фиксированном k JF^ (л) из п. 9.2.4 есть функция от одной переменной (от л). Но она может рассматриваться и как функция от двух переменных (от к ил).

(d) При любом фиксированном к 2а из (И:А) в п. 11.1.3 есть функция от двух переменных (от и и DJ 2).

(e) При любом фиксированном к (т4, . . %п) из п. 11.2.3 являет­ся функцией от п переменных (от т1? . . хп) *).

13.1.3. Для описания функции ф в равной мере необходимо точно определить, для каких конкретных наборов переменных х, у, … вообще определено значение ф (х, у, . . .). Эти наборы, т. е. эти комбинации х, у, . . ., образуют область определения ф.

Примеры (а) — (е) указывают на некоторые из большого числа воз­можностей для областей определения функций: они могут состоять из арифметических или аналитических объектов, так же как и из любых других. Действительно:

(a) Мы можем считать, что область определения состоит здесь из всех целых чисел или из всех вещественных чисел.

(b) Все пары каждого из двух типов чисел, упоминаемых в примере (а), образуют область определения в этом случае.

(c) Областью определения является множество Q всех объектов л, которые описывают партии игры Г (см. п. 9.1.1 и п. 9.2.4).

(d) Область определения состоит из пар, образованных целым поло­жительным числом х и множеством DK.

(e) Область определения состоит из некоторых систем целых поло­жительных чисел.


Функция ф называется арифметической функцией, если ее перемен­ными являются целые положительные числа; она называется числовой функцией, если ее переменными являются вещественные числа; она называется функцией множеств, если ее переменными являются множе­ства (как, например, в (d)).

В данный момент нас в основном интересуют арифметические и число­вые функции.

Мы заканчиваем этот пункт замечанием, которое является естествен­ным следствием нашей точки зрения на понятие функции. Оно состоит в том, что число переменных, область определения и зависимость значе­ния функции от значений переменных составляют функцию как таковую, т. е. если две функции ср, я|) имеют одни и те же переменные у, … и одну и ту же область определения и если ф (х, г/, . . .) = – ф (х, у, . . .) на всей этой области, то функции ф и я|) тождественны во всех отноше­ниях.

13.2. Операции max и min

13.2.1. Рассмотрим функцию ф, значениями которой являются вещественные числа

ф(я, 2/, • • •)•

Предположим сначала что ф является функцией одной переменной. Если можно выбрать значение х0 переменной х так, что ф (х0) ^ ф (х’) для всех других значений х\ то мы говорим, что ф имеет максимум ф (х0) и достигает его при х = х0.

Заметим, что этот максимум ф (х0) определяется однозначно, т. е. мак­симум может достигаться при х = х0 для нескольких различных значе­ний х0, но все они должны давать одно и то же значение ф (х0) а).

Мы будем обозначать это значение через шах ф (х) и называть мак­симальным значением ф (х).

Если мы заменим знак ^ на знак fg, то получим понятие минимума ф как значения ф (я0), — значение переменной, при котором ф

достигает минимума. И в этом случае может быть несколько таких х0, но все они должны давать одно и то же значение ф (я0). Это значение обозначим через min ф (х) и назовем минимальным значением ф.

Отметим, что априори нельзя гарантировать существования ни max ф (х), ни min ф (х) 3). ‘

Однако если область определения ф, т. е. область, в которой изме­няется переменная х, состоит только из конечного числа элементов, то существование как max ф (х), так и min ф (я) очевидно. Фактически этот случай будет иметь место для большинства функций, которые нам придется рассматривать 4). Для остальных же функций это обстоятель­ство будет следствием их непрерывности и геометрической замкнутости их областей определения 1). Во всяком случае, мы ограничиваем наши рассмотрения такими функциями, для которых max и min существуют.

13.2.2. Пусть теперь ср будет функцией многих переменных х, у, z, . . . Выделяя одну из них, например х, и фиксируя значения других переменных у, z, . . ., мы можем рассматривать ср (х, у, z, . . .) как функцию одной переменной х. Следовательно, мы можем, как и в п. 13.2.1, образовать max ф (х, у, z, . . .), min ф (х, у, z, . – .) относительно х. Но так как мы можем проделать то же самое и для любой другой пере­менной у, z, . . ., необходимо указать, что операции max, min относятся именно к переменной х. Мы сделаем это, написав max ф (х, у, z, . . .) и

эс

min ф (х, у, z, . . .) вместо неполных выражений max ф, min ф. Итак,

я

мы можем теперь применить к функции ф (х, у, z, > . .) любой из опера­торов max, min, max, min, max, min. Все эти операторы различны,

X x у у z z

и наша запись становится недвусмысленной.

Даже для случая функции одной переменной эта запись является удобной, и мы будем ею пользоваться. Мы будем писать max ф (х) и

х

min ф (х) вместо соответственно max ф (х) и min ф (х).

X

Иногда удобно или даже необходимо явно указывать область S для максимума или минимума. Например, это будет в случае, когда функция Ф (х) определена также для некоторых значений х вне 5, а желательно указать ее минимум или максимум только в пределах S. В таком случае мы пишем

тахф(я), ттф(х)

xЈS xЈS

вместо max ф (х), min ф (х).

X X

В некоторых других случаях может оказаться проще перечислить все значения ф (х), скажем а, Ь, . . чем выражать ф (х) как функцию. Мы будем тогда писать max (а, 6, . . .) (или min (а, Ъ, . . .)) вместо max ф (х) (или соответственно min ф (х)) 2).

X х

13.2.3. Заметим, что, в то время как ф (х, г/, z, . . .) является функ­цией от переменных х, у, z, . . max ф (х, г/, z, . . .), min ф (х, у, z, . . .)

X X

все еще являются функциями, но уже только от переменных у, zr. . . Чисто графически х по-прежнему присутствует в max ф (я, у, z, . . .).

я

min ф (х, у, z, . . .) но эта буква уже больше не является переменной.

X

Мы говорим, что операции max, min связывают выступающую в каче-

X X

стве их индекса переменную х *).

Так как max ср (х, г/, z, . . .) и min ф (х, г/, г, . . .) по-прежнему

X ЭС

являются функциями переменных г/, z, . . . [112]), мы можем пойти дальше и составить выражения

max max ср (х, г/, z, …), max min ср (х, г/, z, …),

ух ух

min max qp (ж, г/, z, …), min min ср у, z, …).

ух ух

В равной мере мы можем рассматривать

max max ф (х, г/, z, .. .), max min <p (x, у, z, …)

x у x у

и т. д. [113]), или использовать для максимизации или минимизации два дру­гих аргумента (если такие имеются), или использовать больше аргумен­тов, чем два (если такие есть).

Наконец, после применения такого количества операций max или min, сколько имеется аргументов у <р (ж, г/, z, . > .), в любом порядке и комбинации, но в точности по одной для каждого аргумента х, у, z, . . ., мы получим функцию, вовсе не зависящую от каких-либо аргументов, т. е. постоянную.

13.3. Вопросы коммутативности

13.3.1. Рассуждения, приведенные в п. 13.2.3, дают основания смо­треть на max, min, max, min, max, min, . . . как на функциональные

X X у у z z

операторы, каждый из которых переводит одну функцию в другую [114]). Мы уже видели, что можно применять несколько таких операторов после­довательно. В этом случае на первый взгляд представляется существен­ным, в каком порядке они применяются.

Но действительно ли это столь важно? Сформулируем вопрос точно. Говорят, что два оператора коммутируют, если, в случае их последова­тельного применения (к одному и тому же объекту), порядок, в котором они применяются, не имеет значения. Теперь поставим вопрос: комму­тируют друг с другом или нет max, min, max, min, max, min, . . .?

X x у у z t

Дадим ответ на этот вопрос. Для этой цели нам понадобится исполь­зовать только два аргумента, скажем г и у, а в таком случае нет необхо­димости и в том, чтобы ср была функцией от еще каких-либо переменных, кроме х ж у ь).

Итак, рассмотрим функцию от двух переменных ф (х, у). Ясно, что вопросы коммутативности заключаются в следующем: какие из трех написанных ниже равенств справедливы?

(13:1) max max ф (х, у) — max max ф (х, у),

X у ух

(13:2) min min ф (х, у) = min min ф (х, у),

х у ух

(13:3) max min ф (х, у) = min max ф (х, у)2).

х у у ОС

Мы увидим, что равенства (13:1) и (13:2) справедливы, в то время как (13:3) —- нет, т. е. любые два max или любые два min коммутируют, тогда как max и min, вообще говоря, не коммутируют. Мы найдем также критерий, который указывает, в каких частных случаях max и min ком­мутируют.

К вопросу о коммутативности max и min мы вернемся при рассмотре­нии игр двух лиц с нулевой суммой (см. п. 14.4.2. и п. 17.6).

13.3.2. Рассмотрим сначала равенство (13.1). Интуитивно должно быть ясно, что max max ф (х, у) есть максимум ф (х, у), если рассматри-

х у

вать х и у вместе, как еддную переменную. Это значит, что для некоторых надлежащим образом выбранных х0 и у0

ф (я<ъ У о) = max max ф (х, у)

X у

и для всех х’ и у’ должно быть ф (х0, у0) ^ ф (х’, у’).

Если, однако, желательно математическое доказательство^ то мы

приведем и его. Выберем х0 так, чтобы функция max ф (х, у) достигала

у

максимума по х при х = х0, а затем выберем у0 так, лтобы функция ф (#о> У) достигала максимума по у при у = у0. В таком случае

ф (so* У о) = шах ф (х0, у) = max max ф (х, у)

У X у

и для всех хг и у’

ф fab У о) = тах Ф («о» у) ^ max ф (xf, у) ^ ф (х’, у’).

У У

Это завершает доказательство.

Теперь, меняя ролями х и у, мы убеждаемся, что max max ф (х, у)

у х

равно максимуму ф (х, у), если мы рассматриваем х, у как одну пере­менную.

Итак, обе части равенства (13:1) обладают одними и теми же харак­теристическими свойствами и поэтому они равны друг другу. Это дока­зывает (13:1).

Дословно та же аргументация применяется к min вместо max, только в этом случае необходимо всюду вместо ^ написать Это доказывает равенство (13:2).

Такой способ рассмотрения двух переменных х, у как одной иногда оказывается очень удобным. Когда мы будем его применять (как, напри-

*) Комбинация min max не требует отдельного рассмотрения, так как соответ – X у

ствующее равенство для нее получается из равенства для max min переменной ролями

X У

хну.

мер, в п. 18.2.1 с т1? т2 и (т4, т2) соответственно вместо рассматриваемых нами сейчас х, у и ср (х, у)), мы будем писать max ср (х, у) и min ср (х, у).

я, У х* У

13.3.3. Здесь может оказаться полезной графическая иллюстрация. Предположим, что областью определения ср для х, у является конечное множество. Обозначим для простоты возможные значения х (в этой обла­сти) через 1, . . ., а значения у через 1, . . ., s. Тогда значения ср (х, г/), соответствующие всем х, у в этой области, т. е. всем комбинациям х = 1, . . . у = 1, . . ., можно расположить в виде прямоугольной таблицы. Возьмем прямоугольник, у которого t строк и s столбцов. Будем использовать числа х — 1, . . ., t для нумерации строк, а числа у — = 1, . . ., s для нумерации столбцов. На месте пересечения строки х и столбца у (или, говоря короче, в клетке х, г/) напишем значение ср (х, г/) (табл. 1). Такая таблица чисел, известная в математике под названием прямоугольной матрицы, полностью описывает функцию ср (я, г/). Стоя­щие в таблице значения ср (х, г/) называются элементами матрицы.

Таблица 1

1

2

У

s

1

Ф(1, 1)

Ф(1,2)

ф(1, У)

ф (1 , S)

2

<Р(2, 1)

Ф(2, 2)

ф (2, у)

Ф(2,*)

X

ф (х, 1)

ф (*, 2)

ф О*. У)

ф (xi s)

t

ф 1)

Ф (*, 2)

Ф (*, У)

ф (*, *)

, Заметим теперь, что max ф (х, у) есть максимум ф (х, у) в строке х

у

max max ф (х, у)

х U

является поэтому максимумом среди максимумов по строкам. С другой стороны,

max ф (х, у)

х

есть максимум ф (х, у) в столбце у. Следовательно, max max ф (х, у)

у X

является максимумом среди максимумов по столбцам. Наши утверждения в п. 13.3.2 относительно (13:1) можно теперь сформулировать так: макси­мум среди максимумов по строкам — тот же, что и максимум среди

максимумов по столбцам; оба они являются абсолютным максимумом ср (х, у) в матрице. Во всяком случае, в такой форме эти утверждения должны быть интуитивно ясны. Утверждения относительно (13:2) получаются тем же способом, если вместо шах взять min.

13.4. Смешанный случай. Седловые точки

13.4.1. Рассмотрим теперь (13:3). Используя терминологию п. 13.3.3, мы можем сказать, что левая часть (13:3) есть максимум среди минимумов по строкам, а правая часть — минимум среди максимумов по столбцам. Эти два числа не являются ни абсолютными максимумами, ни абсолютными минимумами, и наперед не видно, почему они должны быть равны. Они и в самом деле не равны. Две функции, для которых они различны, приведены в табл. 2 и табл. 3. Функция, для которой они равны, приведена в табл. 4. (Все эти таблицы должны быть истолкованы в смысле объяснений к табл. 1 в п. 13.3.3).


Таблица 3. t = s = 3

Мини­мум по стро­кам

1

2

3

Мини­мум по стро­кам

1

0

-1

1

-1

2

1

0

—1

—1

3

—1

1

0

—1

Мак­симум

по столб­цам

1

1

1

Максимум среди минимумов по строкам = — 1.

Минимум среди максимумов по столбцам =1.


Таблица 2. t = s=2

-1

-1

1

—1

2

1 1

Мак­симум

по столб­цам

Максимум среди мини­мумов по строкам = —1.

Минимум среди мак­симумов по столбцам=1.

Таблица 4. t = s = 2


1

2

Мини­мум по стро­кам

1

1

-2 | 1

-2

2

-1

2

—1

Мак­симум

по столб­цам

—1

2

Максимум среди мини­мумов по строкам =—1.

Минимум среди макси­мумов по столбцам=—1.




Эти таблицы, так же как и общий вопрос о коммутативности inax и min, будут играть существенную роль в теории игр двух лиц с нулевой суммой. Действительно, мы увидим, что они представляют примеры игр, которые являются типичными для некоторых важных возможностей в этой теории (см. п. 18.1.2). Но в данный момент мы хотим обсудить их сами по себе, без каких-либо ссылок на их приложения.

13.4.2. Так как равенство (13:3) не является ни всегда истинным, ни всегда ложным, желательно рассмотреть связь между двумя его частями


(13:4)

max min <p (х, у) и min max <p (х, у)

х у ух



более полно. Таблицы 2—4, которые в известной степени иллюстрируют поведение (13:3), наводят на некоторые соображения о возможном соот­ношении между этими выражениями.

В частности:

(13:А) Во всех трех таблицах левая часть (13:3) (т. е. первое выраже­ние в (13:4)) ^ правой части (13:3) (т. е. второго выражения в (13:4)).

(13:В) В табл. 4, для которой (13:3) выполняется, существует эле­мент матрицы, который является одновременно минимальным в своей строке и максимальным в своем столбце. (Таким элементом оказывается здесь —1 в левом нижнем углу матрицы.) В других таблицах — табл. 2, табл. 3 — где (13:3) не выполняется, такого элемента нет.

Целесообразно ввести общее понятие, которое описывает свойства элемента, упомянутого в (13:В). Введем следующее определение.

Пусть ф (х, у) — некоторая функция двух аргументов. В этом слу­чае пара Xq, у о называется седловой точкой функции ф, если ф (х, у0) при­нимает максимальное значение при х — х0, а ф (х0, у) принимает мини­мальное значение при у = у0.

Причины для использования термина седловая точка таковы. Пред­ставим себе матрицу элементов х, у (х — 1, . . ., t, у — 1, . . ., s) как карту горной местности; высотой горы над элементом х, у будем считать значение ф (х, у). Тогда определение седловой точки х0, у0 действительно, по существу, описывает седло, или перевал в этой точке (т. е. над элемен­том х0, у о); строка х0 является горным хребтом, а столбец у0 — дорогой (от долины к долине), которая пересекает этот хребет.

Формула (13:С*) в п. 13.5.2 тоже находится в соответствии с этой интерпретацией х).

13.4.3. Табл. 2 и табл. 3 показывают, что функция ф может не иметь седловой точки вообще. С другой стороны, возможно, что функция обла­дает и несколькими седловыми точками. Но на всех седловых точках х0, Уо, если они вообще существуют, функция должна достигать одного и того же значения ф (х0, у0)[115]). Мы обозначим это значение, если оно вообще суще­ствует, через Sa*/^ ф (х, у) — седловое значение ф (,х, у) [116]).

Теперь мы сформулируем теоремы, которые обобщают замечания (13:А), (13:В). Мы обозначаем их через (13:А*), (13:В*) (подчеркнем, что они справедливы для всех функций ф (х, у)).

(13:А*) Всегда

max min ф (х, у) rg min max ф (х, у).

х у ух

(13:В*) Мы имеем

max min ф (х, у) = min max ф (я, у)

X у ух

тогда и только тогда, когда существует седловая точка х0, уо функции ф.

13.5. Доказательства основных фактов

13.5.1. Во-первых, определим для каждой функции ф (х, у) два множества: А<р и Вф. min ф (х, у) является функцией от х. Пусть Аф

у

будет множеством всех тех х01 при которых эта функция достигает своего максимального значения. Аналогично шах ф (х, у) является функцией

ос

от г/. Пусть Вф будет множеством всех тех y0l при которых эта функция достигает своего минимального значения. Теперь мы докажем (13:А*) и (13:В*).

Доказательство (13:А*). Выберем х0 из Аф и у0 из Бф. Тогда max min ф (х, у) = min ф (х0, у) ^ Ф (х0, у о) ^ шах ф (х, у0) = min max ф (х, i/),

х у у х ух

т. е. max min ф i/) g min max ф (x, у), что и требовалось.

х у у X

Доказательство необходимости существования седловой точки в (13:В*). Предположим, что

max min ф (х, у) = min max ф (х, у).

X у ух

Выберем в 4Ф и i/o в 5Ф; тогда мы имеем

max ф (я, г/о) = min max ф (х, у) = max min ф (х, у) = min ф (х0г у).

х ух х у у

Следовательно, для любого х’

Ф (х’, уо) max ф (х, у0) = min ф (х0, у) ^ ф (х0, у0),

X у

т. е. ф (х0, Уо) ^ Ф (х’, уо), так что ф (х, у0) принимает свое максимальное значение при х = х0- Точно так же для любого у9

Ф (х0, у’) ^ min ф (хо, у) = max ф (х, у0) ^ Ф (х0, У о),

У X

т. е. Ф (х0, у о) ^ Ф (х0, у’); поэтому ф (х0, у) достигает минимума при у = По­следовательно, пара х0, у о составляет седловую точку. Доказательство достаточности существования седловой точки в (13:В*). Пусть х0, Уо — седловая точка. Тогда

max min ф (х, у) ^ min ф (х0, у) = ф (х0, у о),

X у у

min max ф (х, у) ^ max ф (х, у0) = (р(х0, у о)-

ух X

Следовательно,

max min ф (х, у) ^ (р(х0, у0) ^ min max у(х, у).

х у ~ ” ух

С учетом (13:А*) это дает

max min ф (я, у) = ф (х0, у0) = min max ф (х, у)

X у ух

и, следовательно, нужное равенство.

13.5.2. Рассуждения п. 13.5.1 приводят к некоторым дальнейшим результатам, которые имеет смысл отметить. Мы предположим теперь существование седловой точки, т. е. справедливость равенства (13:В*). Для каждой седловой точки х0, у0

(13:С*) ф (#0, г/0) =max min ф (х, у) = min max ф (х, у).

X у ух

Доказательство. Это совпадает с последним равенством в доказательстве достаточности (13:В*) в п. 13.5.1.

(13:D*) У о образуют седловую точку тогда и только тогда, когда

х0 принадлежит а у0 принадлежит В® [117]).

Доказательство достаточности. Пусть х0 принад­лежит А®, а у0 принадлежит В®. Тогда доказательство необходимости (13:В*) в п. 13.5.1 показывает, что пара х0, у0 является седловой точкой.

Доказательство необходимости. Пусть х0, у0 — седловая точка. Воспользуемся (13:С*). Для каждого х’ должно быть

min ф (х’, у) ^ max min ф (я, у) = ф (.х0, у0) = min ф (х0, у)9

уху у

т. е. min ф (х0, у) ^ min ф (xf, г/); поэтому min ф (х, у) достигает своего

У у у

максимального значения при х = х0. Следовательно, х0 принадлежит Аф. Аналогично для каждого у’

max ф (х, у’) ^ min max ф (х, у) = ф (ж0, У о) = max ф (х, у0),

X у X X

т. е. max ф (х, у0) max ф (,х, у’)\ поэтому max ф (х, у) достигает

XX X

своего минимального значения при у = у0. Следовательно, у0 принад­лежит В®. Это завершает доказательство.

Теоремы (13:С*), (13:D*) указывают, между прочим, на недостатки аналогии, описанной в конце п. 13.4.2, т. е. они показывают, чте наше понятие седловой точки уже, чем обиходное представление о седле, или перевале. Действительно, (13:С*) указывает, что все седла, в предполо­жении их существования, имеют одну и ту же высоту. A (13:D*) утвер­ждаем что, если мы изобразим множества А®, Вф как два интервала чисел [118]), то все седла образуют область, которая имеет форму прямоуголь­ного плато [119]).


13.5.3. Мы закончим этот раздел доказательством существования седло­вой точки для одного частного вида х, у и <р (х, у). Далее станет видно, что общность этого частного случая не является незначительной. Пусть дана функция г|э (х, и) двух аргументов х, и. Рассмотрим все функции f (х) аргумента х, которые принимают значения в области изменения и. Сохраним теперь аргумент х, а вместо аргумента и используем саму функ­цию /[120]). Выражение – ф (х, f (х)) определяется для любых х и /; следова­тельно, мы можем трактовать г|) (х, / (х)) как функцию аргументов я, / и взять ее вместо <р (х, у).

Мы хотим доказать, что для этих х, f и if (я, / (ж)) (вместо а;и1/ и ф (х, у)) существует седловая точка, т. е. что

(13:Е) max min г|; (я, f (х)) = minmaxi|; (я, f(x)).

! xf fx

Доказательство. Выберем для каждого х значение щ так, чтобы было *ф (х, uQ) = min (х, и). Это и0 зависит от х; следовательно,

и

мы можем определить функцию /0 равенством щ = /0 (я). Тем самым я|; (х, /о (х)) = minij) (х, и). Следовательно,

и

max if (ж, /0 (я)) = max min я|э (i, гг).

гс > х и

Тем более

(13:F) min max г|э (а:, / (х)) max min г|з (ж, и).

fx X и

Далее, min (я, f (х)) есть то же самое, что и min (х, и), так как /

/ и

входит в это выражение только через свое значение при данном х, т. е. / (х), для которого мы можем написать и. Таким образом, min о|) (я, / (#)) =

/

= min г|) (#, гг) и потому

и

(13:G) max min г|э (я, / (х)) = max min (я, и).

X f X и

Соотношения (13:F) и (13:G) вместе устанавливают справедливость знака ^ в (13:Е). Знак rg в (13:Е) имеет место благодаря (13:А*). Сле­довательно, в (13:Е) мы имеем знак равенства, т. е. доказательство завершено.

§ 14. ВПОЛНЕ ОПРЕДЕЛЕННЫЕ ИГРЫ

14.1. Формулировка проблемы

14.1.1. Теперь мы приступаем к рассмотрению игры двух лиц с нулевой суммой. Начнем с использования нормальной формы.

В соответствии с этим игра состоит из двух ходов: игрок 1 выбирает число т4 = 1, . . ., Pi, а игрок 2 выбирает т2 = 1, . . (Зг (каждый выбор производится при полном незнании выбора другого игрока), после чего игроки 1 и 2 получают соответственно выигрыши (т1? т2) и (Т4, Т2) [121]).

Так как мы рассматриваем игру с нулевой суммой, согласно п. 11.4 мы имеем

Wi ^2) + Ж2(х1, т2) = 0. Мы предпочитаем выразить это следующим образом:

Жх (т4| т2) == Ж (т1? т2), Ж2 (т1? х2) = – Ж (т1? т2).

Попытаемся теперь понять, как очевидные желания игроков 1 и 2 определяют их действия, т. е. выборы t4 и т2.

Разумеется, необходимо снова напомнить, что и т2 означают, в конеч­ном счете, не выборы (ходы) игроков, а их стратегии, т. е. их полные «теории», или «планы» относительно игры.

Мы пока оставим это в стороне. Впоследствии мы вернемся к такому пониманию т4 и т2 и проанализируем течение партии.

14Л.2. Желания обоих игроков достаточно просты. Первый стре­мится сделать Ж^ (т1? т^ = Ж (т1? т2) максимальным, а второй стремится сделать максимальным Ж2 (^ь = — Ж (хи т2), т. е. первый желает максимизировать, а второй желает минимизировать Ж (т1? т2).

Итак, интересы двух игроков сосредоточены на одном и том же объек­те: на единственной функции Ж (т4, т2). Но их цели, как этого и следует ожидать в игре двух лиц с нулевой суммой, прямо противоположны: первый хочет максимизировать, второй хочет минимизировать. Специ­фической трудностью во всем этом является то, что ни один из игроков не контролирует полностью объекта своих стремлений, значение Ж (т1? т2), т. е. обе переменные и т2. Первый хочет максимизировать, но он кон­тролирует только хи второй хочет минимизировать, но он контролирует только т2. Что же на самом деле произойдет?

Трудность заключается в том, что никакой конкретный выбор, ска­жем хи не может сам по себе сделать Ж (т1? т2) большим или меньшим. Вообще влияние тА на о/С (т1? т2) является неопределенным; оно стано­вится определенным только в соединении с выбором другой переменной, в данном случае т2. (Ср. соответствующую трудность в экономике, рас­смотренную в п. 2.2.3.)

Заметим, что с точки зрения игрока 1, который выбирает перемен­ную, скажем, хи другая переменная, конечно, не может рассматриваться как случайное событие. Другая переменная, в данном случае т2, зависит от воли другого игрока, который должен рассматриваться в свете той же «рациональности», как и сам первый. (См. также конец п. 2.2.3 и п. 2.2.4.)

14.1.3. На этой стадии удобно использовать графическое представ­ление, введенное в п. 13.3.3. Представим Ж (ть т2) в виде прямоугольной матрицы: образуем прямоугольник из Pi строк и р2 столбцов, используя числа Xi = 1, . . ., Pi для нумерации первых и числа т2 = 1, . . ., р2 для нумерации вторых, и в клетку с номерами т4 и т2 впишем элемент матри­цы Ж (т4, т2). (См. табл. 1 в п. 13.3.3. Участвующие там ф, ж, г/, t, s соот­ветствуют нашим Ж, т1? т2, Pi, р2 (табл. 5).)

Следует отдать себе отчет в том, что на функцию Ж (ть т2) не накла­дывается никаких ограничений, т. е. мы свободны выбрать ее по своему желанию Действительно, любая данная функция Ж (хи т2) определяет

Таблица 5

1

2

Ч

Р2

1

<ЙГ(1, 1)

Ж(1, 2)

ж а, т2)

Ж(\, Р2)

2

Ж (2, 1)

Ж (2, 2)

(2, т2)

Ж (2, р2)

Ж(ти 1)

Ж (г 1, 2)

Ж (т1? т2)

Ж (ti, р2)

Pi

Ж (fa, 1)

Ж (Pi, 2)

Ж (Pi, т2)

… .

^ (Pi, Р2)

игру двух лиц с нулевой суммой в смысле (11:D) п. 11.2.3 путем простого определения

SSTi (ti, t2) = sr(ti, т2), 5F2(ti, т2)=-5Г (ti, t2)

(см. п. 14.1.1). Желания игроков 1 и 2, как это описано в конце преды­дущего пункта, можно представить себе следующим образом. Оба игрока заинтересованы только в значениях элемента матрицы &С (т1? т2). Игрок 1 старается максимизировать его, но он контролирует только строку, т. е. число tf. Игрок 2 старается минимизировать его, но он контролирует только столбец, т. е. число т2.

Мы должны теперь попытаться найти удовлетворительную интер­претацию для выхода из этого своеобразного перетягивания каната *).

14.2. Минорантная и мажорантная игры

14.2. Вместо того чтобы пытаться непосредственно приступать к раз­решению самой игры Г, к чему мы еще не подготовлены, рассмотрим две другие игры, которые тесно связаны с игрой Г и которые поддаются непосредственному обсуждению.

Ясно, что трудность при анализе игры Г заключается в том, что игрок 1, выбирая ть не знает, с каким выбором т2 игрока 2 он столкнется, и наоборот. Поэтому сравним игру Г с другими играми, для которых эта трудность не возникает.

Определим первую игру Г4, которая совпадает с игрой Г во всех деталях, за исключением того, что в Г^ игрок 1 делает свой выбор xt до того, как игрок 2 сделает свой выбор т2, а затем игрок 2 делает свой выбор, зная, какое значение придал игрок 1 переменной (т. е. ход пер вого игрока предшествует ходу второго)[122]). Очевидно, в этой игре 11 игрок 1 находится в невыгодном положении по сравнению с его положением в ис­ходной игре Г. Поэтому мы будем называть минорантной игрой, соот­ветствующей игре Г.

Аналогично определим вторую игру Г2, которая также совпадает с Г во всех деталях, за исключением того, что теперь игрок 2 делает свой выбор т2 до того, как игрок 1 сделал свой выбор т1? и лишь затем игрок 1 совершает выбор, зная, какое значение придал игрок 2 переменной т2 (т. е. ход второго игрока предшествует ходу первого) [123]). Очевидно, в этой игре Г2 игрок 1 находится в выгодном положении по сравнению с его положе­нием в игре Г. Будем поэтому называть Г2 мажорантной игрой,, соответ­ствующей игре Г.

Введением этих двух игр Г1? Г2 достигается следующее. Д’олжно быть очевидно из общих соображений, а мы установим это также и путем строгих рассуждений, что для каждой из игр 1\ и Г2ясен «наилучший способ игры», т. е. ясна теория рационального поведения. С другой стороны, очевидно, что игра Г лежит «между» играми Tt и Г2. Например, с точки зрения игро­ка 1, игра Г\ всегда менее, а игра Г2 всегда более выгодна, чем игра Г[124]). Таким образом, можно ожидать, что Г^ и Г2 описывают нижнюю ir верхнюю границы для важнейших характеристик игры Г. Конечно, мы будем рассма­тривать все это совершенно строгим образом. Априори эти «границы» могут существенно отличаться друг от друга и оставлять значительную неопределенность для соответствующих характеристик игры Г. Действи­тельно, на первый взгляд может показаться, что так обстоит дело для многих игр. Но, действуя этим методом и введя некоторые дополнитель­ные операции, мы добьемся того, что получим в конце концов точную теорию для игры Г, которая полностью ответит на все вопросы.

14.3. Рассмотрение вспомогательных игр

14.3.1. Рассмотрим сначала минорантную игру Г4. После того как игрок 1 выберет ть игрок 2 выбирает т2, зная значение т4. Так как второй игрок желает минимизировать Ж т2), он, несомненно, выберет т2 так, чтобы сделать значение Ж (ti, т2) минимальным при данном т4. Другими словами, – когда игрок 1 выбирает определенное значение %и он уже может предвидеть, каково будет значение Ж (т1? т2). Это будет min Ж (ti, т2) [125]). Это функция только от х±. Поскольку игрок 1 хочет

Т2

максимизировать Ж (т1? т2) и так как его выбор ведет к значению min Ж (т1? т2), которое зависит только от и совтсем не зависит от т2,

Т2

. он выберет так, чтобы максимизировать min Ж (т1} т2). Таким образом,

Т2

окончательное значение этой величины будет

шах min Ж (тА, т2)г).

Тх т2

Резюмируем:

(14:А:а) Оптимальным способом игры (стратегией) для первого игрока в минорантной игре Г4 является выбор ^принадлежащего множе­ству А, где А — множество тех хи для которых min Ж (т19 т2)

t2

достигает своего максимального значения max min Ж (ti, т2).

Ti Т2

(14:A:b) Оптимальным способом игры (стратегией) для второго игрока является следующий. Если первый игрок выбрал определенное значение т4 [126]), то т2 должно быть выбрано из множества BXl, где В%1 — множество тех т2, для которых Ж (тА, т2) достигает своего минимального значения min Ж (т1? т2) [127]).

Т2

На основании этого мы можем утверждать следующее:

(14:А:с) Если оба игрока играют минорантную игру Г4 оптимальным образом, т. е. если xt принадлежит А и т2 принадлежит В%1, то значение Ж (т1? т2) будет равно

= max min Ж (т4, т2).

Ti ТГ2

Истинность высказанного выше утверждения в математическом отноше­нии устанавливается непосредственно, если вспомнить определения множеств А и ВХ1 и соответственно подставить их в утверждение. Мы оставляем это упражнение, которое является лишь классической опе­рацией «подстановки определенного в определяемое», читателю. Кроме того, наше утверждение должно быть ясно и из общих соображений.

^ Все рассмотренное делает очевидным, что каждая партия игры имеет определенное значение для каждого игрока. Этим значением для игрока 1 является упоминавшееся выше vt и, следовательно, —vt для игрока 2.

Еще более детальное представление о смысле v* можно получить следующим путем:

(14:A:d). Игрок 1 может, играя надлежащим образом, обеспечить себе выигрыш ^ vt независимо от того, что делает игрок 2. Игрок 2, играя надлежащим образом, может обеспечить себе выигрыш ^ — Vt независимо от того, что делает игрок 1.

(Доказательство. Первое устанавливается выбором про­извольного из А. Второе устанавливается произвольным выбором х2 из BXl *). Мы снова оставляем детали читателю; они совсем тривиальны.) Сказанное выше можно эквивалентно сформулировать так:

(14:А:е) Игрок 2, играя надлежащим образом, может добиться того, что выигрыш игрока 1 будет v4, т. е. воспрепятствовать ему выиграть > независимо от действий игрока 1. Игрок 1, играя надлежащим образом, может добиться того, что выигрыш игрока 2 будет fg — v4, т. е. воспрепятствовать ему выиграть > —v4 независимо от действий игрока 2.

14.3.2. Мы провели обсуждение игры 11 весьма детально, хотя «решение» здесь довольно очевидно. То есть вполне возможно, что кто – нибудь, внимательно посмотрев на ситуацию, легко придет к тем же самым выводам «нематематически», используя только общие соображения. Тем не менее, мы вынуждены были обсудить этот случай так подробно, потому что он является прототипом для ряда других, где ситуация будет гораздо менее доступна «нематематическому» взгляду. Кроме того, все существенные элементы сложности, так же как и основания для преодо­ления их, на самом деле присутствуют уже в этом простейшем случае. Рассматривая соответствующие положения этих элементов сложности, ясные в данном случае, можно будет отчетливо представить себе их в последующих, более сложных случаях. И только таким образом можно будет точно судить о том, чего можно достичь каждым конкретным способом.

14.3.3. Рассмотрим теперь мажорантную игру Г2.

Игра Г2 отличается от игры Г^ только тем, что в ней игроки 1 и 2 поменялись ролями. Теперь игрок 2 должен выбирать х2 первым, а затем игрок 1 выбирает т4, зная значение т2.

Но, говоря, что Г2 получается из rt переменой ролей игроков 1 и 2, следует помнить, что в этом процессе игроки сохраняют свои функции (т4, t2) и Ж2 (tt, т2), т. е. соответственно Ж (т4, t2) и —Ж (хи t2). Это значит, что игрок 1 желает максимизировать, а игрок 2 — мини­мизировать Ж (т1? т2).

Отдав себе в этом отчет, оставим практически дословное повторение рассуждения п. 14.3.1 читателю. Мы ограничимся повторением суще­ственных определений в той форме, в которой, они применимы|к Г2.

(14:В:а) Оптимальным способом игры (стратегией) для игрока 2 в мажо­рантной игре Г2 является выбор т2, принадлежащего множеству В, где В —- множество тех т2, для которых max Ж (t1? т2) дости-

Т1

гает своего минимального значения min max Ж (т1? t2).

Т2 ‘Cl

(14:В:Ь) Оптимальным способом игры (стратегией) для игрока 1 является следующий: если игрок 2 выбрал определенное значение т2 [128]), то Х\ должно быть выбрано из множества АТ2, где АГ2 — множество тех ть для которых Ж (ть х2) достигает своего макси­мального значения max Ж (т4, т2) [129]).

На основе сказанного мы можем утверждать следующее:

(14:В:с) Если оба игрока 1 и 2 играют мажорантную игру Г2 опти­мально, т. е. если т2 принадлежит 5, а хх принадлежит ЛГ2, то значение Ж (т1? т2) будет равно

v2 = min max Ж (т1? т2).

Т2 Ti

Из всего рассмотренного должно быть ясно, что каждая партия игры Г2 имеет определенное значение для каждого игрока. Этим значением является введенное выше v2 для игрока 1 и поэтому —v2 для игрока 2.

Чтобы подчеркнуть симметричность всей аргументации, мы повто­рим, сделав соответствующие изменения, те выводы, которыми заканчи­вается п. 14.3.1. Они полезны для того, чтобы дать более детальное пред­ставление о смысле v2.

(14:B:d) Игрок 1 может, играя надлежащим образом, обеспечить себе выигрыш ^ v2 независимо от того, что делает игрок 2. Игрок 2 может, играя надлежащим образом, обеспечить себе выигрыш —v2 независимо от того, что делает игрок 1.

(Доказательство. Второе устанавливается выбором про­извольного т2 из В. Первое устанавливается произвольным выбором т4 из АГ2 г). Ср. с доказательством, приведенным раньше.)

Сказанное выше снова можно эквивалентно сформулировать так:

(14:В:е) Игрок 2 может, играя соответствующим образом, добиться того, чтобы выигрыш игрока 1 был ^ v2, т. е. воспрепятствовать ему выиграть > v2 независимо от действий игрока 1. Игрок 1 может, действуя соответствующим образом, добиться того, чтобы выигрыш игрока 2 был fg —v2, т. е. воспрепятствовать ему выиг­рать > —v2 независимо от действий игрока 2.

14.3.4. Обсуждения игр и Г2, проведенные соответственно в п. 14.3.1 и в п. 14.3.3, находятся в отношении симметрии, или двойствен­ности друг к другу. Они получаются друг из друга, как отмечалось раньше (в начале п. 14.3.3), переменой ролей игроков 1 и 2.

Ни игра Г1? ни Г2 сами по себе не являются симметричными относи­тельно такого изменения. Действительно, это лишь повторное утвержде­ние того факта, что перемена ролей игроков 1 и 2 переводит игры и Г2 друг в друга и, таким образом, изменяет обе эти игры. Это находится в соответствии с тем, что различные утверждения, которые мы устанав­ливали в п. 14.3.1 и п. 14.3.3 относительно оптимальных стратегий соот­ветственно в играх в Ti и Г2, т. е. (14:А:а), (14:А:Ь), (14:В:а), (14:В:Ь), не были симметричны относительно игроков 1 и 2. И снова мы видим, что перемена ролей игроков 1 и 2 меняет местами основные определения для игр Ti и Г2 и тем самым изменяет обе эти игры [130]).

Поэтому весьма знаменательно, что характеризация значения партии (Vi для Г*!, v2 для Г2), введенная в конце п. 14.3.1 и п. 14.3.3, т. е. (14:А:с), (14:A:d), (14:А:е), (14:В:с), (14:B:d), (14:В:е) (за исключением формул в конце (14:А:с) и (14:В:с)), полностью симметрична относительно игро­ков 1 и 2. В соответствии с тем, что говорилось выше, это совпадает с утверждением о том, что эти характеризации установлены одним и тем же способом для Г4 и для Г2[131]). Все это, конечно, является в равной мере очевидным при непосредственной проверке соответствующих мест.

Итак, нам удалось определить значения партии одинаковым спо­собом для игр Ti и Г2 и симметрично для игроков 1 и 2: в (14:А:с), (14:A:d), (14:А:е), (14:В:с), (14:B:d) и (14:В:е) в п. 14.3.1 и в п. 14.3.3. Это было сделано, несмотря на существенное различие индивидуальных ролей каждого игрока в обеих играх. Все это внушает надежду, что определе­ние значения партии может быть использовано в той же форме и с таким же успехом и для других игр, в частности для игры Г, которая занимает промежуточное положение между и Г2. Эта надежда касается, конечно, только самого понятия значения, но не тех рассуждений, которые приво­дят к нему. Они специфичны в ив Г2, фактически различны для Г4 и для Г2 и вообще непригодны для самой игры Г. Иными словами, в дальнейшем мы ожидаем большего от (14:A:d), (14:А:е), (14:B:d) и (14:В:е), чем от (14:А:а), (14:А:Ь) и (14:В:а), (14:В:Ь).

Ясно, что это — только эвристические соображения. До сих пор мы даже не пытались доказать, что численное значение партии для Г может быть определено этим путем. Теперь мы приступим к детальному рассмотрению, которое восполнит этот пробел. Мы увидим, что сначала некоторые определенные и серьезные трудности ограничат на первый взгляд применимость этой методики, но в дальнейшем будет возможно устранить их введением нового аппарата. (См. соответственно п. 14.7.1 и пп. 17.1-17.3.)

14.4. Выводы

14.4.1. Мы видели, что вполне правдоподобной интерпретацией значения партии являются величины

vt = max min Ж (т4, т2),

Ti т2

v2 — min max (т4, т2)

соответственно для игр и Г2 относительно игрока 1 [132]).

Так как игра Г4 менее благоприятна для игрока 1, чем игра Г2 (в Г4 он должен сделать ход до хода своего противника, которому будет изве­стен его ход, в то время как в игре Г2 наблюдается обратная ситуация), разумным является вывод о том, что значение для меньше или равно (т. е. наверняка не больше), чем значение для Г2. Каждый может судить о строгости этого «доказательства». Этот вопрос решить трудно, но, во всяком случае, тщательный анализ словесных аргументов показывает, что они по существу воспроизводят математическое доказательство того же самого утверждения, которое мы уже получили. Действительно, то, что мы утверждаем:

Vi ^ v2,

совпадает с (13: А*) в п. 13.4.3 (где <р, хя у соответствуют нашим Ж, т4 и т2).

Вместо того, чтобы рассматривать v4 и v2 в качестве значений для двух игр Г4 и Г2, отличных от Г, мы можем связать их с самой игрой Г при соответствующих предположениях относительно «интеллекта» игро­ков 1 и 2.

Действительно, правила игры Г предписывают, чтобы каждый игрок делал свой выбор (свой собственный ход) при полном неведении о выборе своего противника. Тем не менее возможно, что один из игроков, ска­жем 2, «раскрывает» своего противника, т. е. что он как-то получил информацию о его стратегии х).

Мы не будем касаться вопроса об источнике этой информации; им может быть (но не обязательно будет) опыт, накопленный в предыдущих партиях. Во всяком случае, мы предполагаем, что игрок 2 такой инфор – цией обладает. Возможно, конечно, что в этой ситуации игрок 1 изменит свою стратегию, но мы опять предположим, что по каким-то причинам он не делает этого[133]). При этих предположениях мы можем говорить, что игрок 2 «раскрыл» своего противника.

В этом случае условия в Г становятся точно такими же, как и в Г4, и, следовательно, все рассуждения п. 14.3.1 применимы дословно. Анало­гично можно представить себе противоположную возможность, что игрок 1 «раскрыл» своего противника. Тогда условия в Г становятся точно такими же, как в игре Г2, и, следовательно, все рассуждения п. 14.3.3 применимы дословно.

В свете изложенного выше мы можем сказать следующее. Значение партии игры Г является определенной величиной, если делается одно из следующих двух крайних предположений: или что игрок 2 «раскры­вает» своего противника, или что игрок 1 «раскрывает» своего противника. В первом случае значение партии есть для 1 и —для 2, во втором случае значение партии есть v2 для 1 и —v2 для 2.

14.4.2. Эти рассуждения показывают, что если значение партии самой игры Г (без каких-либо дальнейших ограничений или модифика­ций) вообще может быть определено, то оно должно лежать между зна­чениями и у2. (Мы имеем в виду значение для игрока 1.) То есть если мы обозначим через v значение партии для игры Г (для игрока 1), то должно быть

vi ^ v fg v2.

Длина этого интервала t в котором может находиться v, есть

A = v2 — vi^0.

В то же время А выражает преимущество, которого добивается (в игре Г) игрок, «раскрыв» своего противника вместо того, чтобы быть «раскрытым» самому [134]).

Далее, игра может быть такой, что неважно, какой игрок «раскрыл» своего оппонента, т. е. что получаемое преимущество при этом равно нулю. В соответствии со сказанным выше, это может быть в том и только в том случае, когда

А = 0

или, что то же самое, когда

Vi = v2.

Или, если мы заменим и v2 выражениями, которые их определяют, max min &С (ть т2) = min maxe%* (т4, т2).

Ti Т2 Т2 Ti

Если игра Г обладает этими свойствами, то будем называть ее вполне определенной.

Последняя форма этого условия требует сравнения с (13:3) в п. 13.3.1 и с рассуждениями в пп. 13.4.1—13.5.2 (снова ф, геи у там соответствуют нашим Ж, Х\ и т2). Действительно, утверждение (13:В*) в п. 13.4.3 гово­рит, что игра Г вполне определена тогда и только тогда, когда суще­ствует седловая точка функции Ж (т4, т2).

14.5. Анализ полной определенности

14.5.1. Предположим, что игра Г вполне определена, т. е. что суще­ствует седловая точка функции Ж (т17 т2).

В этом случае анализ в п. 14.4.2 вселяет надежду, что станет воз­можным интерпретировать величину

v = yt у2

как значение партии для Г (для игрока 1). Вспоминая определения у4и v2 и определение седловой точки в п. 13.4.3 и используя (13:С*) в п. 13.5.2, мы видим, что последнее равенство может быть записано как

v = max min Ж (т4, т2) = min max Ж (т4, т2) = SaTl/T2e/f (%i, т2).

Ti Т2 Т2 Ti

Повторяя шаг за шагом то, что делалось в конце п. 14.3.1 и в конце п. 14.3.3, нетрудно установить, что v можно интерпретировать как значе­ние партии для Г (для игрока 1).

В частности, (14:А:с), (14:A:d), (14:А:е), (14:В:с), (14:B:d), (14:В:е) из п. 14.3.1 и п. 14.3.3, где они применялись к Г4 и Г2 соответственно, теперь могут быть получены для Г. Начнем с того, что воспроизведем утверждение, эквивалентное (14:A:d) и (14:B:d) г):

(14:C:d) Игрок 1 может, играя надлежащим образом, обеспечить себе выигрыш v независимо от того, что делает игрок 2.

Игрок 2 может, играя надлежащим образом, обеспечить себе выигрыш ^ —v независимо от того, что делает игрок 1.

Для того чтобы доказать это, мы снова образуем множество А из (14:А:а) в п. 14.3.1 и множество В из (14:В:а) в п. 14.3.3. Они являются фактически множествами АВч из п. 13.5.1 (ф соответствует нашей Ж). Мы повторяем:

(14:D:a) А есть множество тех т4, для которых minS^^, т2) Доста­ть

гает своего максимального значения, т. е. для которых ттЖ(г1, т2) = max mm Ж (т4, т2) = у.

Т2 ‘ ti Т2

(14:D:b) В есть множество тех т2, для которых тахс%?(т4, т2) достигает

Tl

своего минимального значения, т. е. для которых тах5Р(т4, т2) ^minmaxc/T (т4, t2) = v.

П Т2 Ti

Теперь легко доказывается утверждение (14:C:d). Пусть игрок 1 выбирает т4 из А. Тогда, независимо от действий игро­ка 2 (т. е. для каждого т2), мы имеем Ж (т1? т2) ^ min Ж (т4, т2) = у,

т. е. выигрыш игрока 1 ^ v.

Пусть игрок 2 выбирает т2 из В. Тогда, независимо от действий игрока 1 (т. е. для каждого т*), мы имеем Ж (т4, т2) ^ max Ж (т4, т2) =

= v, т. е. выигрыш игрока I^vh, таким образом, выигрыш игрока 2 ^ —V.

Это завершает доказательство.

Теперь перейдем к утверждению, эквивалентному (14:А:е) и (14:В:е). Действительно, (14:C:d) эквивалентно можно сформулировать так:

(14:С:е) Игрок 2, играя соответствующим образом, может добиться того, что выигрыш игрока 1 будет v, т. е. может воспрепятство­вать ему выиграть > v независимо от его действий.

Игрок 1, играя соответствующим образом, может добиться того, что выигрыш игрока 2 будет g —v, т. е. воспрепятствовать ему выиграть > —v независимо от его действий. (14:C:d) и (14:С:е) вполне устанавливают нашу интерпретацию v, как значения партии для Г для игрока 1 и —v для игрока 2.

14.5.2. Рассмотрим теперь эквиваленты утверждений (14:А:а),

(14:А:Ь), (14:В:а), (14:В:Ь).

Благодаря (14:C:d) в п. 14.5.1 разумно определять оптимальный способ игры игрока 1 в игре Г как способ, гарантирующий ему выигрыш, больший или равный значению партии для 1, независимо от действия 2, т. е. выбор т4, для которого Ж (т4, t2)^v при всех т2. Эквивалентно это можно записать как min Ж (т4, т2)) ^ v.

Далее, всегда верно

min Ж (т4, т2) max min Ж (т4, т2) = v.

Tl Т2

Следовательно, высказанное’ выше условие для т4 превращается в min Ж (т4, т2) = v, т. е. (благодаря (14:D:a) в п. 14.5.1) т4 принадле-

жит А.

С другой стороны, ввиду (14:C:d) в п. 14.5.1 разумно определять оптимальный способ игры для игрока 2 в игре Г как способ, гарантирую­щий ему выигрыш, больший или равный значению партии для 2, незави­симо от действий 1, т. е. выбор т2, для которого — Ж (т4, т2)^ —v при всех т4. Это значит, что Ж (т4, т2) rg v для всех т4. В эквивалентной форме это можно записать как max Ж (т4, t2)rgv.

Далее, всегда верно

шах Ж (хх, min max Ж (т4, т2) = v.

Ti L Т2 Ti

Следовательно, высказанное выше условие для т2 превращается в в max Ж (ti, т2) = v, т. е. (благодаря (14:D:b) в п. 14.5.1) т2 принад – ч

лежит В.

Таким образом, мы имеем:

(14:С:а) Оптимальным способом игры (стратегией)1 для игрока 1 в игре Г является выбор любого принадлежащего А, где А — множество из (14:D:a) в п. 14.5.1.

{14:С:Ь) Оптимальным способом игры (стратегией) для игрока 2 в игре Г является выбор любого т2, принадлежащего В, где В — множество из (14:D:b) в п. 14.5.1 *).

Наконец, наше определение оптимального способа игры, как указы­валось в начале этого пункта, немедленно дает утверждение, эквивалент­ное (14:А:с) цли (14:В:с).

(14:С:с) Если оба игрока играют в игре Г оптимально, т. е. если т4 принадлежит А, & т2 принадлежит Б, то значение Ж (т1? т2) будет равно значению партии (для игрока 1), т. е. v. Заметим, что (13:D*) в п. 13:5.2 и замечания, изложенные перед утвержде­ниями (14:D:a) и (14:D:b) в п. 14.5.1 относительно множеств А, Б, вместе взятые, дают нам следующеег

(14:C:f) Оба игрока 1 и 2 играют в игре Г оптимально, т. е. т4 принад­лежит А, а т2 принадлежит В тогда и только тогда, когда т4, т2 является седловой точкой Ж (т2).

14.6. Перемена ролей игроков. Симметрия

14.6. Утверждения (14:С:а)—(14:C:f) в пп. 14.5.1 и 14.5.2 разрешают все трудности в той мере, в какой речь идет о вполне определенных играх двух лиц. В связи с этим заметим, что в пп. 14.3.1 и 14.3.3 для игр Г4 и Г2 мы вывели (14:A:d), (14:А:е), (14:B:d), (14:В:е) из (14:А:а), (14:А:Ь), (14:В:а), (14:В:Ь), в то время как в пп. 14.5.1 и 14.5.2 для самой игры Г мы получили (14:С:а), (14:С:Ь) из (14:C:d), (14:С:е). Это является преиму­ществом, так как аргументы в пп. 14.3.1 и 14.3.3 в пользу (14:А:а), (14:А:Ь) (14:В:а), (14:В:Ь) носили гораздо более эвристический характер, чем аргу­менты в пп. 14.5.1 и 14.5.2 в пользу (14;C:d), (14:С:е).

Использование функции Ж (т17 т2) = Ж4 (ть т2) подразумевало определенную асимметрию расположения игроков; игроку 1 тем самым придавалась особая роль. Однако интуитивно должно быть ясно, что равнозначные результаты могут быть получены, если мы отведем эту особую роль игроку 2. Так как перемена ролей игроков 1 и 2 будет иметь определенное значение в дальнейшем, мы приведем сжатое математиче­ское обсуждение этого вопроса.

Перемена ролей игроков 1 и 2 в игре Г, которая теперь не предпола­гается вполне определенной, приводит к замене функций (т1? т2) и

г) Так как эта игра есть Г, каждый игрок должен сделать свой выбор (т4 или т2), не зная о выборе другого игрока (т2 или т^. Сопоставьте это с (14:А:Ь) в п. 14.3.1 для Ti и с (14:В:Ь) в п. 14.3.3 для Г2.

<2^2 (ti, t2) на функции Ж2 (t2, ti) и (t2, Ti) Поэтому такая пере­мена означает изменение функции Ж (т4, t2) на — Ж (т2, ti).

Далее, изменение знака влечет за собой переход операций max и min друг в друга. Следовательно, величины

max min Ж (т4, т2) = v4,

ti т2

min max Ж (т4, т2) = v2,

Т2 Tl

определенные в д. 14.4.1, превращаются теперь в следующие: max min [ — Ж (r2f t4)] = — min max Ж (т2, т4) =

Tl Т2 Tl т2

= — min max Ж (т4, т2)[135]) = — v2r

Ti

min max [ — Ж (т2, т^] = — max min Sf (т2, т4) =

Т2 Tl Т2 Tl

= — max min Ж (rlt т2) [136]) = — v4.

Tl т2

Таким образом, v4, v2 превращаются в —v2f —v4[137]). Следовательно, величина

A = v2 — у4 = ( — v4) — ( — v2)

остается неизменной[138]). Если Г вполне определена, то это также остается верным, так как в этом случае А = 0 и равенство v = = v2 превра­щается в —V = —Vi = —v2.

Теперь легко проверить, что все утверждения (14:С:а) — (14:C:f) в пп. 14.5.1 и 14.5.2 остаются теми же самыми, когда произведена пере­мена ролей игроков 1 и 2.

14.7. Игры, не являющиеся вполне определенными

14.7.1. Все предыдущее относится только к вполне определенным играм и ни к каким другим. Игра Г, которая не является вполне опреде­ленной, характеризуется тем, что А > 0, т. е. в такой игре получает преимущество тот, кто «раскроет» своего противника. Отсюда вытекает существенное различив между результатами, т. е. значениями в Г4 и в Г2, а потому и между оптимальными способами игры в этих играх. Поэтому рассуждения в пп. 14.3.1 и 14.3.3- перестают быть руководящими при рассмотрении игры Г. Рассуждения в пп. 14.5.1 и 14.5.2 также непри­менимы, так как они используют существование седловой точки Ж (т1? т2> и справедливость равенства

шах min Ж (т1? т2) = min max Ж (т4, т2),

Ti Т2 Т2 Tl

т. е. полную определенность игры Г. Конечно, некоторое доверие внушает неравенство из начала п. 14.4.2. Согласно ему значение v партии в Г (для игрока 1) (если такое понятие вообще может быть образовано в том общем случае, для которого мы пока еще его не имеем х)) находится в пределах

Vi^V^VS,

т. е. при этом для v все еще сохраняется интервал неопределенности длины Д = v2 — v4 > 0, и, кроме того, вся ситуация в концептуальном смысле остается весьма неудовлетворительной.

Можно склоняться к тому, чтобы вообще оставить дальнейшие попыт­ки: так как «раскрытие» своего оппонента в такой игре Г дает преимуще­ство, представляется внушающей доверие мысль о том, что нет возможности обнаружить решение до тех пор, пока не будет сделано некоторое определенное предположение о том, «кто кого раскрывает» и в какой степени [139]).

В § 17 мы увидим, что это не так и что, несмотря на Д > 0, решение может быть найдено тем же самым путем, что и раньше. Но мы, не присту­пая к рассмотрению этой трудности, займемся сначала перечислением некоторых игр Г с Д > 0 и других игр, для которых Д = 0. Первые, которые не являются вполне определенными, будут рассмотрены кратко; их детальное исследование будет проведено в п. 17.1. Вторые, которые являются вполне определенными, будут проанализированы значительно подробнее.

14.7,2. Так как существуют функции Ж (т1? т2) без седловых точек (см. пп. 13.4.1 и 13.4.2, где ф (х, у) есть наша Ж (т1? т2)), существуют и не вполне определенные игры Г. Имеет смысл еще раз рассмотреть преж­ние примеры, т. е. функции, описываемые матрицами табл. 2 и табл. 3 на стр. 120, в свете имеющихся в виду приложений. Иными словами, опишем в явном виде те игры, к которым они относятся. (В каждом слу­чае мы заменяем ф (ж, у) на Ж (ть т2); здесь т2 обозначает номер столбца, а т4 — номер строки в каждой матрице. См. также табл. 5 на стр. 126.)

Табл. 2 — это игра в орлянку. Пусть для т4 и для т2 1 означает «герб», а 2 означает «решетку». Тогда элемент матрицы равен 1, если т4 и т2 сов­падают, т. е. равны друг другу, и — 1 в противном случае. Таким обра­зом, игрок 1 угадывает действия игрока 2. Он выигрывает (единицу) при совпадении и проигрывает (единицу) в противном случае.


Табл. 3 — это игра «камень, мешок и ножницы». Пусть для и для т2 1 означает «камень», 2 означает «мешок», а 3 — «ножницы». Распределение 1 и —1 в матрице выражает, что «мешок» побеждает «камень», «нож­ницы» побеждают «мешок», а «камень» побеждает «ножницы» х). Таким образом, игрок 1 выигрывает (единицу), если он побеждает игрока 2, и проигрывает (единицу), если оказывается побежденным. В противном случае (если оба игрока делают одинаковый выбор) игра заканчивается вничью.

14.7.3. Эти два примера в достаточно ясной форме показывают труд­ности, которые встретились нам в не вполне определенных играх. Бла­годаря чрезвычайной простоте примеров эти трудности отчетливо выделе­ны здесь. Дело в том, что в играх «орлянка» и «камень, мешок и ножницы» любой способ игры (т. е. любое или любое т2) так же хорош, как и любой другой. Нет существенной выгоды или невыгоды непосредственно в «гер­бе» или в «решетке». Нет их непосредственно и в «камне», «мешке» или «ножницах». Единственным, что имеет значение, является правильное угадывание действий противника. Но как приступить к описанию этого без дальнейших предположений об «интеллектах» игроков? [140])

Конечно, существуют и более сложные игры, которые не являются вполне определенными и которые важны с различных более тонких спе­циальных точек зрения (см. §§ 18 и 19). Но поскольку речь идет об основ­ной трудности, простые игры «орлянка» и «камень, мешок и ножницы» являются достаточно характерными.

14.8. Программа детального анализа полной определенности

14.8. Хотя вполне определенные игры Г, для которых наше решение строго обосновано, являются, таким образом, только частным случаем, нельзя недооценивать размеров области, которую они охватывают. Тот факт, что мы используем нормальную форму для^ игры Г, может привести нас к такому недооцениванию. При использовании нормальной формы многие вещи кажутся элементарнее, чем они есть на самом деле. Надо помнить, что %i и т2 представляют собой стратегии в позиционной форме игры, которая может имёть, как указывалось в п. 14.1.1, очень сложную структуру.

Следовательно, для того чтобы понять роль полной определенности, необходимо исследовать ее в связи с позиционной формой игры. Это под­нимает вопросы, касающиеся детальной природы ходов (является ход случайным или выполняется игроком), состояния информации игроков и т. д. Тем самым, как упоминалось в п. 12.1.1, мы подходим к структур­ному анализу, основанному на позиционной форме.

Нас особенно будут интересовать те игры, в которых каждый игрок, делая свой ход, полностью информирован об исходах выборов во всех предшествующих ходах. Эти игры уже упоминались в п. 6.4.1, и там утверждалось, что их общее рассмотрение носит специфический характер. Теперь мы установим точный смысл этого, доказав, что все такие игры являются вполне определенными. Это окажется справедливым не только в том случае, когда все ходы являются ходами игроков, но и при нали­чии случайных ходов.

§ 15. ИГРЫ С ПОЛНОЙ ИНФОРМАЦИЕЙ 15.1. Постановка задачи. Индукция

15.1.1. Продолжим изучение игр двух лиц с нулевой суммой с целью нахождения среди них возможно более широкого класса вполне определен­ных игр, т. е. таких игр, для которых величины

ух = шах min Ж (т4, т2), tl t2

v2 = min max Ж (т4, т2)

Т2 ti

из п. 14.4.1, оказавшиеся столь важными для оценки игры, удовлетворяют соотношению

у4 = v2 = v.

Мы покажем, что, когда игра Г является игрой с полной информа­цией, т. е. когда предварение эквивалентно предшествованию (см. п. 6.4.1 и окончание п. 14.8), она вполне определена. Мы обсудим также концеп­туальную значимость этого результата (п. 15.8). Фактически мы получим это утверждение как частный случай более общего правила, касающегося Vi и v2 (см. п. 15.5.3).

Мы начнем наши рассмотрения даже с более общего случая — общей игры п лиц Г. Эта большая общность окажется полезной в дальнейшем.

15.1.2. Пусть Г — общая игра п лиц, заданная в позиционной форме. Мы рассмотрим некоторые аспекты этой игры, используя сначала до-тео­ретико-множественную терминологию из §§ 6 и 7 (в п. 15.1), а затем переведем все на язык теории разбиений и множеств из §§ 9 и 10 (в п. 15.2 и далее). Возможно, читатель получит полное представление о вопросе уже с помощью одного только первого рассмотрения; дальнейшее со своим достаточно формальным аппаратом имеет целью показать только, что фактически мы действуем на основании аксиом п. 10.1.1.

Определим последовательность ходов в Г: оМ^ <Лг, . . ., qMv. Зафик­сируем наше внимание на первом ходе и на ситуации, которая склады­вается в момент этого хода. Поскольку этому ходу ничто не предшествует, то его ничто и не предваряет; иначе говоря, характеристики этого хода ни от чего не зависят; они являются константами. Это относится прежде всего к тому, является ли ход оМ± случайным или личным; в последнем случае — какому из игроков принадлежит ход оМ^ т. е. к значениям /q = 0, 1, . . ., п в смысле п. 6.2.1. Это относится также к числу альтернатив а4 в ходе ф 1? а для случайного хода (когда kt = 0) — и к значениям вероятностей Pi( 1), . . ., Pi(cti). Результатом выбора в ходе оМ^ —случайном или личном — является число а4 = 1, . . ., а4.

Для математического анализа игры Г сам собой напрашивается метод, в достаточной мере отвечающий духу «полной индукции», широко исполь­зуемой во всех областях математики. Успешное применение этого метода позволяет заменить анализ игры Г анализом игр, содержащих на один ход меньше, чем Г[141]). Этот метод состоит в выборе некоторого а4 = 1, ..а4 и в обозначении через игры, которая совпадает с Г во всех дета­лях, за исключением того, что в Г— отсутствует ход оМх и вместо выбора Gi правилами новой игры предписывается значение а4 =

Замечание. Пусть, например, Г — игра в шахматы, a — некоторый начальный ход — выбор при М^ «белых», т. е. игрока 1. Тогда Г – снова оказывается

игрой в шахматы, но начинающейся ходом, который является вторым в обычных шахматах — ходом «черных» (т. е. игрока 2), и позицией, образовавшейся в резуль­тате «открывающего хода». Этот предписанный «открывающий ход» может быть, а мо­жет и не быть общепринятым (типа е2 — е4).

То же происходит и в некоторых разновидностях бриджа, когда «посредник» сдает игрокам определенные — известные’ и заранее выбранные — карты. (Так делается, например, в «двойном бридже».)

В первом примере предписанный ход в первоначальной игре является лич­ным (ход «белых», игрока 1); во втором примере он в первоначальной игре является случайным («сдача»).

Применяемые иногда в некоторых играх «форы» могут сводиться к одной или нескольким таким операциям.

Игра Г- содержит одним ходом меньше, чем Г. Ее ходами будут <Мч, . .. ., oSv[142]). Наш «индуктивный» метод будет успешным, если мы сможем вывести существенные свойства игры Г из свойств игр Г^,

cfi = 1, . . а±.

15.1.3. Тем не менее следует отметить, что возможность составления игр Г – зависит от ограничений, наложенных на игру Г. Действительно, каждый игрок, делающий личный ход в игре Г – , должен быть полностью информирован о правилах этой игры. Теперь эта информация состоит уже из информации о правилах первоначальной игры Г с добавлением предписанного выбора на с/Жт. е. а4. Следовательно, игра Г – может быть получена из игры Г без изменения правил, касающихся состояния информа­ции в Г, только в том случае, когда выбор при о/И^ по правилам перво­начальной игры Г известен каждому игроку при совершении им личных ходов оМг, . . ., qMv, т. е. ход должен предварять все личные ходы с#2> • • •> e^v Таким образом:

(15:А) Игру Г – можно построить, не изменяя существенно для этой цели структуру игры Г, если Г обладает следующим свойством: (15:А:а) <М\ предваряет все личные ходы oS2, . . [143])-

15.2. Точное условие (основание индукции)

15.2.1. Переведем теперь сказанное в пп. 15.1.2, 15.1.3 на язык’ разбиений и множеств из §§ 9 и 10 (см. также начало п. 15.1.2). В связи с этим мы будем пользоваться обозначениями из п. 10.1.

Ai состоит из единственного множества Q (см. (10:l:f) в п. 10.1.1) и является подразбиением $84 ((10:1:а) из п. 10.1.1); следовательно, 95± также состоит из одного множества Q (остальные множества оказываются

пустыми) [144]). Иначе говоря,

Г Q ровно для одного к, скажем для к = ки

В\ (к) — | 0 дЛЯ всех

Это число kt = 0, 1, . . ., п определяет природу о/Н^ оно является пара­метром ki из п. 6.2.1. Если ki — 1, . . ., п, т. е. если ход личный, то Ai также будет подразбиением (к^). (См. (10:l:d) из п. 10.1.1. Это опре­делялось только для Вi (к^, но Bt (kt) — Q). Следовательно, 3)i (ki) также состоит из единственного множества Q [145]). Значит, при к Ф ki 3) 1 (&)> являющееся разбиением в Вi (к) = 0 (см. (10:А:а) из п. 10.1.1), должно быть пустым.

Таким образом, мы получаем ровно одно множество Ai из Ai, которое совпадает с £2, и для ki = 1, . . ., п ровно одно D4 во всех 3)i (к), также совпадающее с £2, в то время как при А^ = 0 ни в одном из (к) не содер­жится множеств Di.

Ход oMi состоит в выборе некоторого Ci из (к4); этот выбор случаен, если ki = 0, и производится игроком kt, если ki = 1, . . ., п. Сi авто­матически оказывается подмножеством единственного множества Ai (— Q) в первом случае и подмножеством единственного Di (— Q) во втором. Число таких Ct равно (см. п. 9.1.5, сноску 1 на стр. 96); поскольку же рассматриваемые Af или Di фиксированы, ai является вполне опре­деленной константой, ai — число альтернатив при ходе где опре­делялось в пп. 6.2.1 и 15.1.2.

Эти Ci отвечают а4 = 1, . . а4 из п. 15.1.2, и мы будем обозначать их соответственно через Ci (1), . . ., Ci (a4) [146]). Теперь утверждение (10:l:h) в п. 10.1.1 показывает, как мы это уже заметили, что А^ также является множеством из Ci (1), . . ., Ci (а4), т. е. равно

До сих пор наш анализ был совершенно общим; он был справедлив для oMi (а при некотором обобщении — и для в условиях любой игры Г. Читатель может перевести эти свойства на повседневную терми­нологию в смысле пп. 8.4.2 и 10.4.2.

Перейдем теперь к Г-^ Этот переход, как было описано в п. 15.1.2, осуществляется предписанием выбора при ходе oMi9 т. е. принятием <т4 = ai. В то же самое время ходы в игре Г – ограничиваются множе­ством <М2, . . ., qMv. Это означает, что элемент я, представляющий партию в игре, не может более принимать произвольные значения из Q, а огра­ничен в пределах Ct (с^). Разбиения, перечисленные в п. 9.2.1, ограни­чиваются теми, «для которых х = 2, . . ., v [147]) (и к = v + 1 для АК).

15.2.2. Перейдем теперь к ограничениям, эквивалентным тем, кото­рые описывались в п. 15.1.3.

Возможность осуществления изменений, сформулированных в конце л. 15.2.1, зависит от некоторых ограничений, налагаемых на Г.

Как было показано, мы стремимся ограничить партию, т. е. л, в рам­ках Ci (ai). Поэтому все множества, фигурирующие в описании Г и являю­щиеся подмножествами Q, должны быть заменены подмножествами Ct (cti), а разбиения — разбиениями в Сi (с^) (или в подмножествах (Oi)). Как это должно быть сделано?

Разбиения, с помощью которых описывается игра Г (см. п. 9.2.1), распадаются на два класса: те, которые представляет объективные фак­ты……………………………………… А у, 9$ у == (By (0), . . ., By (п)) и (к), к = 0, 1 и,-и те,

которые представляют только состояние информации игрока г) — Зу (к), к — 1, . . ., п. Мы предполагаем, конечно, что х ^ 2 (см. конец п. 15.2.1).

В первом классе разбиений достаточно лишь заменить каждый эле­мент на его пересечение с (о^). Таким образом, 98 у видоизменяется заменой его элементов By (0), . . ., By (п) соответственно на

Ci(Oi)()By(0), С^)[\В*(п).

В Л у и этого делать не надо. Оно является подразбиением А2 (поскольку х ^ 2, см. п. 10.4.1), т. е. системы попарно непересекающихся множеств (С±( 1), . . Ci (cti)) (см. п. 5.2.1); следовательно, достаточно оставить только элементы из Л у, являющиеся подмножествами Ci (о4), т. е. часть Ау, содержащуюся в Ci (а4). К %у (к) следует подходить так же, как и к 98 у, однако мы предпочитаем отложить это рассмотрение.

Во втором классе разбиений, т. е. для SB у (к), ничего подобного делать нельзя. Замена элементов из Зу (к) их пересечениями с Ci (о^) приводит к изменению состояния информации игрока [148]), и, таким образом, недо­пустима. Единственно возможной процедурой является процедура, выпол­нимая в случае Ау, замена 3 у (к) той его частью, которая лежит в Сi (а4). Однако это применимо только лишь в том случае, когда 3 „ (к) (как ранее А у) является подразбиением А2 (при % ^ 2).

Теперь %у (к) само позаботится о себе: оно является подразбиением Зу (к) (см. (10:1:с) в п. 10:1:1); следовательно, таковым оказывается и А2 (согласно сделанному выше предположению); поэтому мы можем заменить его на ту его часть, которая содержится в (а4).

Итак, мы видим, что необходимым ограничением, налагаемым на Г, является то, 4TQ каждое Зу (к) (при к ^2) должно быть подразбиением А2. Вспомним теперь интерпретацию п. 8.4.2 и утверждения (10:A:d*) и (10:A:g*) в п. 10.1.2. Эти ограничения имеют тот смысл, что каждый игрок при совершении им личного хода в о/И2, . . ., оМv полностью инфор­мирован о состоянии дел после хода (до совершения хода е#2)> что выражается через А2 (см. также рассмотрение, предшествующее (10:В) в п. 10.4.2). Сказанное означает, что ход должен предварять все ходы <Л2, . . ., G#v

Таким образом, мы вновь получили условие (15:А:а) из п. 15.1.3. Мы предоставляем читателю простую проверку того, что игра Г^ удов­летворяет требованиям п. 10.1.1.

15.3. Точное условие (индуктивный переход)

15*3.1. Как было указано в конце п. 15.1.2, мы стремимся вывести свойства игры Г из свойств игр Г – , Oi = 1, . . с^: в случае успеха это и будет типичным индуктивным переходом.

К настоящему моменту тем не менее единственный класс игр, свой­ства (математические) [которого нам известны, состоит из игр двух лиц с нулевой суммой: для них мы имеем величины и у2 (см. п. 15.1.1). Предположим поэтому, что Г — игра двух лиц с нулевой суммой.

Покажем теперь, что величины v4 и v2, определенные для игры Г, могут быть выражены с помощью соответствующих величин для Г^,

Oi = 1, . . ., а! (см. п. 15.1.2). Это обстоятельство пробуждает желание проводить «индукцию» и дальше, т. е. строить таким же способом игры

ъ ' га 1т а ' ' ' • ' га а а существенно здвсь то, что число

а1» а2 1' 2' 3 1' 2' "v

шагов в этих играх последовательно убывает от v (для Г), v — 1 (для Г^), принимая значения v — 2, v — 3, . . ., до 0 (для игры Г^ -2 здесь Г^ -2 — «пустая» игра (похожая на игру, упомянутую в за­

мечании на странице 102). Она не содержит ходов: игрок к получает фиксированный выигрыш

JFk(Pu • • tfv)-

Это — терминология из пп. 15.1.2, 15.1.3, т. е. из §§ 6 и 7. В терминах пп. 15.2.1 и 15.2.2, т. е. из §§ 9, 10, мы сказали бы, что Q (для Г) последо­вательно ограничивается С4 (а4) из (для Г-), далее С2 (аь о2) из (для r-if-a), C3(Oi, о2,о3) из (для Г-ь-а2 -) и т. д. и, наконец,

Cv (<г4, а2, . . av) из (для Г - -2 Но это последнее

множество состоит из единственного элемента ((10:l:g) из п. 10.1.1), ска­жем я. Следовательно, исход игры Г - ~2 ~v оказывается фиксиро­ванным. Игрок к получает фиксированный выигрыш (я).

Следовательно, природа игры Г - -2 очевидна: понятно, что

является ее значением для каждого игрока. Поэтому процесс, ведущий от Г - к Г, если его удастся построить, может быть использован для работы и в обратном направлении: от Г-х - к Г^ - ,

К Гаь ..., av_2 И Т' Д-' И Т - Д-' К Гд1}с2' К Га! И' наконвц, к Г.

Однако все это возможно только в том случае, когда мы в состоянии построить все игры последовательности Г^, Г^ -2, ~2 , ... . . ., Г - - v, т. е. если для всех этих игр выполняются последние условия из п. 15.1.3 или из п. 15.2.2. Это требование можно снова сфор­мулировать для произвольной общей игры п лиц Г, и мы опять возвра­щаемся к таким Г.

15.3.2. Нужное требование (в терминах пп. 15.1.2, 15.1.3, т. е. из §§ 6 и 7) состоит в том, что ход g#! должен предварять все ходы оМ2, - - - . . ., qMv, ход о/Н2 должен предварять все оМг, . . ., ©#v и т. д., и т. д., т. е. предварение должно совпадать с предшествованием.

То же самое можно, конечно, сформулировать и в терминах пп. 15.2.1 и 15.2.2. Именно все 3^(к), х ^ 2, должны быть подразбиениями А2; все 3 ^ (к), к ^ 3, должны быть подразбиениями А3 и т. д., и т. д., т. е. все 3) у (к) должны быть подразбиениями Jk% при % ^ X *).

Поскольку АК всегда является подразбиением А^ (см. п. 10.4.1), достаточно потребовать, чтобы все 3)^ (к) были подразбиениями А Однако А у является подразбиением 3%(к) в х (к) (см. (10:l:d) в п. 10.1.1); следовательно, наше требование равносильно тому, что (к) является частью Aw лежащей в ВК (к) [149]). Согласно (10:В) из п. 10.4.1 это как раз означает то, что в игре Г предварение совпадает с предшествованием.

В результате всех этих рассуждений мы установили следующее:

(15:В) ^ Для того чтобы можно было построить полную последователь­ность игр

Г’ Га!’ Га4, Га4, Ъ2, а3′ • • •» а2,..av’ состоящих соответственно из

v, V —1, V —2, …, 0

ходов, необходимо и достаточно, чтобы в игре Г предварение и предшествование совпадали, т. е. чтобы имела место полная информация. (См. п. 6.4.1 и конец п. 14.8.)

Если Г — игра двух лиц с нулевой суммой, то сказанное позволяет проанализировать игру Г путем движения в обратном направлении вдоль последовательности (15.1): от тривиальной игры Г^ ~2 – v к Г, поль­зуясь на каждом шаге способом, ведущим от Г – к Г, так, как это будет показано в п. 15.6.2.

15.4. Точное исследование индуктивного перехода

15.4.1. Перейдем теперь к выводу индуктивного перехода от Га1 [150]) к Г. Игра Г должна лишь удовлетворять последним условиям из п. 15.1.3 или п. 15.2.2, но она должна быть при этом игрой двух лиц с нулевой суммой.

Следовательно, мы можем построить все Г^, а4 = 1, . . а4, и они также будут играми двух лиц с нулевой суммой. Обозначим стратегии обоих игроков в Г соответственно через SJ, . . и EJ, , . 2|2,

а «математическое ожидание» выигрыша каждого из игроков в партии при использовании ими стратегий 2J1, 2|2 — через

SSTi(Tlf х2)=зёК(%1, т2), SFa(Ti, т2)=~- — та)

(см. пп. 11.2.3 и 14.1.1). Обозначим соответствующие величины в игре Га1 через 2^/1, . . SjJ^1 и. . и при использовании страте­

гий S^i/1, положим

^CFj/l С^/Ь Тсг2/2) = (та1/1, 2), вй^/2 (Та4/1» Та1/2) = —SSTa4 (Tai/i, ^су2)-

Составим выражения для v1? v2 из п. 14.4.1 в игре Г и в игре Г0а, обо­значая их в последнем случае через v<j /1, va /2. Таким|образом,

V! — max min Ж (т4, т2),

ti т2

v2 = min шах Ж (ть т2), ti

Vcr /1 = max min (та /и Ччуг)» va /2 = min max 0^/1» ^/2).

Ta±/2 Ta±/1

Наша задача состоит в выражении v4 и v2 через vai/i и v0l/2.

Индекс fci из пп. 15.1.2, 15.2.1, который определяет характер хода будет играть существенную роль. Поскольку п = 2, может при­нимать только значения 0, 1 и 2. Мы рассмотрим каждый из этих трех случаев отдельно.

15.4.2. Рассмотрим сначала случай kt = 0, т. е. оМ4 является случайным ходом. Вероятности альтернатив 0^=1, . . а4 равны Pi (1)’ • • •» Pi (01) (pi ((Ti) равно pi (ci) из (10:A:h) в п. 10.1.1 при = = а (а4) в п. 15.2.1).

Стратегия игрока 1 состоит, очевидно, в выборе стратегии ^J1^

игрока 1 в игре Га1 для каждого из значений случайной величины а4 = = 1, . . «1 таким образом, 2 J1 соответствует совокупности Si/i1, . . S^®1^1 для всевозможных комбинаций. . ., t^/i.

Аналогично стратегия игрока 2 в Г состоит в выборе стратегии 2£*/2 игрока 2 в Га1 для каждого из значений (случайной величины = 1, … . . сц; таким образом, 2J2 соответствует совокупности 21/22, • • 2T(Xi/2 для всевозможных комбинации Т1/2, . . та1/2.

«Математические ожидания» выигрыша в играх Г и Га1 связываются очевидной формулой

ai

т2)= 2 рЛо,)Ж0 (ха /и та /2).

а1=1 1 1 1

Следовательно, выражение для принимает вид v4 = max min Ж (ть т2) =

Tl т2

ai

= max min 2 AW^fта</1, та/2).

П/1, . . .,rai/1 т1/2, . . .,Ttti/2 o^l

Соответствующе^ индексу а4 в стоящей справа сумме 2 слагаемое

a1=l

Pi (cXi) Жо^ (T0i/1, Т^/2)

содержит только две переменные: т^/ь t<,i/2. Таким образом, пары

Т1/Ь та4/1» Tttl/2

встречаются порознь в различных агч ленах :

С4 — 1, . . .; Oi = 0&!.

Следовательно, при нахождении min можно минимизировать

т 1/2» • ->ха1/2

^-слагаемые независимо друг от друга, а при нахождении шах

^i/1……. xai/i

можно эти с^-слагаемые независимо максимизировать. В соответствии: с этим наше выражение принимает вид

ai

2 Pi (tfi) max min (та /1, та/2)

VlTV2

Таким образом, мы показали, что

ai

(15:2) v4= 2 PiivJvoji-

°i=1

Переставляя max и min, мы, применяя буквально ту же аргумента­цию, получаем

(15:3)

15.4.3. При исследовании случая кх = 1 мы будем пользоваться результатом п. 13.5.3. Несмотря на исключительно формальный характер этого результата, представляется полезным показать читателю, что это просто формальное утверждение интуитивно правдоподобного факта, касающегося игр. Это прояснит также, почему этот результат должен сыграть определенную роль в данной конкретной ситуации.

Интерпретация результата п. 13.5.3 основана на рассмотрениях пп. 14.2—14.5 и особенно из пп. 14.5.1, 14.5.2; поэтому ее не удалось изложить в п. 13.5.3.

Рассмотрим игру двух лиц с нулевой суммой Г в нормальной форме (см. п. 14.1.1) и минорантную и мажорантную игры Г4 и Г2 (см. п. 14.2).

Если мы решим трактовать нормальную форму игры Г так, как если бы она была позиционной, а затем с помощью правил, изложенных в пп. 11.2.2 и 11.2.3, вводить стратегии и т. д. с целью получить новую игру в нормальной форме, то, как это отмечалось в п. 11.3 и, в частности, в сноске 3 на стр. 109, ничего не произойдет. Иначе обстоит, однако, дело с мажорантной и минорантной играми Г4 и Г2. Они, как об этом упомина­лось в сносках 1 и 2 на странице 127, не заданы в нормальной форме. Следовательно, представляется естественным и необходимым привести их к нормальной форме по правилам пп. 11.2.2, 11.2.3.

Поскольку полные решения игр и Г2 были найдены в пп. 14.3.1Г 14.3.3, следует ожидать, что эти игры окажутся вполне определенными [151]).


Достаточно ограничиться рассмотрением игры (см. начало п. 14.3.4), к чему мы и перейдем.

Для игры Ti будем пользоваться обозначениями %v Ж’ (т^, и2) и v^, Vg, а соответствующие понятия для игры Г будем обозначать через т1? т2, SK (Ti, т2), v4, v2.

Стратегия игрока 1 в игре Г4 состоит в выборе (фиксированного) значения %i (=1, . . Pi), в то время как стратегия игрока 2 в Г4 состоит в выборе значения т2 (= 1, . . Рг) в зависимости от выбора т1? т4 (=1, . . Pi) *). Таким образом, т2 является функцией от т4: т2 = = j2 (tl).

Таким образом, %[ есть %и тогда как т2 соответствует функциям J2, а Ж (%[, т2) превращается в Ж (т1? J2 (т4)).

Поэтому

v[ = max min Ж(ти J2(Ti)), ч Cf 2

v^ min max Ж (rlf J2(Ti)).

Ji

Следовательно, утверждение о полной определенности игры Г^, т. е. о равенстве = полностью совпадает с равенством (13:Е) из п. 13.5.3; для этого достаточно заменить х, и, / (#), if) (х, / (#))) соответственно на т4, т2, J2 (т^, Ж (ti, J2 (тО).

Эквивалентность результата п. 13.5.3 и полной определенности игры Г4 делает понятным значимость его для дальнейших рассмотрений. является очень простым примером игры с полной информацией,— эти игры становятся теперь конечной целью наших исследований (см. конец п. 15.3.2). Первый ход в игре Г4 — точно такого же типа, как и тот, кото­рый нам теперь нужно рассмотреть: он личный и принадлежит игроку 1, т. е. ki = 1 [152]).

15.5. Точное исследование индуктивного перехода (продолжение)

15.5.1. Рассмотрим теперь случай, когда ki = 1, т. е. когда <М± есть личный ход игрока 1.

Стратегия 2J1 игрока 1 в Г состоит, очевидно, из указания фиксиро­ванного значения aj (= 1, . . ., a4), а также фиксированной стратегии

2^ 2), т. е. 2ji соответствует парам aj, тао/г

Стратегия 2 J2 игрока 2 в Г состоит в выборе стратегии 2^/22 игрока 2 в Гао при всех значениях переменной aj = 1, . . ., a4. Тем самым тао/2 оказывается функцией от aj: tao/i = J2 (<??)> т – е – 2J2 соответствует функ­циям J2, и, очевидно,

т2) = зг0о(тсо/2, j2 «)). Поэтому наша формула для дает;

Vi- max min^o^o^, J2 Ю) – maxmaxmin Ж0* (тоо/г J2(oJ)). а°’Тс?/1 X°*/i ^2

Из равенства (13:G) в п. 13.5.3 мы получаем заменой х, и, f (х) hi|)(#, у) соответственно на crj, тао/2, J2K) и &Рао(хаоп, ^/г)[153])^

maxmin^ao(T « J2 (a®)) =тах ттйР^т 0/1, о ).

a? У/2

Далее имеем

v^maxmaxmin^o (тао;1, та?/2) =

М/1 а! V/2

: max max min Жао (тао/1§ тао/2) = maxv(Jo/1. Т<т?/1Тсг?/2 о!

Формула для v2 дает нам[154])

v2 = min max £%ао (xaofi, J2 Ю) =

= min max max ей^о (т^о^ , J2 (crj)).

a? V/l

Теперь

min max max ЙР о (т o/4, J2 Ю) = a? *aS/1

= maxminmax^,ao (тао;1, J2 (aJ)) = maxminmax^^o (^o Co 2) a? ^2 V/l raS/2 TaS/l

следует из (13:E) и (13:G) из п. 13.5.3; достаточно только заменить ху и, /(я), г|ф, и) на oj, rao/2, J2(aJ), тахй? ао (тао/4, тао/2)[155]). Следовательно,

М/1 ^

v2 = max min max Жао (xao/v тао/2) = max vao/2.

2? Xa\/2Xa\/i

Резюмируя (и заменяя gJ на а4), мы получаем (15:4) vt = max VoTi/i,

<У1

(15:5) v2 = max у<Л/2-

<71

15.5.2. Рассмотрим, наконец, случай kt = 2, при котором ход oMt принадлежит игроку 2•

Перемена ролями игроков 1 и 2 сводит этот случай к предыдущему.

Как было показано в п. 14.6, эта перемена приводит к замене vt и у2 на —v2 и —Vi и, следовательно, vGl/i и у01/2 на —vai/2 и —vGl/i – При подстановке полученных после замены значений в формулы (15:4) и (15:5) становится очевидной замена шах на min, и мы получаем

(15:6) v^min vai/i,

[ai

(15:7) v2 = min vai/2.

15.5.3, Формулы (15:2)—(15:7) из пп. 15.4.2, 15.5.1 и 15.5.2 можно объединить следующим образом.

Для произвольной функции / (а4) переменной а4 (= 1, . . at) ^определим операции kt = 0, 1, 2, полагая


ai

2 PiW/Ы при к± = о,

(15:8) M^ffa)-

ai=l

шах / (а4) при = 1,

<Tl

min/(a1) при kt — 2.


Ol

Тогда

= MiJvGl/fc при к = 1, 2.

Подчеркнем некоторые простые свойства введенных операций Мд*. Во-первых, MaJ связывает переменную : / (а4) не зависит более от а4. Для Jct = I, 2, т. е. для max, min, это было обнаружено

ai ai

в п. 13.2.3. Для ki = 0 это очевидно; эта операция, таким образом, ана­логична операции интегрирования, упомянутой в качестве иллюстрации в сноске 1 на стр. 117.

Во-вторых, Мо{ явно зависит от игры Г. Это очевидно, поскольку Ма\ зависит от ка о^ принимает значения 1, . . ., а4. Дальнейшая зависимость появляется ввиду использования pt (1), . . ., pt (а4) в слу­чае kt = 0.

В-третьих, зависимость Yh от vai/k одна и та же при к = 1,2 для всех значений к^

Мы закончим замечанием, что можно было бы легко сделать эти фор-

<Х2

мулы — охватывающие математическое ожидание 2 Pi (ai) / (ai) Для СЛУ"

чайного хода, максимум для личного хода первого игрока и минимум для хода его противника — достаточно правдоподобными при помощи чисто словесных (нематематических) рассуждений. Тем не менее представляется необходимым дать точное математическое описание, чтобы полностью отдать должное роли v* и v2. Чисто словесная аргументация, которая могла бы это осуществить, неизбежно окажется настолько сложной (если вообще понятной), что не будет представлять большой ценности.

15.6. Результат для случая полной информации

15.6.1. Возвратимся к ситуации, описанной в конце п. 15.3.2, и при­мем все упомянутые там допущения; предположим, что игра Г является игрой двух лиц с нулевой суммой с полной информацией. Вместе с форму­лой (15:8) из п. 15.5.3, обеспечивающей индуктивный переход, приведенная

там схема даст нам возможность определить некоторые важные свойства игры Г.

Докажем прежде всего, не вдаваясь в дальнейшие подробности, что игра Г вполне определена. Доказательство проведем полной индукцией по длине игры v (см. п. 15.1.2). Оно будет состоять в доказательстве двух утверждений: «

(15:С:а) Это справедливо для игр минимальной длины, т. е. для слу­чая v = 0.

(15:С:Ь) Из того, что это справедливо для игр длины v — 1 при неко­тором v =1, . . ., 2, . . ., следует его справедливость для игр длины v.

Доказательство (15:С:а). Если длина игры Г равна нулю, то игра не содержит ни одного хода и состоит в выплате игрокам 1 и 2 некоторых фиксированных сумм w и —w х). Следовательно, = |32 ti = т2 =1, Ж (ti, т2) =w[156]), и, таким образом,

Vi = V2 == w;

т. е. игра Г вполне определена, и v = w [157]).

Доказательство (15:С:Ь). Пусть Г имеет длину v. Тогда каждая из игр Га1 имеет длину v — 1. Следовательно, по предположен­ному игры Га1 вполне определены. Поэтому v0l/i = vai/2- Теперь фор­мула (15:8) из п. 15.5.3 показывает [158]), что v4 = v2. Следовательно, игра Г также вполне] определена, и доказательство завершено.

15.6.2. Перейдем теперь к более подробному и явному выводу равенства v4 = v2 = v для игры Г. Для этого нам не понадобится даже результат п. 15.6.1.

Составим, как мы это делали в конце п. 15.3.2, последовательность игр

(15:9) Г, Г ai» Гаь (72, Г(7Ь Q2j <j3, Гаь,, e у [159]),

длины которых соответственно равны

v, V — 1, V —2, . .., 0.

Обозначим величины v4 и v2 для этих игр через

vfc, vai/ft, vai, сгг/ь» •••» vcri, аг,..

Для проведения индуктивного перехода, описанного в конце п. 15.3.2, применим формулу (15:8), заменив при любом к =1, . . v выраже­ния ои Г, Г(л из п. 15.5.3 на Гаь…» Га1……… Gyi_v Тогда

^ из п. 15.5.3 относится к первому ходу в Гаь а, т. е. к ходу о/Ну игры Г. Поэтому его удобно обозначить через ку(ои. . ., _4) (см. п. 7.2.1). Следовательно, заменяя из п. 15.5.3, сконструируем

операцию Ма* . На этом пути мы получим

(15:10) у0ь…, сyK_l/k = M^l(аь’ *” …, vfc для л = 4» 2-

Рассмотрим теперь последний член последовательности (15:9), игру Гсть …,(7у – Она подпадает под рассмотрение (15:С:а) из п 15.5.1; эта игра вовсе не содержит ходов. Обозначим единственную возможную в ней партию через я = я (al7 . . ., crv) 1). Следовательно w в ней фиксирова­но 2) и равно cFi (я (а1? . . ., av)). Таким образом, мы получаем

(15:11) vab.. av/l ~ v(Xi,. crv/2 = <^1 (я (a1? …, <yv)).

Применим теперь (15:10) при x = v к (15:11; и далее последовательно к % — v — 1, . .., 2, 1. Таким способом мы получим

(15:12) Vj = v2 = v = Mo\Mol(ai) …1^”………………… …, <rv)).

Это еще раз доказывает, что игра Г вполне определена и дает в то же время явное выражение для значения игры.

15.7. Применение к о1ахматам

15.7.1. Рассуждения п. 6.4.1 и утверждения п. 14.8 об играх двух лиц с нулевой суммой, в которых предварение эквивалентно предшество­ванию, т. е. об играх, в которых имеет место полная информация, теперь уже обоснованы. Мы ссылались там на распространенное мнение, что такие игры обладают некоторыми свойствами рациональности; теперь мы придали этой расплывчатой точке зрения точный смысл, показав, что такие игры вполне определены. Мы показали также, что это справед­ливо и для игр, содержащих случайные ходы,— факт, в меньшей степени основанный на «общих соображениях».

В п. 6.4.1 были приведены примеры игр с полной информацией: шахматы (без случайных ходов) и трик-трак (со случайными ходами). Таким образом, для всех этих игр мы установили существование опреде­ленного значения (для партии) и определенных оптимальных стратегий. Однако существование таких стратегий доказано в абстрактном виде, и метод их построения в большинстве случаев слишком громоздок для эффективного применения 3).

В связи с этим стоит рассмотреть более подробно игру в шахматы.

Исходы игры в шахматы, т. е. множество значений функций ^ъ из п. 6.2.2 или п. 9.2.4, ограничиваются тремя числами 1, 0, —1 4). Таким образом, функции ^ из п. 11.2.2 принимают те же значения, и, посколь­ку случайные ходы отсутствуют, то же самое верно и для функций Жъ. из п. 11.2.3 5). Далее мы будем пользоваться функцией Ж — Ж^ из

п. 14,1.1. Поскольку Ж принимает только значения 1, 0, —lt число (15.13) v = max min^ (т1? т2) = min^max. Ж (т1? т2)

Tl Т2 Т2 Tl

равно однохму из чисел

v = l,0,f-l.

Мы предоставляем читателю провести простые рассуждения о том, что (15:13) означает следующее:

(15:D:a) Если v = 1, то игрок (белые) обладает стратегией, при кото­рой он «выигрывает» независимо от действий второго игрока (черных).

(l5:D:b) Если v =0, то каждый из игроков обладает стратегией, при которой он может гарантировать ничейный исход (или выиг­рыш) независимо от действий другого игрока.

(15 :D:c) Если v = — 1, то игрок2 (черные) обладает стратегией, при которой он «выигрывает» независимо от действий первого игрока (белых) 1).

15.7.2. Мы видим, что если теория шахмат была бы уже полностью известна, то в эту игру было бы неинтересно играть. Эта теория показала бы, какая из трех возможностей (15:D:a), (15:D:b), (15:D:c) в действитель­ности имеет место, и исход партии стал бы известен до начала игры: в случае (15:D:a) им был бы выигрыш белых, в случае (15:D:b) — ничья, и в случае (15:D:c) — выигрыш черных.

Однако наше доказательство, гарантирующее осуществление одного и* только одного из этих трех исходов, не дает практического метода оты­скания истинного исхода. Такая относительная трудность делает необ­ходимым использование неполных, эвристических методов игры, которые и составляют «хорошую» игру в шахматы; без этого в шахматах не было бы элементов неожиданности и борьбы.

15.8. Другой подход. Словесные рассуждения

15.8.1. Закончим этот параграф одним более простым и менее фор­мальным подходом к нашему основному результату о том, что игра двух лиц с нулевой суммой с полной информацией всегда вполне определена.

Можно оспаривать доказательность приводимой аргументации; мы предпочитаем сформулировать ее как правдоподобное рассуждение, с помощью которого оказывается возможным приписать значение каждой партии любой игры Г указанного вида, и оставляем возможность ее кри­тики. Мы не считаем необходимым показывать во всех деталях опровер­жение этой критики, поскольку мы получаем то же значение для партии игры Г, что и в пп. 15.4—15.6, где было дано вполне строгое доказательство,

При наличии случайных ходов Ж (т^ т2) выражает превышение версятЕости «выигрыша» над вероятностью «проигрыша». Игроки стремятся максимизировать или соответственно минимизировать это число, и строгая трихотомия, описанная в (15:D:a) — (15:D:c), вообще говоря, не получается.

Хотя трик-трак является игрой с полной информацией, содержащей случайные ходы, ее нельзя считать удачным примером для иллюстрации описанной выше воз­можности. Трик-трак играется с целью получения различных выигрышей, а не проста «выигрыша», «ничьей», «проигрыша», т. е. возможные значения функции %Fh не огра­ничиваются числами 1, 0, —1.


основанное на четко определенных понятиях. Ценность приводимых правдоподобных рассуждений заключается^ том, что они легче уясняют­ся и могут, быть повторены применительно к другим играм с полной информацией, выходящим за пределы класса игр двух лиц с нулевой суммой. Мы хотим здесь подчеркнуть, что та же критика приложима и в общем случае и что ее нельзя оставить без опровержения. Действи­тельно, решение в общем случае (даже для игр с полной информацией) будет найдено совсем иным путем. Наши рассуждения прояснят природу различия между случаем игр двух лиц с нулевой суммой и общим слу­чаем. Это будет достаточно важным для обоснования существенно отли­чающихся друг от друга методов, которые будут применяться в общем случае (см. § 24).

15.8.2. Рассмотрим игру двух лиц с нулевой суммой Г с полной информацией. Воспользуемся обозначениями^ п. 15.6.2, указав еЖ1г

ки к2 (00, . . (On <У2, . . 0^);

П/rkl Л^2(°1) ЛугМ01» ‘ ” V-l)

вероятности; операторы Moi, Мо£ > • • MGv ; последо­

вательность игр (15:9), полученную из Г, и функцию ± (л (аь. . av)).

Начнем исследование игры Г с последнего хода после чего пой­дем в обратном направлении через ходы e#V-M^-i, … Предположим сначала, что выборы <т1? а2, ..ov_i соответственно при ходах М2, … …, <3#v_i уже сделаны и совершается выбор ov (при ходе ©#v).

Если ход oSv случайный, т. е. если o2l…, orv_i) = 0, то av

будет принимать значения 1, 2, …, осг(а4, …, аг_4) соответственно с вероятностями jPv(l)? jPv(2), Pvfavfii, • cTv-i)). Поэтому матема­тическое ожидание выигрыша (игрока 1) ^i(3x(a1? av_b av)) будет равно

2 Pv (Оу) (я ((Ti, …, aV-i, av)).

Если o/Hy является личным ходом игрока £1 или 2, т. е. если fcv(0i9 °v_i) = 1 или 2, то игрок будет при выборе av максимизиро­вать или минимизировать JFi(n(Oi, av_i, Ov)), т. е. исходом игры будет тах#’1(л(а1, …, av-ь °л>)) или тт^г1(л(а1, …, av-1, av))-

^v av

Таким образом, во всех случаях математическое ожидание выигрыша (после выборов fy, …, av-i) равно

<<01………. …. <rv)).

Предположим, далее, что выбраны только…, av_2 (при ходах

…, c#v_2) и предстоит выбрать а^ (при ходе

Поскольку определенный выбор о^ приводит, как мы уже видели, к исходу (Jv”l)^r1 (я (al9 …, av)), который является функцией

только от…, gv-1 (так как операция <Tv’”l) связывает лере-

менную ov), мы можем поступить так же, как и раньше. Нам нужно только заменить v; alf…, av; (л (a1? …, av)) соответ­

ственно на v— 1; …, av. i;м1ц\(оь’^M^(°b”” °v-4V i (n (a4,. ..

av)). Следовательно, ожидаемый выигрыш в игре после выполнения

выборов…, av_2 равен

(0ь • • • • av-2)<(ai…….. (як…, crv)).

Аналогично математическое ожидание выигрыша в игре после выбо­ров Oi, …, av_з равно

<:[160]2(ai……… ^Mlizf1……………. 5 CTv))-

Наконец, математическое ожидание выигрыша во всей игре —перед тем как она началась — равно

… Mllzf1………… o^Mlf1………….. (n (a av)).

А это в точности совпадает со значением v из (15:12) в п. 15.6.2 х).

15.8.3. Основным возражением, против процедуры, описанной в п. 15.8.2, является то, что этот подход к «значению» для партии игры Г предполагает наличие «рационального» поведения всех игроков; иными словами, стратегия игрока 1 основана на предположении об оптималь­ности стратегии игрока 2, и наоборот.

Положим, в частности, kv-{ (al9 . . crv_2) = 1, kv (a4, . . ., ov^) = = 2. Тогда игрок 1 при ходе qMv-i выбирает av_! в предположении, что игрок 2 при ходе oMv выбирает ov «рациональным» образом. Един­ственным оправданием для такого предположения является то, что выбор ov_i приводит к выигрышу min JFi (я (ои. . ., crv)), т. е.

av

к MaJ(ai’ “” 0v_l) ^i (я (a4, . . ., av)) (см. определение cMv-i в п. 15.8.2).

Во второй части п. 4.2.1 мы пришли к заключению, что гипотезы о «рациональном» поведении противников следует избегать. Аргументация в п. 15.8.2 не удовлетворяет этому требованию.

Однако можно согласиться с тем, что в игре двух лиц с нулевой суммой можно предположить рациональность поведения противника, поскольку ошибки противника никогда не вредят игроку. Действительно, так как речь идет об игре с двумя участниками, и сумма их выигрышей равна нулю, любые потери, которые несет один игрок (в том числе вслед­ствие своей неразумности), необходимо оборачиваются равным по вели­чине выигрышем другого игрока 2). В таком виде этому соображению далеко до полноты, но оно может быть тщательно разработано. Однако для нас нет необходимости проводить здесь строгие рассуждения: мы рас­полагаем доказательством пп. 15.4—15.6, которое для такой критики неуязвимо [161]).

Те^м не менее предыдущие рассуждения могут оказаться значимыми для некоторого существенного аспекта вопроса. Мы увидим, как влияет изменение условий в более общем случае (без ограничения играми двух лиц с нулевой суммой, о котором говорилось в конце п. 15.8.1).

§ 16. ЛИНЕЙНОСТЬ И ВЫПУКЛОСТЬ

16.1. Геометрические основания

16.1.1. Задача, с которой нам сейчас придется иметь дело, заклю­чается в нахождении решений для всех игр двух лиц с нулевой суммой; нри этом мы встречаемся с трудностями, вытекающими из неполной определенности игры. Мы добьемся успеха, пользуясь теми же идеями, которым мы следовали в случае определенности: окажется, что эти идеи можно обобщить настолько, что будут охвачены все игры двух лиц с нуле­вой суммой. Для того чтобы это сделать, мы должны будем восполь­зоваться некоторыми возможностями теории вероятностей (см. пп. 17.1, 17.2). Кроме того, окажется необходимым также применение несколько необычного математического аппарата. Наш анализ в § 13 составляет одну его часть; для оставшегося удобнее всего будет возвращение к математико- геометрической теории линейности и выпуклости. Две теоремы о выпук­лых телах будут иметь особенное значение х).

По этим причинам мы перейдем к изучению — в той степени, в какой они нам понадобятся, — понятий линейности и выпуклости.

16.1.2. Подробный анализ понятия тг-мерного линейного (евклидова) пространства для нас не является необходимым. Достаточно будет ска­зать, что э^о пространство описывается п числовыми координатами. В соответствии с этим определим для каждого п= 1, 2, . . ., п-мерное линейное пространство Ln как множество тг-наборов вещественных чисел. Эти тг-наборы можно рассматривать также как функции xt переменной i с областью определения (1, . . ., п) в смысле пп. 13.1.2, 13.1.3 [162]). Мы, как это принято делать, будем называть i индексом, а не переменной; однако это не влияет на существо дела. В частности, мы имеем

…, Хп} = {у 1, …, Уп}

в том и только в том случае, когда xt = yt для всех i = 1, . . ., п (см. конец п. 13.1.3). Ln можно рассматривать также как простейшее возможное пространство числовых функций, заданных на фиксирован­ном конечном множестве (1, . . ., п) [163]).

Эти га-наборы чисел, или функции из Ln, мы будем называть точками или векторами пространства Ln и записывать как

(16:1) х = {х17 . .., хп).

Значения xt для фиксированного i — 1, . . ., п (значения функции хг)

—У

называются компонентами вектора х.


16.1.3. Отметим, хотя это для дальнейшего несущественно, что Ln является не абстрактным евклидовым пространством, а таким, в котором уже выбрана определенная система отсчета (система координат) *). \Н у левой вектор, или начало координат в Ln, имеет вид

0 = {0, …. 0}

п-координатными векторами пространства\ L п являются векторы 6′ = {0, . .., 1, . .., 0} – {бij, …, бnj}, 7 = 1, • • •, п,

где

( 1 для £ = lj ~~ \ 0 для i Ф

V

После этого вступления мы можем описать основные свойства векто­ров из Ln и основные операции над ними.

16.2. Операции над векторами

16.2.1 Основными операциями над векторами являются операции

умножения на скаляр, т. е. умножение вектора х на число t, и векторное сложение, т. е. сложение двух векторов. Обе эти операции определяются с помощью соответствующих операций над координатами векторов. Более точно:

Умножение на скаляр: t• {хи. . ., хп} = {txt1 . . txn}. Векторное сложение:

{хи …, хп} + {уи…, Уп} = {х1 + Уп +

Алгебра этих операций настолько проста и очевидна, что мы не будем на ней останавливаться. Отметим только, что указанные операции позво-

—У

ляют выразить каждый вектор х = {хи. . . , хп} через его компоненты и координатные векторы в виде

х= б[164]). i=l

Перечислим некоторые важные подмножества пространства Ln – (16:А:а) Рассмотрим линейное неоднородное уравнение

п

(16:2:а) 2 а4 – f = 6

i=i

(аь..Ь — постоянные). Случай ai = … =ал = 0 мы исклю­чаем из рассмотрения,. так как в этом случае вообще не будет

никакого уравнения. Все точки (векторы), удовлетворяющие этому уравнению, образуют гиперплоскость1).

<16:А:Ь) Пусть задана гиперплоскость


<16:2:а)

2 cLiXi = b;

i= 1



она определяет две части пространства Ln:

п

<16:2:Ь)


<16:2:с)

2 CLi^i < b. i= i


Это — два полупространства, порождаемые гиперплоскостью. Заметим, что если заменить а4, . . ., ап, b на —аи. . ., —ал, —Ь, то гиперплоскость (16:2:а) останется неизменной, однако полупростран­ства (16:2:Ь), и (16:2:с) поменяются местами. Следовательно, можно счи­тать, что полупространство задается неравенством (16:2:Ь). 1

—>■

{16: А:с) Пусть даны две точки (вектора) х и у и число £^0, для которого

—>■ ->

1 — тогда центром тяжести точек х, у с весами t, 1 — t

мы будем, в соответствии с механическими представлениями,

называть точку te + (1 — t) у. Равенства

х = {хи…, Хп}, У = {Уи Уп},

+ —= + —:t)yu txn + (i — t)yn}

делают это определение понятным.

Подмножество С пространства Ьп, содержащее все центры тяжести

своих точек (т. е. содержащее вместе с каждой парой своих точек х, у

Рис. И.

все точки вида Нх + (1 — t) у, 0 й t fS 1), называется выпуклым.

{Читатель видит, что в случае п = 2, 3, т. е. в случае обычных плоскости и простран­ства, это является принятым понятием выпук­лости. Действительно, множество всех точек

вида tx + (1 — t) у, 0 tg t ^ 1, представляет собой прямолинейный отрезок, соединяющий

точки х, у, сегмент [х, у]. Таким образом, вы­пуклым называется множество, содержащее вместе с любыми своими точками и соединяющий их сегмент. Рис. 11 поясняет это условие при п — 2, т. е. в случае плоскости.

16.2.2. Очевидно, что пересечение любого числа выпуклых множеств снова выпукло. Следовательно, для любого числа точек (векторов)

я1, . . ., хр существует наименьшее выпуклое множество, которое их всех содержит: пересечение всех выпуклых множеств, содержащих х1, . . ., хр. Это — выпуклое множество, натянутое на точки я1, . . ., хр. Полезно проиллюстрировать этот факт для случая плоскости. См. рис. 12,» где р = 6. Легко проверить, что это множество состоит из всех точек; (векторов) вида


(16:2:d)

2 tjx\ t^о,…, о,

3=1


где 2^ = 1.

j=i

Доказательство. Точки (16:2:d) образуют множество, содер-

—У —У

жащее все х1, . . ., хр. Действительно, чтобы получить представление для

х\ достаточно положить tj = 1, а все остальные tt = 0.

Точки (16:2:d) образуют выпуклое множество: если х = 2

3=1

и у = т0

j=i

-у 71

+ — 0 у= 2

3=1

где Uj=ttj + (l — t)sj.

-> —у

Любое выпуклое множество £), содержащее ж1, …, хр, содержит также и все точки (16:2:d). Докажем это индукцией по р.

Доказательство. Для /> = 1 это

очевидно, поскольку тогда Јi = l, и х1 бу­дет единственной точкой, принадлежащей множеству (16:2:d).

Предположим, что утверждение верно для р—1. Докажем, что оно верно и р-1

для р. Если 2 tp = то = … =

3=1

= tp_1 = 0 и точка* из (16:2:d) совпадает —>

с хр и, следовательно, принадлежит 2Х

р—1 р—1

Если 2 ^>0» т0 полагаем t= 2 j=i i=i р р-1

так что 1 — £ = 2*7- 2 = Следовательно, Положим sj =

i=l i=l

p-l

— tj/t для 7 = 1, …, — 1, 2 $7=1« Тогда из нашего предположения:

3=1

p-l

для /) —1 имеем, что 2 sj[165]* принадлежит D. Множество D выпукло, по-

з=1

этому

р-1

t 2 j=i

также принадлежит D. Однако этот вектор равен

р-1 ^ р

2 ^ 2 »

который, таким образом, также принадлежит D.

Доказательство завершено. |

Сами числа tu. . ., tp из (16:2:d) можно рассматривать и как компо-

—>

ненты вектора t = {tu. . ., tp} в Lp. Поэтому множество возможных значений вектора, которое определяется условиями

…,

и

‘ v

3=1

удобно как-то именовать. Мы будем обозначать его через Sp. Обозначим, далее, множество векторов t, удовлетворяющих только первой группе1



Рис. 13. Рис. 14.

^

предыдущих условий, т. е. ^ ^ 0, . . ., tv ^ 0, через Рр. Оба множе­ства Sp и Рр являются выпуклыми.

Изобразим графически случаи р = 2 (плоскость) и р = 3 (простран­ство). Р2 есть положительный квадрант — множество точек между положительными полуосями xt и х2 (рис. 13). Р3 есть положительный октант — пространство, заключенное между положительными полуося­ми xi, х2 и х3, т. е. между плоскими квадрантами, ограниченными парами хи х2; xt, х3; х2, х3 (рис. 14). S2 есть прямолинейный отрезок, пере­секающий Р2 (рис. 13). S з — плоский треугольник, аналогич­ным образом пересекающий Р3 (рис. 14). Полезно изобразить отдельно множества S2, S3 без Р2, Р3 (и тем более без L2, L3), в которые они естественно погружа­ются (рис. 15 и 16). На рисунках отмечены расстояния, пропорцио­нальные xl7 х2 и соответственно Xi, х2, х3.

(Подчеркнем еще раз: расстоя­ния, отмеченные на рис. 15 и 16 как х^ х2, х3, не являются самими координатами х^ х2, х3. Последние ле­жат в Ь2 или в L3 вне S2 или S3 и поэтому не могут быть изображены на S2 или на S3. Однако, как можно легко показать, они пропорциональны этим координатам.)

16.2.3. Другим важным понятием является понятие длины вектора. Длиной вектора х = {х^ . • .,. а^} называется

1×1=1/24.

i= 1

Расстоянием между двумя точками (векторами) называется длина взктора разности

I 1/ S (^г —г/г>[166] -

7 г=1

Таким образом, длина вектора х есть его расстояние от начала коорди-

—у t ч! ■

нат 0 *).

16.3. Теорема об опорной гиперплоскости

16.3. Установим теперь одно важное общее свойство выпуклых множеств.

—> —> —>.

{16:В) Пусть дано р векторов а?1, . . ., xv. Тогда вектор у либо принадлежит выпуклому множеству С, натянутому на векторы

х1, . . (см. (16:А:с) в п. 16.2.1), либо существует такая,

—>

содержащая у, гиперплоскость (см. (16:2:а) в п. 16.2.1), что множество С[содержится в одном из полупространств, порождае­мых этой гиперплоскостью (скажем, (16:2:Ь) в п. 16.211; см. (16:А:Ь) там же).

Это утверждение справедливо и в'том случае, когда выпуклое множе-

—>

етво, натянутое на а;1, . . ., хр,^заменено любым выпуклым множеством.



В такой форме это утверждение является основным рабочим аппаратом современной теории выпуклых множеств.

Картина в случае п = 2 (т/е. для плоскости) оказывается следую­щей. На рис. 17 изображено выпуклое множество С с рис. 12 (которое натянуто на конечное число точек), тогда как на рис. 18 изображено выпуклое множество С общего вида 2).

Прежде чем доказывать (16:В), заметим, что вторая альтернатива

явным образом исключает первую, поскольку у принадлежит гиперпло­скости, а не полупространству (т. е. выполняется (16:2:а), а не (16:2:Ь) из (16:А:Ь)).

Перейдем теперь к доказательству.

—►

Доказательство. Предположим, что у не принадлежит С.

Возьмем тогда точку из С, которая лежит ближе всего к г/, т. е. для кото­рой величина

1 z-2/|= S (2i — г/02

г= 1

достигает своего минимального значения.

Рассмотрим любую другую точку и из С. Тогда при любом t, для которого 0 t 1, tu + (1 — t) z также принадлежит С. Из свойства минимальности точки z (см. выше) мы имеем

т. е. или

2 {(2| - Vi) +1 (щ - zt)Y ^ 2 (z, - г/г)2.

г= 1 г=1

Выполняя элементарные алгебраические преобразования, мы получаем

п п

2 2 (Zi-yi)(ui-zi)t+ 2 (Ui-Zi)H^ 0.

i= 1 г= 1

Для £> 0 (причем, конечно, имеем, следовательно,

п п

г=1 г=1

Если t —> 0, то левая сторона неравенства стремится к

п

2 2 (zi — yt) (Ui — Zi)-

г=1

Таким образом,

(16:3) 2 (zt-Vi) (Щ-Zt)^ о/

г=1

Так как Ui — yi — (ui — zi)-f-(zi — yi), это означает следующее:

2 (*! - Vi) (Щ (Zt - У г)2 н * - у I2-

г=1 г=1

Далее, гфу (z принадлежит С, а г/ —нет); следовательно, — г/|2>0. Значит, и левая сторона неравенства >> 0. Мы получаем

(16:4) 2 &-Уг) Щ > 2 (zt - yt) Уи

г= 1 г=1

И

Дш, Нейман, О. Моргенштерн

Положим cii = — yi\ тогда случай ai= ... =ап = 0 исключается, так как ъфу (см. предыдущие рассуждения). Положим также b= 2j aiVi - Таким

г= 1

образом, равенство


(16:2:а*)

2 diXi = Ъ

г=1


определяет гиперплоскость, которой точка г/, очевидно, принадлежит. Далее, пусть

2 diXi > ъ i= 1

(16:2:Ь*)

— полупространство, порожденное этой гиперплоскостью; тогда (16:4) —>

утверждает, что и принадлежит этому пролупространству.

Поскольку и — произвольный элемент из С, доказательство завершено.

Это алгебраическое доказательство можно провести также на геомет­рическом языке.

Сделаем это сначала для случая п = 2 (т. е. для плоскости). Ситуация

—> —>

изображена на рис. 19: z — точка из С, ближайшая к данной точке у;

Рис. 19.

Гиперплоскости (16-3) Рис. 20.


это значит, что расстояние | z — у | принимает на z свое минимальное

значение. Поскольку у и z фиксированы, а и—переменная точка (при­надлежащая С), неравенство (16:3) определяет гиперплоскость и одно

—>

из полупространств, порожденных ею. Легко проверить, что z принадле-

—>

жит этой гиперплоскости и сама гиперплоскость состоит из точек и,

для которых эти три точки образуют прямой угол (т. е. для которых -> ->

векторы z — у и и — z ^ортогональны). Фактически это означает, что

п

2 (zi — Уг) (щ — Zf) = 0. Очевидно, что все множество С должно лежать

г=1

на этой гиперплоскости или по ту сторону от нее, которая не содержит у.

—>

Если какая-либо точка и из С лежала бы на г/-сторонечто нашлись бы точ-

~> —> ——У

ки из сегмента [z, м], лежащие ближе к г/, чем z. (См. рис. 20. Вычисления на страницах 161—162, в надлежащей интерпретации, именно это и пока­зывают.) Поскольку С содержит зима, следовательно, и весь сегмент

-У ->•

[z, и], это противоречит утверждению о том, что точка z является ближаи – шей точкой к у из точек множества С.

Переход от (16:3) к (16:4) соответствует параллельному перено­су гиперплоскости I в положение II (параллельному, ибо коэффициенты

at = zt — yt при Ui, i = 1, . . ., n, не изменяются.) Теперь у принадле­жит гиперплоскости, а С — порожденному ею полупространству (рис. 21). Случай п = 3 можно наглядно представить себе сходным образом. Такой геометрический способ рассуждений можно распростра­нить и на произвольное п. Если читатель сможет убедить себя в том, что он обла­дает тг-мерной «геометрической интуицией)), то Предыдущие рассуждения могут быть вос­приняты как доказательство, верное в прост­ранстве п измерений. Можно даже избежать и этого, рассуждая следующим способом. Како­во бы ни было п, доказательство имеет дело одновременно только с тремя точками, а именно

с точками у, z, и. Через три точки всегда мож – Рис. 21.

но провести плоскость (двумерную). Если мы

будем рассматривать только эту плоскость, то рис. 19—21 и связанные с ними рассуждения могут быть использованы без дополнительной ин­терпретации.

Как бы то ни было, приведенное выше чисто алгебраическое дока­зательство является абсолютно строгим. Мы привели геометрические ана­логии главным образом в надежде, что это облегчит понимание алгебраи­ческих выкладок, выполненных в ходе доказательства.

16.4. Теорема об альтернативах для матриц

16.4.1. Теорема (16:В) позволяет сделать очень важный для нашей дальнейшей работы вывод.

Мы начнем с рассмотрения прямоугольной матрицы в смысле п. 13.3.3 с п строками и т столбцами и элементами a(i, у). (См. рис. И в п. 13.3.3, где ср; х, г/, t, s соответствуют нашим a, i, /, п, т.) Иными словами, a (£, /) является совершенно произвольной функцией двух переменных i = 1, . . ., п и / = 1, . . т. Построим некоторые векторы из Ьп.

Для каждого j = 1, . . ., т возьмем вектор Xs = {xJv . . ., xh] с х{=

= а (i, 7), а для каждого I = 1, . . ., п — координатный вектор б – = == {$ц} (см. конец п. 16.1.3; мы здесь заменили j на Z). Применим теперь

теорему (16:В) из п. 16.3 в случае р = п-\-ткп-\-т векторам х1, …

. . ., хт, б1, . . ., бп (которые выступают в роли х1, . . ., хр). Положим

9 = 0.

Выпуклое множество С, натянутое на х1, . . ., хт, б1, . . ., бп, может содержать 0. Если это имеет место, то из (16:2:d) в п. 16.2.2 следует, что

т п

2^’=о,

j= 1 1 г=1

где

(16:5) fj^O, «1^0,

т п

(16:6) 2^+2^ = 1

3=1 1=1

и*

(мы заменили Z1? tp на tu…, tm, s^ sn). В покомпонентной записи это равносильн^

т п

2tja(i, /)+ 2*^ = 0. j=i z=i

Второе слагаемое слева равно так что можно написать

т

(16:7) 2 i)tj=

j= i

т

Если бы имело место 2 * / ^ 0» т0 были бы справедливы равенства =

i=i

= . . . = — 0 и, следовательно, из (16:7) вытекало бы, что — . . . =

т

Это, однако, противоречит (16:6). Следовательно, 2 tj>0. Заменим

3=1

равенство (16:7) его следствием

т

(16:8) Sa(Ј, 0.

j= i

m / 771

Положим теперь tj! 2 tj для / = 1, .. ., иг. Тогда мы получим 2 #7 = 1»

j=i j=i и (16:5) дает нам rqgrO, …, Следовательно,

(16:9) х = {хи. . .,

и (16:8) приводит к условию

т

(16:10) для / = 1, …, гг.

, i=i

Рассмотрим, с другой стороны, случай, когда С не содержит 0. Теорема (16:В) из п. 16.3 позволяет нам сделать вывод о существо-

вании такой содержащей у гиперплоскости (см. (16:2:а) из п. 16.2.1), что множество С содержится в полупространстве, порожденном этой гипер­плоскостью (см. (16:2:Ь) из п. 16.2.1). Обозначим эту гиперплоскость через

п

2 atXi = Ъ.

г=1

Поскольку 0 принадлежит ей, то Ъ — 0. Таким образом, рассматриваемое полупространство имеет вид

п

(16:11) 2ад>0.

г=1

Векторы ж1, …, ж771, б1, …, бп принадлежит этому полупространству. При записи этого факта для 6г неравенство (16:11) принимает вид

п

2йг6гг>0, т. е. ai> 0. Таким образом, мы получаем (16:12) а4>0, ап>0.


165

§ 16]

ЛИНЕЙНОСТЬ и выпуклость

При аналогичной записи для х3 мы получаем

п

(16:13) За (г, j)at>0.

п

Положим теперь м;г = а[167]/2аг Для ^ • п. Тогда мы получаем

2=1

П

2 Wi = 1, и (16:12) дает нам. .

2=1

Следовательно,

(16:14) w — {wl, . .., и;*}^*.

Неравенство (16:13) дает нам

п

(16:15) ])т>0 для / = 1, . т.

2=1

Объединяя соотношения (16:9), (16:10), (16:14), (16:15), мы можем утверждать следующее:

(16:С) Пусть задана прямоугольная матрица с т столбцами и п стро­ками. Обозначим элементы этой матрицы через a (i, 7), i — = 1, . . ., п; 7 = 1, . . т. Тогда либо существует такой вектор

х = {хи . . хт} £ Sm, что

т

(16:16:а) 2 а (*> /) хз = 0 для i = 1, . . ., п,

3=1

либо такой вектор w = {iЈ?4, . . ., g Sn, что

п

(16:16:b) j)u>i>0 для 7 = 1, т.

2=1

Заметим, далее, следующее:

Альтернативы (16:16:а) и (16:6:Ь) исключают друг друга. Доказательство. Предположим, что (16:6:а) и (16:16:Ь) имеют место одновременно. Умножим каждое из неравенств (16:6:а) на Wi и просуммируем по всем i = 1, . . ., п; это дает нам

п т

2 2а (*» /) ^ о»

2=1 j=l

Умножим, далее, каждое из неравенств (16:16:Ь) на и просуммируем по 7 = 1, …, т; это дает нам

n т

2 j)wixj>01).

2=1 i=i

Таким образом, мы получаем противоречие.

16.4.2. Заменим матрицу a (i, 7) отрицательно транспонированной к ней матрицей; это значит, что мы обозначим столбцы (а не строки,

как раньше) через i = 1, . . п и строки (а не столбцы, как раньше) через 1, . . т. Пусть, далее, элементами матрицы будут — а (i, /) (а не a (i, /), как раньше). (Таким образом, числа пи т также поменялись ролями.)

Сформулируем окончательный результат п. 16.4.1 для новой матрицы

в терминах первоначальной матрицы. Пусть при этом х = . . хт) « -> ->

играет роль w = {w^ . . ., wn}, a w = {м^, . . ., w’n} играет роль.

X — • *

Мы получим следующее:

(16:D) Пусть прямоугольная матрица с п строками и т столбцами

задана. Обозначим элементы этой матрицы через a(i, 7), i = 1, …, п,

7 = 1, . . ., т. Тогда либо существует вектор х’ = . .., я™} 6 Зт»

для которого выполняется

т

(16:17:а) 2 я(*\7)я}<0, г = 1, .тг,

i=i

либо существует вектор = …, w’n}ЈSn, для которого выполняется

п

(16:17:Ь) 2

г= 1

Эти две альтернативы исключают одна другую.

16.4.3. Объединим результаты пп. 16.4.1 и 16.4.2. Из них следует, что выполняются либо (16:17:а), либо (16:16:Ь), либо, наконец, (16:16:а) и (16:17:Ь) одновременно; эти три возможности исключают друг друга.

Используя ту же самую матрицу a(i, 7) и переобозначая х, w, х\ w’

из пп. 16.4.1, 16.4.2 через х’, w, х, w’, мы получаем следующее:

—V

(16:Е) Либо существует вектор х = {х1у…, xm}ЈSm, для которого

т

(16:18:а) 2 a(i, j)xj<.0 для i= 1, …, п,

—У

либо вектор м; = для которого

п

(16:18:Ь) 2 ])т<0 для 7 = 1, …, т,

г=1

-> —>

либо два вектора: = …, x’m}^Sm и w’ = {w’v…, w’n}ЈSn, для которых

т

2 a (U 7) Щ = 0 Для i = 1, …, п,

(16:18:с)

п

Комбинируя (16:18:а) и (16:18:с), с одной стороны, и (16:18:Ь) и (16:18:с), с другой, мы получаем более простое, однако более слабое утверждение [168]):

(16:F) Либо существует вектор х = {х^ …, xm}ЈSm, для которого

т

(16:19:а) 2 a(h 1) xj ^ 0 Для i= 1, ..п,

0=1

либо существует вектор w = {w1, гг^б^, для которого

п

(16:19:Ь) 2 О^^О для / = 1, …, т.

2=1

16.4.4. Рассмотрим теперь кососимметрическую матрицу a(i, 7), т. е. такую матрицу, которая совпадает со своей отрицательно транспониро­ванной в смысле п. 16.4.2; в этом случае должно быть п = т и

a(i, j)= — а (7, i), i, f=l, .n.

Тогда условия (16:19:a) и (16:19:b) из п. 16.4.3 выражают одно и то же. Действительно, (16:19:Ь) записывается как

п

2 а (£, 7) ^ ^ 0;

г=1

это можно переписать как

71 П

— 2 а (/» 0 ^г = 0 ИЛИ 2 Я (*» 7) wi = 0.

г=1 г = 1

Нам остается взять 7, £ вместо i, 7 [169]), и мы получаем

71 п

2 я /) wj = 0, а затем взять я; вместо о?, и мы получаем 2 а (U j) Xj ^ j=i. i=l fg 0. Мы установили (16:19:а).

Таким образом, мы можем заменить дизъюнкцию неравенств (16:19:а) и (16:19:Ь) на одно из них, например на (16:19:Ь). В результате мы полу­чаем:

(16:G) Если

матрица a(i, 7) является кососимметрической (поэтому п = т), то существует вектор w = {w1, …, wn} из Sn, для которого

п

2 а (£• 7) ^ 0 для 7 = 1, …, п.

2=1


§ 17. СМЕШАННЫЕ СТРАТЕГИИ. РЕШЕНИЕ ВСЕХ ИГР 17.1. Два элементарных примера

17.1.1. Для того чтобы преодолеть трудности в случае неполной определенности, который мы рассматриваем, в частности, в п. 14.7, лучше всего возвратиться к простейшим примерам. Это игра в «орлянку», а также игра «камень, мешок и ножницы» (см. пп. 14.7.2 и 14.7.3). Поскольку существует основанное на здравом смысле отношение к «проблемам», возникающим в этих играх, мы надеемся получить ключ к нахождению решения в случае неполной определенности игры двух лиц с нулевой суммой, рассматривая и анализируя это отношение.

Уже было замечено, что при игре в «орлянку» ни один из способов игры (ни выбор «герба», ни выбор «решетки является лучшим»), не и един­ственное, что имеет смысл,— это раскрыть намерения противника. Это, на первый взгляд, преграждает путь к решению, так как правила игры запрещают игрокам получать информацию’ о выборах противника в момент совершения хода. Однако это обстоятельство не соответствует реальному положению дел: в игре в «орлянку» против мало-мальски разумного противника игрок не будет стремиться обнаружить намерения противника, а постарается скрыть свои собственные намерения, выбирая в последо­вательных партиях «герб» и «решетку» без какой-либо, закономерности* Таким образом, если мы попытаемся описать стратегию в одной партии — так как в действительности нам приходится рассматривать одну партию, а не целую их последовательность, — то предпочтительнее всего выразить это следующим образом. Стратегия игрока состоит не в выборе «герба» и не в выборе «решетки», а в выборе «герба» с вероятностью 1/2 и «решет­ки» с вероятностью 1/2.

17.1.2. Можно представить себе, что рациональный способ игры в «орлянку» состоит в том, чтобы перед совершением выбора в партии выбрать решение играть «герб» или «решетку» г) с помощью некоторого случайного устройства 50:50. Дело в том, что такая процедура предохра­няет игрока от потерь. Действительно, что бы ни делал противник, ожидае­мый выигрыш игрока равен нулю [170]). Это верно, в частности, и тогда, когда противник играет «герб», и тогда, когда он играет «решетку», и тогда, когда он играет «герб» и «решетку» с некоторыми вероятностями [171]).

Следовательно, если мы разрешим игроку в игре в «орлянку» исполь­зовать «статистическую» стратегию, т. е. «смешивать» возможные способы игры с некоторыми вероятностями (выбираемыми им самим), то он сможет избежать потерь. Действительно, выше мы определили статистическую стратегию, применяя которую игрок не может проиграть независимо от того, что бы ни делал его противник. То же самое верно и для против­ника, т. е. он может применять статистическую стратегию, которая не даст игроку выиграть независимо от его действий [172]).


Читатель может заметить большое сходство этих рассуждений с рас­суждениями из п. 14.5 [173]). С этой точки зрения является вполне законным рассматривать нуль как значение партии для игры в «орлянку», а стати­стическую смесь «герба» и «решетки» в пропорции 50:50 — как оптималь­ную стратегию.

Ситуация в игре «камень, мешок и ножницы» вполне аналогична. Здравый смысл подсказывает, что оптимальный способ игры заключается в выборе каждой из трех альтернатив с вероятностями 1/3 [174]). Значение партии, как и обоснование качества такой стратегии, может быть моти­вировано так же, как и в предыдущем сдучае [175]).

17.2. Обобщение изложенной точки зрения

17.2.1. Представляются правдоподобными попытки распространить результаты, полученные для игр в «орлянку» и в «камень, мешок и нож­ницы», на все игры двух лиц с нулевой суммой.

Мы будем иметь дело с нормальной формой игры, принимая, как и раньше, т4 = 1, . . ., Pi и т2 = 1, . . (32 в качестве возможных выборов игроков и считая выигрыш игрока 1 равным Ж (х^ т2). Мы не де­лаем здесь предположений о полной определенности игры.

Попытаемся повторить процедуру, оказавшуюся успешной в п. 17.1. Это значит, что мы будем рассматривать игроков, для которых «теория» игры заключается не в выборе определенных, стратегий, а в выборе нескольких стратегий с определенными вероятностями [176]). Таким образом, игрок 1 будет выбирать не число т4 = 1, . . ., т. е. не стратегию 2*1, а чисел. . ., — соответственно вероятности стратегий 2}, . . 201. Аналогично игрок 2 будет выбирать не число т2 = = 1, . . ., р2, т. е. не стратегию 2J2, а |32 чисел т|1? . . ., г)з2, которые являются вероятностями стратегий 2J, . . ., 2f2. Поскольку эти вероят­ности относятся к попарно несовместимым и единственно возможным альтернативам, числа и r)t2 подчиняются условиям

(17:1 :а) 2Јtl = l,

т3=1 32

(17:1:Ь) ть^О, 2 Лт2 = 1

т2=1

и никаким другим.

Образуем векторы £ = . . ., и rj = {r^, . . ., г]32}. Только

что выписанные условия означают, что £ £ а т] £ S$2 (см. п. 16.2.2).

При таком положении дел игрок выбирает не стратегии, как раньше, а только вероятности, с которыми он использует их в партии. Это обобщение встречается со значительными трудностями в случае не полной определенности. Мы видели, что характеристической чертой этого случая являются потери*) игрока, если его намерения становятся известными противнику. Поэтому в такой игре для игрока является очень важным скрыть от противника свои намерения [177]). Случайный выбор нескольких раз­личных стратегий, для которых определенными являются только их вероят­ности, представляется весьма эффективным для этого путем. При такой игре противник не может узнать, какую стратегию выберет игрок, поскольку последний сам этого не знает [178]). Незнание является, конечно, самой лучшей гарантией против прямого или косвенного раскрытия информации.

17.2.2. Может показаться, что в данном случае мы несколько огра­ничили свободу действий игрока. Может случиться, что он захочет играть одну определенную стратегию, исключив все остальные, или, желая выбирать некоторые стратегии с определенными вероятностями, захочет полностью исключить возможность выбора остальных [179]). Мы подчерки­ваем, что такие возможности находятся целиком в рамках нашей схемы. Игрок, не желающий играть те или иные стратегии, просто будет выбирать каждую из них с вероятностью нуль. Игрок, желающий играть одну определенную стратегию, исключив все остальные, выберет ее с вероят­ностью единица, а все остальные — с вероятностью нуль.

Таким образом, если игрок 1 захочет играть 2*1, то он в качестве

вектора | выберет координатный вектор 6Ti (см. п. 16.1.3). Аналогично,

если игрок 2 захочет выбрать стратегию EJ2, то он выберет в качестве г\

вектор 8t2. В свете предыдущих рассмотрений мы будем называть вектор

| £ S^ или вектор г] £ статистической или смешанной стратегией

соответственно игроков 1 или 2. Координатные векторы STl или бТ2 отве­чают, как мы уже видели, первоначальным стратегиям xt или т?, т. е. SJ1 или E2t2 игроков 1 или 2. Мы будем называть их точными или чистыми стратегиями.

17.3. Оправдание процедуры применительно к отдельной партии

17.3.1. На данном этапе читатель может почувствовать неудобство и усмотреть противоречие между двумя точками зрения, которые мы в наших рассуждениях считали одинаково реалистичными. С одной стороны, мы всегда настаивали на том, что наша теория является стати­ческой (см. п. 4.8.2) и что мы исследуем течение одной партии, а не последо – вательности партий (см. п. 17.1). Однако, с другой стороны, мы поставили в центр внимания рассуждения, касающиеся опасности угадывания стратегии игрока его противником (см. пп. 14.4, 14.7.1, и, наконец, послед­нюю часть п. 17.2). Как же можно иначе обнаружить стратегию игрока, в особенности если он осуществляет случайную смесь различных страте­гий, как не путем продолжительного наблюдения! Мы вывели, что эти наблюдения должны распространяться на несколько партий. Для этого необходимо провести их в каждой отдельной партии. Если правила игры таковы, что допускают подобные наблюдения, т. е. если они ведут к повто­ряющимся партиям, то наблюдения могут дать эффект только постепенно и последовательно в ходе партий. Они не будут доступными в начале. Все будет связано с различными динамическими рассмотрениями, в то время как мы настаиваем на статичности теории! Кроме того, правила игры могут вообще исключать возможность наблюдений *), как это имеет место в «орлянке» или в игре «камень, мешок и ножницы». Эти конфликты и противоречия возникают как в рассуждениях в § 14, где мы не исполь­зовали понятия вероятности в связи с выбором стратегий, так и в рас­суждениях § 17, где вероятности используются.

Как следует их разрешить?

17.3.2. Наш ответ будет таким.

Начнем с того, что доказательства последних результатов в §§ 14 и 17, т. е. рассуждения из пп.14.5 и 17.2, не содержат этих элементов проти­воречия. Таким образом, мы можем утверждать, что наши окончательные результаты справедливы, хотя эвристические процедуры, ведущие к ним, можно оспаривать.

Но даже эти процедуры можно обосновать. Мы не идем здесь на ус­тупки. Наша точка зрения статическая, и мы анализируем одну-един – ственную партию. Мы пытаемся создать удовлетворительную теорию — на данном этапе — для игры двух лиц с нулевой суммой. Следовательно, мы занимаемся не дедуктивной аргументацией на прочной основе какой – либо существующей теории, которая уже выдержала все разумные испы­тания, а занимаемся поисками такой теории [180]). В этих целях вполне законным для нас является использование аппарата обычной логики и, в частности, косвенного доказательства. Такой аппарат состоит из пред­положения о наличии некоторой удовлетворительной теории некоторого нужного типа [181]) и попыток обрисовать следствия из воображаемой логи­ческой ситуации и затем из заключений о том, какой же должна быть наша гипотетическая теория. Если применение этого процесса окажется успешным, то он может настолько сузить возможности для такой гипо­тетической теории, что останется только одна возможность; это и означает, что теория определена и открыта именно этим способом[182]). Конечно,

может быть и так, что приложение этого метода оказывается более, чем «успешным» и сужает число возможностей до нуля; это доказывает, что непротиворечивая теория желаемого вида немыслима *).

17.3.3. Предположим, что существует теория игр двух лиц с нулевой суммой, которая указывает игроку, как ему действовать, и она является абсолютно убедительной. Если бы игроки знали такую теорию, то каждый из них предположил бы, что его стратегия раскрыта его противником. Противник знает теорию и также то, что для игрока было бы неразумным не следовать ей [183]). Таким образом, предположение о существовании удовлетворительной теории узаконивает наше исследование ситуации, в которой стратегия игрока «раскрывается» его противником. Удовлетво­рительная теория [184]) может быть построена только в том случае, если удастся гармонизировать две крайности и Г2, когда «раскрыты» стра­тегии игрока 1 и когда «раскрыты» стратегии игрока 2.

Для первоначальной трактовки предмета — без использования поня­тия вероятности (т. е. с одними чистыми стратегиями) — границы, до кото­рых можно распространить теорию, были определены в п. 14.5.

Мы видели, что случай полной определенности является именно тем случаем, при котором на этой основе существует удовлетворительная теория. Постараемся теперь продвинуться дальше, используя вероятности (т. е. смешанные стратегии). Мы снова пустим в ход способ анализа рас­крытия стратегии другого игрока, которым мы воспользовались в п. 14.5, когда никаких вероятностей не было.

Окажется, что теперь гипотетическая теория может быть определена полностью и во всех случаях (а не только в случае полной определенности см. пп. 17.5.1 и 17.6).

После того как теория найдена, ее нужно независимо обосновать путем прямой аргументации [185]). Это было сделано в случае полной опре­деленности в п. 14.5, а для нашей общей теории мы сделаем это в п. 17.8.

17.4. Минорантная и мажорантная игры (для смешанных стратегий)

17.4.1. Воплощение нашей идеи состоит в том, что игрок 1 выбирает произвольный элемент £ £ S$v а игрок 2 выбирает произвольный эле­мент г] £

Если игрок 1 захочет играть только стратегию SJ1, то он должен

—у ->

в качестве | выбрать координатный вектор Sri (см. п. 16.1.3); аналогично, если игрок 2 захочет играть стратегию то он должен в качестве г] выбрать 8Т2.

Мы предполагаем, что игрок 1 производит выбор £ независимо от вы­бора игрока 2, и наоборот.

Смысл этого состоит, конечно, в том, что после того, как выборы сделаны, игрок 1 фактически использует каждую из стратегий т4 = 1, . . ., Pi с вероятностями |Т1, а игрок 2 использует стратегии т2 = 1, …» Ра с вероятностями г\Х2. Поскольку выборы игроков не­зависимы, математическое ожидание выигрыша равно

-> 32

(17:2) К (g, т|)= 2 2 & Ъ) 5тхТ1т2.

Ti=1 т2=1

Иными словами, мы заменили первоначальную игру Г некоторой новой игрой, которая имеет, по существу, такую же структуру, но обла­дает, однако, и некоторыми формальными отличиями.^Числа Ti и т2 (выбо­ры игроков) заменены теперь векторами | и т). Функция Ж (т4, т2) — выигрыш или, точнее, «математическое ожидание» выигрыша в игре —

заменена на К (£, г]). Все это указывает на идентичность нашей данной точки зрения на игру Г с той, которая была изложена в п. 14.1.2 (с един-

ственной разницей, заключающейся в замене т4, т2, Ж(т1? т2) на т),

К (£, г])). Этот изоморфизм указывает нам на возможность приложения тех же самых методов, которыми мы пользовались для исследования первоначальной игры Г, а именно сравнения с мажорантной и минорант – ной играми Ti и Г2, как это было описано в пп. 14.2, 14.3.1, 14.3.3.

17.4.2. Таким образом, в игре Г4 игрок 1 выбирает свой вектор |

первым, а игрок 2 выбирает г\ после него, имея уже полную информацию

о векторе выбранном противником. В Г2 порядок выбора изменен на противоположный. Поэтому рассуждения из п. 14.3.1 здесь применимы

дословно. Игрок 1, выбирая может ожидать, что игрок 2 будет выби­рать т) с целью минимизировать К (|, г]), т. е. что выбор игроком 1 I ведет к min К (£, Г]). Это функция только от следовательно, игрок 1 должен

выбрать I так, чтобы максимизировать min К (£, т)). Таким образом,

—>

л

значение для партии игры Г^ (для игрока 1) равно

—> —>

= max min К (£, т]).

6 л

Аналогично мы получаем, что значение для партии игры Г2 (для игрока 1) равно

v2 = min max К (£, т]).

л Т

(Очевидное допущение о рациональном поведении противника не играет в действительности никакой роли, поскольку утверждения (14:А: а) — (14:А:е), (14:В:а) — (14:В:е) из пп. 14.3.1 и 14.3.3 применимы здесь дословно.)

Как это делалось в п. 14.4.1, можно обосновать тот очевидный факт, что игра Г1! менее благоприятна для игрока 1, чем Г2, т. е. что

Если в справедливости этого возникнут какие-либо сомнения, то напом­ним, что строгое доказательство содержится в (13:А *) в п. 13.4.3. Употреб-

ляемые там выражения х, у, ф соответствуют нашим т), К *). Если окажется, что

V1 == V2>

то рассуждения из п. 14.5 применимы дословно. Утверждения (14:С:а) —

(14:C:f), (14:D:a), (14:D:b) определяют понятия оптимальных £ и г] и устанавливают «значение» партии (для игрока 1):

Согласно (13:В) в п. 13.4.3, все это происходит в том и только в том слу­чае, когда существует седловая точка функции К (переменные х, г/, ф

соответствуют нашим т|, К).

17.5. Полная определенность в общем случае

17.5.1. Мы заменили v4 и v2 из (14:А:с) и (14:В:с) на у^и у2, и преды­дущее обсуждение показывает, что последние могут играть роль первых. Однако мы теперь в такой же степени зависим от равенства у[ — у2, как раньше от v4 = v2. Естествен поэтому вопрос: приобрели ли мы что либо в результате такой замены?

Очевидно, что приобрели, если, имея равенство v^ = у2 (для любой заданной игры Г), мы располагаем лучшими перспективами, чем имея равенство v4 = v2. Мы называли игру Г вполне определенной, если имели Vi = v2. Нам представляется целесообразным фиксировать теперь раз­личие и называть игру Г в случае v4 = v2 вполне определенной в частном, а в случае v^ = V2 вполне определенной в общем. Такая терминология будет правомерной только в том случае, когда из первого будет следовать второе.

С точки зрения здравого смысла эта импликация вполне правдоподобна. Введение смешанных стратегий увеличивает возможность игрока оборо­няться против раскрытия его стратегии противником; поэтому можно ожидать, что числа у[ и у'2 действительно лежат между v4 и v2. Иными словами, можно утверждать, что (17:3) Vi^ v;^ у2^ v2

(это неравенство гарантирует, конечно, правомерность использования только что упомянутой импликации).

Чтобы устранить все возможные сомнения, дадим строгое доказа­тельство неравенства (17:3). Это удобно сделать как следствие другого утверждения.

17.5.2. Докажем вначале такую лемму:

(17:А) Для любого

^ Pi Р2 Pi

min К (I,-л) = min 2 2 Ж r2)lXlr\X2^mm 2 SP (rlt т2) gTl.

Tl— 1 T2=l T2 Ti=l

Л Л

Для любого Tfl^fc

^ ^ Pi fc 02

max К (£, г]) = max ^ 2 ^ fa, т2) £Т1%2 = max 2 W fa» Ъ) Цт2-

1 T^l Т2-1 Tl Т2=1

Доказательство. Докажем только первую из этих формул; доказательство второй в точности такое же, надо только заменить max

на min, а также fg на.

—х’

Если в качестве г\ взять вектор б [186] (см. п. 16.1.3 и конец п. 17.2), то мы получим

Pi 02 Pi Р2

min 2 2 № fa» тг) 2 2 Ж fa» т2) StA2tJ =

^ T1==lt2=l Ti=lT2=l

Pi

= 2 ж (ti, т;) iXl.

n=l

Посколько это верно для всех т2, то

Pi Р2 Р_1

(17:4:а) min 2 2 fa» т2) ЈTlT]T2^min 2 fa» т2) ^п-

Ti=lT2=l Т2 Ti=l

Л

С другой стороны, для всех т2

Рг Pi

2 W fa» т2) ETl ^ min 2 Ж fa» т2)

Ti=l Тг Ti=l

Возьмем произвольное г) £ умножим обе стороны этого % нера-

Р2

венства на т]Т2 и просуммдруем по т2=1, . .., |32. Поскольку 2 Лт*—1»

Т2=1

мы получим

Pi Р2 Pi

2 2^ (Tlf т2) 1Х1У]Х2 ^ min 2 ^ fa» Та)

П=1 T2=l Т2 Ti=l

Так как это верно для всех т], то должно быть

(17:4:Ь) min | | Ж (т„ т2) |TliT2 2= min 2 Ж (т„ т2) tTl.

л Ti= 1 Т2= 1 Т2 Ti= 1

Теперь (17:4:а) и (17:4:Ь) дают требуемое соотношение.

Сопоставляя написанные формулы с определением у^ и \2 из п. 17.4, мы получаем

Pi

(17:5:а) v^ max min 2 (Ti> тг) lxv

t2 ti=l 02

(17:5:b) v^ min max 2 (Ti> ^г) ‘Птг-

Tl T2= 1

Л

Эти формулы допускают простую словесную интерпретацию. При вычис­лении Vj мы заботимся только о защите игрока 1 от раскрытия против­ником его стратегии, что выражается в использовании | (вместо т^; игрок 2 может при этом действовать по-старому и использовать т2 (вме­сто г]). При вычислении v2 роли игроков меняются. Это понятно и с точки зрения здравого смысла: у^ относится к игре (см. пп. 17.4 и 14.2); там игрок 2 выбирает после игрока 1 и полностью информирован о выборе 1; следовательно, он не нуждается в защите от раскрытия его собственной стратегии игроком 1. Для числа относящегося к Г2, роли игроков меняются.

Значение у^ не увеличится, если в приведенной выше формуле огра-

—►

ничить переменную | в операции max. Ограничим значение вектора £

т

векторами 6Ti (Тз = 1, . . Pi) (см. п. 16.1.3 и конец п. 17.2). Поскольку

31

2 т2)6 j = 3ST(t;, т2),

Ti=1

наше выражение заменяется на

max min Ж (т^, т2) — v^ т’ т2

Таким образом, мы показали, что

vi ^ у;.

Аналогично (см. замечание в начале доказательства последней леммы), ограничивая г] векторами rj = 6 2, мы получаем

Вместе с vjfgv^ (см. п. 17.4) это дает нам (17:3)

что и требовалось.

17.6. Доказательство основной теоремы

17.6. Мы установили, что полная определённость в частном смысле (vi = v2) влечет полную определенность в общем смысле (v^ = v2). То, что полная определенность в общем может иметь место и тогда, когда полная определенность в частном не имеет места, т. е. что v^ = v2 и в то же время Vi Ф v2, видно из примеров «орлянки» и игры «камень, мешок и ножницы» 1). Поэтому мы можем утверждать, что переход от полной определенности в частном смысле к полной определенности в общем смысле действительно является шагом вперед. Однако на данный момент мы не знаем, относится ли это ко всем играм; может оказаться, что суще­ствуют такие игры Г двух лиц с нулевой суммой, которые не вполне определены даже в общем: мы еще не исключили возможности неравенства

v;<v;.

Если эта возможность реализуется, то все сказанное в п. 14.7.1 будет снова применимо и даже более широко: раскрытие стратегии против­ника будет составлять определенное преимущество

A’ = v;-v;>0,

и трудно себе представить, как может быть построена теория такой игры без дополнительной гипотезы о том, «кто чью стратегию раскроет».

Решающим фактором поэтому является возможность доказательства ого, что это никогда не произойдет. Для всех игр Г

т. е.

(17:6) max min К (g, г)) = min max К (g, г]),

£ [187]n л

или, что то же самое (снова подставляя г), К вместо х, г/, ср

—> —у

в (13:В) из п. 13.4.3), седловая точка функции К (£, г]) существует. Это — общая теорема, которая имеет место для всех функций

—V —У

К (£, ц) вида

^ 3l 32

(17:2) К (£, т|) = 2 2 & (хи т2) £Т1Г]Т2.

Ti=l Т2=1

Выбор коэффициентов Ж (т4, т2) здесь абсолютно неограничен; они обра­зуют, как это было описано в п. 14.1.3, некоторую совершенно произ-

—V —>-

вольную матрицу. Переменные £ и г) представляют собой фактически последовательности вещественных чисел. . ., и г]. . ., г]р2, областями изменения которых являются множества Sи *Sp2 (см. сноску 1

на стр. 174). Функции К (£, т]) вида (17:2) называются билинейными формами.

3 амечание. Эта теорема впервые была сформулирована и доказана в статье одного] из авторов теории игр: J. von Neumann, Zur Theorie de Gesellschaftsspiele, Math. Annalen, 100 (1928), 295—320. Несколько более общая форма этой минимаксной проблемы возникает в математической экономике в связи с уравнениями производ­ства: J. von Neumann, Uber ein okonomisches Gleichungssystem und eine Ver- allgemeinerung des Brower’schen Fixpunktsatzes, Ergebnisse eines Math. Kolloquinms, 8*(1937), 73—83. Следует заметить, что две совершенно различные задачи, изучаемые совершенно различными методами, приводят к одной и той же математической задаче необычного, «минимаксного» вида. По-видимому, здесь имеют место и более глубокие формальные связи, как и в других направлениях, о которых упоминается во второй статье. Это обстоятельство должно быть разъяснено.

J) В обеих играх v4 = — 1,V2 = 1 (см. пп. 14.7.2 и 14.7.3), а рассуждения в п. 17.1 можно рассматривать как доказательство того, что v^ = = 0.

12 Дж. Нейман, О. Моргенштерн

Доказательство нашей теоремы, приведенное в первой статье, довольно запутан­ным. образом использует аппарат топологии и теории функций. Доказательство во вто­рой статье полностью топологическое и связано с теоремой, являющейся важным мето­дом этой дисциплины, так называемой «теоремой о неподвижной точке» JI. Е. И. Бра – уера. Этот аспект был в дальнейшем прояснен, а доказательство упрощено С. К а к у – т а н и: A Generalization of Brouwer s Fixed Point Theorem Duke Math. Journal, 8 (1941), 457—459. Все эти доказательства определенно не являются элементарными. Первое элементарное доказательство было дано Ж. Биллем вместе с Е. Боре – л е м и его сотрудниками: Traite du Calcul des Probabilites et de ses Applications, IV, 2, Application aux Jeux de Hasard, Paris. 1938; J. V i 11 e, Sur la Theorie Generale des Jeux au Intervient 1′Habilete des Joueurs, 105—ИЗ. Доказательство, которое мы здесь приводим, является дальнейшей элементаризацией доказательства Ж. Билля и пред­ставляется особенно простым. Основным здесь является, конечно, связь с теорией выпуклых множеств, изложенной в § 16, ив особенности с результатами из п. 16.4.3.

Доказательство получается просто при помощи результатов н. 16.4.3. Приведем его.

Применим (16:19:а) и (16:19:Ь) из п. 16.4.3, заменяя 7, п, т и a(i, j) на ti, т2, Pi, р2 и Ж (ть т2), а векторы w и я —на £ и г).

Если выполняется (16:19:Ь), то существует такой вектор что

Ai

2 T2)Sti^0 для T2=lf…,p2,

Т1=1

т. е.

3i

inin 2 t2)ЈTi^0.

Т2 Ti=l

Следовательно, формула (17:5:а) из п. 17.5.2 дает нам

—>■

Если выполняется (16:19:а), то существует вектор для которого

02

2 Ж (т4, т2) Т]Т2rg0 для ^ = 1, р4,

Т2=1

т. е.

02

шах 2 (Ti> тг) Цх2 = 0.

Т2 Г 2=1

Следовательно, формула (17:5:Ь) из д. 17.5.2 дает

Мы видим теперь, что имеет место либо v^ ^ 0, либо v2 ^ 0, т, е.

(17:7) Невозможно v^ < 0 < v2.

Возьмем теперь произвольное число w и заменим функцию Ж (т1? т2) на Ж (т1? т2) — w

При этом К (£, т]) заменяется на К (gf г])—w 2 2 Ixi^xz – Так g и ц

ti=l Т2=1

01 02

принадлежат соответственно S^tniS^2, должно быть 2 Sti = 2 ‘Птг =

П=1 Г2=1


и фактически К(£, г]) заменяется на К (£, т]) —w. Следовательно, и v2 заменяются на vj-w и v2—w*). Применяя утверждение (17:7) к у^ — w, v2 —w, мы получаем:

(17:8) Невозможно vi < w < х’2.

Заметим теперь, что число w было выбрано совершенно произвольно. Вместе с тем при v^ < v2 можно будет выбрать w так, чтобы было у[ < w < однако это противоречит (17:8). Итак, неравенство v^ < v2 невозможно, и мы доказали v^ = v'2, что и требовалось. Доказательство завершено.

17.7. Сравнение подходов для чистых и для смешанных стратегий

17.7.1. Прежде чем двинуться дальше, обсудим еще раз смысл равен­ства

Его существенной чертой является то, что всегда имеет место = v2, но не всегда Vi = v2, т, е. всегда имеет место полная определенность в общем и не всегда вполне определенность в частном (см. начало п. 17.6). Выразим сказанное математически. Всегда имеет место равенство

—У —»• —>

(17:9) max min К (£, r)) = minmaxK(Ј, г]),

I л л I

т. е.

01 02 01 02 (17:10) max min 2 2 ^ (т1? т2) gtlr]t2min max 2 2 (ть тг) 5ti%2-

- Ti=l Т2=1 ^ Т1=1 Т2=1

Используя (17:А), можно даже написать, что

fe 02 (17:11) maxmin 2j Ж (ть т2) ЈXl == min max V Ж (тА, т2) т]Т2.

1 т2 Ti=i ^ ti T2==i

Однако не всегда выполняется

(17:12) maxmincJf (т1? т2) = min max е/Г (тА, т2).

ti t2 t2 tl Сравним (17:9) с (17:12). Равенство (17:9) верно всегда, чего нельзя сказать о (17:12). Единственно, чем они отличаются, это величинами г], К и т4, т2, Ж. Почему же подстановка одних на место других превращает неправильное утверждение (17:12) в правильное (17:9)?

Причина этого заключается в том, что Ж (т4, т2) из (17:12) является совершенно произвольной функцией своих переменных т4 и т2 (см. п. 14.1.3),

тогда как К (£, г\) в (17:9) является функцией весьма частного вида пере-

менных | и г], т. е.

• • • > ^01» • • •> 1102′

а именно билинейной формой. (См. первую часть п. 17.6.) Большая общ­ность Ж (т4, т2) делает невозможным доказательство (17:12), в то время как частная, билинейная природа К г)) составляет основу приведен­ного в п. 17.6 доказательства равенства (17.9),

-> —У

Замечание. Билинейность К (£, т^) происходит оттого, что она является «математическим ожиданием» выигрыша. Представляется существенным, что линей­ность этой функции связана с существованием решения в том смысле, в кртором мы его нашли. С математической точки зрения это открывает нам довольно интересные перспективы: можно исследовать, какие иные понятия, кроме «математического ожи­дания», не будут противоречить нашему решению, т. е. получению результата п. 17.6 для игр двух лиц с нулевой суммой.

Понятие «математического ожидания» является фундаментальным со многих точек зрения. Его значимость с точки зрения теории полезности обсуждалась в п. 317.1.

17.7.2. При всей правдоподобности может показаться парадоксальным,

что функция К г]) имеет более частный вид, чем &С (т41 т2), несмотря на то что первая получена из второй с помощью процесса, имеющего все признаки обобщения: мы получили ее заменой понятия чистой стра­тегии на понятие смешанной стратегии, как это было описано в п. 17.2,

—у —у

т. е. заменой т4 и т2 на £ и rj.

Однако более пристальное рассмотрение разрешает этот парадокс.

—> -»■

К (£, г]) является функцией очень частного вида по сравнению с SK (т4, т2), однако ее переменные имеют значительно более широкую область измене­ния, чем первоначальные переменные и т2. Действительно, т4 имеет

—»■

областью значений конечное множество 1, . . р4, тогда как £ изменяет­ся во всем множестве S$v которое является (pi — 1)-мерной поверхностью в ргмерном линейном пространстве (см. конец п. 16.2.2 и п. 17.2).

—У

Аналогичное справедливо по отношению к т2 и т).

Замечание. Заметим, что вектор g = . . ., g^) с компонентами gTl, где т4 = 1, . . ., Pi, также содержит т4; однако здесь имеется существенное отличие. В Ж (т1? т2) само является переменной. В К (£, tj) переменной является в то время

как т4 оказывается как бы переменной внутри переменной. \ фактически является

функцией от ti (см. конец п. 16.1.2), и эта функция как таковая является переменной —»•

в К (£, ti). То же относится и к т2, т].

Выразим то же в терминах и т2 : Ж (т19 т2) является функцией от т4 и]т2, в то —> —►

время как К (£, г\) является функцией от функции от переменных т4, т2 (т. е. тем, что в математике называется функционалом).

—У

Среди точек | из S^ находятся точки, фактически соответствующие различным Ti из 1, . . Pi – Для каждого Tt можно построить (как это

делалось в п. 16.1.3 и в конце п. 17.2) координатный вектор £ = 6Т*, выражающий выбор стратегии при исключении всех остальных стра­тегий. Таким же способом каждой чистой стратегии т2 из 1, . . ., р2

—>■

можно поставить в соответствие некоторый вектор т) из S$2. Для этого

—> —>■

по данному т2 можно построить координатный вектор г] = 6Та, выражаю­щий выбор стратегии 2J2 с исключением всех остальных. Теперь очевидно, что

_ ^ Pi 32

к (в*1, 8Т2) К* «г:т А:т* = ЙГ (tlf т2) 1).

Таким образом, несмотря на свой частный вид, функция К (£, г]) содер­жит функцию Ж (Ti, т2) и поэтому является более общей. Она действи-

-> —>■ ~с “с

тельно шире, чем Ж (т, т2), поскольку не все ц имеют вид oTl, ot2, т. е. не все смешанные стратегии являются чистыми *). Можно сказать, что

К (£, г)) является продолжением Ж т2) с более узкой области опреде-

ления Ti, т2 (т. е. с STl, St2) на более широкую область г) (т. е. на все ^Рг)*’ с области чистых стратегий на область смешанных стратегий.

Билинейность функции К (£, г]) выражает лишь тот факт, что это продол­жение осуществляется путем линейной интерполяции. То, что пришлось применить именно этот процесс, объясняется линейным характером «математического ожидания» [188]).

17.7.3. Возвращаясь к равенствам (17:9) — (17:12), мы видим теперь, что можно следующим образом выразить справедливость (17:9) —(17:11) и неправильность (17:12).

(17:9) и (17:10) выражают тот факт, что каждый из игроков полностью защищен от раскрытия его стратегии противником в том случае, если

он пользуется смешанными стратегиями г] вместо чистых тА, т2. (17:11) утверждает, что это остается в силе и в том случае, когда игрок, раскрыв­ший стратегию противника, использует ть т2, в то время как противник

—> —>

продолжает использовать g, т). Наконец, неверность (17:12) показывает, что оба игрока — ив особенности тот, стратегия которого окажется раскрытой,— не могут, вообще говоря, безнаказанно обойтись без исполь-

зования смешанных стратегий т).

17.8. Исследование полной определенности в общем случае

17.8.1. Переформулируем содержание п. 14.5, как указывалось в конце п. 17.4, особо подчеркивая тот установленный в п. 17.6 резуль­тат, что всякая игра двух лиц с нулевой суммой Г вполне определена в общем.

Согласно этому результату мы можем определить

v’ = max min К (£, т]) = min max К (£, т]) = Sa_>_> К (£, г]) £ л л I

(см. также (13:С*) в п. 13.5.2 и конец п. 13.4.3).

Построим теперь по аналогии с множествами А и В в (14:D:a), (14:D:b) из п. 14.5.1 множества А и 5, являющиеся соответственно под­множествами и S$2. Это будут множества А® и Вф из п. 13.5.1 (здесь ф соответствует нашему К). Таким образом, мы определяем:

(17:В:а) А есть множество тех g £ для которых min К (£, г|)

л

принимает свое максимальное значение, т. е. тех, для которых

min К (£, г)) = max min К (g, г)) = v.

—> —>■—>-

_______ л__________ t v

То есть с положительными вероятностями могут использоваться несколько стратегий.

2) Фундаментальная связь между понятием числовой полезности и линейным «математическим ожиданием» была отмечена в конце п. 3.7.1.

—————————————- —V ->

(17:В:Ь) В есть множество тех т) £ £р2, для которых max К (£, т))

I

принимает свое минимальное значение, т. е. тех, для которых

—»•—»■ —>• —>

шах К (£, г]) = min max К (£, rj) = v’.

T ч ?

Теперь можно повторить рассуждения из п. 14.5. При этом мы будем использовать нумерацию, которая соответствует перечислению утвержде­ний (14:С:а) – (14:C:f) в п. 14.5 Во-первых, заметим следующее;

(17:C:d) Игрок 1, играя надлежащим образом, независимо от действий второго игрока может обеспечить себе выигрыш i^v’.

Игрок 2, играя надлежащим образом, независимо от действий

первого игрока может обеспечить себе выигрыш ^ — v\

-> —

Доказательство. Пусть игрок 1 выбирает I £ А. Тогда

независимо от действий игрока, 2, т. е. для всех т), мы имеем К (£, ц) ^

—► —► – ______________________________________________________________________________________

^ min К (g, rj) = v’. Пусть игрок 2 выбирает ц £ В. Тогда независимо

Т)

—V ->

от действий игрока 1, т. е. для всех мы имеем К (£, т]) max К (£, ц) =

, ^ 1 = V. Это завершает доказательство.

Во-вторых, утверждение (17:C:d), очевидно, эквивалентно следую­щему:

(17:С:е) Игрок 2, играя надлежащим образом, может быть уверен в том, что выигрыш игрока 1 будет v’, т. е. он может не дать игроку 1 выиграть > v’ независимо от того, что делает игрок 1.

Игрок 1, играя надлежащим образом, может быть уверен в том, что выигрыш игрока 2 будет rg — v’, т. е. он может не дать выиграть игроку 2 > — v’ независимо от того, что делает игрок 2.

17.8.2. В третьих, можно утверждать, опираясь на (17:C:d) и(17:С:е) и на рассуждения, приведенные при доказательстве (17:C:d), что

(17:С:а) Оптимальный способ игры (комбинация стратегий) для игро­ка 1 в игре Г заключается в выборе произвольного I 6 А, где А — множество, определенное в (17:В:а). (17:С:Ь) Оптимальный способ игры (комбинация стратегий) для игро­ка 2 в игре Г заключается в выборе произвольного ч\£В, где В — множество, определенное в (17:В:Ь).

В-четвертых, объединение утверждений из (17:C:d) или, что равно­сильно, из (17:С:е) дает:

(17:С:с) Если оба игрока 1 и 2 оптимально играют в игру Г, т. е. если

I 6 А, а г] 6 В, то значение К (£, т]) будет равно значению партии (для игрока 1), т. е. v\

Используя дополнительно (13:D*) из п. 13.5.2, а также предшествую­щее (17:В:а) замечание о множествах А и В, мы получаем:

—> —

(17:C:f) Оба игрока 1 и 2 игрют оптимально в игру Г, т. е. £ £ А, а г\ £ В в том и только в том случае, когда г\ является седловой

точкой функции К (1, Т]). Все это делает вполне понятным, что v’ можно в действительности интерпретировать как значение партии игры Г (для 1) и что А и В содержат оптимальные способы игры соответственно для игроков 1 и 2. Во всех рассуждениях (17:G:a) — (17:G:f) нет ничего эвристического или неоп­ределенного. Мы не делали никаких специальных предположений о «спо­собностях» игроков, о том, «кто чью стратегию обнаружил» и т. п. Точно так же наши результаты не основываются и на вере в рациональное пове­дение противника; важность этого момента мы неоднократно подчерки­вали. (См. конец п. 14.1.2, а также п. 15.8.3.)

17.9. Дальнейшие свойства оптимальных стратегий

17.9.1. Результаты (17:С:с) и (17:C:f) в п. 17.8.2 дают также простую и явную характеризацию элементов нашего решения, т. е. число v’ и мно­жества векторов А и JS.

Согласно (17:С:с) А и В определяют у’; следовательно, достаточно только изучить А, В, что мы и сделаем, опираясь на утверждение (17:C:f). На основании этого критерия £ £ А и г\ £В тогда и только тогда,

когда пара т] является седловой точкой функции К (£, т]). Это озна­чает, что

К (6, ф

шахК(|’,т]), v

min К ri’).

Т]’

Мы получили это в явном виде, использовав выражение (17:2) из п. 17.4.1 и п. 17.6 для К (|, г]), а также выражения в лемме (17:А) из п. 17.5.2 для

max К (Б’,т|) и min К (g, г]’). Теперь наши уравнения приобретают такой

? ?

вид:

С 02

max 2 & Ч) 2j 2j ж(т19 т2) 1x^x2= 32

П= 1 Т2= 1

5tr

min 2 &С (Ti> т2)

01 02

Замечая, что 2 Јti = 2 мы можем также написать

Ti=l Т2=1

01 02 02 2 (шах ) 2 w К, та) %2( – 2 (т4, т2) %2) gTl = О,

Ti=l Т[ Т2=1 Т2=1

02 01 01

(-min) 2 ST(tlf ti)gtl(+ 2 ST (т4, t2) Јtl) r]t2 — 0.

T2=1 t: ti=1 n=i

Слева в этих уравнениях коэффициенты при и rjt2 все ^О1). Кроме того, все Јtl, rjt2 и сами^ 0. Следовательно, эти равенства имеют место только в том случае, если все слагаемые слева обращаются в нуль. Ины­ми словами, для всех т4 = 1, . . ., р4, для которых коэффициент при не равен нулю, должно быть =0; точно так же для всех т2 = 1, . . . Рг? для которых коэффициент при rjt2 не равен нулю, должно бытьг]Г2=0. Резюмируем:

(17:D) | £ А и ц £ В в том и только в том случае, когда имеет место следующее:

02

Для всех ti = 1, . . ., Pi, для которых 2 тг) Цх2

Т2=1

не принимает своего максимального значения (по тА), мы имеем

gtx = 0.

Pi

Для всех т2 = 1, . . р2, для которых 2 ^2) In

ti=l

не принимает своего минимального значения (по т2), мы имеем Лт2 = 0-

Легко сформулировать эти принципы словесно. Они выражают следующее.

Если £ и г] — оптимальные смешанные стратегии, то | не содержит

—> —>

стратегий т4, которые не оптимальны (для игрока 1) против т], а т] не содержит стратегий т2, которые не оптимальны (для игрока 2)

против Иными словами, т), как и следовало ожидать, оказываются оптимальными друг против друга.

17.9.2. Другое замечание, которое можно сделать в связи с этим, таково:

(17:Е) Игра вполне определена в частном в том и только в том слу­чае, когда для каждого игрока существует оптимальная чистая стратегия.

С точки зрения наших предыдущих рассуждений, в особенности процесса обобщения, с помощью которого мы перешли от чистых стра­тегий к смешанным, это утверждение можно считать интуитивно убеди­тельным. Однако мы приведем математическое доказательство, которое столь же просто. Оно состоит в следующем.

В последней части п. 17.5.2 мы видели, что как так и получаются

Pi

применением операции шах к min 2 Ж (rlf т2) lXv но по различным

1 Т2 Tl=1

множествам изменения Для v4 это будет множество всех 8Ti (т4 = = 1, . . Pi), а для v[ — множество SТаким образом, макси­мизация производится по множеству чистых стратегий в первом случае и по множеству смешанных стратегий во втором. Следовательно, v4 = v^, т. е. равенство двух максимумов возможно в том и только в том случае, когда максимум во втором множестве достигается (хотя бы однажды) в пределах первого множества. Это, согласно (17:D), означает, что множеству А должна принадлежать хотя бы одна чистая стратегия, т. е. хотя бы одна чистая стратегия должна быть оптимальной. Таким образом,

г) Проследите, как появились здесь max и min.

(17:F:a) v4 = v^ в том и только в том случае, когда для игрока 1 суще­ствует оптимальная чистая стратегия.

(17:F:b) v2 = v'2 в том и только в том случае, когда для игрока 2 суще­ствует оптимальная чистая стратегия.

Теперь мы имеем v^ = v2 = v', а полная определенность в частном означает = v2 = v, откуда v4 = v[ и v2 = v'2. Таким образом, (17:F:a) и (17:F:b) дают вместе (17:Е).

17.10. Ошибки и их следствия. Перманентная оптимальность

17.10.1. Из предыдущих рассуждений мы выяснили, что представляет собой оптимальная смешанная стратегия. Скажем еще несколько слов о других смешанных стратегиях. Мы хотим выразить отличие этих стра-

—> —У

тегий (т. е. векторов г]) от «оптимальности» и таким образом определить величину ошибки при использовании стратегий, не являющихся опти­мальными. Однако мы не будём пытаться исчерпать этот вопрос, имеющий много интересных ответвлений.

Для всех g £ Sfa и всех т) £ S$2 определим числовые функции

(17:13:а) а (1) = у’ – min К (£, ij)

—>

Г]

и

(17:13:Ь) (3 (ц) = max К (f, ц) – v\

—>

I

Согласно лемме (17:А) из п. 17.5.2 это равносильно

Зг

(17:13:а*) a(g) = v’-min 2 Ж (ти т2)

Г2 Ti=Pi 32

(17:13:b*) p(r]) = max 2 ЙГ(т4, т2)т]т2-у’.

Tl Г 2=1

Определение

—> —> —> —>

v’ = max min К (£, r\) = min max К (£, г]) -> —> —>

£ T) T] i

гарантирует нам, что всегда

Теперь утверждения (17:В:а), (17:В:Ь) и (17:С:а), (17:С:Ь) из п. 17.8

—>

дают нам, что стратегия £ является оптимальной в том и только в том

—у —>

случае, когда а (£) = 0, а т) является оптимальной в том и только в том случае, когда р (х\) — 0.

Таким образом, а (£) и р (т]) являются удобными числовыми опи-

саниями для произвольных £ и г) их расстояний от оптимальных стра-

—> —>


тегий. Явное словесное определение а (£), р (т]) делает это еще более правдоподобным: формулы (17:13:а), (17:13:Ь) или (17:13:а*), (17:13:Ь*) показывают, сколько рискует потерять игрок (с точки зрения значения партии для него) х), используя данную стратегию. Под «риском» мы пони­маем здесь наихудшее, что может произойти при данных условиях 2).

—> —>

Тем не менее необходимо отдавать себе отчет в том, что а (g) и (3 (г|) не указывают, какая именно стратегия противника причиняет эту

(максимальную) потерю для игрока, использующего g или г). В частности, вовсе не очевидно, что если противник использует некоторую оптималь­ную стратегию, т. е. некоторое у\0^В или g0 £А, то это само по себе приведет к максимальным потерям. Если игроки используют отличные

-> —у

от оптимальных стратегии g или г), то максимальные потери достигаются на тех стратегиях rj’ или g’ противника, для которых (17:14:a) К(|, rf’) = mmK(f, ц),

(I7:14:b) К(|’, r]) = maxK(f,

т

—у —у —

т. е. если стратегия г)’ оптимальна против данной g или g’ оптимальна

—У

против данной т]. При этом мы никогда не можем установить, будет ли

-> – У —У

некоторая фиксированная стратегия т]0 или g0 оптимальной против всех g или Т).

-У —У

17.10.2. Назовем поэтому стратегию г)’ или стратегию g’, которая

-> – у

оптимальна против всех т] или g, т. е. стратегию, для которой выполняют­ся (17:14:а) или (17:14:Ь) в п. 17.10.1 для всех g, т],— перманентно опти-

—У —у

малъной. Всякая перманентно оптимальная стратегия г)’ или g’ необ­ходимо является оптимальной; с концептуальной точки зрения это долж­но быть ясно, и строгое доказательство является простым.

Доказательство. Достаточно провести доказательство для г]’; дока­зательство для g’ аналогично.

—у —У

Пусть стратегия rj’ перманентно оптимальна. Выберем стратегию g*, которая оптимальна против rj’, т. е. для которой

—> I

По определению

К(|*, rf’) = min К (f*, rj).

—у Т]

—У —У * —> -У

Таким образом, £* и т)’ образуют седловую точку функции К (g, г]), и, следовательно, согласно (17:C:f) в п. 17.8.2 г]’ принадлежит т. е. является оптимальной стратегией.

Однако открытым остается вопрос: все ли оптимальные стратегии являются перманентно оптимальными? Более того: существуют ли пер­манентно оптимальные стратегии вообще?

В общем случае ответ оказывается отрицательным. Так, например, в «орлянке», в игре «камень, мешок и ножницы» единственной оптимальной

-> —У

стратегией (для игрока 1, равно как и для игрока 2) является | = т] = = {1/2, 1/2} или соответственно {1/3, 1/3, 1/3} х). Если игрок 1 играет определенным образом, например выбирая всегда «решетку» или всегда «камень» [189]), то он проиграет, если противник будет выбирать соответ­ственно «герб» [190]) или «мешок» 3). Однако в этом случае стратегия про­тивника не будет оптимальной; она не будет совпадать с {1/2, 1/2} в од­ном случае и с {1/3, 1/3, 1/3} в другом. Если противник играет опти­мальную стратегию, то ошибки игрока не имеют значения 4).

Далее мы приведем другой пример — в более тонком и сложном случае, касающемся покера и необходимости «блефа» (см. пп. 19.2 и 19.10.3).

Все сказанное можно резюмировать заметив, что, в то время как наши оптимальные стратегии совершенны с оборонительной точки зрения, они (в общем случае) не дают максимального выигрыша при (возможных) ошибках противника, т. е. они не рассчитаны на наступление.

Следует, однако, помнить, что наши рассуждения в п. 17.8 остаются в силе: теория наступления, в указанном смысле, без существенно новых идей невозможна. Читатель, который не склонен принять это, может еще раз рассмотреть положение дел в «орлянке» или в игре «камень, мешок и ножницы»; исключительная простота этих двух игр делает наиболее важные моменты особенно ясными.

Другим предостережением против переоценки этой точки зрения является следующее. Во многих случаях слово «наступательный» употреб­ляется в повседневной речи не в том смысле, как мы только что употреб­ляли; оно употребляется именно в том смысле, который полностью охва­тывается настоящей теорией. Это, как будет показано в п. 17.10.3, имеет место для всех игр с полной информацией,[191]) а также в случае таких типично «агрессивных» операций (обусловленных неполной информа­цией), как «блеф» в покере [192]).

17.10.3. Закончим этот параграф замечанием о том, что существует важный класс игр двух лиц с нулевой суммой, в которых существуют перманентно оптимальные стратегии. Это игры с полной информацией, которые исследовались нами в § 15 и, в частности, в пп. 15.3.2, 15.6 и 15.7. Действительно, небольшое видоизменение доказательства полной опре­деленности в частном достаточно для доказательства и того утверждения. Мы получим при этом перманентно оптимальные чистые стратегии. Одна­ко не будем здесь вдаваться в подробности.

Поскольку игры с полной информацией всегда вполне определены в частном (см. сказанное выше), можно ожидать наличия более тесной связи между вполне определенными в частном играми и играми, в кото­рых существуют перманентно оптимальные стратегии (для обоих игро­ков). Мы не будем дальше обсуждать эти вопросы, а отметим только некоторые существенные моменты.

(17:G:a) Можно показать, что если существуют перманентно опти­мальные стратегии для обоих игроков, то игра вполне определена в частном.

(17:G:b) Можно показать, что обратное к (17:G:a) не имеет места.

(17:G:c) Некоторые утончения понятия полной определенности в част­ном могут указать на более тесные связи с существованием пер­манентно оптимальных стратегий.

17.11. Перемена ролей игроков. Симметрия

17.11.1. Рассмотрим значение симметрии или, в более общем случае, эффект, получаемый от перемены ролей игроков. Это будет естественным продолжением анализа п. 14.6.

Как там было отмечено, эта перемена ролей игроков ведет к замене функции Ж(хи т2) на — Ж (т2, т4). Формула (17:2) из п. 17.4.1 и п. 17.6

показывают, что это в свою очередь влечет замену К (£, т]) на —К (т), g). В терминах п. 16.4.2 матрица (Ж (тА, т2) см. п. 14.1.3) заменяется на отри­цательно транспонированную к ней.

Таким образом, продолжается полная аналогия с рассуждениями

§ 14; мы снова получаем те же формальные результаты, заменяя ть т2,

—>- ->

(т^ь ^г) соответственно на т), К (£, т]) (см. пп. 17.4 и 17.8, где это впер­вые было проделано).

В п. 14.6 мы увидели, что замена Ж (ть т2) на — Ж (ть т2) влечет заме­ну уАи v2 на—у2и—уА. Дословное повторение этих рассуждений показы-

—> -> ->

вает, что в нашем случае замена К (£, т]) на —К (т), £) влечет за собой заме­ну у[ и v2 на—у2и—v^. Подведем итоги: перемена игроков местами влечет за собой замену v1? v2, v^, v2 на —v2, —v4, —v2, —v^.

Результат п. 14.6, установленный для случая полной определенности (в частном), заключался в том, что равенство v = v* = v2 превращалось в —v = —Vi = —v2.

Теперь мы знаем, что полная определенность в общем имеет место всег­да, так что v' = у[ = v2. Следовательно, это равенство переходит в —v' = = - v; = - v;.

Словесно содержание этого результата ясно. Поскольку нам удалось определить удовлетворительное понятие значения партии для Г (для игро­ка 1) v', то весьма естественно, что эта величина изменяет знак при пере­мене ролей игроков.

17Л 1.2. Мы можем также строго установить, когда игра Г является симметричной. Это будет в том случае, когда игроки 1 и 2 играют одну и ту же роль, т. е. когда игра Г совпадает с игрой, которая получается из нее в результате перемены ролей игроков 1 и 2. В соответствии с тем, что было сказано выше, это означает, что

38е (Tlf т2) = — ЗГ(т2, т,)

или, что то же самое,

-v —>

Это свойство матрицы &С (ть т2) или билинейной формы К (£, т)) было впер­вые введено в п. 16.4.4 и было названо кососимметричностью.

Замечание 1. Для матрицы Ж, т2) или для соответствующей билинейной

—V —>■

формы К rj) симметричность определяется следующим образом:

ОЙГ (Ti, Т2)=су£(Т2, Tl)

или, что равносильно,

K(l, rj) = К (rf, fj,

Следует заметить, что симметрия игры Г эквивалентна кососимметричности, а не симметричности матрицы выигрышей или билинейной формы.

Замечание 2. Кососимметричность означает, что отражение матрицы табл. 5 от ее главной диагонали (состоящей из элементов с индексами (1. 1), (2. 2) и т. д.) изме­няет ее знак (симметричность в этом смысле означала бы, что такое отражение пере­водит матрицу в себя). В рассматриваемом случае матричная схема табл. 5 должна быть квадратной, т. е. р± = р2. Это, однако, выполняется автоматически, так как мы предположили, что роли игроков 1 и 2 в игре Г одинаковы.

В этом случае Vi и v2 должны совпадать с—v2 и—v4, следовательно, Vl = — v2, а так как v4 ^ v2, должно быть v4 ^ 0. Однако v' должно совпадать с —v', поэтому мы можем даже утверждать, что

v' — О1).

Мы видим, таким образом, что значение каждой партии симметричной игры равно нулю.

Следует заметить, что значение v' каждой партии игры Г может быть нулем и без того, чтобы игра Г была симметричной. Игра, для которой у' = 0, называется безобидной.

Это обстоятельство иллюстрируют примеры пп. 17.7.2, 14.7.3. Игра «камень, мешок и ножницы» симметрична (и, следовательно, безобидна); игра в «орлянку» безобидна, не будучи симметричной.

Зам ечание 3. Роли игроков в игре в «орлянку» различны. Игрок 1 стре­мится угадать, а 2 стремится избежать угадывания. Чувствуется, конечно, что такое различие несущественно и что безобидность игры вызвана незначительностью этой асимметрии. Эти рассуждения можно уточнить; однако, в данном случае мы этого делать не намерены. Более удачный пример безобидной игры без симметрии можно было бы дать в виде резко несимметричной игры, в которой успех и неуспех каждого из игро­ков подобраны столь разумно, что в результате получается безобидная игра, т. е. значение ее у' = 0.

Не во всех отношениях удачным примером такой игры может служить игра в кости. В этой игре игрок 1, называемый «игроком», бросает две кости, на каждой

2) Это, конечно, следует из того, что v^ = v2. Без этого равенства, т. е. без общей теоремы (16:F) из п. 16.4.3, мы могли бы относительно v^ и v'2 утверждать только то, что мы получили ранее для и v2, а именно что = —v2, а так как v^ ^ v2, имеем vi ^ 0.

из которых обозначены числа 1, 2, 3, 4, 5, 6. Таким образом, результатом каждого бросания может оказаться любое из чисел 2, . . ., 12. Эти числа имеют вероятности, приведенные в табл. 6.

Таблица 6

Сумма

2

3

4

5

6

7

8

9

10

11

12

Случаи появления из 36

1

2

3

4

5

6

5

4

3

2

1

1

2

3

4

5

6

5

4

3

2

1

Вероятность

36

36

36

36

36

36

36

36

36

36

36

Если «игрок» выбрасывает 7 или 11, то он выигрывает. Если он выбрасывает 2, 3 или 12, то он проигрывает. Если он выбрасывает что-либо другое (4, 5, 6 или 8, 9, 10), то игра повторяется до тех пор, пока он не выбрасывает того же числа, что на первом шаге (в этом случае он выигрывает), или пока не выбрасывает 7 (в этом случае он проигрывает). Игрок 2 («банк») на игру не влияет.

Несмотря на существенные различия правил, определяющих поведение игроков 1 и 2 («игрока» и «банка»), их шансы примерно равны. Простые вычисления, приводить которые мы здесь не будем, показывают, что «игрок» имеет 244 шанса из 495 против 251 шанса, которые имеет «банк». Поэтому значение партии для единичной ставки равно

244-251 7 . ... 0/


Таким образом, получается достаточно хорошее приближение к безобидности.

В симметричной игре множества А ж Б из (17:В:а), (17:В:Ь) в п. 17.8, очевидно, совпадают; так как А = Б, то в (17:D) из п. 17.9 мы можем

положить | = г). Переформулируем результат для этого случая.

—> .—

(17:Н) В симметричной игре £ (Е А в том и только в том случае, когда

Pi

для всех т2 --= 1, . . ., |32, Для которых 2 йГ (т4, т2) £Т1 не дости - гает своего минимума (по т2), имеет место £Т2 = 0. Используя терминологию заключительного замечания из п. 17.9,

—V

мы можем сказать, что £ оптимальна против самой себя.

17.11.3. Результаты пп. 17.11.1 и 17.11.2 о том, что для любой сим­метричной игры v' =0, можно объединить с (17:C:d) в п.17.8. Тогда мы получим следующее.

(17:1) В симметричной игре каждый из игроков, играя надлежащим

образом, может избежать потерь г) независимо от действий против­ника.

Математически это можно сформулировать следующим образом. Если матрица Ж (т1? т2) кососимметрична, то существует такой вектор

—>

\ 6 Se 1, что

3i

S Ж (ть т2)ЕТ1^0 для т2 — 1,

Это неравенство можно также получить и непосредственно, потому что оно совпадает с последним результатом (16: G) п. 16^4.4. Для того чтобы это показать, достаточно ввести там новые обозначения: заменить имеющие-

—У - У

ся там г, а (г, j) на наши хи т2, Ж (ть т2) и w на

То есть обеспечить себе выигрыш

Этим фактом можно даже обосновать всю нашу теорию, т. е. вывести из него теорему п. 17.6. Другими словами, полная определенность в общем для произвольной игры Г может быть выведена из таковой для симметрич­ных игр. Доказательство этого представляет самостоятельный интерес, однако мы не будем его здесь рассматривать, поскольку рассуждения в п. 17.6 являются более прямыми.

Возможность защитить себя от потерь (в симметричной игре) имеется

—> —>

только благодаря применению смешанных стратегий г\ (см. конец п. 17.7). В случае, когда игроки ограничиваются выбором чистых стратегий т£ и т2 существует опасность раскрытия стратегии противником и связанных с этим потерь. Для того чтобы в этом убедиться, достаточно вспомнить игру «камень, мешок и ножницы» (см. пп. 14.7 и 17.1.1). Мы еще раз встре­тимся с этим в п. 19.2.1 в связи с покером и необходимостью «блефа».


Глава IV

ИГРЫ ДВУХ ЛИЦ с НУЛЕВОЙ СУММОЙ.

ПРИМЕРЫ

§ 18. НЕКОТОРЫЕ ЭЛЕМЕНТАРНЫЕ ИГРЫ


18.1. Простейшие игры

18.1.1. Наше общее обсуждение игры двух лиц с нулевой суммой закончено. Теперь мы перейдем к рассмотрению характерных примеров таких игр. Эти примеры лучше, чем какие бы то ни было общие абстракт­ные рассуждения, выявят истинную значимость различных компонент этой теории. Они покажут, в частности, как с точки зрения здравого смыс­ла можно интерпретировать некоторые формальные шаги, предписываемые нашей теорией. Окажется, что можно строго формализовать основные аспекты таких «практических» и «психологических» явлений, которые будут упомянуты в пп. 19.2, 19.10 и 19.16 *).

18.1.2. Числа р4, (32 — т. е. количество возможностей, имеющихся у двух игроков в игре в нормальной форме,— дают естественную первую

1

2

1

0ЙГ(1, 1)

айГ(1, 2)

2

Ж (2,1)

g%*_(2, 2)

оценку степени сложности игры Г. Тот случай, Таблица 7 когда одно из этих чисел (или оба) равно 1, можно не рассматривать. Это условие означало бы, что у рассматриваемого игрока вообще нет выбора, благодаря которому он мог бы влиять на ход игры [193]). Поэтому простейшими играми того класса, который представляет для нас ин­терес, являются игры, для которых

(18:1) р! = р2 = 2.

В п. 14.7 мы видели, что игра в «орлянку» яв­ляется игрой такого типа; ее матричная схема 13.4.1. Другой пример такой игры дан там же

в табл. 2 в

приведена в табл. 4.

Рассмотрим теперь игру наиболее общего вида, удовлетворяющую условию (18:1), т. е. игру, представленную в табл. 7. Это приложимо, например, к игре в «орлянку», если различным способам совпадения сто­рон монет не обязательно соответствует один и тот же выигрыш (или вооб­ще выигрыш), а также различным способам несовпадения — один и тот же проигрыш (или вообще проигрыш) [194]). Мы намерены применительно к это­му случаю обсудить результаты из п. 17.8, а именно значение игры Г и множества оптимальных стратегий А и В. Эти понятия были введены при доказательстве основных результатов в п. 17.8 (доказательстве, основ – ванном на теореме из п. 17.6); но теперь мы хотим вычислить их снова

в явном виде для этого частного случая и тем самым еще дальше проник­нуть в их назначение и возможности.

18.1.3. Для представленной в табл. 7 игры можно принять несколько тривиальных соглашений, которые существенно упрощают ее анализ.

Во-первых, совершенно безразлично, какой из двух выборов игро­ка 1 мы обозначим через т4 = 1, а какой через х± = 2; мы можем их пере­ставить, т. е. поменять местами две строки матрицы.

Во-вторых, также безразлично, какой из двух выборов игрока 2 мы обозначим через т2=1, а какой через т2 = 2; мы можем переставить и их, т. е. поменять местами два столбца матрицы.

Наконец, безразлично также, какого из двух игроков мы будем назы­вать 1, а какого 2; мы можем переставить их, т. е. заменить Ж (т17 т2) на — Ж (т1? т2) (см. пп. 14.6 и 17.11). Это равносильно тому, что меняются ролями строки и столбцы матрицы и, кроме того, изменяется знак каждо­го ее элемента. е

Итак, мы имеем здесь 2x2x2 = 8 возможных вариантов, каждый из которых описывает, по существу, одну и ту же игру.

18.2. Подробное количественное рассмотрение этих игр

18.2.1. Теперь мы переходим непосредственно к обсуждению. Оно бу­дет состоять в рассмотрении нескольких альтернативных возможностей, «случаев», которые будут далее перечислены.

Эти случаи отличаются друг от друга различными возможностями, соответствующими положению максимума или минимума по обоим аргу­ментам функции Ж (ti, t2); на первый взгляд такое разграничение могло бы показаться произвольным, но тот факт, что оно приводит к полному перечислению всех возможностей, оправдывает его.

Рассмотрим поэтому max Ж (ть т2) и min Ж (ть т2). Следует считать,

Tl, Т2 Tl, Т2

что каждое из этих значений достигается хотя бы в одной точке, причем можно допустить, что они достигаются и более чем в одной точке х); но для нас это не изменяет положения дел. Начинаем теперь с определения раз­личных случаев.

18.2.2. Случай (А): клетки таблицы можно выбрать так, чтобы шах

Tl, Т2

и min лежали в разных строках и в разных столбцах.

Tl, т?(

Изменяя нумерацию =1,2 точно так же, как л т2 =1,2, мы мо­жем первую из указанных клеток ( max ) сделать клеткой (1, 1). Тогда

Tl, Т2

второй клеткой ( min ) должна быть клетка (2, 2). Следовательно, имеем

Tl, Т2

[>Ж( 1, 2)>1

(18:2)

Поэтому (1, 2) является седловой точкой2).

Таким образом, в этом случае игра вполне определена и

(18:3) ч' = У = Ж( 1, 2).

В игре в «орлянку» (см. сноску 3 на стр. 192) max равен 1 и достигается на (1, 1)

'Cl,

и (2, 2), в то время как min равен —1 и достигается на (1, 2) и (2, 1).

Tl, Т2

2) Вспомните п. 13.4.2. Заметим, что мы должны выбрать (1, 2), а не (2, 1).

13 Д? к. Но йман, О. Моргенштерн

18.2.3. Случай (В): описанный выше выбор невозможен. Возьмем две интересующие нас клетки ( шах и min ); тогда они будут

Tl, То Ть Т2

лежать либо в одной и той же строке, либо в одном и том же столбце. Если имеет место первый случай, то можно поменять ролями игроков 1 и 2; поэтому всегда можно будет считать, что эти две клетки лежат в одном и том же столбце *).

Переставляя т4 == 1, 2 (если это необходимо, одновременно с т2 = — 1, 2), мы опять можем сделать так, чтобы первой из указанных клеток ( max ) была бы (1, 1). Таким образом, номер интересующего нас столбца XI, т2

будет т2 = 1. Тогда второй из указанных клеток ( min ) должна быть (2,1)[195]).

tl, т2

Следовательно, мы имеем

[>Ж( 1, 2)>1

(18:4)

Фактически случаи ^(1, 1) = Ж(1, 2) или Ж (2, 2) = 5Г(2, 1) исклю­чаются, поскольку иначе для max и min был бы возможен альтернатив-

Ть Т2 Tl, Т2

ный выбор (1, 2), (2, 1) или (1, 1), (2, 2) и мы попадали бы в условия случая (А)[196]).

Таким образом, мы можем усилить (18:4), именно:

(18:5)

Теперь мы должны произвести дальнейшее разделение.

18.2.4. Случай (ВО:

(18:6) вЯГ (1, 2)^Ж(2, 2).

Тогда неравенства (18:5) можно усилить:

(18:7) Ж (1, 1) > Ж (1, 2) ^ Ж (2, 2) > Ж (2, 1).-

Поэтому (1, 2) снова оказывается седловой точкой.

Таким образом, и в этом случае игра тоже вполне определена, и опять

(18:8) у’ = у — Ж (1, 2).

18.2.5. Случай (В2):

(18:9) Ж{ 1, 2)<щЖ (2, 2).

Тогда неравенства (18:5) можно усилить:

(18:10) Ж (1, 1)^Ж(2, 2)>ЙГ(1, 2)^ Ж (2, I)[197]).

Эта игра не является вполне определенной [198]).

Однако нетрудно найти оптимальные стратегии (т. е. £ из А и г) из В),

как удовлетворяющие характеристическому условию (17:D) из п. 17.9.

—>

Мы в состоянии сделать даже большее: можно выбрать г) и ^ так, чтобы

2

соответственно сумма 2 (ть т2) %2 сохраняла свое значение для всех

т2=1

2

ti, а сумма 2 (т4, т2) ^ — Для всех т2. Для этого необходимо, чтобы t1=j

Г 1) % + 2) г)2 = Ж (2, 1)^ + ^(2, 2) г)2,

(1Ь:11} 1 аг(1, i)E2 = sr(if 2)g1 + sr(2> 2)ga-


Это означает, что

(18:12) fЈl” tni •

2)-Ж (2, 1)):(ЙГ(1, 1)-еЖ(1, 2)), Па = (Й8Г (2. 2)-ЙГ(1, 2)):(ЗГ(1, 1)-ЗГ(2, 1)).

Эти отношения должны удовлетворять еще и требованиям it^O, _ & +

rji^O, г]2^0, 41 + 42= 1.

Этим требованием удовлетворить можно, поскольку приведенные отноше­ния (т. е. правые части в (18:12)) положительны в силу (18:10). Мы имеем

Ж (2, 2)—Ж (2, 1)

и

%

*]2

Ж (i, 1) + Ж(2, 2)~

2)-

-Ж (2, 1)

. Ж( 1, 1)-

-Ж(1, 2)

ОЙГ (1, 1) + G^(2, 2)~

-с/Г(1, 2)-

-ой: (2, 1)

ойГ(2, 2)-

-сЖ(1, 2)

ейГ(1, 1)+е&’(2, 2)-

-<#Г(1, 2)-

-0^(2, 1)

<ЙГ(1, 1)-

-^(2, 1)


1) + ейГ(2, 2) — (1, 2)—Ж (2, 1)


Можно показать даже, что эти векторы т] единственны, т. е. множест – ва Ау В не имеют других элементов.

Доказательство. Если бы вектор £ или г\ отличался от найден­ного нами, то в силу характеристического условия (17:D) из п. 17.9

—у —>

вектор г) или соответственно вектор g должен был бы иметь одну равную

—> —>

нулю компоненту. Но тогда г) или g должны были бы отличаться от

приведенных выше, поскольку у них обе компоненты положительны. Таким

—> —у

образом, отличаться от приведенных значений должны одновременно и £ и Г), но тогда оба они должны иметь по одной равной нулю компоненте. Для обоих другая компонента будет тогда равна 1, т. е. оба являются коорди-

натными векторами Следовательно, седловая точка функции К (£, rj), которую они представляют, совпадала бы с седловой точкой функции Ж (хи т2); ср. (17:Е) из п. 17.9. Таким образом, игра была бы вполне определенной, но мы знаем, что в данном случае это не так. Это завершает доказательство.

Теперь видно, что все четыре выражения в (18:11) равны одному и тому же значению, именно:

1)Ж(2, 2) —Ж (1, 2) Ж (2, 1)

Ж{1, 1)4-^(2, 2)~с^(1, 2) —ойГ (2, 1)

а в силу (17:5:а), (17:5:Ь) из п. 17.5.2 этим значением является v\ Таким образом, мы имеем

/,0.0ч, ^ 1)<ЙГ(2, 2)-Ж(1, 2) Ж (2, 1)

I10-10′ V ‘ Ж (1, 1)+Ж(2, 2) —аГ (1, 2) —суГ(2, 1) •

18.3. Качественное описание

18.3.1. Полученные в п. 18.2 формальные результаты можно резюми­ровать различными способами, которые сделают их более ясными. Начнем прежде всего со следующего критерия.

Клетки (1, 1), (2, 2) образуют одну диагональ матрицы в табл. 7. Клетки (1, 2), (2, 1) образуют другую диагональ.

Будем говорить, что два множества чисел Е и F отделены, если либо каждый элемент множества Е больше любого элемента из F, либо каждый элемент из Е меньше любого элемента из F.

Рассмотрим теперь случаи (А), (В^, (В2) из п. 18.2. В первых двух случаях игра вполне определена, а элементы, расположенные на одной диагонали матрицы, не отделяются от элементов, расположенных на дру­гой диагонали [199]). В последнем случае игра не является вполне определен­ной и элементы, образующие одну диагональ матрицы, отделяются от эле­ментов, образующих другую диагональ [200]).

Таким образом, отделимость диагоналей необходима и достаточна для того, чтобы игра не была вполне определенной. Этот критерий осно­ван на результатах, полученных в п. 18.2 благодаря соглашению в п. 18.1.3 Но описанные в п. 18.1.3 три соглашения не затрагивали ни полной определенности игры, ни отделимости диагоналей [201]). Следовательно, наш первый критерий всегда справедлив. Переформулируем его:

(18:А) Игра не является вполне определенной в том и только том

случае, когда элементы одной диагонали матрицы отделяются от элементов другой диагонали.

18.3.2. В случае (В2), т. е. когда игра не вполне определена, найден­ные нами (единственный) вектор | из А и (единственный) вектор г) из В имеют обе ненулевые координаты. Это, так же как и утверждение о еди – ственности, не зависит от соглашений, описанных в п. 18.1.3 *). Таким образом, мы имеем:

(18:В) Если игра не является вполне определенной, то существуют

~> —

только одна оптимальная стратегия g (т. е. из А) и только одна

—у —

оптимальная стратегия г] (т. е. из В) и обе компоненты этих стра­тегий положительны.

Иными словами, оба игрока действительно должны использовать смешанные стратегии.

В силу (18:В) ни одна из компонент векторов £ и у] (| из А, г] из В) не равна нулю. Поэтому критерий из п. 17.9 показывает, что утверждение, предшествующее выводу (18:11), — (который являлся тогда достаточным, но не был необходимым) теперь является необходимым (и достаточным). Поэтому условия (18:11) должны быть выполнены, и, следовательно, все полученные из них заключения справедливы. Это относится, в частности, к значениям £2, Ль Л2? полученным после (18:11), и к значению у’, давае­мому формулой (18:13).

Таким образом, всякий раз, когда игра не является вполне опреде­ленной, применимы все эти формулы.

18.3.3. Сейчас мы сформулируем другой критерий. Будем говорить, что в матрице общего вида &С (т4, т2) (см. табл. 5 на стр. 126) при произволь­ных Pi и р2 строка (скажем, г’г) или столбец (скажем, т’2) доминирует соответственно другую строку (скажем, т’^) или другой столбец (скажем, Tg), если это справедливо для всех без исключения соответствующих эле­ментов. Иными словами, если Ж (т^, т2) ^ &С (т^, т2) для всех т2 или соот­ветственно если Ж (т1? tQ ^ сУС (т4, т’2) для всех т^

Это определение имеет простой смысл. Оно означает, что для игрока 1 выбор %[ не хуже выбора или что для игрока 2 выбор т2 не лучше выбо­ра т2, и в обоих случаях это справедливо независимо от действий про­тивника [202]).

Вернемся теперь к нашей задаче (рА == р2 = 2). Вновь рассмотрим случаи (А), (ВО, (В2) из п. 18.2. В первых двух случаях имеется доми­нирующая строка или столбец [203]). В последнем случае нет ни того ни дру­гого [204]).

Таким образом, тот факт, что какая-то строка (столбец) доминирует другую, является необходимым и достаточным условием полной опре­деленности игры Г. Подобно нашему первому критерию, этот критерий основан на использовании в п. 18.2 сформулированных в п. 18.1.3 согла­шений. И точно так же, как и в п. 18.2, эти соглашения не влияют ни на полную определенность, ни на доминирование строк или столбцов. Следо­вательно, и этот критерий также всегда справедлив. Переформули­руем его.

(18:С) Игра Г вполне определена в том и только том случае, когда

некоторая строка (столбец) доминирует другую (другой).

18.3.4. В том, что условие (18:С) достаточно для полной определенно­сти, нет ничего удивительного. Оно означает, что для одного из двух игро­ков одна из его чистых стратегий во всех случаях не хуже других (ср. выше). Таким образом, он знает, что делать ему, а его противник знает, что его ожидает. Это и соответствует полной определенности.

Проведенное рассуждение основано, конечно, на предположении о рациональном поведении другого игрока. Наше первоначальное обсужде­ние свободно от такого предположения. Замечания, сделанные в начале и в конце п. 15.8, применимы до некоторой степени и в этой более простой ситуации. Существенно здесь то, что на самом деле результат (18:С) является и необходимым условием. Иными словами, из того, что могло бы обеспечить полную определенность игры, нет ничего более тонкого, чем непосредственное доминирование строк или столбцов.

Следует помнить, что нами рассматривался самый простой случай: = р2 == 2. В п. 1*8.5 мы увидим, какие следует добавить условия в тех случаях, когда Pi и р2 увеличиваются.


18.4. Обсуждение некоторых конкретных игр (обобщения игры в «орлянку»)

18.4.1. Рассмотрим некоторые применения результатов из пп. 18.2 и 18.3.

(а) Игра в «орлянку» в ее обычной форме с матрицей &С (табл. 7) задается так, как это указано в табл. 2 (стр. 120). Нам известно, что значение этой игры

v’ = 0

и (единственные) оптимальные стратегии

(См. п. 17.1. Это получается сразу же из формул п. 18.2.)

18.4.2. (Ь) Игра в «орлянку», где выбор «решетки» дает двойной выигрыш. Таким образом, матрица табл. 7 отличается от матрицы табл. 2 тем, что у нее элемент (1, 1) в два раза больше (см. табл. 8).

Таблица

1

2

1

2

—1

2

-1

1

и оптимальные стратегии

Диагонали здесь отделены (1 и 2 больше, чем — 1); следовательно, оптимальные стратегии единствен­ны и они будут смешанными (см. (18:А), (18:В)). Используя соответствующие формулы из случая (В2) в п. 18.2.5, мы получаем значение

1

Ml-!}’

V = 5

Заметим, что выигрыш при угадывании «решетки» увеличил значение игры для игрока 1, который пытается угадать. Кроме того, это обстоятель­ство заставляет его выбирать «решетку» менее часто, поскольку выигрыш делает этот выбор правдоподобным и, следовательно, опасным. Прямая угроза большой потери из-за выбора «решетки» влияет на игрока 2 анало-

гичным образом. Это рассуждение весьма правдоподобно, но недостаточно строго. Однако наши формулы, из которых этот результат был получен, достаточно строги.

18.4.3.(с) Игра в «орлянку», в которой совпадение «решеток» дает двойной выигрыш, а несовпадение при выборе «решетки» игроком 1 влечет тройной штраф. Таким образом, матрица табл. 7 модифицируется так, как показано в табл. 9.

Таблица 9

1

2

1

2

-3

2

-1

1

примеров это-

Диагонали отделены (1 и 2 больше, чем —1, —3); следовательно, оптимальные стратегии \ единственны и оказываются смешанными (ср. с полученными выше результатами). В этом случае использованные ранее формулы приводят к значению

и к оптимальным стратегиям

^={т’т}’ ^ = {т’ т} •

Мы предоставляем читателю дать качествен ную интерпретацию этого результата в том же смысле, что и выше. Конструирование дальнейших го типа можно теперь осуществить без труда.

18.4.4.(d) В п. 18.1.2 мы видели, что рассмотренные нами различные варианты игры в «орлянку» являются простейшими примерами игр двух лиц с нулевой суммой. В силу этого обстоятельства они приобрели общую значимость, которая затем подтвердилась результатами в пп. 18.2 и 18.3: действительно, мы там обнаружили, что этот класс игр выявил уже на про­стейших формулах условия, при которых чередуются случаи полной и неполной определенности. В качестве дальнейшего дополнения в этом же духе мы укажем, что взаимосвязь этих игр с игрой в «орлянку» подчер­кивает только один частный аспект. Другие игры, встречающиеся в совер­шенно ином оформлении, могут в действительности также принадлежать этому классу. Рассмотрим один пример такой игры.

Игра, которую мы сейчас рассмотрим, является эпизодом из приклю­чений Шерлока Холмса [205]).


Шерлок Холмс намерен отправиться из Лондона в Дувр и далее на континент, чтобы спастись от профессора Мориарти, который его пре­следует. Сев в поезд, он после отхода поезда заметил на платформе профес­сора Мориарти. Шерлок Холмс допускает — и предполагается, что в этом он совершенно прав,— что его противник, который увидел его, может взять специальный поезд и догнать его. Перед Шерлоком Холмсом альтернати­ва: или продолжать поездку в Дувр, или покинуть поезд в Кентербери,

единственной промежуточной станции. Его противник, который, как предполагается, достаточно умен, чтобы представить себе такие возмож­ности, стоит перед тем же самым выбором. Оба противника должны выб­рать место выхода из поезда, не зная о соответствующем решении, при­нимаемом каждым из них. Если в результате принятия решений они ока­жутся в конце концов на одной и той же платформе, то Шерлок Холмс может с достоверностью считать себя убитым Мориарти. Если Шерлок Холмс благополучно достигнет Дувра, то он может считать себя спа­сенным.

Каковы оптимальные стратегии, в частности, для Шерлока Холмса? Эта игра имеет, очевидно, определенное сходство с игрой в «орлянку»; профессора Мориарти можно принять за того игрока, который стремится угадать. Назовем его игроком 1, а Шерлока Холмса — игроком 2. Обозна­чим выбор выхода в Дувре через 1, а выбор выхода на промежуточной станции через 2. (Это относится как к т4, так и к т2.)

Рассмотрим теперь матрицу &С в табл. 7. Клетки (1, 1) и (2, 2) соответ­ствуют поимке профессором Мориарти Шерлока Холмса. Элементы матри­цы, соответствующие этим выборам, должны быть, по вполне понятным

Таблица 10

1

2

1

100

0

2

-50

100

причинам, очень большими, например 100. Клет­ка (2, 1) означает, что Шерлок Холмс благопо­лучно попадает в Дувр, в то время как Мориарти останавливается в Кентербери. Это — поражение Мориарти; поскольку оно касается обоих сопер­ников, этой ситуации должно соответствовать в матрице большое по абсолютной величине отрица­тельное число, но меньшее, чем упомянутое выше положительное число. Пусть, например, это от­рицательное число есть —50. Клетка (1, 2) означа­ет, что Шерлок Холмс ускользает от Мориарти на промежуточной станции, [206]но не попадает на континент. Это лучше все­го назвать ничьей и соответствующему элементу матрицы приписать значение 0.

Матрица &С изображена в табл. 10.

Как в рассмотренных ранее примерах (Ь) и (с), диагонали отделены (100 больше, чем 0 и чем — 50); следовательно, оптимальные стратегии снова единственны и являются смешанными. Использованные выше формулы дают значение (для Мориарти) игры

v’ = 40 -> —>

и оптимальные стратегии (£ для Мориарти, ц для Шерлока Холмса):

ГЗ 21 – Г 2 31

Таким образом, Мориарти должен с вероятностью 60% ехать в Дувру в то время как Шерлок Холмс должен с вероятностью 60% сойти на про­межуточной станции; оставшиеся 40% соответствуют в каждом случае другой возможности.

Замечание. В рассказе Конан Дойль, естественно, не рассматривает сме­шанные стратегии и вместо этого описывает фактическое развитие событий. Поэтому Шерлок Холмс выходит на промежуточной* станции и победоносно провожает взглядом специальный поезд Мориарти, проследовавший в Дувр. Решение Конан Дойля являет­ся наилучшим при его ограничениях (только чистые стратегии), поскольку он пред­писал каждому сопернику то поведение, которое, как мы нашли, является наиболее

вероятным (т. е. он заменяет вероятность в 60% на достоверность). Это, однако, порож­дает некоторое заблуждение, будто этот процесс приводит к полной победе Шерлока

Холмса, тогда как шансы (т. е. значение партии), как мы уже видели, благоприятст-

-» —>

вуют Мориарти. Из нашего результата для ^ и г] вытекает, что Шерлок Холмс был уже с вероятностью 48% мертв, когда его поезд отошел от вокзала Виктории. См. в связи с этим высказывание в цитированной выше книге Моргенштерна (стр. 98) о том, что вся поездка была ненужной, поскольку проигрывающего можно определить с самого начала.

18.5. Рассмотрение несколько более сложных игр

18.5.1. Полученное в п. 17.8 общее решение игры двух лиц с нуле­вой суммой вводит определенные альтернативы и понятия, в частности наличия или отсутствия полной определенности, значения партии vA и множеств оптимальных стратегий А, В. Для всех этих понятий мы полу­чили в п. 18.2 достаточно простые явные характеристики и определения. Они оказались пригодными даже в п. 18.3 при переформулировке всех результатов.

Эта простота может привести даже к некоторым недоразумениям. Действительно, результаты в пп. 18.2 и 18.3 получены с помощью непосред­ственных и притом вполне элементарных вычислений. Комбинаторные критерии полной определенности (18.А), (18.С) в п. 18.3, по крайней мере в их окончательном виде, были также значительно более прямолинейны­ми по сравнению с встречавшимися ранее. Это может вызвать сомнение в необходимости привлекать рассмотрения из п. 17.8 (и соответствующие результаты из п. 14.5 для случая полной определенности), особенно пото­му, что они основаны на математической теореме в п. 17.6, для которой был необходим анализ линейности и выпуклости в § 16. Если бы все это можно было заменить на рассуждения в стиле пп. 18.2, 18.3, то наши рас­смотрения в §§ 16 и 17 были бы совершенно необоснованными 1).

Но это не так. Как указывалось в конце п. 18.3, чрезвычайная простота процедур и результатов в пп. 18.2 и 18.3 является следствием того факта, что они приложимы только к очень простым играм двух лиц с нулевой суммой, именно к играм типа «орлянки», для которых = (32 = 2. По-видимому, для общего случая более абстрактные построения из §§ 16 и 17 пока представляются необходимыми.

Для того чтобы правильно понять взаимосвязь этих вещей, мы на нескольких примерах покажем, что для больших значений |3 утверждения из пп. 18.2, 18.3 уже не имеют места.

18.5.2. Для наших целей достаточно рассмотреть игры с р4 = (32 = 3. По существу они будут несколько напоминать игру в «орлянку» — боль­шая общность получена только за счет введения третьей альтернативы.

Таким образом, оба игрока имеют альтернативы (т. е. значения для т1? т2) 1, 2, 3. Для читателя лучше всего подразумевать под выбором 1 «решетку», под выбором 2 —«герб» и под выбором 3 что-нибудь вроде «безымянный». Снова пытается угадать игрок 1. Если f одного из игроков «безымянный», то не имеет значения, что у другого — «герб» или «решет­ка»; существенно лишь одно: у другого тоже «безымянный» или же у него одна из первых двух возможностей.

Поэтому в данной игре матрица будет иметь вид, представленный в табл. 11.

Четыре первых элемента матрицы (т. е. первые два элемента в первых двух строках) соответствуют уже знакомому примеру игры в «орлянку» (см. табл. 2). Два элемента, равные а, соответствуют случаю, когда игрок 1 выбирает «безымянный» и выбор игрока 2 не совпадает с выбором

Таблица И

1

2

3

1

1

-1

7

2

—1

1

У

3

а

а

Р

игрока 1. Два элемента, равные у, соответствуют противоположной ситуации. Элемент, равный |3, соответствует случаю, когда оба игрока выбирают «безымянный». Придавая соответствующие зна­чения (положительное, отрицательное или нуль), мы можем каждой из этих ситуаций поставить в соответствие премию или штраф или же сделать ее безразличной.

Мы получим все эти примеры, когда они нам понадобятся, конкретизируя нашу схему, т. е. выбирая соответствующим образом указанные выше а, |3, у.

18.5.3. Наша задача состоит в том, чтобы показать, что ни один из результатов (18:А), (16:В), (18:С), вообще говоря, не верен.

По поводу (18:А). Этот критерий полной определенности относится к частному случаю р4 = |32 = 2. Для больших значений р1э р2 две диаго­нали даже не будут исчерпывать матрицы, и, следовательно, положение дел только на диагоналях не может быть такой же характеристикой, как это было выше.

Таблица 12

Tl\

1

2

3

1

1

—1

0

2

-1

1

0

3

а

а

По поводу (18:В). Приведем пример игры, которая не является вполне определенной, но в которой тем не менее существует оптимальная стратегия одного из игроков, являющаяся чистой (конечно, для другого игрока это уже не так). Кроме того, особенность этого примера состоит в том, что у одного из игроков имеется несколько опти­мальных стратегий, в то время как у другого — только одна.

Возьмем для игры, описываемой табл. 11, а, Р, у из табл. 12. Здесь а > 0, 8 > 0. Для се­бя читатель определит, какие комбинации выбо­ра «безымянный» соответствуют выигрышу или штрафу в указанном выше смысле.

Проанализируем эту игру, используя кри­терии из п. 17.8.

Для g={V2, У2, 0} всегда К (£, rj) = 0, т. е. при этой стратегии игрок 1 не может ни­чего потерять. Следовательно, v’ ^ 0. Для г] = б3 = {0, 0, 1} всег-

да К (£, г|) rgO1), так что при этой стратегии не может ничего поте­рять игрок 2. Следовательно, v’ fg 0. Таким образом, имеем

v’ = 0.

Поэтому £ является оптимальной стратегией в том и только том случае,

—> —>

когда К (£, т]) ^ 0, а г] является оптимальной стратегией в том и только том случае, когда 1) К (£, т]) rg 0. Легко видеть, что первое справедливо тогда и только тогда, когда

= = у 9 5з=0,

& второе —тогда и только тогда, когда



Таким образом, множество А оптимальных стратегий | состоит ровно

из одного элемента, и этот элемент не является чистой стратегией. В то же — ->

время множество В оптимальных стратегий т] содержит бесконечно много

—V —>

стратегий, одна из которых является чистой, именно т] = б3 = {0, 0, 1}.


Рис. 23.

Рис. 22.


Множества А ж В можно представить графически, используя графиче­ское представление по аналогии с рис. 16 (см. рис. 22, 23).

По поводу (18:С). Приведем пример вполне определенной игры, в которой никакие две строки, а также никакие два столбца не доминируют друг друга. Фактически мы сделаем даже несколько больше.

18.5.4. Предположим пока, что числа р1у р2 произвольны. Сущность доминирования строк и столбцов была рассмотрена в конце п. 18.3. Как было показано, это означает, что у одного из игроков имеется простой и непосредственный повод отказаться от одной из своих возможностей ради другой,— и это сужает возможности в направлении, приводящем в конечном счете к полной определенности.

В частности, если строка т[ доминируется строкой т^ т. е. если (Ti» т2) ^^ (t'v т2) Для всех т2> то игроку 1 можно не рассматривать выбор Ti, поскольку при любых обстоятельствах выбор т^ не хуже выбо­ра т". Если столбец т2 доминирует столбец т. е. если Ж (т4, т£) ^ ^ Ж (т1? т0 для всех т1? то игроку 2 можно не рассматривать выбор поскольку при любых обстоятельствах выбор т[ для него не хуже выбора (См. приведенное выше, в частности сноску 2 на стр. 197. Это рассмотре­ние, конечно, является чисто эврис? тическим, см. замечание на стр. 204.)

Теперь мы можем использовать более общее положение. Если стро­ка (т. е. чистая стратегия игрока 1, соответствующая строке т![) доми­нируется линейной комбинацией оставшихся строк Ф (т. е. смешан - —>

ной стратегией в которой компонента ==0), то правдоподобно


предположить, что игроку 1 можно не рассматривать выбор %"v поскольку другие %[ при любых обстоятельствах будут не хуже.

Математически эта ситуация выражается так:

(

Pi

Ж т2) ^ 2 т2)£Х1 для всех т2,

С Ђ5Pl, |xI = 0.

Для игрока 2 аналогичное положение дел возникает в том случае* когда столбец т2 (т. е. чистая стратегия игрока 2, соответствующая т'2) доминирует линейную комбинацию оставшихся столбцов т2 Ф (т. е. сме­шанную стратегию т] с компонентой ч\х» — 0). Математически эта ситуа­ция выражается так:

{

32

т2) ^ 2 Ж {%и т2) г]Х2 для всех ти

Эти утверждения аналогичны приведенным выше.

Таким образом, игра, в которой имеют место (18:14:а) или (18:14:Ь)Г позволяет для одного из игроков быстро и естественно ограничить возможность выбора.

Замечание. Это, конечно, чисто эвристическая аргументация. Мы в ней и не нуждаемся, поскольку в нашем распоряжении имеется полное рассмотрение, проведенное в пп. 14.5 и 17.8. Однако может возникнуть иллюзия, что это рассужде­ние может заменить или по крайней мере упростить эти строгие доказательства. При­мер, который мы собираемся привести в этом тексте, по-видимому, разбивает такие надежды.

Существует и другой путь, позволяющий получить эти результаты. Если имеет место (18:14:а) или (18:14:Ь), то комбинация этого с результатами из п. 17.8 может быть использована для получения информации о множествах оптимальных стратегий А и В. Здесь мы не собираемся этим заниматься.

Таблица 13

\Т2 Tl\

I

2

3

1

1

1

—а

2

—1

‘ i 1

—а

3

а

а

0

18.5.5. Покажем теперь, что возможности применения утверждений (18:14:а) и (18:14:Ь) весьма ограничены. Мы построим вполне определен­ную игру, для которой не справедливо ни (18.14:а), ни (18:14:Ь).

Для этого вернемся к рассмотрению класса игр с матрицей, изображенной в табл. 11 (Pi = = р2 = 3). Положим 0 < а < 1, Р = 0, у = —а (см. табл. 13). Читатель может сам определить, какая комбинация выбора «безымянный» соответ­ствует выигрышу или штрафу в указанном вы­ше смысле.

Обсудим эту игру. Элемент (3, 3) является, очевидно, седловой точкой; поэтому игра вполне определенная и

у’ — 0.

Нетрудно показать теперь (привлекая метод, использованный в п. 18.5.3), что как множество А всех оптимальных стратегий так и множество В всех оптимальных стратегий г) содержат ровно по одному элементу: чистую стратегию б3 = {0, 0, 1}.

С другой стороны, у читателя не вызовет затруднения проверка того, что здесь не имеют места ни (18:14:а) ни (18:14:Ь), т. е. что в матрице на табл. 13 ни одна из строк не доминируется линейной комбинацией двух других и ни один столбец не доминирует линейную комбинацию двух других.

18.6. Случай и неполная информация

18.6.1. Рассмотренные в предыдущих пунктах примеры прояснили тот факт, что роль случая — более точно, вероятности — в игре не всегда очевидна, поскольку она не вытекает непосредственно из правил игры. Правила игр с матрицами табл. 7 и табл. И никак не предусматривают случай: все без исключения ходы делаются игроками *). Тем не менее мы обнаружили, что большинство из этих игр не является вполне опреде­ленным, т. е. оптимальные стратегии в них являются смешанными стра­тегиями, включающими явное использование вероятностей.

С другой стороны, анализ игр с полной информацией показал, что эти игры всегда вполне определены, т. е. что игроки в них имеют оптималь­ные стратегии, которые являются чистыми стратегиями, и совсем не вклю­чают вероятность (см. § 15).

Таким образом, с точки зрения поведения игроков, т. е. с точки зре­ния используемых ими стратегий, существенно, является ли игра вполне определенной или нет, но несущественно, содержит ли она какие-либо случайные ходы.

Результаты § 15, относящиеся к играм, в которых имеется полная информация, показывают, что существует тесная связь между полной определенностью и правилами, которые регулируют информацию игроков. Для того чтобы сделать это совершенно ясным и, в частности, показать, что наличие случайных ходов несущественно, мы установим сейчас следую­щее. В каждой игре двух лиц с нулевой суммой любой случайный ход можно так заменить комбинацией личных ходов, что стратегические воз­можности игры не изменятся. Это будет необходимо допустить для пра­вил, включающих неполную информацию игроков, но это является именно тем, что мы хотим сейчас показать: неполная информация включает (сре­ди другого) все возможные последствия явных случайных ходов 2).

18.6.2. Итак, рассмотрим игру двух лиц с нулевой суммой Г и в ней случайный ход Перенумеруем, как обычно, все альтернативы а и = 1, • • и примем, что их вероятности. . ., равны

I/a*, *). Заменим теперь Л^ на два личных хода оМ’%, оМ^ соответственно игроков 1 и 2. Пусть каждый из них имеет а^ альтернатив; соответствую­щие выборы обозначим через сг^ = 1, . . ., и а* = 1, . . а%. После­довательность этих ходов безразлична, но мы потребуем, чтобы они произ­водились без всякой информации относительно результатов каких бы то ни было ходов (в том числе и относительно другого хода оМ’^, Зададим функцию б (а’, а”) с помощью матричной схемы (см. табл. 14; б (а’, а”) — элемент матрицы [207])). Влияние о/Ч^ч o/flк, т. е. влияние соответствующих личных выборов с^с, сг’и, на исход игры точно такое же, как ио! ис соот­ветствующим (случайным) выбором = б (а^, oQ. Обозначим эту новую игру через Г*. Мы утверждаем, что стратегические возможности игры Г*” совпадают со стратегическими возможностями игры Г.

Таблица 14

7 G”

О’

1

2

—1

а*

1

1

а*

3

2

2

2

1

4

3

ax —1

ак — 1

а* — 2

1

«X

а*

ссх

а и — 1

1

2

1

18.6.3. Действительно, пусть игрок 1 в игре Г* использует данную смешанную стратегию из игры Г с последующим уточнением относительна хода [208]), для того чтобы выбрать все о’к = 1, . . с одними и теми

же вероятностями 1/ах. Тогда эта игра Г* — с этой стратегией игрока 1 — будет, с точки зрения игрока 2, совпадать с игрой Г. Это объясняется тем, что любой выбор игрока 2 при oJll”^ (т. е. любое о”Уу — 1, . . ., ах) даст тот же самый результат, что и исходный случайный ход Взглянув на табл. 14, мы увидим, что столбец о” = этой матрицы содержит каждое из чисел о = б (сг\ о”) = 1, . . а„ ровно один раз, т. е. что функция б (о’, о”) принимает значения 1, . . а% (стратегии игрока 1) с равными вероятностями 1/ах точно так же, как это сделал бы ход оМ^ Таким образом, с точки зрения игрока 1, игра Г* не хуже игры Г. Те же самые доводы, если при этом поменять ролями игроков 1 и 2, т. е. если поменять ролями строки и столбцы в матрице на табл. 14, показывают, что, с точки зрения игрока 2, игра Г* также не хуже игры Г.

Поскольку точки зрения двух игроков противоположны, это означает, что игры Г и Г* эквивалентны1).

18.7. Интерпретация этого результата

18.7.1. Последовательное применение ко всем случайным ходам игры Г операций, описанных в пп. 18.6.2, 18.6.3, позволит избавиться от них; тем самым заключительное утверждение из п. 18.6.1 доказано. Для того чтобы лучше понять сущность этого результата, приведем несколько практических примеров, иллюстрирующих это преобразование.

(A) Рассмотрим следующую совсем элементарную «игру случая». Два игрока при помощи случайного устройства с распределением 50% на 50% решают, кто платит другому одну единицу. Применение схемы из пп. 18.6.2 и 18.6.3 преобразует эту игру, состоящую ровно из одного случайного хода, в игру с двумя личными ходами. Взглянув на матрицу табл. 14 при ак = 2, мы придем к выводу, что она совпадает с матрицей табл. 2, если значения б (а’, а”), равные 1, 2, заменить на фактические выигрыши. Вспоминая пп. 14.7.2, 14.7.3, мы видим (ход рассуждений достаточно прозрачен), что наша игра является игрой в «орлянку».

Таким образом, игра в «орлянку» является естественной схемой полу­чения вероятностей 1/2, 1/2 в случае личных ходов и неполной информации. (Вспомним п. 17.1!)

(B) Модифицируем пример (А) так, чтобы допустить возможность «ничьей». Два игрока с помощью случайного устройства, дающего исходы

111

с вероятностями 33 %, 33 у %, 33 %, решают, кто будет платить другому

одну единицу или же никто никому совсем ничего не заплатит. Снова при­меняем схему из пп. 18.6.2, 18.6.3. Теперь матрица табл. 14 с ах = 3 совпадает с матрицей табл. 3 после замены в ней значений 1, 2, 3, прини­маемых функцией б (о’, о”), на фактические выигрыши 0, 1, —1. Восполь­зовавшись пп. 14.7.2, 14.7.3, мы видим, что это есть игра «камень, мешок и ножницы».

Таким образом, игра «камень, мешок и ножницы» является естествен­ной схемой получения вероятностей 1/3, 1/3, 1/3 в случае личных ходов и неполной информации. (Вспомним п. 17.4!)

18.7.2. (С) Функцию б (о’, о”) в табл. 14 можно заменить другой функ­цией, и даже области о’к = 1, . . а^ и о^ = 1, . . ., а^ можно заменить на другие области о’к = 1, . . ., а’к и а^ — 1, . . ., а*, лишь бы было

г) Мы предоставляем читателю привести эти рассуждения в соответствие с точ­ными формализованными рассуждениями в § И и пи. 17.2, 17.8. Это не представляет затруднений, но несколько длинно. Мы надеемся, что проведенные выше неформаль­ные аргументы подчеркивают существенные особенности рассматриваемого явления более простым и ясным путем.


выполнено следующее условие. Каждый столбец матрицы табл. 14 содер­жит каждое число 1, . . ах одно и то же число раз х), и каждая строка содержит каждое из чисел 1, . . ., ах одно и то же число раз 2). Действи­тельно, в рассуждениях в п. 18.6.2 использовались только эти два свой­ства функции б (Ох, сгх) (и а’к, а и).

Нетрудно видеть, что предосторожность, заключающаяся в «подсня – тии» колоды карт перед сдачей, попадает в эту категорию. Когда одна из 52 карт должна быть выбрана случайным образом с вероятностью 1/52, это обычно обеспечивается тасованием колоды. В этом и заключается слу­чайность хода, но если игрок, тасующий колоду, шулер, то он может «передернуть», что и будет его «личным» ходом. Для защиты от этого другому игроку разрешается указать в перетасованной колоде место, с которого рассматриваемая колода должна быть «подснята». Эта комби­нация двух ходов — даже если они личные — эквивалентна случайному ходу, который имелся в виду первоначально. Отсутствие информации, конечно, является необходимым условием эффективности этой схемы.

Здесь ах = 52, а’к = 52! равно числу возможных расположений карт в колоде, а^ = 52 — количество способов «подснятия». Мы предоставля­ем читателю возможность самостоятельно восстановить детали и выбрать в этой ситуации б (а^, oQ 3)-

§ 19. ПОКЕР И БЛЕФ

19.1. Описание покера

19.1.1. Неоднократно подчеркивалось, что случай = р2 = 2, рас­смотренный в п. 18.3 и более детально в п. 18.4, охватывает лишь самые простые игры двух лиц с нулевой суммой. Затем в п. 18.5 мы привели несколько более сложных примеров, возникающих при рассмотрении общего случая игры двух лиц с нулевой суммой, но для лучшего понима­ния наших общих результатов целесообразно, по-видимому, обсудить детально еще одну частную игру более сложного типа. Это тем более жела­тельно, что для игр с Pi = р2 = 2 выборы т1? т2, называемые (чистыми) стратегиями, едва ли заслуживают это имя: естественнее было бы называть их «ходами». Действительно, в этих чрезвычайно простых играх вряд ли могло бы проявиться какое-либо различие между позиционной и нор­мальной формами, и поэтому тождественность ходов и стратегий (харак­теризующих игру в нормальной форме), в этих играх не пропадает. Мы бу­дем теперь рассматривать игру в позиционной форме, в которой игрок имеет несколько ходов, так что переход к нормальной форме и к страте­гиям станет уже достаточно содержательной операцией.

19.1.2. Игра, которую мы собираемся рассмотреть, — это покер.

Замечание. Рассмотрение в общем виде вопросов, связанных с покером, и математическое обсуждение вариантов осуществлено Дж. фон Нейманом в 1926—28 гг., л о до сих пор не опубликовано. Этот круг вопросов освещен в последующих пунктах (см. общее упоминание в «Zur Theorie der Gesellschaftsspiele», Math. Ann., 100 (1928)). Это относится, в частности, к симметричному варианту в пп. 19.4—19.10, к вариантам

—– 1————————-

*) Именно ax/a^ раз; поэтому сс^ должно делиться на

2) Именно раз; поэтому а к должно делиться на

3) Мы предполагаем, что тасование используется для последующего выбора толь­ко одной карты. Если сдается более одной карты, то «подснятие» не будет абсолютно надежным средством. Шулер может подтасовать колоду таким образом, что одно «под­снятие» не расстроит его планы и информация о такой колоде даст шулеру незаконное преимущество.

(А) и (В) из пп. 19.11—19.13 и ко всей интерпретации блефа, который преобладает во всех этих обсуждениях. Несимметричный вариант (С) из пп. 19.14—19.16 рассмат­ривался в 1942 г. специально для этой книги. В работе Э. Бореля и Ж. Билля, упо­мянутой в замечании на стр. 177, также рассматривается покер (Vol. IV, «Applications aux Jeux de Hasard», Chap. V: «Le Jeu de Poker»). Эти работы очень поучительны, но основное внимание уделено в них оценке вероятностей применительно к покеру. Эта оценка произведена более или менее эвристическим путем без систематического использования каких бы то ни было основ общей теории игр.

Чисто стратегическая разновидность покера («La Relanee» — «повышение») ана­лизируется на стр. 91—97 упомянутой работы. Ее можно рассматривать также как упрощенный вариант покера, подобный двум вариантам, рассмотренным в пп. 19.4— 19.10 и пп. 19.14—19.16. В действительности он тесно связан с последним.

Читателю, который захочет сравнить эти два варианта, будут полезны следующие указания:

(I) Наши «ставки» а, Ъ соответствуют 1 + а, 1 из указанной работы.

(II) Различие между нашим вариантом из пп. 19.4—19.10 и вариантом Бореля и Билля состоит в следующем. Если игрок 1 начинает с низкой ставки, то наш вариант приводит к сравниванию карт, в то время как в упомянутом варианте игрок безусловно теряет низкую ставку. Это значит, что мы трактуем начальную низкую ставку как «уравнивание» (см. обсуждение в начале п. 19.14 и, в частности, сноску 1 на стр. 233), в то время как в указанном варианте это трактуется как пасование. Мы считаем, что наша трактовка лучше описывает эту фазу реального покера й, в частности, это необходимо для правильного анализа и интерпретации блефа. По поводу технических деталей см. сноску 1 на стр. 240.

Настоящий покер является слишком сложной игрой и не поддается исчерпывающему анализу; поэтому нам придется ограничиться некоторыми упрощенными модификациями, при этом некоторые из упрощений дейст­вительно весьма существенны *). Тем не менее основная идея покера и свойства его решений в нашей упрощенной форме, по-видимому, сохра­няются. Поэтому окажется возможным при помощи результатов, получен­ных в уже разработанной теории, обосновать общие выводы и дать их интерпретацию.

Заметим, прежде всего, что в обычном покере участвует произволь­ное число игроков [209]); поскольку, однако, мы сейчас рассматриваем игры двух лиц с нулевой суммой, количество игроков мы примем равным двум.

Игра в покер начинается с раздачи из колоды [210]) каждому игроку по 5 карт. Возможные комбинации по пяти карт, а их всего [211]) 2 598 960, называются «раскладами». Эти расклады линейно упорядочиваются, т. е. указывается исчерпывающее правило, определяющее, какой расклад является самым старшим среди всех, какой — вторым, третьим, …— от самого старшего к самому младшему [212]). Покер играется в различных вариантах, которые распадаются на два класса: «короткая» и «длинная» игры. В короткой игре расклад игрока, получаемый им с самого начала, остается неизменным в течение всей партии. В длинных играх у игрока имеется несколько способов изменить весь свой расклад или его часть; в некоторых вариантах игры игрок может проделывать это несколько раз в течение одной партии. Поскольку мы намерены обсудить простей­шую форму покера, мы ограничимся рассмотрением короткой игры.

В этом случае несущественно различие раскладов как таковых, т. е. как комбинаций карт. Обозначим через S число возможных раскла­дов (для случая полной колоды, как отмечалось, S = 2 598 960). С таким же успехом мы могли бы говорить, что каждый игрок вместо комбинации карт получает число 5=1, . . ., S. Эта идея состоит в том, что значению s = S ставится в соответствие самый старший расклад, значению s — S — — 1 — следующий за ним и т. д.; наконец, значению s = 1 ставится в соот­ветствие самый младший расклад. Условие честной игры предполагает равновероятность всех возможных раскладов. Поэтому выбор числа s мы должны интерпретировать как случайный ход, причем вероятность каждого из возможных значений 5=1, . . ., S равна 1/S. Таким обра­зом, игра начинается двумя случайными ходами х): извлечением числа s для каждого из игроков 1 и 2. Эти числа мы обозначим через st и s2.

19.1.3. Следующая фаза покера в общем случае состоит в том, что игроки «ставят». Смысл этого состоит в том, что после ставки одного из игроков, которая состоит из некоторой суммы денег, другой игрок имеет возможность пасовать, раскрыться или повысить. Если игрок пасу­ет, то это означает, что он согласен заплатить без каких бы то ни было условий определенную сумму из своей предыдущей ставки (которая необходимо должна быть меньше, чем последняя ставка). В этом случае несущественно, какие расклады имеют игроки. Эти расклады даже не рас­крываются. Раскрытие приводит к тому, что расклады сравниваются и иг­рок со старшим раскладом получает сумму в размере последней ставки. Повышение означает, что партнер заменяет последнюю ставку на боль­шую и игроки меняются ролями, т. е. игрок, ранее объявивший ставку, сам выбирает между пасом, раскрытием и повышением [213]).

19.2. Блеф

19.2.1. Существо игры состоит в том, что игрок с достаточно хорошим раскладом, поскольку у него достаточно оснований надеяться на выигрыш, склонен к назначению большой ставки и к многочисленным повышениям. Поэтому противник игрока, назначившего большую ставку или повысив­шего, может на основании увиденного предположить, что у его парт­нера хороший расклад. Это может побудить его к пасованию. Однако, поскольку в случае паса расклады не сравниваются, даже игрок с младшим раскладом может в этом случае выиграть у противника с более высоким раскладом, создав (обманчивое) впечатление старшего расклада при помо­щи высокой ставки или повышения, побуждая, таким образом, своего партнера пасовать.


Такой прием называется «блефом». Все опытные игроки несомненно пользуются этим приемом. Можно оспаривать реальность той мотивировки блефа, которую мы привели. Однако он допускает и иную интерпретацию. Именно если известно, что данный игрок назначает высокую ставку только в том случае, когда у него хорошие карты, то в таких случаях его партнеру естественно пасовать. Поэтому этот игрок не сможет добиться высоких ставок или многочисленных повышений даже в тех случаях, когда имею­щийся у него высокий расклад обеспечивает ему при этом выигрыш. Следо­вательно, в его интересах создать неопределенность в мнении своего партнера относительно таких возможностей. Это значит, что он стремится заставить партнера поверить в то, что он иногда назначает высокую ставку и при слабых картах.

Подведем итоги. Можно указать два возможных основания для «блефа». Во-первых, желание создать (обманчивое) впечатление высокого расклада при (фактическом) низком и, во-вторых, желание создать (обман­чивое) впечатление низкого расклада при (фактическом) высоком. Оба эти случая являются примерами подмены фактической информации на проти­воположную (см. п. 6.4.3), т. е. примерами введения противника в заблуж­дение. Следует заметить, однако, что первый тип блефа оказывается наи­более эффективным в том случае, когда он «проходит», т. е. когда против­ник спасует, поскольку именно это обеспечивает получение желаемого выигрыша; наоборот, второй тип блефа оказывается наиболее эффектив­ным тогда, когда он «не проходит», т. е. когда противник требует рас­крыться, поскольку это внушает противнику искаженную информацию.

Замечание. Здесь нас можно было бы обвинить в забвении ранее сформу­лированных основных принципов. В проведенном рассуждении предполагается нали­чие ряда партий (так что возможно статистическое наблюдение за привычками против­ника); тем самым оно имеет явно выраженный динамический характер. С другой сто­роны, мы постоянно заявляли, что наши рассуждения должны быть применимы и к одной изолированной партии, и что они тем самым являются строго статическими.

Мы отсылаем читателя к п. 17.3, где это кажущееся противоречие тщательно исследуется. Приведенное там рассуждение полностью справедливо также и в данном случае и должно оправдать нашу процедуру. Здесь мы только добавим, что наша непоследовательность — использование многих партий и динамической термино­логии — является чисто словесной. Формально мы могли бы сделать наши рассужде­ния более сжатыми и более близкими к способу обсуждения различных вещей в по­вседневной речи. Но в п. 17.3 было тщательно разобрано, каким образом все эти оспариваемые картины можно заменить на строго статическую задачу нахождения оптимальной стратегии.

19.2.2. Возможность такого косвенного и явно иррационального мотивирования ставок имеет еще и другое последствие. Такие ставки всегда являются рискованными, и поэтому может оказаться целесообраз­ным сделать их йце более рискованными путем применения соответствую­щих контрмер. Это ограничит использование их партнером. Но такие контрмеры как таковые также являются косвенно мотивированными ходами.

Мы уделили так много внимания этим эвристическим рассуждениям потому, что в нашей точной теории все эти запутанные мотивировки могут быть разъяснены. В пп. 19.10, 19.15.3 и 19.16.2 будет показано, каким образом можно количественно оценить ситуации, возникающие в связи с блефом, и каким образом мотивы связываются с такими основными стра­тегическими особенностями игры, как обладание инициативой и т. д.

19,3. Описание покера (продолжение)

19.3.1. Вернемся теперь к техническим правилам покера. Для того чтобы избежать бесконечных повышений, обычно их число ограничи­вается х). Для того чтобы избежать нереально высоких ставок —с едва предвидимым иррациональным влиянием на противника,—существуют

‘) Это и есть правило остановки из п. 7.2.3.

также ограничения на максимальные размеры ставок и повышений. Обычно накладывают также ограничения, исключающие слишком мелкие повышения; мы будем последовательно указывать, что послужило поводом для введения этих ограничений (см. конец п. 19.13). Ограничения на раз­мер ставок и повышений мы выразим в простейшей из возможных форм. Мы будем предполагать, что заранее даны такие два числа а и для которых

а>Ь>0,

и что для каждой ставки имеется только Две возможности: ставка может быть либо «высокой», и в этом случае она равна а, либо «низкой», и в этом

случае она равна Меняя отношение которое, очевидно, является здесь единственным существенным соотношением, мы можем сделать игру азартной, если отношение у существенно больше единицы, или от­носительно спокойной, если отношение ~ лишь немного больше

о

единицы.

Ограниченность числа ставок и повышений будет использована сейчас для упрощения всей схемы. В реальном покере один из игроков начинает с начальной ставки; затем игроки чередуют свои ходы.

Преимущества или недостатки того обстоятельства, что инициатива находится у одного из игроков, который зато должен начинать первым, сами по себе представляют интересную задачу. В пп. 19.14, 19.15 мы обсу­дим одну (несимметричную) разновидность покера, в которой это обстоя­тельство учитывается. Сначала, однако, нам не хотелось бы слишком усложнять исследуемый вопрос. Иными словами, на некоторое время нам хотелось бы избежать рассмотрения всех отклонений от симметричности, для того чтобы выявить наиболее характерные особенности покера в их наиболее чистом и простом виде. Поэтому мы будем предполагать, что начальные ставки делают оба игрока одновременно и ни один не знает о выборе другого. Только после того, как оба игрока назначат начальные ставки, они узнают, чья ставка выше или ниже.

19.3.2. Дальнейшее упрощение состоит в том, что игроки могут либо пасовать, либо раскрыться, т. е. исключается повышение. В самом деле, повышение является лишь более сложным и интенсивным выражением тенденции, содержащейся уже в высокой начальной ставке. Поскольку мы хотим по возможности упростить исследование, мы будем избегать рассмотрения нескольких путей проявления одной и той же тенденции. (См., однако, (С) в пп. 19.11, 19.14 и 19.15.)

В соответствии со сказанным сформулируем следующие условия. Рассмотрим момент, когда оба игрока информированы о сделанных став­ках. Если при этом обе ставки оказываются либо высокими, либо низкими, то расклады сравниваются и игрок с более сильным раскладом получает от партнера соответственно а или 6. Если расклады игроков равны, то расплата не производится. Если же одна из ставок оказывается высокой, а другая низкой, то игрок с низкой ставкой может либо пасовать, либо раскрыться. Пасование означает, что он платит своему партнеру сумму в размере низкой ставки (без какого бы то ни было сравнения раскладов). «Раскрытие» означает, что он изменяет свою низкую ставку на высокую, и эта ситуация рассматривается как такая, в которой оба игрока с самого начала назначили высокие ставки.

19.4. Точная формулировка правил

19.4. Теперь мы можем подвести итоги предыдущего описания нашего упрощенного покера, точно сформулировав принятые правила.

Сначала каждый игрок в результате случайного хода получает свой расклад, являющийся числом s = 1, …,£; каждое из этих чисел имеет одну и ту же вероятность 1 /S. Расклады игроков 1 и 2 мы обозначим соот­ветственно через sl9 52.

Затем каждый игрок выбирает при своем личном ходе либо а, либо Ъ (высокую или низкую ставку). Каждый игрок производит выбор (ставку), ознакомившись со своим раскладом и не зная ничего ни о раскладе, ни о выборе (ставке) своего противника.

Наконец, каждому игроку становится известным выбор другого, но не его расклад. (Каждому игроку по-прежнему известны свои расклад и выбор). Если оказывается, что одна ставка высокая, а другая низкая, то игрок с низкой ставкой может либо раскрыться, либо пасовать.

Это и есть партия. По окончании партии выплаты производятся сле­дующим образом. Если ставки обоих игроков высокие или ставка одного высокая, а ставка другого низкая, но сопровождается раскрытием, то

а

при Si = s2 игрок 2 выплачивает игроку 1 соответственно сумму 0. < —а

Если ставки обоих игроков «низкие», то при S* = s2 игрок 2 выплачивает

ъ “”

игроку 1 соответственно сумму 0. Если ставка одного игрока высокая,

—6

а ставка другого низкая и сопровождается пасованием, причем с высшей

1 Ъ

ставкой оказывается игрок ^ т0 игрок 2 выплачивает игроку 1 сумму.

Замечание. Ради формальной корректности это построение следовало бы еще привести в соответствие с моделями из §§ 6 и 7 в гл. II. Таким образом, упомянутые выше первые случайные ходы (имеющие дело с раскладами) следовало бы назвать хода­ми 1 и 2, последующие два хода (ставки) — ходами 3 и 4 и последний личный ход (пасо­вание или раскрытие) — ходом 5.

В случае хода 5 как игрок, личным ходом’которого он является, так и количество возможностей зависят от предыдущего хода игры, как это описано в пп. 7.1.2 и 9.1.5. (Если ставки обоих игроков одновременно высокие или низкие, то количество возмож­ностей равно 1 и не имеет значения, какому игроку мы припишем этот пустой личный ход. Если же ставка одного игрока высокая, а другого низкая, то личный ход делает назначивший низкую ставку.)

Последовательное использование упомянутых обозначений заставило бы писать

Для s2; СГ3, сг4 для высокой или низкой ставки, сг5 для пасования или раскрытия.

Мы предоставляем читателю сгладить все эти различия. ,

19.5, Описание стратегий

19.5.1. Всякая (чистая) стратегия в этой игре состоит, очевидно, в следующем. * Для каждого расклада 5 = 1, . . S указывается, какая будет назначена ставка, высокая или низкая, и в последнем случае делает­ся дополнительное заявление относительно последующего течения игры: если с этой низкой ставкой сочетается высокая ставка противника, то игрок может раскрыться или пасовать. Проще всего записать это с по­мощью числового индекса is = 1, 2, 3; is = 1 соответствует высокой став­ке; is = 2 соответствует низкой ставке с последующим раскрытием (если таковое происходит); = 3 соответствует низкой ставке с последующим пасованием (если таковое происходит). Таким образом, стратегия заклю­чается в задании для каждого s = 1, . . ., S значения индекса is, т. е. в задании последовательности. . .,

Сказанное относится к обоим игрокам 1 и 2. Поэтому описанную выше стратегию мы будем обозначать соответственно через

Si (Ч,—— is) или S2 (/i, . .., 7s).

Таким образом, у каждого игрока имеется одно и то же число страте­гий: столько, сколько существует последовательностей iu. . ., is, т. е. 3s. Используя старые обозначения из п. 11.2.2, имеем

Pi = Рг = Р = 3s.

Если бы мы хотели придерживаться введенных выше прежних строгих обозначений, то нам следовало бы перенумеровать теперь эти последова­тельности iu. . ., is при помощи т4 = 1, . . ., |3 и затем (чистые) страте­гии игроков 1 и 2 обозначить соответственно через Sj[214], SJ[215]. Но мы пред­почитаем применять наши новые обозначения.

Теперь мы должны записать выигрыш, получаемый игроком 1, если игроки используют стратегии (ц, . . ., is) и 22(/i, . . 7s)- Этим выигрышем является элемент матрицы SK. . is\ji, . . js) 1)-

2 598 960.

б) Это описание содержит такие общеизвестные технические термины, как «флепГ рояль», «стрит», «каре на королях», «фул» и т. п. Здесь мь! не собираемся обсуждать эту терминологию. 4

14 Дж. Нейман, О. Мор генштерн




Таблица 15. (i, /) Таблица 16. (г,/) Таблица 17.


\ /

1

2

3

 

1

0

0

b

 

2

0

0

0

 

3

—b

0

0

 

\ / г \

1

2

3

 

1

—a

—a

b

 

. 2

—a

—b

—b

 

3

—b

—b

—b

 

\ / i \

1

2

3

1

a

a

Ь

2

a

b

3

—b

b

b


Если игроки фактически получили расклады и s2, то выигрыш, получаемый игроком 1, можно записать (используя сформулированные выше правила) следующим образом. Этот выигрыш равен jЈSign(si-S2) (hi, js2)i где sign (si — s2) — знак 2) числа sx — s2, и три функции

#+(*,/)> Xo(i, J), X-(i, j), / = 1,2,3, можно задать с помощью матриц[216]), приведенных в табл. 15 —17.

Числа s^ s2 появляются в результате случайных ходов, как это опи­сано выше. Поэтому[217])

s

(hi • • • » is | 7i» • • • ? 7s) = 2 ^sign(si-s2) (hv 7s2)-

81» S2=l

19.5.2. Перейдем теперь к смешанным стратегиям в смысле п.17.2. —> —>

Они являются векторами g, rj, принадлежащими множеству Имея

в виду используемые сейчас обозначения, мы должны задать компоненты этих векторов также по-новому. Мы должны писать 1ц…………………………………………………………………. is, вместо

Напишем формулу (17:2) из п.17.4.1, оценивающую ожидаемый выиг­рыш игрока 1:

К(1 л)= 2 («4, -.., «S | /1» – - -. 7s) Eil =

ii, h, …Js

1 XI

2 ^sign(si-s2) (iSl, U2) ill, …,isVht

ZJ

u…… si, s2

Изменим здесь порядок суммирования, тогда

Tl)==”52″S 2 <2?sign(si-s2) (*sn *s2) 1гь …, igHii,

si, s2 ils ii, …,

Если теперь положить

(19:1) рГ= S is,

ii, …, исключая iSl

<19:2) . S. r)ib…,is,

Jit •••> исключая jS2 ho=3


то наше равенство можно переписать в виде

1

Sl, S2 i, j

(19:3) КГ^)42 2 ^sign^-s,) (i\ 7) Р? о?.


Целесообразно пояснить смысл равенств (19:1) — (19:3).

Равенство (19:1) показывает, что р?1 есть вероятность того, что игрок 1, использующий смешанную стратегию выберет имея расклад равенство (19:2) показывает, что of есть вероятность того, что игрок 2, использующий смешанную стратегию г), выберет /, имея [218]) расклад s2.

Теперь интуитивно ясно, что ожидаемое значение К г]) зависит только от этих вероятностей pf1, af и не зависит от отдельных вероятностей £гь. . js, Ib’i, . . jS’

Замечание. Это означает, что две различные смешанные (чистые) стра­тегии могут с точки зрения фактического эффекта быть одинаковыми.

Для иллюстрации этого рассмотрим простой пример. Пусть S — 2, т. е. имеются только высокий и низкий расклады. Рассмотрим i — 2, 3 как один случай, т. е. пусть имеется только высокая и низкая ставки. Тогда будут существовать четыре возмож­ные (чистые) стратегии, которым мы дадим специальные имена. «Отважная»: при каждом раскладе высокая ставка. «Осторожная»: при каждом раскладе низкая ставка.

«Нормальная»: высокая ставка при высоком раскладе и низкая при низком. «Блеф»: высокая ставка при низком раскладе и низкая при высоком. Тогда (50-50)-смесь отважной и осторожной стратегий эквивалентна (50-50)- смеси нормальной стратегии и блефа, поскольку в каждом из этих случаев игрок будет, в соответствии с исходом случайного испытания, назначать 50-50 высокую или низкую ставку при любом раскладе.

Тем не менее в принятых нами обозначениях эти смешанные стратегии оказыва-

—>

ются различными, т. е. они оказываются различными векторами

Это означает, конечно, что наши обозначения, будучи полностью подходящими в общем случае, оказываются для многих конкретных игр избыточными. Это частое явление при математических рассмотрениях, преследующих общие цели. Пока мы разрабатывали общую теорию, у нас не было причин принимать во внимание эту избы­точность. Но сейчас, при рассмотрении конкретной игры, мы от нее избавимся.

Легко видеть, как непосредственно интерпретируется формула (19:3). Для^этого достаточно вспомнить смысл функции Xsign (si-s2) (*» /) и интер­претацию величин р!1, ар.

19.5.3. Понятно, что как по своему смыслу, так и в силу формальных определений (19:1), (19:2) числа pf1, of удовлетворяют условиям

з

(19:4) все SpP-1,

i= 1

3

(19:5) все af^O, 2af = l.

i=i

С другой стороны, любые рГ, af, удовлетворяющие этим условиям*

-> —>

можно получить из соответствующих г] по формулам (19:1), (19:2). Это понятно как математически х), так и интуитивно. Любая система таких чисел pf1, af является набором вероятностей, определяющих возможный способ поведения. Поэтому они должны соответствовать некоторой сме­шанной стратегии.

Соотношения (19:4) и (19:5) дают возможность составлять трехмерные векторы

= ps2\ рП, ^ = о*2, а-}.

—> —>

Тогда условия (19:4), (19:5) утверждают, что все p[219], a^ принадлежат S3.

Это показывает, каких больших упрощений мы добились благодаря

—>- —>-

введению этих векторов. Именно вектор £ (или т]) принадлежал

т. е. зависел от |3 — 1 = 3s — 1 числовых параметров; psi (или о82) состав­ляют множество, состоящее из S векторов в S3, т. е. каждый из них зави­сит от двух числовых констант. Число 3^ — 1 много больше числа 2S даже при умеренных S.

19.6. Формулировка задачи

19.6. Поскольку мы имеем дело с симметричной игрой, мы можем

использовать характеристику оптимальных (смешанных) стратегий,

—> —

т. е. характеристику £ £ А, указанную в (17:Н) из п. 17.11.2. Она состоит в следующем: стратегия g должна быть оптимальной против самой себя,

—> -7» -> —►

т. е. предполагается, что min К (g, г]) должен достигаться при ц =

—У

Далее, в п. 19.5 мы видели, что функция К (g, rj) фактически зависит

-> -> -> —► —> ->

OTpS1, aS2. Поэтому можно переписать ее в виде К (р1, . . ., ps| а1, . . . , os).- Тогда формула (19:3) из п. 19.5.2 утверждает (мы несколько изменили порядок суммирования), что

(19:6) К (р1, …, ps | о1, …, as) 2 2 ^signd-*) («, 7) P? of,

si, г S2, i

-> – v

и p1, .ps для оптимальной стратегии характеризуется тем, что

—> —-> ->

min К (р1, …, ps | о1, …, os) ai, о s

-> —у —>

достигается при а1 = р1, . . ., os = ps. Можно найти и явные условия для этого, используя, по существу, тот же метод, который был применен к аналогичной задаче в п. 17.9.1; мы сжато изложим его.

Минимум по (а1, . . ., os) функции (19:6) равен минимуму, взятому

—> —У

отдельно по каждой из переменных о1, . . os. Рассмотрим поэтому

—>

некоторую переменную oS2. Единственное ограничение, которому она удовлетворяет, состоит в принадлежности ее к £3, т. е.

з

все of^ 0, SoJ2=l.

э—1

Функция (19:6) линейна по этим трем компонентам о®2, о|2, в**. Следова­тельно, минимум по aS2 будет находиться там, где обратятся в нуль всо те компоненты af2, коэффициенты которых (по у, см. ниже) не достигают наименьшего возможного значения.

Обозначая через yf коэффициент при of, равный

S <^sign(s1-s2) {U j) Pi1» 8i, г

мы из (19:6) получаем

(19:7) К (р\ …, ps | a1……… = 2 v№■

__________________________________________________________________________________ S2, j

*) В действительности S равно приблизительно 2,5-106 (см. сноску 4 на стр. 209); поэтому оба числа 3s — 1 и 2S большие, но первое из них несравненно больше.

Тогда условием минимума (по о82) будет:

(19:8) Для каждой пары s2, j, для которой у)[220] не достигает минимума (по / х)), должно быть of = 0. Следовательно, характеристика оптимальной стратегии — минимиза – ция при а1 = р1, . . ., gs = ps — состоит в следующем:

—У – У —у ———————

{19:А) р1, . . ps описывают оптимальную стратегию, т. е. £

в том и только том случае, если для каждой пары s2, h Для кото­рой yf не достигает минимума (по j х)), имеем af = 0. На основе матричных схем табл. 15—17 выпишем, наконец, явные выражения для yf:

S2— 1

<19:9:а) ysi2 = 4″ { 2 (- «Р? – «Р? – bPS1) – bp?+

Sl=i 8

+ 2 (apr + ap!1 —&Р!1)} ,

Sl=S2 + l

S2—1

<19:9:b) у? = – i – { S (~ «Р?1—^Pl1 – bp?) +

Si=l

8

+ S (^Pf1 + &PS21+6PS31)} ,

S1=S2+1 «2-1

(19:9:c) у» = 4″ { 2 (&Pix~ 6P?~ bP?) + &P?2 +

Sl=l

S

+ 2 (&p!1 + &pi1+&ps31)}. Si=S2+l

19.7. Переход от дискретной задачи к непрерывной

19.7.1. Критерий (19:А) из п. 19.6 вместе с формулами (19:7), (19:9:а), (19:9:Ь) и (19:9:с) можно использовать для нахождения всех оптимальных стратегий 2). Эти рассуждения носят несколько утомительный комбина­торный характер и содержат анализ ряда возможностей. Получающиеся при этом результаты качественно сходны с результатами, получаемыми далее при несколько измененных предположениях. Различие между ними касается лишь некоторых деликатных вопросов, которые можно назвать «тонкой структурой» стратегии. Более подробно мы остановимся на этом в п. 19.12.

Нас сейчас интересуют главным образом основные характеристики решения, а не эти вопросы «тонкой структуры». Сначала обратим внима­ние на дискретную структуру последовательности возможных раскладов.

Если мы попытаемся изобразить старшинство всех возможных раскла­дов на шкале от 0% до 100% или лучше в виде дробей от 0 до 1, то «самый младший из возможных раскладов, 1, будет соответствовать нулю, а самый старший из них будет соответствовать единице. Поэтому расклад s

(= 1, . . ., S) следует заменить на величину z — * , принадлежащую

этой шкале. Итак, мы получаем табл. 18.

Таблица 18

Возможные ,

Старая шкала

s =

1

2

3

S-1

S

расклады

Новая

Z =

0

1

2

S — 2

1

шкала

S — 1

. — 1

S — 1


Таким образом, хотя значения z заполняют интервал <19:10) O^z^l

весьма плотно х), но все-таки они составляют дискретную последователь­ность. Это и есть упомянутая выше дискретная структура. Перейдем теперь от этого случая к непрерывному.

Будем предполагать, что случайный ход, выбирающий расклад s (т. е. число z), может воспроизвести любое z из интервала (19:10). Пред­положим, что вероятность любой части интервала (19:10) равна длине этой части, т. е. что величина ъ распределена [221]) на интервале (19:10) равномерно. Обозначим расклады игроков 1 и 2 соответственно через Zi и z2.

19.7.2. Это изменение влечет за собой замену векторов p8i, сг®2

—>

($!, s2 = 1, . . ., S) на векторы р21, о22 (0 zl9 z2 1); при этом, конечно, они по-прежнему являются вероятностными векторами (той же природы, что и раньше, т. е. принадлежат S3). Поэтому компоненты (вероятности) pi1, of (Si, s2= 1, …, S; i, 7 = 1, 2, 3) переходят в компоненты pf1, ар (OfgZi, z2rg 1; i, /=1,2, 3). Аналогично величины yf (в формулах <19:9:a), (19:9:b), (19:9:c) из п. 19.6) переходят в yf.

Перепишем теперь выражения для К и у* в формулах (19:7), (19:9:а), (19:9:Ь), (19:9:с) из п. 19.6. Ясно, что все суммы

is

s

~ 2 ‘

S2=l

81=1

надо заменить интегралами

1

j … dz2,

1

j.. . dzu

о


а суммы

82-1 ^ S

г S ‘ т” 2

Si=l Sl=S2+l

— интегралами

Z2 1 .

j . . . dzu j… dzu

0 Z2

в то время как отдельные слагаемые, стоящие в скобках с коэффициен­том 1/5, можно опустить *»л[222]). Понятно, что формулы для К и у* (т. е., у)) превращаются в

1

(19:7*)

3 о

22 1 (19:9:а*) = j (- apfi – ар? – bpf1).d*i + { (^Pf1 + apf1 – Ьр^1) 0 22 22 1 (19:9:b*) ^ = j (-ap?-bp?-bp?) dzt + j (ар? + bp? + bp?) dzi: 0 22 Z2 1

(19:9:c*) yf = j (&pn – bp? – bp?) dz, + j (bp? + ftp? + bp?) dz,, 0 22 а характеристика (19:A) из п. 19.6 переходит в следующую:

—У

(19:В) Векторы pz (0 ^ z 1) (все они принадлежат S3) описывают оптимальную стратегию в том и только том случае, когда^спра­ведливо утверждение:

Для каждой пары z, 7, для которой не достигает минимума (по j [223])), должно быть pzj = 0.

Замечание. Формулы (19:7*), (19:9:а*), (19:9:Ь*), (19:9:с*) и этот кри­терий можно было бы получить также и непосредственно из рассмотрения «непрерыв – —> -> ->

ного» случая с р*1, а22 вместо т], с которых мы начинали. Мы предпочли более длин­ную и явную процедуру, вытекающую из пп. 19.4—19.7, чтобы сделать строгость и полноту нашего подхода очевидной. Хорошим упражнением для читателя будет осуществить более короткое и непосредственное рассмотрение этого случая.

Соблазнительно построить теорию игр, в которой систематически и непосредст­венно встречаются такие непрерывные параметры, т. е. с общностью, достаточной для приложимости этой теории к случаям, подобным только что рассмотренному, и без использования процессов предельного перехода от дискретных игр.

Интересный шаг в этом направлении сделан Биллем в работе, указанной в заме­чании на стр. 177 (см. стр.110—113 упомянутой работы). Однако сделанные там предположения о непрерывности являются, по-видимому, слишком жесткими для многих приложений и, в частности, для рассматриваемого здесь.

19.8. Математическое построение решения

19.8.1. Приступим теперь к построению оптимальных стратегий pz, т. е. решения, определяемого условием (19:В) из п. 19.7.

Предположим сначала, что всегда > О х). Для такого z необходимо min yz. = у*; следовательно, у* ^ у*, т. е.

Vi —Tf^O.

Подстановка сюда выражений из (9:9:а*), (19:9:Ь*) дает

2 1 1 <19:11) (а-Ь) ( [ p? dZi - J p^dz,) +2b J p^dz^O.

0 Z 2

Обозначим, далее, через z° верхний предел тех z, для которых р£ > 0 [224]).

Тогда в силу непрерывности неравенство (19:11) справедливо также и для

z = z°. Поскольку для Zx > z° не может иметь места неравенство pf1 > 0

1

<по предположению), интеграл £ ръ dz4 в (19:11) равен нулю. Поэтому

zo

можно поставить перед ним знак «+» вместо знака «—», тогда из (19:11) мы получаем

1 1 (a-ft) J p?<fei + 2ft j ppcfc^O.

0 zo

Но по предположению р*1 всегда иногда >0; следовательно, первое

слагаемое всегда[225]»[226]) >0. Понятно, что второе слагаемое ^0. Таким образом, получено противоречие, т. е. мы показали, что [227])

<19:12) р| = 0.

19.8.2. Исключив 7 = 2, проанализируем теперь связь между / = 1 и 7 = 3. Поскольку р| = 0, должно быть р* + р| = 1, т. е.

<19:13) 1 —pf,

и, следовательно,

<19:14) O^pf^l.

Далее, на интервале 0 z ^ 1 могут существовать подинтервалы, для которых всегда р\ = О или всегда pf 1 х). Всякое z, не принадлежа­щее ни одному из подинтервалов такого типа, т. е. вблизи которого спра­ведливо как pf Ф 0, так и pf Ф 1, мы будем называть промежуточными.

Поскольку из pf Ф 0 или из pf Ф 1 (т. е. из pf Ф 0) вытекает, что min yf =

j

= yf или yf соответственно, мы видим, что вблизи любого промежуточ­ного z выполняется как неравенство yf fg yf, так и неравенство yf~ Следовательно, для таких z в силу непрерывности мы имеем [228]) у\ = – yf, т. е^

Подставляя (19:9:а*), (19:9:с*) и вспоминая (19:12), (19:13), мы получаем: 2 1 1 (a + b) j p*i dz, — (а —&) j pfi dZi + 2b j (1 – p*i) dzx = 0,

0 22

т. e.

z l

(19:15) {a + b) ( j pfi— \ ppdz^ +2b{l-z)=0.

0 z

Рассмотрим теперь два промежуточных z’, z”. Подставляя в (19:15) z = zr и z = z” и вычитая, мы получим

z”

2 (а+ 6) j pfidz1-26(z”-z’) = 0;

2′

отсюда

2″

(19:16) – L. j =

z’

Словесно это означает, что между двумя промежуточными zr и я? среднее – ъ

значение р\ равно.

Далее, ни одно из тождеств pf = 0 и pf = 1 не может выполняться! на всем интервале

поскольку среднее значение было бы тогда равно 0 или 1. Следовательно, этот интервал должен содержать еще хотя бы одно промежуточное z, т. е. между любыми двумя промежуточными z лежит хотя бы одно третье промежуточное z. Повторение этих рассуждений показывает, что между двумя промежуточными zf и z” другие промежуточные z лежат всюду плот­но. Поэтому z’ и z”, для которых выполняется (19:16), лежат всюду плотно* между z’ и z”. Но тогда в силу непрерывности соотношение (19:16) должно* иметь место для всех z’, z” [229]) между z’ и z”. Это не оставляет иной возмож­ности, кроме как утверждать, что pf = всюду между z’ и z”.

Замечание. Очевидно, при этом допускаются изолированные исключения,, составляющие область z меры 0, т. е. область общей нулевой вероятности (например, конечное число фиксированных значений z). Они не влияют на интегралы. Легко про­вести точное математическое рассуждение, но, по-видимому, оно здесь не требуется (см. сноску 4 на стр. 221). Таким образом, наиболее простым будет, по-видимомуг

предположение, что pf = ^ в интервале z’ ^ z ^ z”, без каких бы то ни было

исключений.

Это следует иметь в виду при рассмотрении формул на следующих страницах,, где, с одной стороны, имеется интервал ъ’ ^ z ^ с другой стороны, интервалы О < z < z’ ж z” <С z Ш 1. Иначе говоря, точки, z’ и z” отнесены к первому из назван­ных интервалов. Это, конечно, не является существенным: две фиксированные изо­лированные точки — в данном случае z’ и z” — можно рассмотреть произвольным^ образом (см. выше).

Читатель должен заметить, однако, что, в то время как при сравнении между собой значений z нет существенных, различий между случаями << и ^, для у* дело* обстоит иначе. Мы видели, что из неравенства yf > Уз вытекало pf = 0. Однако из неравенства yf ^ у| аналогичных заключений сделать нельзя. (Ср. также обсуждение рис. 25 и рис. 28, 29.)

19.8.3. Далее, если промежуточные z существуют, то существуют так­же наименьшее и наибольшее среди них; обозначим их через z’, z”.. Мы имеем:

(19:17) pi = ^ всюду в z’^z<iz”.

Если промежуточных z нет, то должно быть pf == 0 (для всех z) или pf = 1 (для всех z). Легко видеть, что ни одно из них не является решением *). Поэтому промежуточные z заведомо существуют, а с ними существуют и *z’, z”, так что формула (19:17) справедлива.

19.8.4. Левая часть в (19:15) равна у* — у* при всех z; следователь­но, для z = 1 мы имеем

1

Vj-Vi = (* + b) j pf1 dzi > 0

о

(поскольку случай pf1 = 0 исключен). В силу непрерывности неравенство* ?з ~~~ Yi > 0 или у2 < уI остается справедливым даже при значениях z, близких к 1. Тогда для этих z будет р\ = 0, т. е. pf =1. Таким образом, из (19:17) с необходимостью вытекает, что z” < 1. Далее, пусть в интервале* z” z ^ 1 не существует промежуточных z; тогда во всем этом интервала мы имеем pf = 0 или же pf = 1. Первую из этих возможностей наши пре­дыдущие результаты исключают. Следовательно,

(19:18) pf = 1 всюду в?<Ј*sgl.

_ 19.8.5. Рассмотрим, наконец, нижнюю границу zf в (19:17). Если z’ > 0, то мы имеем интервал 0 fg z rg z’. Этот интервал не содержит

Иначе говоря, ни высокая ставка, ни низкая ставка (с последующим пасова­нием) не будут при всех условиях оптимальными стратегиями.

Математическое доказательство. Пусть pf = 0. Находим: у? = — Ъ, уз = следовательно, у? < что противоречит р| = 1 Ф 0. Пусть. pz = 1. Находим: у? = а->4% = следовательно, у§ < yj, что противоречит pf = 1 Ф промежуточных z; следовательно, мы имеем в интервале 0 rg z ^g z’ либо всюду pf = 0, либо всюду pf = 1. Первая производная от у% — Yf, т. е. от левой части (19:15), равна, очевидно, 2 (а + Ъ) pf — 26. Поэтому в интервале 0 fg z < z’ эта производная равна 2 (а + 6)-0 — 2Ъ = —2Ъ < <0, если pf е= 0, и 2 (а + Ъ)Л — 2& = 2а >0, если pf = 1; таким обра­зом, разность Уз — yf в интервале 0 rg z < z’ или монотонно убывает, или монотонно возрастает. Поскольку на правом конце (промежуточная точка z’) ее значение равно нулю, мы имеем соответственно у\ — yf > О или < 0, т. е. соответственно Yf < у\ или yf > у% всюду на интервале О fg z <С z’. Тогда из первого неравенства мы заключаем, что в интервале О ^g z < z’ должно быть р* == О, pf = 1, а из последнего, что pf == 0. Но вначале мы предположили, что на этом интервале соответственно pf = 0 или pf = 1. Таким образом, в каждом из случаев получено про­тиворечие.

Следовательно,


ъ’ = 0.

<19:19)


19.8.6. Теперь для определения z” воспользуемся тождеством (19:15), лодставив туда промежуточное z = z’ = 0. Мы получаем



о

1


о

Но (19:17), (19:18), (19:19) дают

1


о

Таким образом, мы имеем

^ а -„______ 2 Ь

а-\-Ь а-\-Ъ ‘

а —„ л 2Ъ а — b

а-\-ЪZ а-\-Ъ а-\-Ъ ‘

т. е.


<19:20)

z

> ___ а — Ъ а


Воспользовавшись (19:17), (19:18), (19:19), (19:20), получаем


<19:21)


Вместе с (19:12), (19:13) это полностью описывает стратегию.


19.9. Детальный анализ решения

а+Ь

Рис. 24,

19.9.1. Полученные в п. 19.8 результаты показывают, что для рас­сматриваемой формы покера существует одна и только одна оптимальная стратегия х). Она описывается формулами (19:21), (19:12), (19:13) из п. 19.8. Мы изобразили эту стратегию графически, что облегчит последующее ее обсуждение. (См. рис. 24. Фактиче­ские пропорции этого чертежа соответ­ствуют отношению а! Ъ ~ 3.)

Сплошная линия описывает кри­вую р = pf. Таким образом, высота этой линии над линией р = 0 равна вероятности высокой ставки pf; превы­шение линии р = 1 над сплошной ли­нией равно вероятности низкой ставки (с обязательным последующим пасо­ванием): pf = 1 — pf.

19.9.2. Формулы (19:9:а*), (19:9:Ь*), (19:9:с*) из п. 19.7 позволя­ют вычислить теперь коэффициенты у). Вместо формул мы дадим графи­ческую интерпретацию, предоставляя читателю элементарную проверку. (См. рис. 25. Фактические пропорции остались здесь теми же, что и

У

b(3a-b) a+b

b

\

b(3b-a)

а,+о

0

a-b\ a \

/ ^

b(3a-b)

a+b

Рис. 25.

на рис. 24, т. е. а! Ъ ~ 3.) Сплошная линия соответствует кривой у = yf, точечная линия — кривой у = у*, а пунктирная^линия — кривой у — у*. На рисунке видно, что сплошная и пунктирная линии (т. е. у\ и совпадают на интервале 0 z rg ^ (а —: Ь)/а, а линии точечная и пунктирная (т. е. у* и у*) — на ин­тервале (а — b)/a ^z^l. Каждая из трех кривых составлена из двух отрезков, с общим концом в точке

z = . Фактические значения

а

величин у) в критических точках z = 0, (а — Ь)/а, 1 можно увидеть на рисунке 2).

19.9.3. Сравнение рис. 24 и 25 показывает, что наша стратегия дей­ствительно является оптимальной, т. е. что она удовлетворяет условию (19:В) из п. 19.7. В самом деле, на интервале 0 rg z fg (а — Ь)/а, где выполняются оба неравенства pf ^=0, pi Ф 0, как кривая Yf, так и

Фактически мы доказали только следующее утверждение. Никакая стратегия, отличная от стратегии, определенной в п. 19.8, не может быть оптимальной. То, что эта стратегия на самом деле является оптимальной, можно было бы заключить из существования (по крайней мере) одной оптимальной стратегии, хотя наш переход к «непрерывному» случаю и может вызвать некоторое сомнение. Далее мы убедимся в том, что рассматриваемая нами стратегия является оптимальной, т. е. что она удов­летворяет условию (19:В) из п. 19.7.

2) Проверку этих результатов мы предоставляем читателю.

15 Дщ. Нейман, О. Моргенштерн

кривая уI являются нижними, т. е. их ординаты равны min На интервале

j

(а — Ъ)!а < z 1, где только pf Ф 0, только одна кривая у\ оказывается

нижней, т. е. ее ординаты равны min у]. (Поведение у* несущественно,

д

поскольку всегда pf = 0.)

Формула (19:7*) из п. 19.7 позволяет вычислить также значение пар­тии К. Очевидно, К = 0. Именно этого значения и следовало ожидать,, поскольку игра симметрична.

19.10. Интерпретация решения

19.10.1. Хотя результаты из пп. 19.8 и 19.9 являются математически завершенными, они, однако, требуют некоторых комментариев и интер­претации, изложением которых мы сейчас и займемся.

Во-первых, изображение оптимальной стратегии, представленное на рис. 24, показывает, что для достаточно высокого расклада оказы­вается pf = 1, т. е. игрок должен назначать обязательно высокую ставку.

Этот случай соответствует раскладам z > • Для младших раскладов,

однако, pf = , pf == 1 — pf = , так что как pf, так и р* отличны

от нуля, т. е. игроку следует назначать беспорядочно высокие и низкие ставки (с определенными вероятностями). Этот случай соответствует

раскладам z ^ ^zr^ • Высокие ставки (в этом случае) будут более редкими,,

z

чем низкие; действительно, = у, а а > 6. Эта последняя формула

Pi

показывает также, что последний тип высоких ставок становится все более редким, если размер высокой ставки (по сравнению с низкой) возрастает.

Теперь эти высокие ставки при младших раскладах, которые делаются беспорядочно (с определенными вероятностями) и которые становятся все более редкими с ростом цены высокой ставки, получают очевидную интер­претацию: они являются блефом в обычном покере.

Благодаря большим упрощениям, которые мы приняли при нашем анализе покера, блеф вошел в самом зачаточном виде, но тем не менее признаки его несомненны. Игроку целесообразно всегда назначать высо­кую ставку при старшем раскладе (z > (а — Ъ)!а) и, как правило, назна­чать низкую ставку (с вероятностью а!(а + Ъ)) при младшем раскладе (z < (а — Ъ)!а)\ вместе с тем иногда надо беспорядочно блефовать

(с вероятностью jq^) •

19.10.2. Во-вторых, условия в зоне блефа, 0 ^ z, также

проливают некоторый свет на другие факты — на такие последствия отхода от оп