احسان مرادی
احسان مرادی
شماره دانشجویی : 930527348
دانشگاه آزاد اسلامی اراک
فصل اول : |
|
فرایند تصمیم گیری با استفاده از مفاهیم نظریه بازی ها |
|
مقدمه |
3 |
نظریه بازی چیست |
5 |
اجزای تشکیل دهنده بازی |
5 |
انواع بازی |
6 |
تاریخچه پیدایش و تکامل نظریه بازی |
6 |
استراتژی بیش-کم |
7 |
تعادل نش |
9 |
تعادل نظریه بازی |
12 |
آشنایی با توماس شلینگ و توسعه نظریه بازی ها |
14 |
کاربردهایی از نظریه بازیها |
18 |
علوم سیاسی |
18 |
اقتصاد و تجارت |
18 |
زیست شناسی |
18 |
علوم کامپیوتر و منطق |
19 |
فلسفه |
19 |
کاربردهای نوین |
20 |
نتیجهگیری |
20 |
فصل دوم : |
|
انواع بازیها و راه حلهای آنها |
|
مقدمه |
22 |
تصمیم گیری در شرایط تضاد-نظریه بازی ها |
23 |
بازی دونفره با مجموع صفر |
23 |
روشmaximin/minimax |
24 |
روش برتری(سلطه) |
26 |
استراتژی مختلط |
28 |
نظریه بازی ها و برنامه ریزی خطی |
33 |
حل مساله برنامه ریزی خطی در مورد نظریه بازیها با نرم افزار EXCEL |
36 |
خلاصه نظریه بازیها |
43 |
فصل سوم : |
|
نمونه مطالعه کاربردی |
|
اثر تحریمهای اقتصادی بر ایران(با استفاده از نظریه بازیها) |
45 |
چکیده |
45 |
انواع تحریم اقتصادی |
45 |
مکانیزم تأثیرگذاری تحریم |
47 |
ارزیابی تحریمهای موجود علیه ایران در چهارچوب تعادل نش |
49 |
نوع تحریمهای اقتصادی ایران و نحوه تأثیرگذاری آنها |
51 |
منابع |
5 |
فصل اول
فرایند تصمیم گیری با استفاده از
مفاهیم نظریه بازی ها
مقدمه:
در اکتبر سال 1962 جهان در آستانة نبرد هسته ای قرار داشت. اتحاد جماهیر شوروی در حال استقرار موشک های هسته ای در کوبا بود، جایی که تنها 145 کیلومتر با خاک آمریکا فاصله داشت و آمریکایی ها برچیدن فوری این عملیات را تقاضا می کردند. در غیر آن صورت ، آنچه نباید می شد، اتفاق می افتاد.
وجود آن موشک ها تهدیدی بود که کندی ، رئیس جمهور وقت ایالات متحده ، نمی توانست آن را نادیده بگیرد، در عین حال، او می دانست که یک واکنش غلط می تواند به جنگ هسته ای و مرگ میلیون ها نفر منجر شود. بعضی از مشاوران کندی پیشنهاد یک حملة هوایی سنگین می دادند تا چند دوجین موشکی را که شوروی در کوبا به سمت آمریکا نشانه رفته بود، نابود و منهدم کنند. خطر این کار در این بود که احتمالاً شوروی، به جای این که فقط شاهد نابودی کلاهک های هسته ای اش باشد، به حملة هسته ای علیه آمریکا دست بزند. بعضی دیگر پیشنهاد محاصرة دریایی می دادند تا از استقرار موشک های بیشتر در جزیره جلوگیری شود و در ضمن، تقاضای برچیدن قبلی ها هم پا بر جا باشد، اما گروهی از این هراس داشتند که مبادا این اقدام مؤثر نباشد.
به مدت چند روز سرنوشت ساز دو ابر قدرت در حال سبک و سنگین کردن گزینه های خود بودند، در حالی که به خوبی از عواقب گرفتن یک تصمیم غلط آگاه بودند. رئیس جمهور آمریکا محاصرة دریایی را انتخاب کرد و در همان وقت برای حملة هوایی علیه کوبا آماده شد. چند روز بعد، پس از مذاکرات پر تب و تاب پشت پرده، اتحاد جماهیر شوروی موشک هایش را برچید و جهان دوباره نفس راحتی کشید .
بحران موشکی کوبا یکی از نقاط عطف تاریخ قرن بیستم است ، اما در عین حال نمونه ای از مساله ای است که همة ما در زندگی روزمره به دفعات بسیار با آن مواجه می شویم. چگونه وقتی نمی دانیم طرف مقابل چه فکری می کند، بهترین تصمیم را بگیریم ؟
این سؤال دائماً برای همه پیش می آید، از کارمندی که می خواهد سر اضافه حقوق چانه بزند، تا بازیگری که می خواهد بداند بهتر است ادامه دهد یا خیر.
آیا راهی هست تا بتوان بهترین روش بازی کردن را پیدا کرد، یعنی استراتژی بهینه ای که به بهترین نتیجة ممکن منتهی شود؟ حدود یک قرن پیش عده ای از ریاضی دانان دوراندیش شروع به تأمل در این پرسش کردند و راه حل آن را پیدا کردند و در نتیجه مبحث تازه ای به نام «نظریة بازی » به راه انداخته که از آن زمان تا کنون در همه جا کاربردهای زیادی پیدا کرده است، از عملیات نظامی گرفته تا اقتصاد و زیست شناسی .
نظریه بازی چیست؟
نظریه بازیها (Game Theory) حوزهای از ریاضیات کاربردی است که در بستر علم اقتصاد توسعه یافته و به مطالعه رفتار استراتژیک بین عوامل عقلانی میپردازد. رفتار استراتژیک، زمانی بروز میکند که مطلوبیت هرعامل، نه فقط به استراتژی انتخاب شده توسط خود فرد بلکه به استراتژی انتخاب شده توسط بازیگران دیگر وابستگی داشته باشد. زندگی روزمره ما، مثالهای بیشمار از چنین وضعیتهایی دارد که از جمله آنها میتوان به مذاکرات تجاری بین دو کشور، جنگ تبلیغاتی بین دو شرکت رقیب، رای دادن دو سهامدار، بازی بین استاد و دانشجو برای تعیین کیفیت درس، بازی دولت و شهروندان برای اعلام و پذیرش سیاستها، پیشنهاد و رد ازدواج بین یک زن و مرد اشاره کرد.
اجزاء تشکیل دهنده بازی:
برای تعریف فضای بازی، مشخصکردن عناصر زیر لازم و کافی است:
1- بازیگران: طرفهای بازی که هر کدام حداقل دو استراتژی در اختیار دارند.
2- استراتژی در اختیار هر بازیگر: زنجیرهای مرتب از اقداماتی است که بازیگر میتواند در قدمهای مختلف بازی برگزیند.
3- ترتیب بازی: این که در هر قدمی از بازی، چه بازیگری حرکت میکند.
4- ساختار اطلاعاتی: در هر لحظه از بازی هر بازیگر میتواند چه اطلاعاتی را از حرکتها و ترجیحات طرف مقابلش بداند.
5- خروجیهای بازی: وقتی بازی به انتها میرسد چه
نتایجی به بار می آید.
انواع بازی:
انواع بازی را میتوان به شکل زیر طبقه بندی کرد:
1- بازی با مجموع صفر: در این بازی سود یک بازیگر معادل زیان بازیگر دیگر است.
2- بازی با مجموع غیر صفر: در این بازی تصمیمات یک بازیگر ممکن است به نفع همه بازیگران تمام شود.
3- بازی تعاونی: در این نوع بازی امکان سازش و تبانی با دیگران وجود دارد.
4- بازی غیر تعاونی: در این نوع بازی امکان سازش و تبانی بین شرکت کنندگان وجود ندارد.
تاریخچه پیدایش و تکامل نظریة بازی:
نظریه بازی با وجود کاربردهای گسترده ای که دارد، منشا آن به چیزی مهم تر از همان موضوعی که نامش از آن گرفته شده است، یعنی بازی کردن، بر نمی گردد. اشرف زادة انگلیسی، جیمز والدگریو (James waldegrave) در سال 1713 روشی برای بردن بازی با کارت پیدا کرد که بسیاری از اجزاء نظریة مدرن بازی را در بر می گیرد. با این حال، او متوجه کاربردهای باالقوة این روش در حوزه های دیگر نشد و نظریة بازی می بایست 200 سال دیگر برای شکوفایی اش صبر کند.
یک ریاضی دان فرانسوی به نام امیل بورل (emile borel) کسی بود که بازی ها را به مسائل جدی تر ربط داد. در سال 1921 او اولین مقاله از مجموعه مقاله هایش را به چاپ رساند که دربارة بازی کردن است، یعنی پیدا کردن بهترین استراتژی برای بردن یک بازی، وقتی شیوة بازی حریف را نمی دانیم. بورل راه استادانه ای برای مقابله با این کمبود اطلاعات پیدا کرد :«طوری بازی کن که شیوة حریف هر چه که باشد، احتمال باخت به حداقل برسد». بورل توانست با نشان دادن این که کدام ترکیب سه تایی، احتمال باختن را به حداقل می رساند، یک قاعدة سردستی برای بازی های ساده ای مثل سنگ، کاغذ، قیچی پیدا کند. او همچنین بر خلاف والدگریو، متوجه شد که این ایده می تواند کاربردهای جدی تری از جمله در استراتژی نظامی، داشته باشد. با این حال، او در مورد خطرهای تعمیم بیش از حد این روش هشدار داد، به خصوص که معتقد بود برای تعیین بهترین استراتژی در بازی های پیچیده که بازیکنان چندین گزینه دارند، هیچ راهی وجود ندارد.
استراتژی بیش- کم:
اما بورل اشتباه می کرد. هر گاه دو حریف برای رسیدن به برتری بجنگند و برد یکی دقیقاً با باخت دیگری برابر باشد (یعنی چیزی که یکی به دست می آورد با آنچه دیگری از دست می دهد برابر باشد)، همواره یک بهترین استراتژی ممکن وجود دارد که آنها می توانند آن را به کار ببرند. این استراتژی به بیش- کم (minimax) موسوم است و وجودش را یک ریاضی دان نابغه 25 سالة مجار به نام جان فون نویمان (John Von Neumann) اثبات کرد.
فون نویمان با استفاده از روش های بسیار پیچیده نشان داد که ابتدا تمام گزینه های ممکن را بررسی کنیم، بدترین نتیجه ای که ممکن از هر کدام حاصل شود را ارزیابی کنیم و سپس آن را که کمتر از همه بد است، انتخاب کنیم. اگر یکی از حریفان بخواهد نتیجة بهتری بگیرد، خطر ضرر بیشتری را قبول می کند. در نتیجه استراتژی «بیش- کم» منطقی ترین گزینه است.
این استراتژی مسألة پیش بینی رفتار حریف را هم حل می کند، چرا که اگر فرض کنیم حریف ها همواره منطقی عمل می کنند، پس آن ها هم استراتژی بیش- کم را اتخاذ خواهند کرد.
اثبات قضیة بیش- کم توسط فون نویمان، او را به پدر نظریة بازی تبدیل کرد، اما خودش این را آغاز کار می دانست. در سال 1944 او به اتفاق اسکار مورگنسترن (Morgenstern Oscar) اقتصاددان اتریشی، کتاب «نظریة بازی و رفتار اقتصادی» را منتشر کرد که در آن، در پی آن بود تا نظریة بازی را مبنای رویکرد نوینی به علم اقتصاد قرار دهد، چرا که در اقتصاد معمولاً دو یا چند حریف برای رسیدن به بهترین نتیجة ممکن با هم رقابت می کنند.
کتاب فون نویمان و مورگنسترن امکانات گستردة کاربرد نظریة بازی را در مواردی مهمتر از وقت گذارنی نشان داد و از اوایل دهه پنجاه استراتژیست های نظامی از آن برای تحلیل جنگ سرد استفاده می کردند، اما خیلی زود محدودیت های آن را دریافتند. مهم تر از همه، این فرض بود که آنچه یک بازیکن به دست می آورد، دقیقاً برابر است با آنچه دیگری از دست می دهد. گرچه بسیاری از بازی های ساده از قاعدة «حاصل جمع صفر» پیروی می کنند، اما بسیاری از موقعیت های واقعی در زندگی چنین نیستند. به عنوان مثال در بحران موشکی کوبا، حملة یکی از طرفین می توانست جنگ هسته ای راه بیندازد که نتیجه اش احتمالاً نابودی هر دو طرف می بود.
قضیة بیش - کم اولیة فون نویمان در برنامه های شطرنج رایانه ای نیز به کار برده می شود که در این مورد کمک می کند تا معدودی از بهترین حرکت ها از بین تعداد پرشمار حرکت های ممکن انتخاب شوند.
قضیه فون نویمان دربارة بازی های «حاصل جمع غیر صفر» سکوت می کند. آیا برای پیدا کردن بهترین استراتژی در این بازی ها راهی وجود دارد؟ اصلاً بیایید ببینیم چنین استراتژی وجود دارد یا نه. یک بار دیگر یک ریاضی دان جوان نابغه پاسخ را پیدا کرد و این بار هم پاسخ مثبت بود.
تعادل نش:
در سال 1950 یک دانشجوی 21 سالة دانشگاه پرینستون به نام جان نش (John Nash)، برنده جایزه نوبل اقتصاد در سال 1994 میلادی، موفق شد قضیة اولیة بیش- کم فون نویمان را تعمیم دهد تا بازی های با حاصل غیر صفر را هم در برگیرد. نش نشان داد برای هر بازی بین هر تعداد بازیکن، همواره حداقل یک استراتژی وجود دارد که اگر بازیکنی، غیر از آن را انتخاب کند، قطعاً نتیجة بدتری خواهد گرفت.
در این شکل تعادل، هر یک از بازیکنان بدون تبانی یا همکاری با دیگران و بدون توجه به رفاه جامعه یا هر یک از بازیگران دیگر، بهترین استراتژی ممکن را در راستای منافع خویش اتخاذ میکند. برای نمونه بازی تعادلی آدام اسمیت(دست نامرئی) که در آن رقابت بین تولید کنندگان با انگیزه کسب سود، خود به خود قیمت را در پائینترین سطح تعیین میکند، یک نوع تعادل غیر تعاونی کارآمد است، زیرا کالای فراوان با پائینترین قیمت ممکن، به نفع مردم و مصرف کنندگان تمام میشود. اما بازی آلودگی محیط زیست یا مسابقه تسلیحاتی که در آن رقابت بین تولید کنندگان به زیان کشورها و مردم و مصرف کنندگان است، از نوع تعادل غیر تعاونی ناکار آمد هستند. البته پیمانهای کنترل تسلیحات میتوانند این تعادل را به تعادل غیر تعاونی کمتر نا کار آمد، تبدیل کرده و رقبا میتوانند حاشیه امنیت و رفاه خود را افزایش دهند.
این استراتژی ها که امروزه به اسم «تعادل های نش» معروف اند، در قلب نظریة بازی جا دارند. هم چنین آنها منشاء بحث های بسیاری شدند که یک دلیلش این است که این استراتژی ها همیشه با چیزی که آشکارا بهترین گزینه برای بازیکن هاست، مطابقت ندارند. یک مثال کاملاً واقعی این موضوع، مسابقة تسلیحات هسته ای است که همزمان با کشف نش در جریان بود. هم آمریکا هم شوروی می دانستند بهترین گزینه این است که هر دو خلع سلاح شوند، اما هیچ کدام به دیگری اعتماد نداشتند، بنابراین در نهایت هر دو مشغول صرف هزینه هایی گزاف برای تهیه سلاح هایی شدند که امیدوار بودند هرگز از آن ها استفاده نکنند.
همچنین آشکار شد که بسیاری از موقعیت های روزمره، بیش از یک تعادل نش وجود دارد و به هیچ وجه روشن نیست که بازیکنان کدام را باید برگزینند. در این مورد هم یک نمونه مشهور معاصر وجود داشت : فیلم هالیوودی «شورش بی دلیل»، تولید سال 1955 و با شرکت جیمز دین. دین نقش «جیم» را بازی می کند که با یکی از گردن کلفت های مدرسه به اسم «باز» وارد یک بازی می شود که در آن با ماشین هایشان به سمت پرتگاه، مسابقه می گذارند و کسی که اول «جا بزند» بازنده است .
بنابراین جیم و باز باید بین تغییر جهت دادن و مستقیم ادامه دادن انتخاب کنند. این بازی چهار نتیجة ممکن دارد که واضح است، هیچ کدام شان مطلوب نیستند. زودتر تغییر مسیر دادن معنایش باخت است و اگر هر دو مستقیم برانند، نتیجه فاجعه بار خواهد بود.
روشن است که اگر هر دو تصمیم به تغییر مسیر بگیرند، بهتر است، چون هر دو می بازند، ولی زنده می مانند. با کمال تعجب، کار نش نشان می دهد که این گزینة آشکار، یک تعادل نش نیست: هر کدام از بازیکنان ها اگر وقتی دیگری تغییر مسیر می دهد، به راه خود ادامه دهد نتیجة بهتری می گیرد. بدتر این که معلوم شده است که این جا دو استراتژی تعادل نش در میان است : مستقیم رفتن، وقتی دیگری تغییر جهت می دهد و بر عکس. اما چه طور می توان راننده دیگر را مجبور کرد که طبق این استراتژی پیش برود؟
متخصصان نظریة بازی که با این پرسش دست و پنجه نرم کردند، به مسائل بیشتری برخوردند. به نظر می رسید چیز بیشتری لازم است. برای مثال جیم می توانست قبل از سوار شدن وانمود کند که عقلش سر جایش نیست و در نتیجه ترسی از مردن ندارد و به این ترتیب، باز را فریب دهد که زودتر تغییر مسیر دهد.
به طور خلاصه، کار نش آشکار ساخت که وضوحی که به نظر می رسید نتایج اولیة فون نویمان به نظریة بازی داده است، توهم بوده است. از آن زمان متخصصان نظریة بازی به دو دستة بزرگ تقسیم شده اند : یک دسته تلاش شان بر این متمرکز شده است که با استفاده از بازی های کلاسیکی مثل «کی ترسوتر است؟» (مثال بالا)، جوهر یک مسأله را درک کنند، و دستة دوم در پی گسترش نظریة استاندارد بازی هستند، تا آن را به واقعیت نزدیک تر کنند.
تکامل نظریة بازی
هر دو دسته نامبرده در زمینه های وسیعی، از اقتصاد گرفته تا جامعه شناسی، موفقیت های قابل توجهی به دست آورده اند. برای نمونه، اندرو کولمن (Andrew Colman) و همکارانش در دانشگاه لیسستر، رفتار مجرمان در جامعه را به صورت بازی «کی ترسوتر است» مدل سازی کرده اند. هم مجرم هم جامعه ترجیح می دهند که طرف مقابل زودتر «جا بزند» از طرف دیگر اگر همه مجرمانه رفتار می کردند، هیچ وقت یکی از دو طرف منتفع نمی شدند. کولمن و همکارانش با استفاده از نظریة بازی نشان دادند که در نهایت این وضعیت به این منجر می شود که جمعیت مجرمان نسبت به جامعه تقریباً ثابت میماند، در حدی که مجرمان از رفتار مجرمانه نفع ببرند بدون این که جامعه به مقابلة بی رحمانه تحریک شود. نظریة بازی همچنین پیش بینی می کند که برای این که آمار جرائم از این میزان جرم پائین تر بیاید، لازم است تدابیری که برای مقابله اتخاذ می شود، چنان سخت گیرانه باشند تا مجرمان به این نتیجه برسند که رفتار مطابق قانون، به نفع آنهاست ، با موفقیت سیاست های بدون انعطاف در نیویورک و دیگر شهرهای بزرگ جهان، این پیش بینی تأیید شده است.
با تعقیب و پیگیری کار پیشتازانة نظریه پرداز زیستی، جان مینارد (John Maynard Smith) زیست شناسان برای فهم این که چرا حیوانات نوع خاصی از رفتار مثل تهاجم یا همکاری در پیش میگیرند، از ایده های نظریة بازی کمک می گیرند. زیست شناسان به جای تعادل نش، از یک «استراتژی پایدار زیستی» صحبت می کنند، یعنی رفتاری که به یک جمعیت اجازه می دهد تا مقابل هجوم دیگرانی که رفتار متفاوتی دارند، مقاومت کنند.
مهیج ترین پیشرفت، تلاش و تمرکز برای هر چه واقعی تر کردن نظریة بازی است. گروهی به سرپرستی نظریه پرداز بریتانیایی، دکتر نایجل هاوارد (Nigel Haward) در حال پروردن نظریه ای به نام نظریة نمایش (Drama Theory) هستند که عواطف را وارد نظریة بازی میکند. معمولاً بازیکنانی که خود را در یک نوع بازی گرفتار می یابند، از طریق واکنش های عاطفی آنرا به نوع دیگری از بازی تبدیل می کنند. نظریة نمایش تلاش می کند تا نتایج احتمالی آن را پیش بینی کند.
یکی از بزرگترین پیشرفت های نظریة بازی، توسط پروفسور استیون برامس (Steven Brams) استاد علوم سیاسی دانشگاه نیویورک، به دست آمد. او تعمیمی برای نظریة بازی یافته که نظریة حرکت ها نامیده می شود و نشان می دهد که چگونه با واکنش نشان دادن هر بازیکن به استراتژی بازیکن دیگر، بازی ها تکامل می یابند. به نظر می رسید نسبت به نظریة بازی استاندارد، این نظریه بتواند درک قابل قبول تری از رویدادهای مهم جهانی، از بحران موشکی کوبا گرفته تا امضای موافقتنامه «جمعة نیک» در ایرلند شمالی به دست دهد.
آشنایی با توماس شلینگ و توسعه نظریه بازیها:
شلینگ سالهای زیادی را در مخزن فکری معروف رند (RAND) سپری کرده است که در دوره بعد از جنگ جهانی دوم میزبان حلقهای از متخصصان معروف نظریه بازی بوده و سهم به سزایی در توسعه کاربردهای این رشته ایفا کرده است.
او در سال 2005 پس از 54 سال فعالیت علمی جایزه نوبل اقتصاد را به طور مشترک با رابرت آومن به دلیل نقش وی در توسعه درک از منازعات و همکاریها در قالب مدلهای بازی، دریافت نمود.
در ادامه 4 محور از فعالیتهای فکری مهم شلینگ را به طور اجمالی توضیح میدهیم:
بازی ترسوها (Chicken Game) و نقطه کانونی (Focal Point) در بین کارهای متعدد شلینگ (مفهوم نقطه کانونی که گاهی هم به افتخار او، نقطه شلینگ نامیده میشود) بیشترین تأثیر و ارجاع را داشته است. مفهوم پیشنهادی او، درک ما را از تعادلهای ممکن در کلاس بزرگی از بازیها که بازی هماهنگی نامیده میشوند، ارتقا دادهاست.
خصوصیات این بازیها این است که در آنها ترکیبی از استراتژیهای بازیگران وجود دارد که برای هر دو آنها مطلوب است ولی چون هر بازیگری فاقد اطلاع از استراتژی انتخابشده توسط بازیگر دیگر است، نمیداند باید چه استراتژی را انتخاب کند، تا بازی در یکی از این نقاط جذاب پایان یابد. این مفهوم، درک ما را از بسیاری از زیرساختهای فرهنگی و سیاسی که نقش هماهنگکننده انتظارات افراد و در نتیجه تحقق یکی از چندین تعادل ممکن بازی را دارند، بسیار غنیتر میکند.
مثالی که شلینگ در کتاب استراتژی تضادها (The Strategy of Conflict) ذکر میکند، این است که فرض کنید شما و همسرتان در یک فروشگاه بزرگ، همدیگر را گم کردهاید. این جا یک بازی هماهنگی بین دو نفر شکل میگیرد که در آن استراتژی هر بازیگر، محلی است که باید در آن جا منتظر همسرش باشد. دراین حالت مجموعه استراتژیهای در اختیار هر فرد بسیار بزرگ و شامل تمامی نقاط موجود در فروشگاه است.
اگر فرد به در شماره یک برود، حال آن که همسرش در مقابل صندوق منتظر او باشد، هر دو مطلوبیت پایینی به دست میآورند. در حالی که اگر هر دو تصمیم بگیرند تا مقابل تابلوی خاصی منتظر باشند (هماهنگی)، همدیگر را یافته و در نتیجه مطلوبیت هر دو بسیار بالا خواهد بود. طبیعی است که اگر قبل از بازی، چنین هماهنگی صورت میگرفت، هر نقطهای از فروشگاه میتوانست یک محل ملاقات باشد ولی در غیاب چنین هماهنگی، هر بازیگر باید با خودش فکر کند که همسرش در چنین شرایطی ممکن است کجا برود و ضمناً به این فکر کند که همسرش فکر میکند که خود او ممکن است کجا برود و الی آخر. اگر افراد هیچ نکتهای برای غیرمتقارن کردن نقاط بالقوه قرار نداشته باشند، احتمالاً شانس کمی برای یافتن هم دارند. ولی معمولاً تجارب گذشته یا عرف و مسایلی از آن دست به کمک ما میآید. مثلاً افراد از تجربه گذشته میدانند که بهتر است موقع گمشدن، در مقابل در خروج منتظر همسر خود باشند و نه مثلاً مقابل انبار فروشگاه.
همین موضوع کمک میکند تا به احتمال بسیار بالاتری دو نفر همدیگر را در این نقطه ملاقات کنند و هماهنگی بین آنها شکل بگیرد. شلینگ این مفهوم را به نحو جالبی در تحلیل منازعات بینالملل به کار گرفت. برای تشریح رویکرد او از مدل ساده بازی «کی ترسوتر است» استفاده میکنیم.
بازی «کی ترسوتر است» در زندگی روزمره بسیار شناخته شده است. توصیف کلی بازی این است که راهی وجود دارد که فقط یک بازیگر میتواند از آن عبور کند و اگر هر دو بازیگر با هم سعی کنند وارد آن شوند (انتخاب همزمان استراتژی شهامت)، وضعیت هر دو آنها بدتر از حالتی است که یکی منتظر شود، تا اول آن دیگری عبور کند. در عمل این راه میتواند بازار یک محصول، جنگ بر سر یک منطقه تحت اختلاف بین دو کشور و غیره باشد. شلینگ در این مسئله از یک مشاهده تجربی شروع میکند. دو نفر را تصور کنید که باید از یک در باریک رد شوند.
در عمل احتمال این که هر دو نفر با هم به سمت در حرکت کنند و در نتیجه با هم برخورد کنند، بسیار ضعیف است. در دنیای واقعی، نهادهایی مثل ارزشهای اجتماعی کمک میکنند تا صرفاً یکی از این استراتژیها محقق شود. مثلاً افراد بنا به عادت میدانند که معمولاً خانمها یا افراد مسنتر یا ارشد، اولویت بیشتری در عبور از در دارند، لذا همین اطلاع کوچک کمک میکند تا دو نفر استراتژی خود را با هم هماهنگ کرده، بنابراین بهترین نتیجه بازی بهدست آید.
شلینگ بر اساس مشاهداتی از این جنس از دنیای واقعی، بهاین نتیجه رسید که عواملی وجود دارند که تقارن موجود در بازی را به هم زده و شانس تحقق یک تعادل را بیشتر از تعادل دیگر میکنند. همین عدم تقارن باعث میشود تا بازیگران بهطور مشترک باور کنند که احتمال تحقق یک تعادل بیشتر است و به همین علت، در عمل این تعادل با احتمال بالایی ظاهر میشود.
شلینگ با معرفی مفهوم تهدید معتبر و غیرمعتبر، درک از این ماجرا را بسیار تعمیق بخشید. عبارت تهدید غیرمعتبر به این حقیقت اشاره میکند که حتی اگر یکی از بازیگران، طرف مقابل را به استفاده از یک استراتژی خاص تهدید کرده باشد، ولی اگر شرایط جوری شود که او مجبور شود تهدید خود را عملی کند، خود او اجرای تهدید را عقلانی نخواهد یافت. مدیری را تصور کنید که کارمند بیانضباط ولی با تخصص بالای خود را تهدید کرده که اگر یکبار دیگر دیر سر کار حاضر شود، او را اخراج میکند. او در واقع قصد دارد تا با آشکار کردن این تهدید، کارمند را در شرایطی قرار دهد که تأخیر برای او غیرعقلانی شود. ولی کارمند از طرف دیگر شرایط را برای خودش شبیه سازی میکند و فرض میکند که فردا دیر سر کار حاضر شده است.
مدیر در اینجا باید تهدید خود را عملی کند ولی اگر این کار را بکند و این نیروی خوب را از دست بدهد، باید هزینه فراوانی برای یافتن نیروی جدید متحمل شود، بنابراین اخراج کارمند در آن لحظه غیرعقلانی است. به همیندلیل مدیر از اجرای تهدید قبلی خود خودداری میکند. کارمندی که این موضوع را میداند تهدید مدیر را جدی نمیگیرد و به دیرآمدن خود ادامه میدهد (در ادبیات خارج از نظریه بازیها، گاهی به این موضوع "قربانی عقلانیت خود شدن" هم گفته میشود و منظور آن است که چون تهدیدکننده عقلانی است، تهدیدشونده میداند که تهدید وی عملی نخواهد شد)
کاربردهایی از نظریه بازیها:
در این بخش به طور خلاصه به کاربردهای نظریه بازی، در علوم مختلف ئاشاره شده است.
علوم سیاسی (Political Science):
کاربرد نظریه بازی در علم سیاست، در مسائلی مانند تقسیم عادلانه، اقتصاد سیاسی، انتخاب عمومی، نظریه سیاست مثبت و نظریه انتخاب اجتماعی می باشد. در هر یک از این موضوعات، پژوهشگران مدلهای نظریه بازی را به گونهای توسعه دادهاند که اغلب رای دهندگان، موقعیتها، گروههای ذینفع و سیاستمداران، بعنوان بازیگران تلقی میشوند.
اقتصاد و تجارت (Economics and Business):
اقتصاددانان بطور گسترده نظریه بازی را برای تحلیل پدیدههای اقتصادی مانند مزایده (یا حراج)، معامله و قرارداد، انحصار فروش کالا بین دو نفر، تقسیم عادلانه، تولیدات کالا توسط افراد یا شرکتهای معدود، شکلگیری شبکه اجتماعی و سیستم رایگیری به کار میبرند.
زیستشناسی (Biology):
در زیستشناسی تناسب با استفاده از بازیها تفسیر میشود. تناسب مفهومی اصلی در نظریه تکامل است. این مفهوم توانایی تولید مجدد نوع خاصی از ژنها را بیان میکند. به علاوه در تعادلی که در اینجا مورد توجه است، کمتر به جنبه عقلانی توجه میشود و بیشتر تعادلی مد نظر است که توسط نیروی تکامل تحمیل میشود.
در زیستشناسی، نظریه بازی برای درک بسیاری از پدیدهها به کار میرود. زیستشناسان نظریه بازی تکاملی و استراتژی تکامل پایدار را برای توضیح روابط غیرمنتظره حیوانات بکار بردهاند. همچنین آنها نوعی از بازیها به نام بازی Dove-Hawk را برای تحلیل رفتار جنگجویانه و تشکیل قلمرو مستقل مورد استفاده قرار دادهاند.
علوم کامپیوتر و منطق (Computer Science and Logic):
برخی از تئوریهای منطقی، پایههای معناشناسی بازیها (به عنوان مثال فهمیدن این که آیا بازی استراتژی برد دارد یا خیر) را تشکیل میدهند.
همچنین دانشمندان علوم کامپیوتر، بازیها را برای مدل سازی محاسبات فعل و انفعالی به کار میبرند. محاسبات فعل و انفعالی یعنی محاسباتی که در طی آنها با جهان خارج ارتباط برقرار میشود. به عنوان مثال، از یک ارتباط ساده میان محاسبهگر و محیط پیرامون میتوان به پرسیدن یک سوال مانند درخواست یک ورودی و یا جواب دادن به یک سوال مانند ارسال خروجی، اشاره کرد. همچنین نظریه بازیها نقش مهمی در الگوریتمهای آنلاین دارند. در علوم کامپیوتر الگوریتم آنلاین به الگوریتمی اطلاق میشود که میتواند ورودیهای خود را بطور قطعه به قطعه پردازش کند و نیازی به در دسترس بودن تمام ورودیها در ابتدا نیست.
فلسفه (Philosophy):
نظریه بازیها توسط برخی نویسندگان برای بررسی دلایل فلسفی تعهد، به کار رفته است. برخی دیگر با استفاده از آن به بررسی رابطه میان اخلاق و منافع شخصی پرداختهاند. عدهای دیگر از نظریه بازیها برای توضیح تمایلات غیرمنتظره بشری به اخلاق و رفتارهای متناظر آن در حیوانات، استفاده میکنند.
کاربردهای نوین:
اخیراً برخی از محققان از نظریه بازی برای حل مسائل مربوط به تروریسم مانند مدل سازی رفتار تروریستها استفاده کردهاند.
نتیجه گیری:
شناخت قدرت نظریة بازی در بیرون مرزهای اولیه اش، در حال افزایش است و اخیراً اعطای جایزه نوبل در سال 1994 به چند تن از پیشتازان این رشته از جمله جان نش، نشان از این واقعیت دارد. شاید رفتار آدم هایی که با انتخاب های دشوار روبرو هستند، به آن سادگی که فون نویمان در ابتدا امیدوار بود، نباشد، اما شکی نیست که نظریة بازی ارزش خود را در گشودن رازهای آن به اثبات رسانده است.
فصل دوم:
انواع بازی و راه حلهای آنها
اکثر تصمیمات پیچیده مدیریتی در شرایط عدم حتمیت و ریسک صورت میگیرد. مدیران اغلب تصمیمات تولیدی و سرمایهگذاری را بدون دانش کافی از فعالیت رقبا و یا میزان تقاضای محصول در آینده انجام میدهند. در این بخش برخی روشهای موجود برای انتخاب در این نوع محیط تصمیمگیری ملاحظه میشود. انواع مختلف تصمیمگیری به صورت زیر تقسیم بندی میشود:
1. تصمیمگیری در شرایط حتمیت و اطمینان: در این نوع تصمیمگیری تمامی اطلاعات مورد نیاز برای تصمیمگیری مشخص میباشد. اغلب مدل های برنامه ریزی خطی در شرایط حتمیت به کار میروند. به طور مثال در این نوع محیط مقدار نهادهها برای تولید محصولات مشخص، دسترسی به نهاده های تولید و قیمت محصولات با اطمینان کامل مشخص می باشند.
2. تصمیم گیری در شرایط ریسک: در این مورد، مسائل تصمیم گیری در محیطی نامعلوم صورت میگیرد و اطلاعات مورد نیاز دارای طبیعت نامشخصی می باشند. البته در مسائل تصمیمگیری تحت ریسک می توان احتمال رخداد پدیدهها را تخمین زد. اغلب مسائل تصمیمگیری در شرایط ریسک به روش نموداری تحت عنوان درخت تصمیم[1] تحلیل میشوند. درخت تصمیم برای حل مسائل با یک سری تصمیمات متوالی مواجه است.
3. تصمیمگیری در شرایط عدم حتمیت: در این نوع تصمیمگیری، اطلاعات مورد نیاز دارای ماهیت نامشخص اند. همچنین نمیتوان احتمال رخداد پدیده ها را تعیین نمود.
4. تصمیمگیری در شرایط تضاد: مساله تصمیم گیری تحت تعارض و تضاد [2] زمانی رخ میدهد که دو یا چند تصمیمگیرنده برای بدست آوردن منافع مشخصی در رقابت با یگدیگرند. به نحوی که موفقیت یک تصمیم گیرنده معمولا به ضرر سایر رقبا می باشد. مثالهای متعددی در این زمینه وجود دارد از قبیل جنگهای نظامی، تیمهای ورزشی، شرکتهای تجاری رقیب، گروههای سیاسی و نظایر آن. مسائل تصمیم گیری در شرایط تضاد، اغلب تحت نظریه بازی [3] تحلیل میشوند.
نظریه بازیها یک تئوری ریاضی است که در آن رقابت به روشی قراردادی و خلاصه نشان داده میشود. تأکید اساسی نظریه بازی ها بر فرآیند تصمیم گیری رقبا است.
2- تصمیم گیری در شرایط تضاد – نظریه بازی ها
1-2- بازی دو نفره با مجموع صفر
بیشتر مطالعات در مورد نظریه بازیها، روی بازیهای دو نفره با مجموع صفر[4] صورت گرفته است. این نوع بازیها تنها شامل دو رقیب یا بازیکن میباشند و منافع یک بازیکن به ضرر بازیکن دیگر است. به این علت به آن بازی با مجموع صفر گویند. پیش از شروع بازی، بازیکنها انواع استراتژیهای در دسترس خود را میدانند و میتوانند ماتریس بازده[5] را تعیین کنند. استراتژی یک قاعده از پیش مشخص است که بطور کامل تعیین میکند شخص در شرایط مختلف در هر مرحله از بازی چگونه عکسالعمل انجام خواهد داد استراتژی ممکن است یک فعالیت ساده باشد. در بازیهای پیچیده ممکن است شامل یک سری از حرکات باشد. در هنگام بازی، همزمان هر بازیکن یک استراتژی را انتخاب میکند بدون آنکه از استراتژی رقیب آگاه باشد.
بطور کلی اگر شرکتکننده اول دارای m استراتژی و شرکتکننده دوم دارای n استراتژی باشد، پیامدهای
احتمالی حاصل از بازی را با ماتریس زیر میتوان نشان داد.
در ماتریس فوق aij سود بازیکن اول است، اگر وی از iامین استراتژی خود و بازیکن دوم از j امین استراتژی خود استفاده کند. از آنجا که بازی از نوع بازی با جمع صفر است، سودی که از این استراتژی نصیب بازیکن دوم میشود معادل aij- است. بازیهای سه نفره یا بیشتر در وضعیتهای مدیریتی که شامل مداخلهی بیشتر از دو تصمیم گیرنده میباشند؛ کاربرد دارد که این نوع بازی ها بسیار پیچیدهاند و در مطالعه حاضر بحث نشده است.
سوال اصلی نظریه بازیها این است که چه استراتژی هر بازیکن بایستی دنبال کند تا سودش حداکثر گردد؟ یک بازی دونفره با مجموع صفر را می توان از به روش های زیر حل نمود.
2-2- روش maximin/minimax
مثال 1-7 بازی دونفره با مجموع صفر: طبیعت یا شرایط اقلیمی را میتوان به عنوان رقیب کشاورز در یک بازی دونفره با جمع صفر در نظر گرفت که میتواند بازدهی مزرعه را کاهش دهد در این صورت تصمیمگیری برای انتخاب برنامه کشت مزرعه جهت افزایش مطلوبیت کشاورز تحت شرایط عدم حتمیت است. بدین منظور سه حالت بد، خوب و عالی برای طبیعت فرض میشود. همچنین فرض میشود که کشاورز در برنامه کشت مزرعه خود گندم، جو و یا چغند قند را انتخاب میکند. بنابراین ماتریس بازده در نرم افزار Excel به صورت زیر مشخص شد (شکل 1-4):
شکل 1- ماتریس بازده در انتخاب برنامه کشت مزرعه
کشاورز به عنوان بازیکن در سمت راست و طبیعت به عنوان بازیکن در بالای ماتریس بازده مشخص شدهاند که ارقام مثبت ماتریس بازده، بیانگر منافع کشاورز و زیانهای طبیعت می باشد (در صورتی که ارقام ماتریس بازده منفی باشند بیانگر آن است که بازیکن سمت راست زیان و بازیکن دیگر سود برده است).
بر اساس این روش بازیکن سمت راست از معیار maximin و بازیکن دوم از معیار minimax استفاده میکند. در این حالت هر یک از بازیکنها کمترین بازده تعیین شده در هر استراتژی را مشخص میکند سپس آن استراتژی را انتخاب میکند که بهترین نتایج را از بین مقادیر حداقل بازده بدست میآورد. تصمیمات دو بازیکن زمانی تداوم داشته و تعادل وجود دارد که:
(ماکزیمم مقدار هر ستون) همه ستون هاحداقل=(مینمم مقدار هر ردیف) همه ردیف هاحداکثر
در صورتی که تصمیمات دو بازیکن به هیچ وجه هماهنگ نباشد در این حالت نقطه تعادل وجود ندارد و تنگنای ایجاد شده را از روش استراتژی مختلط[6] می توان حل نمود که در بخش بعد ذکر شده است.
نتایج حل روش maximin/minimax در نرم افزار Excel (شکل 2) برای مثال 1 ذکر شده است. بر اساس این روش استراتژی مناسب برای کشاورز این است که محصولی را انتخاب کند که بیشترین بازدهی را در بین بدترین نتایج برای کشاورز داشته باشد. بنابراین پیشنهاد میشود که کشاورز استراتژی سوم یعنی کشت چغندر قند را انتخاب کند. همچنین استراتژی مناسب برای طبیعت این است که شرایطی را انتخاب کند که کمترین زیان را در بین بدترین نتایج برای طبیعت داشته باشد (انتخاب کمترین زیان در بین مقادیر حداکثر زیان در هر استراتژی طبیعت). بنابراین طبیعت استراتژی اول خود یعنی شرایط بد اقلیمی را انتخاب میکند. مقدار بازده تعیین شده برای بازی 50 میباشد که ارزش بازی نامیده میشود.
شکل 2- روش maximin/minimax در انتخاب برنامه کشت مزرعه در نرم افزار Excel
3-2- روش برتری[7] (سلطه)
در این روش استراتژی برتر در بازی مورد توجه قرار می گیرد و اشاره دارد که استراتژی i بر استراتژی j برتری دارد اگر :
· در هیچ حالتی استراتژی j بهتر از استراتژیi نباشد.
· حداقل در یک حالت استراتژی j بدتر از استراتژیi باشد.
در این روش تمامی استراتژیهای تحت تسلط استراتژی برتر، بجز استراتژی برتر از ماتریس بازده حذف می شوند. با نظر اجمالی به ماتریس بازده شکل 1-4 مشاهده میشود که هیچ استراتژی برتری ( ردیف برتر، ردیفی که بالاترین مقادیر بازده را در مقایسه با سایر ردیفها دارد.) برای بازیکن اول وجود ندارد . اما در بین ستونهای ماتریس بازده، ستون برتر ستونی است که کمترین مقادیر زیان را در مقایسه با سایر ستونها دارد. بنابراین استراتژی اول برای طبیعت (شرایط اقلیمی بد) بر سایر استراتژی ها (استراتژی خوب و عالی) برتری دارد. بنابراین در مرحله اول استراتژی های تحت تسلط (ستون دوم و سوم) از ماتریس بازده حذف میشود و ماتریس بازده در این روش به صورت زیر کاهش مییابد.
شکل 3 - روش برتری در انتخاب الگوی کشت مزرعه
در مرحله دوم، با مقایسه مجدد بین ردیف ها میشود که استراتژی کشت چغندر قند برای کشاورز بر استراتژی کشت گندم و جو برتری دارد؛ لذا ردیف اول و دوم حذف میشود. در این حالت، مقدار بازده تعیین شده برای بازی 50 می باشد که با نتایج روش maximin/minimax یکسان است.
در حالتی که در بازی دو نفره با
مجموع صفر نقطه تعادل وجود نداشته باشد؛ میتوان از روش استراتژی مختلط مساله را
حل نمود. در این روش، از طریق انتخاب استراتژی بر اساس احتمالات مساله حل میشود.
فرض کنید احتمالاتی که بازیکن اول برای m استراتژی خود بکار میگیرید؛ به صورت زیر باشد:
(1)
و به همین ترتیب احتمالات بازیکن دوم برای n استراتژی اش به صورت زیر میباشد:
(2)
اکنون تولید کننده بجای سود واقعی و
قطعی با سود انتظاری مواجه خواهد بود. سود انتظاری برابر با مجموع حاصلضرب هر
پیامد در احتمال وقوع آن است. برای مثال اگر بازیکن دوم از استراتژی j ام خود با احتمال 1 استفاده نماید و بازیکن اول دارای احتمالات
باشد، سود انتظاری تولید کننده اول معادل
است. احتمالاتی که دو تولید کننده بکار میگیرند
زمانی بهینه تعریف میشود که
(3)
(4)
در روابط فوق V ارزش بازی تعریف میشود. رابطه 3 بیان می کند که سود بازیکن اول
حداقل به اندازه V خواهد بود؛ اگر بازیکن دوم هر استراتژی خود را با احتمال وقوع یک
انتخاب نماید. رابطه 4 نیز بیانگر این است که زیان انتظاری بازیکن دوم حداکثر به
میزان V خواهد بود، اگر بازیکن
اول هر استراتژی خود را با احتمال وقوع 1 انتخاب نماید. بر اساس یکی از قضایای
بنیادی نظریه بازیها همواره یک جواب منحصر به فرد (به ازای مقادیری از و
که بتواند روابط 3 و 4 را تأمین کند) برای V وجود دارد. پیامد انتظاری برای هر دو بازیکن یکسان و برابر با
ارزش بازی V خواهد بود که در ادامه
با مثال توضیح داده میشود.
مثال 2- اگر ماتریس بازده در برنامه کشت مزرعه برای شرایط مختلف اقلیمی به صورت زیر باشد:
شکل 4- ماتریس بازده در انتخاب برنامه کشت مزرعه
بر اساس حل مساله به روش maximin/minimax ، کشاورز تمایل دارد که استراتژی اول (کشت گندم) را انتخاب و طبیعت تمایل دارد که استراتژی اول خود را (شرایط اقلیمی بد ) انتخاب کند، این تصمیمات به هیچ وجه هماهنگ نمیباشد و بر خلاف ماتریس بازده شکل1-4، در این حالت، بین تصمیمات هر یک از بازیکنها تعادل وجود ندارد.
maxmin aij = 45 ≠60 = minmax aij
شکل 5- عدم تعادل در حل مساله استراتژی های مختلط به روش maximin/minimax
تنگنای ایجاد شده در مثال2 ( ماتریس بازده ی
شکل 4) را میتوان از روش استراتژی مختلط حل نمود. اگر احتمال اینکه کشاورز
استراتژی یک خود را انتخاب کند؛ باشد و احتمال اینکه استراتژ ی دوم خود را
انتخاب کند؛
باشد؛ در این صورت سود انتظاری کشاورز زمانی که
طبیعت استراتژی اول خود را انتخاب میکند؛ با سود انتظاری کشاورز زمانی که طبیعت
استراتژی دوم خود را انتخاب می کند؛ مساوی
باشد:
(5)
برای حل
مسالهی تعیین برنامهی کشت مزرعه به روش استراتژیهای مختلط در اکسل باید سلولهای
زیر را ایجاد نمود که در شکل 6 آمده است. مقادیر احتمال انتخاب هر یک از استراتژیهای
کشاورز در سلولهای E4:E5 مشخص میشود. ارزش بازی به
عنوان تابع هدف مدل در سلول C7 به صورت زیر فرموله میشود:
C7=SUMPRODUCT(C4:C5;E4:E5)
همچنین سمت چپ و راست محدودیت مساله به ترتیب در سلول A10 و C10 وارد میشود که به صورت زیر فرموله می شوند:
A10=SUMPRODUCT(C4:C5;E4:E5)
C10=SUMPRODUCT(D4:D5;E4:E5)
با توجه به اینکه احتمال استراتژی دوم از تفاوت مقدار احتمال استراتژی اول از یک بدست میآید؛ فرمول "1-E4" در سلول E5 وارد میشود.
شکل6 - نحوه وارد نمودن متغیر تصمیم، محدودیت و ارزش بازی در مساله تعیین برنامهی کشت مزرعه به روش استراتژیهای مختلط در Excel
برای حل مدل در Excel گزینه Solver را انتخاب نموده و پس از باز شدن پنجرهSolver Parameters در قسمتTarget Cell ، ارزش بازی در سلول C7 وارد کنید. در روش استراتژی مختلط، ارزش تابع هدف حداکثر میگردد.
در این مساله، متغیر در سلول E4 به عنوان متغیر تصمیم در قسمت Changing Cellsوارد میشود.
همچنین محدودیت مساله با انتخاب گزینه add به قسمت محدودیتها افزوده میشود. با توجه به اینکه متغیر
غیر منفی میباشد؛ گزینه Options در پنجره Solver Parameters را
انتخاب نموده و فرض مدل خطی و غیر منفی را چک نمایید. سپس برای یافتن جوابهای
بهینه گزینه Solve در پنجره Solver Parameters را انتخاب نمایید.
شکل 7- نحوه وارد نمودن اطلاعات درSolver برای حل مساله تعیین برنامهی کشت مزرعه به روش استراتژی های مختلط
با حل مساله مشاهده میشود که کشاورز بایستی استراتژی اول (کشت گندم) خود را با احتمال 27 درصد و استراتژی دوم (کشت جو) خود را با احتمال 73 درصد انتخاب میکند (شکل 8). سود انتظاری کشاورز در روش استراتژی مختلط (ارزش بازی) برابر 54/54 میباشد.
شکل 8- نتایج حل مساله انتخاب برنامهی کشت مزرعه به روش استراتژیهای مختلط و تعیین مقدار احتمال و ارزش بازی
قابل ذکر است که روش استراتژی مختلط
تنها برای بازیهای با ماتریس بازده به کار می رود. لذا برای حل بازیهای بیش از دو استراتژی میتوان از روش
برنامه ریزی خطی استفاده نمود.
5-2- نظریه بازیها و برنامه ریزی خطی
استراتژی بهینه یک بازی را میتوان با استفاده از تکنیک برنامه ریزی خطی تعیین کرد. برای فرموله کردن یک بازی در قالب برنامه ریزی خطی به نحو زیر عمل میشود.
تابع هدف مساله برنامه ریزی خطی برای بازیکن اول: بازیکن اول مایل است سود انتظاری خود را که معادل ارزش بازی است؛ حداکثر کند.
(6)
محدودیت های مساله:
محدودیت 1- مجموع احتمالاتی که بازیکن اول برای m استراتژی خود بکار میگیرید؛ برابر یک می باشد:
(7)
محدودیت 2- اگر بازیکن دوم استراتژی j ام خود را با احتمال 1 انتخاب کند و بازیکن اول دارای احتمالات
باشد؛ در این حالت سود انتظاری بازیکن اول معادل
است. بنابراین سود انتظاری بازیکن اول بایستی
حداقل برابر ارزش بازی باشد. به عبارتی
احتمالاتی که بازیکن اول بکار میگیرد؛
زمانی بهینه تعریف میشود که :
(8)
تابع هدف مساله برنامه ریزی خطی برای بازیکن دوم: از طرف دیگر بازیکن دوم مایل است که حداکثر زیان احتمالی خود را که معادل ارزش بازی است؛ حداقل نماید.
(9)
محدودیت 1- مجموع احتمالاتی که بازیکن دوم برای n استراتژی خود بکار میگیرید؛ برابر یک می باشد:
(10)
محدودیت 2- اگر بازیکن اول استراتژی iام خود را
با احتمال 1 انتخاب کند و بازیکن دوم دارای احتمالات باشد؛ در این حالت زیان انتظاری بازیکن دوم
معادل
است. بنابراین زیان انتظاری بازیکن دوم بایستی
حداکثر برابر ارزش بازی باشد. به عبارتی احتمالاتی که بازیکن دوم بکار میگیرد؛ زمانی بهینه تعریف میشود که
:
(11)
زمانی که ارزش بهینه بازی در مساله برنامه ریزی خطی تعیین میشود؛ ماکزیمم منافع انتظاری بازیکن اول برابر با حداقل زیان مورد انتظار بازیکن دیگر است. بنابراین ارزش بازی در مساله حداکثر سازی برای بازیکن اول دقیقاً مشابه مساله حداقل سازی برای بازیکن دوم میباشد به عبارتی مساله حداقل سازی زیان مورد انتظار بازیکن دوم، به عنوان مساله دوگان برنامه ریزی خطی ابتدایی می باشد.
بنابراین مسالهی برنامه ریزی
خطی در پی آنست که مقادیری برای ها بیابد که ارزش بازی (v) را حداکثر کند و یا برعکس
برای مسالهی دوگان آن مقادیری برای
ها بیابد کهv را حداقل کند. در ادامه با مثال، یک بازی در
قالب برنامه ریزی خطی فرموله شده است.
6-2- حل مـساله برنامه ریزی خطی در مورد نظریه بازی ها با نرمافزار Excel
مثال 3- اگر ماتریس بازده در برنامه کشت مزرعه برای شرایط مختلف اقلیمی به صورت زیر باشد:
شکل 9- ماتریس بازده در انتخاب برنامه کشت مزرعه
به منظور
وارد نمودن اطلاعات در اکسل برای حل مسالهی تعیین برنامهی کشت مزرعه به روش برنامه
ریزی خطی باید سلولهای زیر را کامل نمود که در شکل 10 آمده است. مقادیر احتمال
انتخاب هر یک از استراتژیهای کشاورز در سلول هایF4:F7 مشخص میشود. ارزش بازی به
عنوان تابع هدف مدل در سلول C9 به صورت زیر فرموله میشود:
C9=SUMPRODUCT(C4:C7;$F$4:$F$7)
سمت راست محدودیتهای مساله برنامه ریزی خطی در سلولهای A12:A15 وارد میشوند که به صورت زیر فرموله می شوند:
A12=SUMPRODUCT(C4:C7;$F$4:$F$7)
A13=SUMPRODUCT(D4:D7;$F$4:$F$7)
A14=SUMPRODUCT(E4:E7;$F$4:$F$7)
A15=SUM(F4:F7)
همچنین سمت چپ محدودیتهای مساله برنامه ریزی خطی در سلولهای C12:C15 وارد میشوند که به صورت زیر فرموله میشوند:
C12:C14=$C$9 ; C15=1
شکل 10- نحوه وارد نمودن متغیر تصمیم، محدودیت ها و ارزش بازی در مسالهی تعیین برنامهی کشت مزرعه به روش برنامه ریزی خطی در Excel
برای حل مدل در Excel گزینه Solver را انتخاب نموده و پس از باز شدن پنجرهSolver Parameters در قسمتTarget Cell ، ارزش بازی را در سلول C9 وارد کنید. در حل مساله تعیین برنامه کشت مزرعه به روش برنامه
ریزی خطی، ارزش تابع هدف حداکثر میگردد. در این مساله، متغیرهای تصمیم (سلولهایF4:F7 ) در قسمت Changing Cells وارد میشود. همچنین محدودیت مساله با انتخاب گزینه add به قسمت محدودیتها افزوده میشود. با توجه به اینکه
غیر منفی میباشد؛ گزینه Options در پنجره Solver Parameters را
انتخاب نموده و فرض مدل خطی و غیر منفی را چک نمایید. سپس برای یافتن جواب های
بهینه گزینه Solve در پنجره Solver Parameters را انتخاب نمایید.