استراتژی (نظریه بازی)
در استراتژی (نظریه بازی) (به انگلیسی: (Strategy (game theory) استراتژی یا راهبرد یک بازیکن در یک بازی یک مجموعه کامل از اعمالی است که در هر موقعیت انجام میدهد. استراتژی بهطور کامل رفتار بازیکن را بیان میکند. استراتژی یک بازیکن بیانکننده اعمالی است که بازیکن در هر مرحله از بازی، برای هر مجموعه از اعمالی که بازیکن قبل از این مرحله انجام داده، انتخاب میکند.
یک نمایه استراتژی (گاهی آن را ترکیب استراتژی نیز مینامند) مجموعهای از استراتژیها برای هر بازیکن است که بهطور کامل همه اعمال در یک بازی را بیان میکند. یک نمایه استراتژی باید شامل یک و فقط یک استراتژی برای هر بازیکن باشد.
مفهوم استراتژی گاهی به غلط با حرکت اشتباه گرفته میشود. یک حرکت عملی است که توسط یک بازیکن در نقطهای از بازی انتخاب میشود (مثلاً در شطرنج حرکت فیل سفید از نقطهٔ a۲ به نقطهٔ b۳). در حالی که یک استراتژی یک الگوریتم کامل برای انجام بازی است که به بازیکن میگوید در هر موقعیت ممکن در طول بازی چه کار کند.
مجموعه استراتژی
مجموعه استراتژی یک بازیکن تعیین میکند که برای این بازیکن، بازی کردن کدام استراتژیها ممکن است.
اگر برای یک بازیکن تعدادی استراتژی گسسته وجود داشته باشد، مجموعه استراتژی این بازیکن متناهی است. به عنوان نمونه در بازی سنگ، کاغذ، قیچی، هر بازیکن مجموعه استراتژی متناهی {سنگ، کاغذ، قیچی} را دارد.
در غیر این صورت یک مجموعه استراتژی نامتناهی است. به عنوان هستند و مجموعه استراتژی نامتناهی است {۱۰ هزار تومان، ۲۰ هزار تومان، ۳۰ هزار تومان و...}. همچنین، بازی بریدن کیک دارای استراتژیهای کراندار و پیوسته در مجموعه استراتژیها است {بریدن هر جا بین ۰٪ تا ۱۰۰٪ از کیک}.
در یک بازی پویا مجموعه استراتژی شامل قوانین ممکن است که یک بازیکن میتواند به یک ربات یا یک عامل نرمافزاری بدهد تا بفهمد که چطور بازی کند. برای مثال در بازی اولتیماتوم، مجموعه استراتژی برای بازیکن دوم شامل همه قوانین ممکن است که برای آنها پیشنهاد میشود فرد بپذیرد یا رد کند. در یک بازی بایزی (Bayesian game) مجموعه استراتژی شبیه بازی پویا است. مجموعه استراتژی شامل قوانینی است که بیان میکند برای هر اطلاعات خصوصی ممکن چه عملی انجام شود.
انتخاب یک مجموعه استراتژی
در نظریه بازیهای کاربردی، تعریف مجموعههای استراتژی بخش مهمی از هنر به صورت همزمان معنادار و قابل حل کردن یک بازی است. نظریه پرداز بازی میتواند از دانش سراسر مسئله به منظور محدود کردن فضای استراتژی و سادهتر کردن راه حل استفاده کند.
به عنوان مثال، اگر بخواهیم در مورد بازی اولتیماتوم دقیق صحبت کنیم، یک بازیکن میتواند استراتژیهایی مثل رد کردن پیشنهاد (۱ تومان، ۲ تومان، ...، ۱۹ تومان) و پذیرفتن پیشنهاد (۰ تومان، ۱ تومان، ...، ۲۰ تومان) را داشته باشد. به حساب آوردن همهٔ این استراتژیها، فضای استراتژی بسیار بزرگی را به وجود میآورد و مسئله را دشوار میکند. یک نظریهپرداز بازی در عوض میتواند مجموعه استراتژیها را به این صورت بسازد: {رد کردن هر پیشنهاد کمتر یا مساوی x و پذیرفتن هر پیشنهاد بزرگتر از x، برای x در (۰ تومان، ۱ تومان، ...، ۲۰ تومان)}.
استراتژی خالص و استراتژی مختلط
یک استراتژی خالص تعریف کاملی از این که یک بازیکن چگونه بازی خواهد کرد ارائه میدهد. این استراتژی حرکتی را که یک بازیکن برای هر موقعیتی که با آن روبهرو خواهد شد باید انجام دهد، تعریف میکند. مجموعه استراتژی یک بازیکن مجموعهای است از استراتژیهای خاصی که برای آن بازیکن ممکن است.
یک استراتژی مختلط انتصاب یک احتمال به هر استراتژی خالص است. این استراتژی به یک بازیکن اجازه میدهد به صورت تصادفی یک استراتژی خالص را برگزیند. چون احتمالها پیوسته هستند استراتژیهای مختلط نامتناهی برای یک بازیکن وجود دارد، حتی اگر مجموعه استراتژیهای آن متناهی باشد.
البته میتوان یک استراتژی خالص را نوع خاصی از استراتژی مختلط دانست که در آن یک استراتژی خالص خاص با احتمال ۱ و بقیه استراتژیها با احتمال ۰ انتخاب میشوند.
یک استراتژی کاملاً مختلط، استراتژی مختلطی است که در آن بازیکن یک احتمال اکیداً مثبت به هر استراتژی خالص میدهد.
استراتژی ترکیبی
مثال
ماتریس بازدهی که در شکل زیر نشان داده شده را در نظر بگیرید (بازی تشریک مساعی). در اینجا یک بازیکن ردیف و بازیکن دیگر ستون را انتخاب میکند. بازیکن ردیف اولین بازده را دریافت میکند و بازیکن ستون دومی را. اگر بازیکن ردیف ترجیح دهد که A را با احتمال ۱ انتخاب کند، در اینصورت میگوییم او یک استراتژی خالص را بازی میکند. اگر بازیکن ستون یک سکه بیندازد و اگر شیر آمد A و اگر خط آمد B را بازی کند، در این صورت او یک استراتژی مختلط را بازی کرده و نه یک استراتژی خالص.
A | B | |
---|---|---|
A | ۱٬۱ | ۰٬۰ |
B | ۰٬۰ | ۱٬۱ |
اهمیت
جان فوربز نش، در مقاله معروف خود اثبات کرد که برای هر بازی متناهی یک تعادل وجود دارد. تعادل نش بر دو قسم است: تعادلهای نش استراتژی خالص تعادلهایی هستند که در آنها همه بازیکنان با استراتژی خالص بازی میکنند. تعادلهای نش استراتژی مختلط تعادلهایی هستند که در آنها حداقل یک بازیکن با استراتژی مختلط بازی میکند. نش اثبات کرد که هر بازی متناهی یک تعادل نش دارد، نه این که هر بازی متناهی یک تعادل نش خالص دارد. بازیها میتوانند هم تعادل خالص و هم تعادل مختلط داشته باشند.