ربات های پوکرباز (1)

ربات های پوکرباز با کمک هوش مصنوعی (AI) از انسان پیشی گرفتند

در دنیای ورق‌ها، جایی که بلوف کردن یک هنر و استراتژی پادشاه بازی است، انسان‌ها مدت‌هاست که برتری دارند. اما اخیرا، اوضاع تغییر کرده است، و این به خاطر نسل جدیدی از اعجوبه‌های پوکر نیست. در عوض، این ماشین‌ها هستند که رهبری را به دست گرفته اند! به لطف شگفتی‌های هوش مصنوعی، ربات‌های پوکرباز حتی تیزبین‌ترین ذهن‌های انسان را هم فریب داده‌اند. دنیایی را تصور کنید که در آن رایانه ها می توانند چهره پوکر را بهتر از هر انسانی حفظ کنند. جالب به نظر می رسد، درست است؟ در این مطلب، ما به داستان دو ربات پوکرباز فوق ستاره Libratus و Pluribus که واقعاً جریان را تغییر داده اند، می پردازیم. بنابراین، با ما همراه شوید تا برای ملاقات با قهرمانان جدید دنیای پوکر آماده شوید!

هوش مصنوعی لیبراتوس و پوکر

داستان Libratus داستانی جذاب از چگونگی تسلط هوش مصنوعی بر یکی از پیچیده ترین و استراتژیک ترین بازی های شناخته شده برای انسان است. لیبراتوس از تلاش های مشترک پروفسور توماس سندهولم و دانشجوی دکترای او نوام براون در دانشگاه کارنگی ملون متولد شد. هدف آنها ایجاد یک هوش مصنوعی بود که بتواند در بازی پوکر بدون محدودیت تگزاس هولدم که یک بازی پر از بلوف، استراتژی و اطلاعات ناقص است برنده شود.

چرا آنها بازی پوکر را انتخاب کردند؟

برخلاف بازی‌هایی مانند شطرنج یا Go که تمام مهره‌ها قابل مشاهده هستند و هر حرکت ممکن مشخص است، پوکر یک بازی اطلاعات ناقص است. بازیکنان کارت های حریفان خود را نمی شناسند و این باعث می شود که این بازی برای هوش مصنوعی چالش برانگیز باشد. بازی فقط در مورد محاسبه شانس نیست. این در مورد خواندن حریف، بلوف کردن، و گیم پلی استراتژیک است.

لیبراتوس با یک استراتژی ثابت برای بازی پوکر برنامه ریزی نشده بود. در عوض، از یادگیری عمیق برای آموزش بازی از ابتدا استفاده کرد. لیبراتوس با بازی تریلیون ها دست علیه خودش، استراتژی های خود را اصلاح کرد. از امکانات ابررایانه‌ای در مرکز ابررایانه پیتسبورگ، به‌ویژه سیستم «Bridges» برای خرد کردن حجم وسیعی از داده‌ها و اجرای شبیه‌سازی استفاده کرد.

نتیجه رقابت لیبراتوس با انسان

پس از ساعت‌ها کار دقیق، سرانجام روزی که همه مشتاقانه منتظرش بودند، فرارسید. ژانویه 2017 لحظه ای بود که شهود انسان با دقت ماشین برخورد می کرد. چهار تن از بهترین بازیکنان پوکر جهان، هر کدام با سبک بازی پوکر منحصر به فرد و سال ها تجربه، با ترکیبی از هیجان و ترس وارد شدند. آنها در آستانه رقابت با لیبراتوس، آخرین شگفتی هوش مصنوعی، در یک تورنمنت پوکر هدزآپ بودند. جو دوستانه بود و تماشاگران در این فکر بودند که آیا انسان یا ماشین پیروز خواهد شد.

با پیشرفت مسابقات، حرفه ای های پوکر شروع به احساس چیز خارق العاده ای در مورد حریف هوش مصنوعی خود کردند. در ابتدا، آنها بر استراتژی های پوکر آزمایش شده و واقعی خود تکیه کردند و انتظار داشتند الگوها یا نقاط ضعفی را در گیم پلی Libratus پیدا کنند. با این حال، با هر دست، آنها فشار عجیبی را احساس کردند. گویی لیبراتوس به روح آنها نگاه می کرد و هر فکر و حرکت آنها را می خواند. هوش مصنوعی فقط بازی را انجام نداد. به نظر می رسید آن را در سطحی درک می کرد که تقریباً وهم انگیز بود. هر بلوفی را تشخیص میداد و با هر استراتژی مقابله می کرد. حرفه‌ای‌ها در طول بازی همواره سعی میکردند تا بازی لیبراتوس را پیش بینی کنند، و سعی می‌کردند از ماشین پیشی بگیرند، اما لیبراتوس همیشه یک قدم جلوتر بود.

روزها به شب تبدیل شدند و با نزدیک شدن به پایان مسابقات، بازیکنان انسانی متوجه شدند، آنها فقط در برابر یک نرم افزار ساده نبودند. آنها در حال رقابت با موجودی مافوق بشری بودند که در هنر پوکر تسلط داشت. نحوه انطباق، یادگیری و پیش‌بینی حرکات لیبراتوس با هر چیزی که تا به حال با آن مواجه شده بودند متفاوت بود. این یک تجربه بود که پتانسیل بی حد و حصر هوش مصنوعی را به آنها یادآوری می کرد. لیبراتوس نه تنها برنده مسابقات شده بود، بلکه بیش از 1.8 میلیون دلار از بازیکنان انسانی به دست آورد و آینده تعاملات انسان و ماشین را نیز تغییر داده بود.

لیبراتوس و استراتژی بازی پوکر

تصور کنید لیبراتوس فردی بود که روی میز پوکر نشسته بود، چشمانی تیزبین و ذهن تیزتر داشت. در اینجا نگاهی اجمالی به نحوه تفکر و بازی او در طول بازی پوکر را توضیح میدهیم:

  • شروع با یک برنامه بازی: در ابتدای بازی، Libratus با سر شیرجه نمی رود. در عوض، او از یک طرح ذهنی، که در واقع نسخه ساده‌تری از پوکر است را به کار میبرد. این مانند داشتن یک برگه تقلب است که در آن حرکات مشابه با هم گروه بندی شده اند. بنابراین، به جای یادآوری تک تک حرکات، این گروه ها را به یاد می آورد و سریعتر و کارآمدتر تصمیم می گیرد.
  • یادگیری و تطبیق: با پیشرفت بازی، Libratus همیشه هوشیار است و همیشه در حال یادگیری است. تصور کنید که او فکر می کند: “اوه، آن حرکت طبق برنامه پیش نرفت. بیایید دیگر این کار را انجام ندهیم.” او با استفاده از ابزار ذهنی خود به نام CFR، حرکات خود را مرور می کند، از اشتباهات خود درس می گیرد و استراتژی خود را تنظیم می کند. انگار مدام در ذهنش تمرین می کند و بر اساس بازی های گذشته بهترین حرکات را پیش بینی می کند.
  • فکر کردن مستقل: گاهی اوقات، بازی آنطور که هوش مصنوعی آماده بود پیش نمیرفت. Libratus در این شرایط وحشت نمی کند. مکث می کند، فکر می کند و ممکن است ناگهان بگوید: “می دانی چیست؟ اینجا حرکت بهتری وجود دارد.” او انعطاف پذیر است، اگر راه بهتری برای بازی پیدا کند، همانجا استراتژی خود را تغییر می دهد.
  • بازتاب و بهبود: در پایان روز، پس از پایان بازی، کار Libratus تمام نمی شود. او بازی را در ذهنش تکرار می کند و فکر می کند: “این حرکت غیرمنتظره بود. باید دفعه بعد برای آن آماده باشم.” او این حرکات غافلگیرکننده را به صورت ذهنی تمرین می کند و اطمینان می دهد که برای بازی بعدی آماده تر است.

در اصل، در این مسابقات لیبراتوس از یک رویکرد سه جانبه برای تسلط بر بازی استفاده کرد که شامل محاسبه یک استراتژی انتزاعی، اصلاح آن بر اساس رفتار حریفان و رفع نقاط ضعف احتمالی در زمان واقعی بود. Libratus اولین هوش مصنوعی بود که بازیکنان برتر انسانی را در این بازی شکست داد، که به دلیل اطلاعات ناقص و نیاز به بلوف و فریب، چالش بزرگی برای تحقیقات هوش مصنوعی در نظر گرفته می‌شود.

اما چه چیزی لیبراتوس را تا این حد خاص می کند؟

موفقیت Libratus نقطه عطفی در تحقیقات هوش مصنوعی بود. این ربات پوکرباز، پتانسیل هوش مصنوعی را در انجام وظایف پیچیده ای که به ترکیبی از محاسبه، استراتژی و شهود نیاز دارند، نشان داد. در حالی که لیبراتوس برای پوکر طراحی شده است، فناوری پشت آن کاربردهای گسترده تری دارد، از مذاکرات تجاری گرفته تا امنیت سایبری. در اصل، داستان Libratus فقط در مورد برنده شدن یک ماشین در پوکر نیست. این در مورد جهش های باورنکردنی است که هوش مصنوعی انجام می دهد و مرزها را جابجا می کند و آنچه را که در حوزه یادگیری ماشینی و استدلال استراتژیک امکان پذیر است، دوباره تعریف می کند.

موفقیت Libratus فقط در مورد محاسبه شانس در بازی پوکر نیست. این هوش مصنوعی می‌تواند بلوف بزند، تطبیق دهد و استراتژی‌سازی کند. فرانک پفنینگ، رئیس بخش علوم کامپیوتر در Carnegie Mellon، پیامدهای گسترده‌تری را برای این پیروزی برجسته کرده است و آینده‌ای را متصور شده است که در آن گوشی‌های هوشمند ما ممکن است قیمت خودرو را برای ما مذاکره کنند، همه اینها به لطف مهارت‌های جدید هوش مصنوعی در بلوف کردن است.

ظهور Pluribus: اعجوبه بعدی پوکر

پس از موفقیت چشمگیر Libratus AI در دنیای پوکر، کارشناسان احساس کردند که زمان آن رسیده است که مرزها را حتی فراتر ببرند. دانشگاه کارنگی ملون (CMU) به بخش هوش مصنوعی فیسبوک پیوست. هدف بلندپروازانه آنها؟ برای ساختن یک هوش مصنوعی که بتواند پوکر را نه تنها در مقابل یک، بلکه شش بازیکن به طور همزمان بازی کند و محدودیت های Libratus را که محدود به پوکر هدز آپ بود، برطرف کند.

ماه ها کار خستگی ناپذیر، جلسات فکری، و ماراتن های کدنویسی ادامه یافت. همکاری بین این ذهن های درخشان به ثمر نشست و هوش مصنوعی جدیدی در بازی پوکر متولد شد. اسمش را پلوریباس گذاشتند.

چیزی که در مورد Pluribus برجسته بود، روش منحصر به فرد یادگیری آن بود. به جای مطالعه بازی های انسانی، با نسخه های خودش بازی کرد. با حرکات تصادفی شروع کرد و به آرامی استراتژی خود را اصلاح کرد. این رویکرد «خودآموزی از بازی با خود» به Pluribus کمک کرد تا یک برنامه بازی محکم ایجاد کند، جایی که در مورد حرکات گذشته خود فکر می‌کند، متوجه می‌شود که چه چیزی اشتباه بوده و سپس تصمیمات بهتری در آینده می‌گیرد.

زمان آن فرا رسیده بود که پلوریباس در کانون توجه قرار گیرد و با رقبای انسانی روبرو شود. انتظار محسوس بود. همه، از علاقه مندان به پوکر گرفته تا کارشناسان هوش مصنوعی، مشتاق بودند ببینند که این هوش مصنوعی جدید در برابر بازیکنان با تجربه انسانی چگونه خواهد بود.

نتایج حیرت آور نبود. Pluribus فقط بازی نکرد. مسلط شد. بلوف زد، استراتژی به کار برد، و به راحتی همتایان انسانی خود فریب داد، که همه را متحیر کرد. بازیکنان انسانی، ماهر و با تجربه، خود را در ضرر دیدند. آن‌ها نمی‌توانستند حرکات پلوریباس را پیش‌بینی کنند، و همچنین نمی‌توانستند در الگوی بازی آن نقطه‌ ضعفی بیابند. عملکرد هوش مصنوعی بی عیب و نقص بود. Pluribus به طور متوسط 5 دلار در هر دست برد. اما آماری که واقعاً شگفت انگیز بود، نرخ ساعتی آن بود – Pluribus در هر ساعت 1000 دلار درآمد داشت.

این نمایش قدرت تأثیر عمیقی بر جامعه پوکر داشت. بسیاری از بازیکنان حرفه‌ای مجبور بودند با اکراه واقعیت جدیدی را بپذیرند: ماشین‌ها در واقع می‌توانند در بازی از انسان‌ها پیشی بگیرند.

با این حال، چیزی که Pluribus را قابل توجه تر کرد، کارایی آن بود. برخلاف لیبراتوس که قدرت پردازشی بسیار زیادی نیاز داشت، Pluribus به دستاوردهای خود با عضلات محاسباتی بسیار کمتری دست یافت. لاغرتر و در عین حال قدرتمندتر بود.

با این حال، مانند تمام نوآوری های پیشگامانه، ظهور Pluribus بحث هایی را برانگیخت. مخالفان استدلال می کنند که ظهور هوش مصنوعی بازی پوکر مانند Pluribus ماهیت بازی را از بین می برد و آن را از انصاف خالی می کند. آنها از دورانی می ترسند که ماشین ها بر میزهای پوکر حکومت کنند و جایی برای مهارت و شهود انسانی باقی نگذارند.

از سوی دیگر، طرفداران این فناوری آینده روشن تری را می بینند. آنها معتقدند که هوش مصنوعی می تواند کلید تضمین یکپارچگی در پوکر آنلاین باشد. با بازی های پیشرفته و نظارت هوش مصنوعی، می توان تقلب را شناسایی و از آن جلوگیری کرد و زمینه بازی برابر را برای همه تضمین کرد.

با غروب خورشید در این فصل از تاریخ پوکر، یک چیز واضح بود: بازی و جهان دیگر هرگز مثل قبل نمی‌شوند.

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

پیمایش به بالا