Pemain Poker Online seperti Ekonom

Nashing in: Apa yang menyebabkan pemain poker berpikir layaknya Ekonom.

Penggunaan kata Nash diambil dari Nash ekuilibrium yang mana merupakan konsep teori permainan yang menentukan solusi optimal dalam permainan non kooperatif dimana setiap pemain tidak memiliki insentif untuk mengubah strategi awalnya.

Nash sendiri adalah seorang matematika AS. Singkatnya konsep perilaku dan interaksi antar pemain untuk menentukan hasil terbaik.

Dalam beberapa tahun terakhir, poker online telah merevolusi dengan menerapkan wawasan dari teori permainan, alat standar dalam ekonomi untuk pemodelan perilaku konsumen dan perusahaan. Artikel ini menceritakan tentang bagaimana dan mengapa teori permainan memasuki dunia poker online. Ini juga menjelaskan apa yang dapat dipelajari oleh bisnis, regulator, dan ekonom dari revolusi teori permainan poker.

Bagaimana regulator persaingan memprediksi bagaimana merger antara dua perusahaan akan berdampak pada harga yang dibayar oleh konsumen? Bagaimana raksasa teknologi dan pemerintah merancang lelang untuk mengalokasikan ruang iklan online, spektrum telekomunikasi, dan izin perdagangan emisi? Dalam setiap kasus, sebagian dari jawabannya terletak pada pemodelan perilaku perusahaan menggunakan teori permainan.

 

Teori permainan adalah studi tentang situasi di mana pilihan terbaik (atau “strategi”) di antara alternatif tergantung pada pilihan yang dibuat oleh orang lain. Tidak semua situasi seperti ini – ketika Anda memilih apa yang akan Anda santap untuk sarapan, Anda mungkin tidak peduli apa yang orang lain makan untuk sarapan – tetapi pilihan yang saling bergantung seperti itu biasa terjadi dalam permainan dunia nyata (karenanya disebut “teori permainan”). Misalnya, dalam sepak bola, seorang pengambil penalti dapat memilih apakah akan menembak ke kiri, kanan, atau lurus ke tengah gawang tergantung pada arah mana yang menurutnya akan dilakukan kiper. Situasi ekonomi seringkali memiliki karakteristik yang sama – misalnya perusahaan yang memilih harga produk mereka mungkin ingin sedikit menurunkan harga pesaing mereka.

 

Teori permainan menganalisis situasi ini menggunakan konsep yang disebut Ekuilibrium Nash, dinamai dari pemenang hadiah Nobel John Nash (Anda mungkin ingat film A Beautiful Mind, yang dibintangi Russell Crowe sebagai Nash). Keseimbangan Nash adalah situasi yang stabil di mana semua peserta membuat pilihan terbaik yang mereka bisa, mengingat pilihan saingan mereka. Misalnya, dalam model merger yang digunakan oleh regulator persaingan, ekuilibrium Nash berarti bahwa semua perusahaan memilih harga yang memaksimalkan keuntungan mereka berdasarkan harga yang dipilih oleh perusahaan lain. Saat ini, teori permainan dan keseimbangan Nash mendasari bagaimana para ekonom berpikir tentang pilihan yang saling bergantung dan dengan demikian mendukung banyak ekonomi mikro modern.

 

Menerapkan teori permainan ke poker online

Poker online tampaknya cocok secara alami untuk teori permainan karena pilihan kapan dan berapa banyak untuk bertaruh tergantung pada kartu Anda sendiri, tetapi juga kartu lawan Anda dan bagaimana mereka berencana memainkan kartu itu. Memang, salah satu pendahulu Nash, John von Neumann, mencoba menerapkan teori permainan ke poker pada tahun 1944.

 

Namun, selama 60 tahun berikutnya, teori permainan diabaikan oleh para pemain poker online. Mereka tahu tentang peluang dan probabilitas sampai batas tertentu, tetapi umumnya mengandalkan aturan praktis berdasarkan pengalaman praktis. Pemain yang kuat dicirikan oleh “perasaan” yang baik untuk poker dan penguasaan pembicaraan di meja, bahasa tubuh, psikologi, dan hal-hal tidak berwujud lainnya. Seperti yang dikatakan James Bond dalam film Casino Royale tahun 2006: “Dalam poker online, Anda tidak pernah memainkan tangan Anda, Anda memainkan pria di seberang Anda.”

 

Boom poker

Untuk memahami bagaimana segala sesuatunya berubah, ada baiknya kembali ke kelahiran poker onlinemodern pada tahun 2003, ketika Chris Moneymaker yang tepat, seorang akuntan, memenangkan Acara Utama World Series of Poker (WSOP) di Las Vegas (pada dasarnya kejuaraan dunia poker) dan mendapatkan $2,5 juta secara keren. Kemenangan pembuat uang yang tidak terduga menangkap perhatian publik (ia memenuhi syarat melalui saham $39 di turnamen poker online, daripada membayar biaya masuk standar $10k) dan membantu menjual poker sebagai olahraga penonton.

 

Setelah kemenangan Moneymaker, pemirsa TV poker tumbuh pesat, dibantu oleh pengenalan “kamera kartu lubang”, kamera mini yang ditempatkan di bawah meja poker yang dirancang khusus dengan panel kaca yang memungkinkan pemirsa TV untuk melihat kartu dibagikan tertutup ke setiap pemain. Pada tahun 2007, poker menjadi “olahraga” ketiga yang paling banyak ditonton di TV di AS. Jumlah peserta WSOP meningkat dari 839 pada tahun 2003 menjadi 8.773 pada tahun 2006, yang kira-kira sama dengan hari ini (8.569 pada tahun 2019).

 

Poker internet, diluncurkan pada akhir 1990-an, menikmati ledakan serupa. Merek taruhan olahraga online utama melakukan diversifikasi ke poker melalui situs paling populer menarik dengan lalu lintas website puncak puluhan atau bahkan ratusan ribu pengunjung. Popularitas poker yang tiba-tiba (dan uang yang akan dimenangkan) menarik pemain baru ke permainan dan berarti bahwa banyak dari mereka, jika mereka cukup baik, dapat menjadi “profesional” dan mencari nafkah dari bermain poker penuh waktu.

Sekolah Lama vs Sekolah Baru

Munculnya poker online menciptakan kesenjangan antara pemain lama/jadul yang telah membuat karir mereka bermain poker langsung di kasino dan sekolah baru pemain online yang mempelajari permainan di internet.

 

Dibandingkan dengan ketergantungan sekolah lama pada “Pemain yang bermain”, kerumunan online baru sering dianggap sebagai pemain “matematika” yang mendasarkan keputusan mereka secara ketat pada probabilitas dan peluang. Mereka cenderung muda – Annette Obrestad, seorang Norwegia, mulai bermain online pada usia 15 tahun, dengan nama layar “Annette_15”. Tapi mereka juga berpengalaman. Pada tahun 2007 ketika Ms Obrestad memenangkan £1 juta di sebuah turnamen berusia 18 tahun, dia mencatat, “Saya telah memainkan ribuan turnamen online. Kebanyakan profesional hanya memainkan 60 atau lebih turnamen langsung setahun, jadi saya pikir saya memiliki keuntungan di sana.”

 

Para pemain sekolah barulah yang menganggap serius teori permainan, terutama gagasan strategi keseimbangan Nash (yang oleh para pemain disebut sebagai strategi “Teori Game Optimal”). Seperti yang diterapkan pada poker online, keseimbangan Nash diperoleh ketika semua pemain memilih “strategi” (resep cara bermain di setiap situasi yang memungkinkan – kapan dan berapa banyak untuk bertaruh, kapan harus call, kapan harus mundur, dll.) yang memaksimalkan keuangan mereka. Kemenangan bisa didapatkan dari mengingat strategi yang digunakan oleh pemain lain. Jika Anda bisa memainkan strategi keseimbangan Nash di poker, Anda tidak akan pernah kehilangan uang dalam jangka panjang (setelah keberuntungan kartu seimbang), tidak peduli siapa lawan Anda. Bahkan jika pemain lain mengetahui strategi Anda, mereka tidak dapat mengalahkan Anda – strategi Anda akan “tidak dapat dieksploitasi”. Dan John Nash telah membuktikan kembali pada tahun 1950 bahwa strategi keseimbangan Nash seperti itu harus ada dalam poker.

 

Tentu saja, tidak cukup hanya mengetahui bahwa ada strategi yang sempurna – Anda juga perlu tahu seperti apa bentuknya. Tetapi bahkan untuk komputer yang paling kuat, menemukan strategi keseimbangan Nash dalam poker sejauh ini tidak dapat dicapai – dengan 1.326 kombinasi kartu awal, 254.251.200 kemungkinan kombinasi kartu komunitas dan sedikit batasan pada ukuran taruhan, bahkan dua pemain poker online memiliki sekitar 10160 hipotetis situasi.

 

Namun, itu tidak berarti teori permainan tidak menawarkan poker. Pada awalnya, pemain sekolah baru menghitung strategi ekuilibrium Nash dalam model poker yang disederhanakan menggunakan sedikit lebih dari pena dan kertas. Kemudian, ketika daya komputasi meningkat, mereka mulai menggunakan “pemecah” teori permainan. Kalkulator online ini, tersedia untuk beberapa ratus pound, tidak cukup kuat untuk menemukan keseimbangan Nash dalam permainan penuh poker, tetapi mereka membuatnya lebih mudah untuk membidik pada strategi keseimbangan Nash dalam situasi tertentu atau dalam model poker sederhana. Pemain dapat memasukkan input kunci (misalnya jumlah ronde pertaruhan yang tersisa, ukuran tumpukan, kartu komunitas, ukuran taruhan yang diizinkan, kemungkinan kartu yang dapat dipegang oleh setiap pemain) dan pemecah masalah akan menemukan strategi keseimbangan Nash yang sesuai. Pemain kemudian dapat mencari pola dan mencoba memahami logika di balik strategi ini – seberapa sering mereka harus bertaruh, jenis tangan apa yang harus mereka pertaruhkan, dll.

 

Meningkatkan standar

Generasi baru pemain poker online yang paham teori permainan merevolusi cara permainan dimainkan. Tiga perubahan menonjol.

 

 

Menggertak agresif.

Mungkin yang paling terlihat adalah seberapa sering pemain sekolah baru menggertak (yaitu bertaruh dengan tangan yang lemah). Ketika orang-orang seperti Ms Obrestad mulai sering menggertak di awal 2000-an, mereka dianggap gila; jika mereka menang, itu pasti karena keberuntungan. Sebelumnya, para pemain secara intuitif berpikir bahwa mereka harus bertaruh terutama dengan tangan yang bagus dan hanya menggertak sedikit. Teori permainan Poker online menunjukkan pendekatan ini salah, terutama pada tahap awal permainan. Dalam model teori permainan, rasio optimal “taruhan gertakan” terhadap “taruhan nilai” biasanya sekitar 2:1 pada kegagalan (ketika tiga kartu komunitas dibagikan dengan dua kartu lagi yang akan datang). Ini berarti bahwa ketika Anda bertaruh, Anda memiliki kemungkinan dua kali lebih besar untuk memiliki tangan yang lemah daripada tangan yang kuat. Logikanya ada dua. Pertama, menggertak berarti lawan Anda harus sering melakukan call taruhan Anda dan hal itu untuk menghentikan Anda menang dengan tangan yang lemah; maka Anda akan sering menang banyak ketika Anda memiliki tangan yang kuat. Kedua, banyak tangan yang Anda gertakan dapat meningkat dan menjadi tangan yang kuat ketika lebih banyak kartu komunitas dibagikan. Itu berarti Anda bisa lolos dengan banyak menggertak ketika masih ada lebih banyak kartu komunitas yang akan datang.

Permainan tumpukan pendek.

Ketika pemain memiliki chip yang relatif sedikit, keputusan sering kali dapat diringkas menjadi pilihan antara masuk semua (yaitu bertaruh semua chip Anda sekaligus) atau mundur/fold. Ketika poker online dapat disederhanakan dengan cara ini, teori permainan memberikan rekomendasi tentang kapan tepatnya harus memasukkan semua dan tangan mana yang harus dilipat. Pemain sekolah baru menghafal rekomendasi ini secara intensif, memberi mereka keuntungan signifikan atas rival yang mengabaikan matematika dan sebaliknya mengandalkan “rasa/ feeling”.

Strategi campuran.

Teori permainan sering merekomendasikan strategi campuran – memilih secara acak apa yang harus dilakukan dengan tangan tertentu dalam beberapa situasi – untuk menghindari menjadi terlalu dapat diprediksi. Ini sangat penting bagi banyak pemain di internet, di mana lawan dapat menggunakan perangkat lunak pelacakan untuk menganalisis permainan mereka dan mencari kelemahan.

Menurut salah satu pemain sekolah baru, “Karena poker online telah menjadi lebih populer selama 15 tahun terakhir atau lebih, pemain telah meningkat secara dramatis, ke titik di mana sangat sulit untuk secara konsisten mengalahkan permainan tanpa pengetahuan teori permainan di sudut Anda… pemain sekolah menghasilkan jutaan dari permainan eksploitatif, sedangkan hampir semua pemain menghasilkan jutaan sekarang bergantung pada teori permainan poker.”

 

Sementara teori permainan terutama dipertahankan oleh minoritas yang cenderung matematis di tahun 2000-an, hari ini ada permintaan kuat dari pemain poker kasual untuk memahami dan menerapkan teori permainan. Dengan demikian, industri pelatihan poker yang berfokus pada teori permainan bermunculan. Buku-buku poker sekarang memiliki judul seperti “Mainkan Poker Optimal: Teori Permainan Praktis untuk Setiap Pemain Poker online”, dan ada sejumlah kursus dan aplikasi pelatihan online yang menjanjikan untuk mengajari calon pemain poker rahasia teori permainan.

 

Mungkin keadaan akhir-akhir untuk poker akan datang ketika komputer dapat menemukan strategi keseimbangan Nash untuk keseluruhan permainan (yaitu poker “memecahkan”). Kecerdasan buatan (AI) sedang dimanfaatkan untuk tujuan itu. Satu perangkat lunak poker AI, bernama “PokerSnowie” dan berharga $99, “dilatih” dengan bermain melawan dirinya sendiri miliaran kali. Lainnya, yang disebut “Libratus”, mengalahkan empat profesional poker dalam pertandingan tantangan 120.000 tangan Brains vs. AI selama 20 hari, menggunakan algoritme yang dirancang untuk mendekati keseimbangan Nash. Meskipun poker online masih terlalu rumit untuk sepenuhnya “diselesaikan” untuk saat ini, pemain sering menganggap AI poker mulai mendekati keseimbangan Nash sebenarnya dari permainan.

 

Itu tidak berarti teori permainan memiliki semua jawaban untuk pemain manusia. Teori permainan poker bekerja paling baik melawan lawan yang kuat, karena strategi keseimbangan Nash memaksimalkan kemenangan Anda hanya ketika pesaing lain “rasional”. Terhadap pemain rekreasi yang membuat kesalahan sistematis (seperti tidak cukup menggertak), mengadopsi strategi tipe Nash berarti Anda tidak harus memaksimalkan kemenangan Anda. Ini telah memicu perdebatan besar di dunia poker tentang apakah Anda harus memainkan strategi berbasis Nash atau eksploitatif (melibatkan penyimpangan sistematis yang dapat dimanfaatkan oleh pemain bagus, membuat Anda rentan, tetapi itu membantu Anda menang lebih banyak melawan pemain yang lebih lemah). Pada kenyataannya, mungkin tidak ada banyak konflik di sini: pemain poker yang baik membutuhkan kedua strategi. Teori permainan memberikan dasar untuk menyesuaikan, sama seperti teori ekonomi tradisional dengan konsumen rasional bertindak sebagai dasar yang kemudian disesuaikan oleh ekonomi perilaku untuk memperhitungkan bias umum yang ditunjukkan orang.

Bertaruh untuk masa depan

Kisah teori permainan dalam poker memberikan pengingat akan manfaat model ekonomi tradisional. Meskipun teori permainan tidak dapat menangkap setiap detail dari tangan poker, itu masih dapat memberikan wawasan praktis – seperti yang dilakukan model merger, misalnya, untuk regulator kompetisi. Tetapi poker juga dapat menunjukkan masa depan bagi para ekonom. Sementara teori permainan, dengan asumsi yang kuat tentang pemain yang “rasional”, tidak selalu melakukan pekerjaan yang baik untuk menggambarkan bagaimana manusia bermain poker di masa lalu, itu mungkin melakukan pekerjaan yang baik untuk menggambarkan poker taruhan tinggi hari ini dan pekerjaan yang sangat baik dari menjelaskan bagaimana dua program AI poker online bermain melawan satu sama lain. Pemain poker online AI telah dirancang untuk meniru teori ekonomi atau, sebagai alternatif, tampaknya telah belajar sendiri untuk beroperasi dengan cara yang memenuhi teori ekonomi. Jika AI memenuhi asumsi ideal model ekonomi lebih baik daripada manusia, dan AI mulai mengambil peran yang lebih besar dalam pengambilan keputusan konsumen dan perusahaan (misalnya dengan memandu pilihan belanja konsumen dan menetapkan harga untuk perusahaan), maka mungkin model ekonomi merger, lelang, kolusi, dan diskriminasi harga akan melakukan pekerjaan yang lebih baik untuk menggambarkan ekonomi yang didominasi AI daripada ekonomi yang didominasi manusia?

 

Diperlukan kehati-hatian di sini – poker mungkin bukan contoh yang baik untuk diekstrapolasi dan AI mungkin pada kenyataannya tidak mengambil peran yang lebih besar dalam pengambilan keputusan konsumen dan perusahaan. Seperti yang dijelaskan oleh Frontier’s David Parker, AI kemungkinan besar akan digunakan dalam situasi di mana ada sejumlah besar data. Hal ini memungkinkan untuk pengembangan:

  • Model prediksi yang baik:

dengan menggunakan sejumlah besar data “sebelum”, AI dapat mengembangkan prediksi “setelah” yang baik dalam poker online

  • Analisis klasifikasi:

misalnya, dengan menggunakan banyak gambar wajah, AI dapat belajar mengidentifikasi wajah dalam gambar baru dalam poker online (yang pada dasarnya adalah versi lain dari analisis prediktif).

  • Perangkat bermain game:

dalam game dengan aturan statis yang ditentukan dengan baik seperti Chess and Go, AI dapat berulang kali bermain melawan dirinya sendiri untuk mengembangkan pemahaman tentang strategi yang optimal dalam poker online .

Penggunaan AI dalam poker online sangat banyak berada di kategori ketiga. Tetapi sebagian besar pengambilan keputusan “kehidupan nyata” lebih berantakan dan lebih dinamis daripada poker. Prediksi AI akan tidak akurat ketika data terbatas tersedia atau ketika ‘aturan main’ berubah (perusahaan baru memasuki pasar, selera pelanggan berubah, dll.).

Mengingat ketidakpastian tentang peran AI di masa depan, kita harus menunggu dan melihat apakah revolusi teori permainan dalam poker online adalah tanda hal-hal yang akan datang dalam ekonomi riil atau jika para ekonom hanya menggertak.

Exit mobile version