728X90 728X90 rgp rgp 728X90 728X90 728X90 728x90 728X90

memahami decesion tree atau pohon keputusan di permainan poker

Sekarang, mari kita tinjau beberapa spesifikasinya. Kita dapat mengatur semua keputusan yang mungkin di tangan HUNL menjadi pohon keputusan yang terdiri dari titik-titik keputusan yang dihubungkan bersama oleh tindakan pemain. Setiap titik di pohon, kecuali daun, yang mewakili ujung tangan, mewakili keadaan tertentu dari permainan dan merupakan tempat di mana pemain (atau Alam) harus membuat keputusan. Game ini akan pindah ke salah satu dari beberapa negara baru tergantung pada pilihannya. Kami melihat bahwa pohon keputusan penuh yang mewakili HUNL pada ukuran tumpukan yang besar terlalu besar untuk ditangani. Namun, ada banyak hal yang bisa dipelajari dari game perkiraan. Sebagai contoh, sebuah pohon yang mewakili situasi sungai di mana hanya ada satu taruhan yang tersisa di tumpukan yang tersisa ditunjukkan pada gambar.

Strategi seorang pemain menentukan bagaimana dia akan membuat keputusan apa pun yang dapat dia hadapi dalam sebuah game. Dalam praktiknya, strategi harus menentukan kisaran tangan yang digunakan pemain untuk melakukan setiap tindakan pada setiap poin keputusannya. Kita dapat memvisualisasikan ini sebagai berikut. Kedua pemain memulai tangan dengan rentang yang terdiri dari 100% dari masing-masing dari 1.326 tangan hold ’em yang berbeda. Pada setiap poin keputusannya, pemain membagi atau membagi rentangnya menjadi beberapa bagian, satu untuk setiap opsi strategisnya. Dengan cara ini, rentang pemain cenderung menjadi lebih kecil dan lebih jelas sebagai pemain mendapatkan lebih dalam dan lebih dalam ke tangan. Pemisahan rentang ini diilustrasikan di pohon �matahari-pecah� di sampul buku itu.

dia mengharapkan nilai atau EV dari holding untuk pemain pada titik keputusan tertentu adalah total ukuran tumpukannya di ujung tangan, dirata-ratakan atas semua cara tangan dapat bermain keluar dari titik itu dan seterusnya. Ingat bahwa konvensi kami untuk EV berbeda dari beberapa penulis lain. Kami bekerja dalam hal total ukuran tumpukan, dibandingkan dengan perubahan dalam ukuran tumpukan. Pendekatan dasar untuk pengambilan keputusan pada titik mana pun adalah dengan mempertimbangkan EV dari masing-masing opsi yang tersedia dan kemudian pergi dengan yang terbesar. Respons terbaik atau strategi eksploitatif maksimal adalah yang memaksimalkan EV pemain dengan cara ini dengan setiap tangan di setiap titik. Dengan permainan yang dijelaskan oleh pohon keputusan dan strategi Villain untuk memainkan game itu, kami melihat cara menghitung tanggapan terbaik Hero di Bab 2.
Ketika kedua pemain menggunakan strategi eksploitatif maksimal secara bersamaan, kita memiliki ekuilibrium Nash. Ketika dua pemain mengadopsi strategi keseimbangan mereka di HUNL, tidak ada insentif untuk menyimpang. Mereka tidak dapat meningkatkan ekspektasi mereka dengan melakukan itu, karena mereka sudah bermain maksimal secara eksploitatif. Strategi kesetimbangan juga dikenal sebagai tidak tereksploitasi, karena ini adalah pemain terbaik yang dapat dilakukan terhadap lawan yang sadar akan strateginya dan mampu dengan cepat menyesuaikan diri dengannya. Ketika dua pemain yang cukup cerdas saling berhadapan, mereka tidak bisa melakukan lebih baik daripada memainkan strategi keseimbangan mereka. Jadi, ketika kami menemukan keseimbangan permainan, kami mengatakan kami telah menyelesaikannya. Dalam buku ini, kami menggunakan istilah GTO, unexploitable, dan equilibrium sebagai sinonim untuk mengacu pada strategi tersebut.
Solusi untuk game HUNL penuh tidak diketahui, tetapi hasil dari upaya untuk mendekati disebut permainan optimal-pseudo-atau hampir-optimal. Kita telah melihat bahwa permainan optimal pseudo adalah tepat tidak hanya terhadap pikiran-membaca super-jenius, tetapi juga melawan lawan-lawan yang lebih run-of-the-mill yang strateginya hanya tidak kita ketahui. Ketika menghadapi lawan baru, banyak strategi eksploitatif yang berbeda dapat menjadi yang terbaik tergantung pada kecenderungannya. Ketika kecenderungan ini tidak diketahui, bagaimanapun, setiap penyimpangan dari GTO bermain di pihak kita hampir sama mungkin untuk menyakiti untuk membantu kami. Tanpa pengetahuan tentang kelemahan pemain, kita tidak bisa mengharapkan penyimpangan tertentu dari ekuilibrium untuk meningkatkan EV kami. Meskipun tidak sepenuhnya ketat, kita bisa memikirkan permainan yang tidak dapat dieksploitasi sebagai respon terbaik yang diberikan ketidakpastian lengkap tentang lawan kita.
Lebih jauh lagi, memahami bermain yang tidak dapat dieksploitasi dapat membantu kita mengenali kecenderungan yang bisa dieksploitasi di lawan kita dan memahami bagaimana menyesuaikan rentang kita sendiri untuk mengambil keuntungan. Misalnya, ingat salah satu situasi sungai paling sederhana yang kita lihat di Volume 1: game PvBC. Rentang satu pemain terdiri dari kacang dan udara, dan lawannya hanya memegang tangan yang mengalahkan udara tetapi kalah dengan kacang. Kami melihat bahwa dalam banyak kondisi, strategi keseimbangan di sini adalah untuk pemain pertama yang bertaruh dengan semua tangan nut dan gertakan yang cukup sehingga EV lawannya jika dipanggil sama dengan jika dia melipat. Demikian pula, permainan GTO pemain kedua adalah untuk memanggil cukup untuk menjaga acuh tak acuh pertama untuk menggertak.
Bagaimana dengan bermain eksploitatif? Jika pemain kutub terlalu sering menggertak, lawannya harus selalu memanggil, tetapi jika dia menggertak sedikit terlalu sedikit, penangkap gertakan harus selalu melipat. Di sisi lain, jika penangkap-gertakan panggilan terlalu banyak, lawannya seharusnya tidak pernah menggertak, dan sebaliknya. Tentu saja, “terlalu banyak” dan “terlalu sedikit” didefinisikan dalam hal strategi yang tidak dapat dieksploitasi. Jadi, pemahaman kita tentang bermain GTO membuatnya sangat mudah untuk memahami dan menggambarkan semua peluang untuk bermain eksploitatif dalam situasi ini. Terlepas dari kenyataan bahwa keseimbangan sejati HUNL mungkin terlalu besar untuk dihafal dan terlalu rumit untuk dipahami sepenuhnya (dan bahkan bukan pendekatan terbaik lawan lawan), para pemain dengan pengetahuan terbaik tentang permainan-teoritis juga merupakan pemain eksploitatif terbaik. karena pemahaman mereka tentang permainan. Dengan pemikiran ini, kami telah berfokus pada pembelajaran tentang strategi keseimbangan untuk mengembangkan intuisi dan pemahaman tentang struktur bermain HUNL. Dalam buku ini, kami akan terus mempertimbangkan berbagai tempat dan bagaimana kami mungkin ingin membagi rentang kami ketika kami menemukannya.
Meskipun kami akan mendeskripsikan perbaikan nantinya, pendekatan umum kami untuk mencocokkan permainan dimulai dengan bermain pseudo-optimal. Dari postur pertahanan ini, Hero dapat mengamati kecenderungan lawannya dan menentukan penyesuaian yang tepat. Tentu saja, sangat jarang bahwa lawan baru tidak diketahui sepenuhnya. Dalam praktiknya, kami mungkin melakukan dengan baik untuk membuat beberapa penyesuaian pra-pertandingan berdasarkan pada pengetahuan kami tentang kecenderungan populasi – kecenderungan dari rata-rata individu di kolam pemain kami. Namun, peringatan ini tidak memberi kita tiket gratis untuk hanya membuat permainan “standar” tanpa alasan yang bagus. Setiap penyimpangan dari permainan keseimbangan harus dibenarkan dengan mengacu pada kecenderungan yang dapat dieksploitasi, baik dari populasi rata-rata atau dari lawan tertentu.
Meskipun kami akan mendeskripsikan perbaikan nantinya, pendekatan umum kami untuk mencocokkan permainan dimulai dengan bermain pseudo-optimal. Dari postur pertahanan ini, Hero dapat mengamati kecenderungan lawannya dan menentukan penyesuaian yang tepat. Tentu saja, sangat jarang bahwa lawan baru tidak diketahui sepenuhnya. Dalam praktiknya, kami mungkin melakukan dengan baik untuk membuat beberapa penyesuaian pra-pertandingan berdasarkan pada pengetahuan kami tentang kecenderungan populasi – kecenderungan dari rata-rata individu di kolam pemain kami. Namun, peringatan ini tidak memberi kita tiket gratis untuk hanya membuat permainan “standar” tanpa alasan yang bagus. Setiap penyimpangan dari permainan keseimbangan harus dibenarkan dengan mengacu pada kecenderungan yang dapat dieksploitasi, baik dari populasi rata-rata atau dari lawan tertentu.
Meskipun ini adalah buku tentang permainan kepala, perlu diperhatikan bahwa banyak properti yang membuat Nash seimbang sehingga bermanfaat tidak ada dalam gim dengan tiga atau lebih pemain. Khususnya, jika kami memainkan strategi keseimbangan di HUNL, kami dijamin untuk setidaknya mematahkan (mengabaikan penggaruk) rata-rata atas kedua posisi. Itu tidak terjadi dalam 3-atau-lebih game pemain, di mana memainkan strategi keseimbangan tidak memberikan batas bawah pada kemenangan yang diharapkan kami. Dengan demikian, ekuilibrium Nash jauh kurang bermanfaat di luar permainan kepala, dan siapa pun yang menjual ide strategi “GTO” untuk 3-atau-lebih pemain game harus dilihat dengan kecurigaan.

Leave a Comment

Your email address will not be published. Required fields are marked *