Apakah AI Benar-Benar “Mendapatkan” Poker? Mengapa Itu Penting?

Apakah AI Benar-Benar “Mendapatkan” Poker? Mengapa Itu Penting?

Maria Konnikova (kiri), seorang jurnalis sains yang keluar dari pertunjukan yang bagus untuk menjadi pemain poker, belajar banyak tentang sisi manusiawi permainan dan tentang upaya pemrogram AI untuk mengotomasinya. Sepanjang jalan, dia memenangkan uang dan menulis buku, Tebing Terbesar: Bagaimana Saya Belajar Memberi Perhatian, Menguasai Diri Sendiri, dan Menang (Juni 2020).

Dalam kutipan di Kabel, dia merenungkan fakta bahwa pelopor komputer John von Neumann (1903–1957) adalah seorang pemain poker dan “Bukan hanya seorang pemain poker, tetapi seseorang yang pokernya mengilhami wawasan cemerlang dalam pengambilan keputusan manusia, seseorang yang menganggapnya sebagai permainan pamungkas untuk mendekati tantangan strategis kehidupan.”

Poker adalah permainan keterampilan tetapi memiliki unsur peluang dan ketidakpastian yang relatif besar. Sebagai Konnikova katakan,

Dalam poker, Anda bisa menang dengan tangan terburuk dan Anda bisa kalah dengan tangan terbaik. Dalam setiap permainan lain di kasino — dan dalam permainan informasi sempurna seperti catur dan Go — Anda harus memiliki yang terbaik untuk menang. Tidak ada cara lain yang memungkinkan. Singkatnya, itulah sebabnya poker lebih merupakan usaha yang terampil daripada perjudian.

Memang, ketika ekonom Ingo Fiedler menganalisis ratusan ribu tangan yang dimainkan di beberapa situs poker on-line selama periode enam bulan, ia menemukan bahwa tangan terbaik yang sebenarnya menang, rata-rata, hanya 12 persen dari waktu, dan kurang dari sepertiga tangan pergi ke showdown (berarti bahwa pemain cukup terampil untuk membujuk orang lain untuk melepaskan kartu mereka sebelum akhir tangan).

Maria Konnikova, “Poker dan Psikologi KetidakpastianDi Wired (23 Juni 2020)

Di Alam, Liz Boeree memberitahu kami, saat meninjau The Largest Bluff, bahwa dia juga, sebagai lulusan astrofisika, menghabiskan sepuluh tahun bermain poker di sirkuit profesional. Saat dia melihatnya,

Permainan ini berada di zona Goldilocks antara informasi catur yang jernih dan sempurna (tidak ada pengetahuan tersembunyi; pemain terbaik hampir selalu menang) dan pertaruhan yang tidak ada artinya dari roda roulette. Ini melibatkan keberuntungan yang cukup dan keterampilan yang cukup untuk menyerupai kekacauan realitas.

Liv Boeree, “Apa yang dibutuhkan dunia sekarang: pelajaran dari pemain pokerDi Alam

Jadi, mengingat semua itu, seberapa mudah mengajarkan AI untuk bermain poker? Konnikova memutuskan untuk melakukannya Temukan dari seorang professional, ilmuwan komputer Universitas Carnegie Mellon Tuomas Sandholm, yang berharap menggunakan poker untuk mengajar aplikasi AI untuk menangani ketidakpastian:

"Poker adalah program tolok ukur dan tantangan utama untuk permainan informasi yang tidak sempurna," kata Sandholm pada sore musim semi yang hangat pada tahun 2018, ketika kami bertemu di kantornya di Pittsburgh. Permainan, ternyata, telah menjadi standar emas untuk mengembangkan kecerdasan buatan …

Tujuannya bukan untuk memecahkan poker, seperti itu, tetapi untuk membuat algoritma yang keputusannya mengambil keputusan dalam dunia poker dari informasi yang tidak sempurna dan situasi stokastik – situasi yang ditentukan secara acak dan tidak dapat diprediksi – kemudian dapat diterapkan ke ranah stokastik lainnya, seperti militer, bisnis, pemerintah, cybersecurity, bahkan perawatan kesehatan.

Maria Konnikova, “Dek Tidak Dicurangi: Poker dan Batas AIDi Hapus tanda (17 Juli 2020)

Sejauh ini tiga program telah dirancang untuk bersaing dengan pemain manusia: Claudicus (yang gagal), Libratus (yang berhasil) sekarang Pluribus, yang dapat memainkan lima pemain sekaligus. Modul yang menambah kesuksesan adalah strategi meniru penyesalan (“Menyesal untuk komputer berarti menyadari bahwa tindakan yang tidak dipilih akan menghasilkan hasil yang lebih baik daripada yang sebelumnya”), pemecah subgame dan pemacu diri. Komentar Konnikova,

Tentu saja, tidak ada algoritma yang sempurna. Ketika Libratus sedang bermain poker, itu pada dasarnya bekerja di lingkungan zero-sum. Itu menang, lawan kalah. Lawan menang, kalah. Tetapi sementara beberapa interaksi kehidupan nyata benar-benar zero-sum – peperangan cyber muncul di benak – banyak yang lain hampir tidak langsung: Kemenangan saya tidak selalu berarti kerugian Anda. Pai tidak tetap, dan interaksi kita mungkin lebih banyak daripada jumlah positif.

Terlebih lagi, aplikasi kehidupan nyata harus bersaing dengan sesuatu yang tidak algoritma poker: bobot yang ditugaskan untuk elemen keputusan yang berbeda. Dalam poker, ini adalah proses memaksimalkan nilai sederhana. Tetapi apa nilai dalam dunia manusia? Sandholm harus bersaing dengan ini sebelumnya, ketika dia membantu membuat pertukaran ginjal pertama di dunia. Apakah Anda ingin lebih efisien, memberikan jumlah maksimum ginjal secepat mungkin – atau lebih adil, yang mungkin memerlukan biaya untuk efisiensi? Apakah Anda ingin sebanyak mungkin nyawa diselamatkan – atau apakah ada yang mengambil prioritas dengan biaya mencapai lebih banyak? Apakah ada preferensi untuk lama menunggu hingga transplantasi? Apakah anak-anak mendapatkan preferensi? Dan terus dan terus. Sangat penting, kata Sandholm, untuk memisahkan cara dan tujuan. Untuk mengetahui tujuannya, manusia harus memutuskan apa tujuannya.

Maria Konnikova, “Dek Tidak Dicurangi: Poker dan Batas AIDi Hapus tanda (17 Juli 2020)

Seperti banyak profesional AI, Sandholm memiliki pandangan cerah tentang apa yang terjadi hari ini: ia percaya bahwa "Dunia pada akhirnya akan menjadi jauh lebih aman dengan bantuan algoritma seperti Libratus":

Logikanya bagus, dan AI jauh lebih baik dalam penalaran strategis daripada manusia, ”jelasnya. “Ini menghilangkan irasionalitas, emosi. Dan itu lebih adil. Jika Anda memiliki AI di pihak Anda, itu dapat mengangkat non-pakar ke tingkat ahli. Negosiator yang naif tiba-tiba akan memiliki senjata yang lebih baik. Kita bisa mulai menutup kesenjangan digital. "

Maria Konnikova, “Dek Tidak Dicurangi: Poker dan Batas AIDi Hapus tanda (17 Juli 2020)

Cara segalanya berjalan, respons satu kata muncul di pikiran: Cina.

Konnikova belajar beberapa hal menarik dari kunjungannya ke lab Sandholm. Sistem utama, Bridges, menjalankan Libratus menggunakan lebih dari dua setengah petabyte (2,5 juta gigabytes) tetapi hanya berhasil dalam poker kepala di bawah "keadaan terbatas":

Namun terlepas dari kekuatan komputasi yang menakjubkan yang tersedia, Libratus masih sangat terbatas. Ya, itu mengalahkan lawannya di mana Claudico gagal. Tetapi para profesional poker tidak diizinkan untuk menggunakan banyak alat perdagangan mereka, termasuk perangkat lunak analisis lawan yang mereka andalkan dalam permainan on-line yang sebenarnya. Dan manusia lelah. Libratus dapat berputar selama dua minggu maraton, di mana pikiran manusia terputus-putus.

Tetapi masih banyak yang tidak bisa dilakukan: bermain lebih banyak lawan, bermain langsung, atau menang setiap saat. Ada lebih banyak manusia dalam poker daripada yang ditaklukkan Libratus. “Ada keyakinan bahwa ini semua tentang statistik dan korelasi. Dan kami sebenarnya tidak percaya itu, ”Nystrom menjelaskan ketika kami meninggalkan Bridges. "Korelasi sesekali baik, tetapi secara umum, mereka juga bisa sangat menyesatkan."

Maria Konnikova, “Dek Tidak Dicurangi: Poker dan Batas AIDi Hapus tanda (17 Juli 2020)

Pluribus melakukan jauh lebih baik tetapi Konnikova bertanya, dapatkah AI membuat hal yang tidak dapat diprediksi dapat diprediksi ketika dek tidak dicurangi ?:

Ada lebih banyak hal dalam hidup daripada yang ditulis dalam algoritma. Kami tidak memiliki perangkat lunak pendeteksi kebohongan yang dapat diandalkan – baik di wajah, kulit, atau otak. Dalam tes tebing di poker baru-baru ini, pengenalan wajah komputer gagal complete. Kita bisa merasa tidak nyaman, tetapi kita tidak bisa mendapatkan alasan untuk ketidaknyamanan itu: berbaring, kelelahan, stres – semuanya terlihat sama. Dan manusia, tentu saja, juga bisa meniru stres di mana tidak ada, memperumit gambaran lebih jauh.

Pluribus mungkin berubah menjadi kuat, tetapi tantangan von Neumann masih bertahan: Sifat sebenarnya dari permainan, yang paling manusiawi dari manusia, masih harus ditaklukkan.

Maria Konnikova, “Dek Tidak Dicurangi: Poker dan Batas AIDi Hapus tanda (17 Juli 2020)

Kenny Rogers (1938–2020) pasti akan setuju (sebagai ikon “Gambler”): “Nak, aku telah membuat hidupku lepas dari membaca wajah orang, Dan tahu apa kartu mereka dengan cara mereka memegang mata mereka ”:

(embed) https://www.youtube.com/watch?v=7hx4gdlfamo (/ embed)

Poin yang dapat diambil tampaknya adalah bahwa komputer yang cukup kuat akan menang pada permainan apa pun yang bergantung pada penghitungan semua peluang yang ada, berurusan dengan ketidakpastian, dan membuat keputusan terbaik untuk tujuan terbatas yang ditentukan. Tetapi begitu banyak kehidupan tidak seperti itu. Informasi ini seringkali jarang dan sangat tidak sempurna atau menyesatkan. Terlebih lagi, sulit untuk memutuskan, dalam banyak kasus, apa hasil "terbaik" itu. Banyak hal berubah dan orang-orang terus bergerak. Mereka yang berharap bahwa suatu algoritma dapat muncul dan memecahkan masalah mendasar dari ketidakpastian dalam hidup adalah bercanda sendiri.


Anda juga dapat menikmati:

Bisakah juara poker AI meningkat keputusan dunia nyata?
Itulah klaim yang ditayangkan di Nature for Pluribus, juara bertahan Texas yang baru. Orang-orang Bradley Middle skeptis. Eric Holloway: “AI trendy seperti siswa jagoan yang dapat lulus setiap tes tetapi melakukannya dengan menggunakan lembar contekan. Itu bisa mendapatkan semua jawaban yang benar di area terbatas di lingkungan pengujian. "