Teori permainan
Dari Wikipedia, ensiklopedia bebas
Teori permainan (bahasa Inggris: game theory) adalah bagian dari ilmu matematika yang mempelajari interaksi antar agen yang bersifat rasional. Setiap keputusan atau strategi yang dipilih oleh agen akan memiliki hasil yang berbeda (payoff) pada agen kompetitor.[1] Pertama kali dikembangkan sebagai cabang tersendiri dari ilmu matematika oleh Oskar Morgenstern dan John von Neumann, cabang ilmu ini telah berkembang sedemikian pesat hingga melahirkan banyak tokoh peraih nobel, seperti John Nash (AS), Reinhard Selten (Jerman), dan John Harsanyi (AS) pada tahun 1999 dan Thomas Schelling (AS), Robert Aumann (Israel) pada tahun 2005, dan Leonid Hurwicz (Amerika Serikat) pada tahun 2007.
Dasar teori permainan
Permodelan teori permainan paling mudah biasanya dimodelkan dalam bentuk matriks payoff atau pohon keputusan. Pada dasarnya, teori permainan diasumsikan semua agen bersifat rasional. Rasionalitas yang dimaksud adalah dimana setiap agen diasumsikan memutuskan strategi untuk memaksimalkan payoff dari agen itu sendiri yang tergantung pada pengetahuan dari agen terhadap strategi kompetitor.[2] Variabel-variabel yang diformulasikan pada teori permainan mencakup keputusan (strategi) dari setiap agen dan payoff yang berupa hasil dari pengambilan keputusan tersebut. Apabila digambarkan pada agen dan , maka agen dapat memiliki strategi , , ..., sampai dan agen memiliki strategi , , ..., sampai . Kemungkinan hasil atau payoff yang diperoleh agen dan dapat berjumlah . Diketahui bahwa agen dan agen memiliki Payoff berupa dan . adalah fungsi payoff dari agen mempertimbangkan strategi Agen () yang ke dan strategi Agen () yang ke . Tabel matriks payoff dari agen dan adalah sebagai berikut:
Agen | |||||
---|---|---|---|---|---|
... | |||||
Agen | ... | ||||
... | |||||
... | ... | ... | ... | ... | |
Penyelesaian atau solusi dari permasalahan ini disebut ini keseimbangan Nash (Nash Equilibrium) apabila setiap agen sudah mencapai payoff maksimum tergantung dari strategi agen lain dan seluruh agen tidak dapat lagi merubah strateginya. Keseimbangan Nash ditemukan oleh John Forbes Nash Jr. dalam studinya yang berjudul Noncooperative games[3]. Sebagai contoh, permasalahan dilema tahanan (prisoner's dilemma) adalah penerapan teori permainan untuk dua tahanan yang sedang diinterogasi. Tahanan dan ditangkap karena kejahatan yang dilakukan mereka secara bersamaan oleh penegak hukum. Setiap tahanan yang diinterogasi memiliki dua strategi yaitu mengakui kejahatannya atau tidak. Payoff dari kedua tahanan ini adalah lama tahanan akan dipenjara. Setiap strategi yang dilakukan akan menghasilkan payoff yang berbeda-beda untuk setiap Tahanan. Jika dimodelkan dengan matriks payoff, strategi dan payoff kedua tahanan adalah berikut ini:
Pengakuan Tahanan | |||
---|---|---|---|
Mengaku | Tidak | ||
Pengakuan
Tahanan |
Mengaku | 3 tahun
3 tahun |
bebas
5 tahun |
Tidak | 5 tahun
bebas |
1 tahun
1 tahun |
Contoh matriks payoff menunjukan efek dari penetapan setiap strategi tahanan dan terhadap lama mereka akan dipenjara. Sebagai contoh, Jika tahanan mengakui perbuatannya dan tahanan tidak, maka tahanan akan bebas dan tahanan dipenjara selama 5 tahun. Berdasar dari konsep keseimbangan Nash, jika tahanan memilih mengaku, maka respon terbaik tahanan adalah juga mengakui perbuatannya. Jika tahanan memilih untuk tidak mengakui, respon terbaik tahanan adalah masih mengakui perbuatannya. Apapun strategi yang dipilih tahanan , tahanan sebaiknya memilih untuk mengakui perbuatannya. Hal ini pun juga berlaku untuk tahanan . Jika tahanan memilih mengaku, maka respon terbaik tahanan adalah juga mengakui perbuatannya. Jika tahanan memilih untuk tidak mengakui, respon terbaik tahanan adalah masih mengakui perbuatannya. Alhasil, kedua tahanan akan memilih untuk mengakui perbuatannya. Hal ini disebut keseimbangan Nash dimana kedua tahanan yang sudah mengaku tidak lagi dapat memperbaharui strateginya. Akhirnya kedua tahanan memiliki payoff berupa dipenjara selama 3 tahun. Kondisi permainan yang dilakukan juga termasuk kedalam permainan nonkooperatif (Noncooperative game), dimana semua agen rasional berkompetisi tanpa ada interaksi antar mereka. Jika kedua tahanan memilih untuk berinteraksi, maka satu-satunya payoff paling optimal diperoleh jika keduanya tidak mengaku. Mereka akan hanya dipenjara selama satu tahun. Skema interaksi ini dinamakan permainan kooperatif (Cooperative game).

Selain dimodelkan dengan matriks payoff, permainan dapat dimodelkan dengan menggunakan pohon keputusan (Decision tree). Penggunaan pohon keputusan dalam teori permainan dapat merujuk kepada permainan sekuensial (Sequential game) dan permainan extensive form. Jika diaplikasikan pada permainan dilema tahanan, strategi tahanan yang dari tahanan dapat dilihat pada gambar pohon keputusan.
Penerapan teori permainan dalam pemodelan ekonomi
Wikiwand - on
Seamless Wikipedia browsing. On steroids.