第1部分(第4/5頁)
章節報錯
與人而言,如果沒有不同選擇的可能,理性的計算便是多餘的,對自己的目標也就無能為力。從這個意義上來講,我國改革開放走向市場經濟,就是使得每個經濟主體有選擇的可能,這樣人們才能發揮其理性的作用,使每個人的經濟狀況更好,而在計劃經濟下因沒有可選擇的餘地,每個人的理性計算能力便無從施展。
參與人在不同策略組合下會得到一定的支付(payoff)。
我們往往用支付矩陣來表示參與人在各種策略組合下的支付。1這個方法簡單,比用函式來表示直觀、易於理解,當然它的缺陷是,它只能表示兩個人的博弈結構。囚徒困境的支付矩陣為:
基本術語(2)
甲
乙 不招認 招認 不招認 各被判刑3個月 甲:當場釋放
乙:被判刑10年, 招認 甲:被判刑10年
乙:當場釋放 各被判刑5年這個矩陣表示的是:若甲選擇“招認”、乙選擇“招認”,甲乙各被判刑5年;若甲選擇“招認”、乙選擇“不招認”,甲被當場釋放,乙被判刑10年;若甲選擇“不招認”、乙選擇“招認”,甲被判刑10年,乙被當場釋放;若甲選擇“不招認”、乙選擇“不招認”,甲乙均被判刑3個月。
我們再來刻畫一交易過程的支付矩陣。在賣主甲和買主乙之間的“買—賣”博弈中——這是一討價還價過程,透過討價還價後一個價格被確定。在此價格下我們假定,賣者賣成後獲得的效用為6,賣不成的效用為0;買者買成的效用為4,買不成的效用為0。而如果他們之間的交易不成功,無論是買主還是賣主都要等待並再次進行討價還價,這需要成本。假定等待和討價還價的成本均為1,則支付矩陣為:
乙
甲 買成 買不成 賣成 6,4 5,0 賣不成 0,3 0,0 這兩個矩陣表明,在每個策略組合下參與人有一個收益值或支付值。
第四,對於博弈參與人來說,存在一個博弈結果。
所謂博弈結果是指,一個博弈中參與人最終對策略的選擇而產生的確定性的支付。如在曹操敗走華容道的博弈中,諸葛亮在“埋伏大路”與“埋伏通往華容道的小路”之間進行選擇,而曹操需要在“走大路”與“走(通往華容道的)小路”之間進行選擇。在這個博弈中,雙方猜測對方的行為,看誰猜測得準。博弈的最終結果是,諸葛亮派關羽埋伏在通往華容道的小路,而曹操正好選擇了走這條小路,曹操被諸葛亮抓住。這就是曹操與諸葛亮之間的博弈的結果。
第五,博弈涉及均衡。
均衡是經濟學中的重要概念。什麼是均衡?它的含義是什麼?
均衡即是平衡的意思,在英文中是equilibrium。在經濟學中,均衡意即相關量處於穩定值。在商品的供求關係中,在某一商品市場的某一價格下,想以此價格買此商品的人均能買到,而想賣的人均能將商品賣出去,此時我們就說,該商品的供求達到了均衡,此時的價格可稱之為均衡價格、產量可稱之為均衡產量。均衡分析是經濟學中的重要分析。
那麼什麼是博弈均衡呢?博弈均衡是一個穩定的博弈結果。均衡是博弈的一種結果,但不是說博弈的結果都能成為均衡。博弈的均衡是穩定的,在某種情況下是可以預測的。
納什均衡是一種最常見的均衡。它的含義是:在對方策略確定的情況下,每個參與人的策略是最好的,此時沒有人願意先改變或主動改變自己的策略。
在上面的“買—賣”的博弈中,(賣成,買成)是一個納什均衡,這個博弈可以解釋為什麼在現實中討價還價後買賣能做成,因為這對雙方來說都是最優選擇。同時在“買—賣”博弈中,其均衡對雙方來說是全域性最優的。