close
5個海盜搶到了100顆寶石,每一顆都一樣的大小和價值連城。他們決定這麼分:

  • 抽籤決定自己的號碼(1,2,3,4,5)
  • 首先,由1號提出分配方案,然後大家5人進行表決,當且僅當超過半數的人同意時,按照他的提案進行分配,否則將被扔入大海餵鯊魚。
  • 如果1號死後,再由2號提出分配方案,然後大家4人進行表決,當且僅當超過半數的人同意時,按照他的提案進行分配,否則將被扔入大海餵鯊魚。
  • 以此類推
  • 條件:每個海盜都是很聰明的人,都能很理智的判斷得失,從而做出選擇。

問題:第一個海盜提出怎樣的分配方案才能夠使自己的收益最大化?

答案:(底下有艱澀的數學分析,請在閒暇之餘在看!)

百度 - 5個海盜搶到了100顆寶石,每一顆都一樣的大小和價值連城。

(回答者: symen)

此題的標準答案是:1號海盜分給3號1顆寶石,4號或5號2顆寶石,自己則獨得97顆寶石,即分配方案為(97,0,1,2,0)或(97,0,1,0,2)。

現來看看我的分析:

   首先從5號海盜開始,因為他是最安全的,沒有被扔下大海的風險,因此他的策略也最為簡單,即最好前面的人全都死光光,那麼他就可以獨得這100顆寶石了。

  接下來看4號,他的生存機會完全取決於前面還有人存活著,因為如果1號到3號的海盜全都喂了鯊魚,那麼在只剩4號與5號的情況下,不管4號提出怎樣的分配方案,5號一定都會投反對票來讓4號去喂鯊魚,以獨吞全部的寶石。哪怕4號為了保命而討好5號,提出(0,100)這樣的方案讓5號獨佔寶石,但是5號還有可能覺得留著4號有危險,而投票反對以讓其喂鯊魚。因此理性的4號是不應該冒這樣的風險,把存活的希望寄託在5號的隨機選擇上的,他惟有支持3號才能絕對保證自身的性命。

   再來看3號,他經過上述的邏輯推理之後,就會提出(100,0,0)這樣的分配方案,因為他知道4號哪怕一無所獲,也還是會無條件的支持他而投贊成票的,那麼再加上自己的1票就可以使他穩獲這100寶石了。

  但是,2號也經過推理得知了3號的分配方案,那麼他就會提出(98,0,1,1)的方案。因為這個方案相對於3號的分配方案,4號和5號至少可以獲得1顆寶石,理性的4號和5號自然會覺得此方案對他們來說更有利而支持2號,不希望2號出局而由3號來進行分配。這樣,2號就可以屁顛屁顛的拿走98顆寶石了。

  不幸的是,1號海盜更不是省油的燈,經過一番推理之後也洞悉了2號的分配方案。他將採取的策略是放棄2號,而給3號1顆寶石,同時給4號或5號2顆寶石,即提出(97,0,1,2,0)或(97,0,1,0,2)的分配方案。由於1號的分配方案對於3號與4號或5號來說,相比2號的方案可以獲得更多的利益,那麼他們將會投票支持1號,再加上1號自身的1票,97顆寶石就可輕鬆落入1號的腰包了。

顯然,海盜分寶石的模型相對於現實來說,實在是太粗糙了,現實中的情況遠要比它複雜千萬倍。

   首先,現實中肯定不可能人人都絕頂聰明並富有理性,海盜中只要3號、4號或5號中任何一人偏離此假設,1號就極有可能被拋入大海。因此,現實中的1號必須首先考慮他的兄弟們是否足夠的聰明與理性,而斷然不能顧自取走那97顆寶石。

   其次,在這一涉及個人重大利益的分配過程中,陰謀會像雜草一般瘋長,而謊言與虛假承諾也就有了用武之地。假如,2號事先對3、4、5號海盜大放煙霧彈,稱基於1號所提出的任何分配方案,他都會再多加1顆寶石給他們,那結果可能又會是另一番景象了。

  再次,所有規則的設立,說到底,都遵循一條根本規則:暴力最強者說了算。這是一條元規則,決定規則的規則。在發生爭執時,如果在肉體上消滅對方是最合算的,付出成本也是最低的話,那麼當5個海盜中最強悍的那個將刀架在其餘海盜脖子上,並大喝道「要命還是要寶石」的時候,那麼任何的爭執都不難解決,任何的意見也就不難統一了。

   當然,即使1號是那最強悍的海盜,其餘4人也還是有可能組成一個反1號大聯盟,並經過精心策劃和充分準備而起來「造反」,合力將1號制服並扔進大海,再由這4人重新商定分配規則。

  已經無需討論更多的情況,相信大家已同意現實實在是太複雜的看法了。但是,海盜分寶石的模型還是不乏有啟示意義,即任何「分配者」想讓自己的方案獲得通過,其關鍵是在於事先要考慮清楚「挑戰者」所可能會提出的分配方案,然後盡力拉攏「挑戰者」分配方案中最不得意的人,用最小的代價使自己的利益最大化,總之是離不開過人的智慧和高超的策略。

百度 - 5個海盜分金是簡單的數學邏輯題嗎?

海盜分金網上的答案多是(98,0,1,0,1)之類的答案,我覺得不對。

想起小時候的題:樹上10隻鳥,打死一隻,樹上還有幾隻?
如果只考慮數學邏輯,答案是9隻。如果考慮行為邏輯是0隻。

其實這道題也是這樣的,海盜---鳥,船上----樹上,所以這是考行為邏輯下的博弈題目。

如題目是某5人分100塊石頭,且不用扔到海裡。答案就不同了。

所以按照行為邏輯的來進行推理如下,這是我跟樓主討論後的一些分析,希望高手指點!我們志在將這個簡單的博弈模型複雜化,考慮的因素多一些。(回答者: P仔7079202 )

(一)

假定大家在任何情況下都會遵守分配規則,即無論幾個人都會進行投票,遭否決的提議人均會被扔下海。那麼這就是個簡單的非合作動態博弈題目。逆推法可以輕鬆解決。

只剩4,5時,4只能提出0,100的分配方案,5可以答應也可以不答應,這就要看4,5之間的人際關係及5的脾氣性格等各種因素了。

因為大家都足夠聰明,所以4可以預計如果只剩下他們倆時自己的下場,分兩種情況:
1. 博弈方4可以保命,雖然不得到寶石,但至少沒死。
2. 博弈方4肯定喪命,既得不到寶石,也要送命,得益不是0而是負數。

接著設想只剩3,4,5時的情形,博弈方3也深知5的脾氣,即3可以預見在自己方案遭否決而只剩4,5時的情形,所以3要爭取4或者5中的一人同意自己的方案,顯然巴結4的成本小很多。由於只剩4,5時的情況有兩種,於是3的策略會不同,(次序同上)
1. 博弈方3至少得出1顆寶石,因為如果3提出100,0,0的方案,4沒有必要答應,5更不會答應,所以3最少會提出99,1,0的方案
2. 由於4有喪命的危險,此時3可以提出100,0,0的方案,4 也會答應。

不妨依次往下推:
剩博弈方2,3,4,5時(情況的次序同上)
1. 博弈方2最少提出的方案為97,0,2,1以此得到4,5的支持
2. 博弈方2最少提出的方案為98,0,1,1以此得到4,5的支持

最後是博弈方1的方案策略了
1. 博弈方1最少提出97,0,1,0,2的策略以此得到博弈方3和5的支持
2. 博弈方1最少提出97,0,1,2,0或者97,0,1,0,2的策略,以此巴結到3號的同時得到4或者5中一個人的支持。

綜上所述,
1在不考慮違反規則,
2在不考慮博弈方有冒生命風險去獲得寶石,即博弈方的冒險可能性被剔除的情況下,
3在不考慮可能在博弈之前,甚至抽籤之前已經形成結盟的情況下,
我們得到了一個動態博弈問題的完美子博弈納什均衡解,該解在不考慮上述三種情況時是穩定並且有效的,不容置疑。

(二)

在第(一)中最為簡單的基礎上,我們僅僅多引入違反大家已定規則的可能性。

前提假設為5個人實力相等,即大家如果搶奪大家誰都打不過誰,所以才有了這個題目,如果有個海盜「實力」超凡,也就會成為所謂的「老大」,就沒必要大家投票了,該前提假設(一)也適用,只是在(一)中不會產生如在(二)中的影響。因為實力相當,也就是多數人能打過少數人,所以在5個人,4個人,3個人在場的情況下,誰都不可能違反已定規則。比如1號提的方案遭拒,他拒絕被丟進海,企圖違反規則,但是4個人是不會允許的。同理,4個人,3個人的時候大家違反規則的可能性是沒有的。

而當只剩2個人的時候情況就不同了,4號不是傻子,他有能力一搏,5號同樣不是傻子,他知道4會放手一搏。在這種情況下,打一架決定收益,則不計受傷的負收益,那麼雙方由於實力均等,各自的期望得益均為50,於是不如雙方不打架直接平分,各得50。

這種情況是有可能發生的,並且是很可能發生的,因為既定規則在只剩2人博弈的時候變得就像道德約束一樣,我想,海盜似乎不會因為這種道德約束而選擇死亡或者一顆寶石都不要吧。

用逆推法推斷,如(一)的方法
博弈方3會選擇49,51,0或者49,0,51的方案
博弈方2會選擇49,50,0,1或者49,50,1,0的方案
博弈方1的方案為:97,0,0,1,2或者97,0,0,2,1

說實話,這種可能性是更大的,因為既定規則在只剩2人博弈時會顯得蒼白無力,而海盜們都是「聰明」的,都是可以預見到未來的,所以這樣的推導是不存在問題的,只是在如果考慮到某個博弈方有可能「冒險」時,或者有結盟存在時,該推導所得的解會被改變。

博弈論中有個均衡的概念叫作「顫抖手均衡」,我不太肯定的把(二)所得的解歸為顫抖手均衡,其實它也是一個相對穩定的解。

(三)

我們討論存在「冒險」行為的該博弈問題。定義「冒險」為博弈方為了未來利益而願意放棄眼前利益,即風險收益比。

眼前利益,不僅侷限於可以馬上得到的寶石,還會牽涉到生命,所以是相當複雜的。

假定,我們必須給出假定,否則根本無從下手。

假定:
  • 1. 五個人都是風險中性。
    舉個例子講就是,比如1提出的方案是給5號50顆寶石,而如(二)分析得到的一樣,在剩4,5存在時,5也會得到50顆寶石,那麼這兩種情況下得到的50顆寶石對於5號來說是無差異的。但是博弈方5到底會怎麼選擇呢?給出假定2.
  • 2. 博弈方在面對兩階段的相同得益時,會選擇較前階段的得益。
    也就是說,在上述例子中,博弈方5在1提出方案時會投贊成票。為什麼這樣假設?「折舊」的概念在這裡被縮小的,但是從時間機會成本的角度,或者殺人對於博弈方的得益來看,博弈早點結束,寶石早點得到分配對大家都有利,大家可以有多點時間去瀟灑,我們排除喜歡浪費時間看殺人的「殺人狂」的存在。
    這兩個假設在(一)(二)中均未得到應用,所以在(一)(二)的分析中號碼前的博弈方會試圖用至少多一點的寶石去巴結賄賂其他博弈方,而當有這些假定時,博弈方只需用同樣的寶石即可賄賂到其他博弈方。
    這兩個假設不缺乏道理,此時我甚至有把它運用到(一)(二)中的衝動。
  • 3. 假定每個海盜都會去「冒險」,即為了自己可能得到的最大得益而去讓博弈不停的進行下去,以此取得一個自己的最大利益。
    而當出現這個最大得益時,「冒險」停止,無論在哪輪出現。
這個假定是個很關鍵的假定,在這3個假定的情況下,我們繼續討論(二)基礎上的問題。

在只剩4,5時,大家收益都為50.
所以4,5預計的最大「冒險」得益為50.

3可以巴結4,也可能賄賂5,假設概率各為0.5,那麼3會怎麼做呢?他提出的方案50,0,50或者50,50,0。根據假定是可以得到通過的。於是3的最大「冒險」得益也為50。但是在剩下3,4,5的情況下,也就是3提方案的時候,4,5的期望得益均為25,也就是4,5中只有一個人可以得到50,另一個為0,所以4,5實際上不可能希望博弈進行到這一步,但是一旦進行到這一步,方案也是會被通過的,不會再向下進行了。

考慮2提方案的時候,因為3,4,5會去等待最大得益50,於是為了保命,失去性命是會產生負收益的,他只能提出讓3,4,5中的兩人各得50,分法有3種,不依次說了。2的最大「冒險」收益為保命。1的方案只要得到通過,2可提前保命,所以1只需再籠絡3,4,5中的一個人,給他50寶石,自己留50,於是就得到瞭解。

綜上所述,在大家都把「冒險」進行到極端情況下,博弈方1的方案有三種:50,0,50,0,0或者50,0,0,50,0或者50,0,0,0,50。可以清晰的看到,其實這種情況下大家是不理智的,3,4,5的期望得益都是50的三分之一,但是他們在面對這樣方案提出的時候,又是會被通過的。

將假定3稍微改動下,即假定大家都不會「冒險」去等待可能存在的最大利益,大家的選擇原則是根據期望得益而定,分析如下。

4和5在最後一輪的得益會是各自50。

如果進行到3提方案,他會給4,5中其中一個人50,於是4,5在倒數第二輪的期望得益均為25。因為4,5害怕3提出方案自己的得益會是0,那麼2可以提出的最優方案是50,0,25,25.不會有其他情況。

3當然希望可以進行到自己提方案的時候,但是實際是不可能的了。

1只要提出75,0,0,25,0或者75,0,0,0,25的方案,那麼4,5中有一個人必然同意,3會同意嘛?如果他不同意,浪費了時間,在 2提出50,0,25,25的方案時自己同樣得不到寶石,所以在大家都不「冒險」的情況下,1 的方案為:75,0,0,25,0或者75,0,0,0,25。

至於涉及風險利益比率,以及要將生命當作一種條件進行博弈的分析,情況更為複雜,在此不再討論,只取兩種極端情況。至於假定,一定要仔細看一下,沒有假定,(三)的分析不成立。

(四)

最後探討的問題是「結盟問題」,這是我最不願提及的問題,極為複雜,任何多人博弈在加入不確定的結盟可能時,解會變得既不穩定。我們單單考慮一下結盟均為「穩定結盟」的情況,即結盟不會因為其他博弈方或者其他聯盟的「小恩小惠」瓦解。

不會瓦解的穩定結盟有多少種呢?
  • 5人結盟,不存在。
  • 4人結盟,5種。
  • 3人結盟,另2人結盟,10種,另2人不結盟,10種。
  • 2人結盟,其他3人不結盟,10種;其他3人中有2人結盟,30種。
65種?似乎不多。

但結盟會導致的「分贓權」歸屬問題將使問題再次複雜化。
  • 3人,4人結盟的分贓權歸屬不存在疑問。
  • 2組兩人聯盟存在時,拉攏「破壞者」成為關鍵,於是30*2=60
  • 2人結盟,其他三人各自為戰時,情況也不簡單。
    2人聯盟只需拉攏一人,拉攏成功有3種情形,不成功即另3人達成一致,雖然未結盟,又是一種,10*4=40
所以,其實變成了125種,可能有錯誤,不確定。
論及可能存在的不穩定聯盟時,那可能性趨向無窮。
也許高等的數學知識可以解決,但我力不能及。
arrow
arrow
    全站熱搜
    創作者介紹
    創作者 DolphinWing 的頭像
    DolphinWing

    海豚看世界

    DolphinWing 發表在 痞客邦 留言(9) 人氣()