24小时热门版块排行榜    

CyRhmU.jpeg
查看: 2480  |  回复: 2

daiben06

金虫 (初入文坛)

[交流] 关于信号博弈的一些总结已有1人参与

信号博弈
Eric.lab

引:

信号博弈是不完全信息动态博弈的一种表现形式,基本的求解方法与不完全信息动态博弈中的贝叶斯nash均衡类似.但是要给予信号博弈贝叶斯纳什均衡的几个条件,从而形成了信号条件的概念.

1.定义:

是一种由一个发送者(S)和另一个接收者(R)所组成的动态博弈。一开始这个发送者有一个给定的类型(t),接着发送者会观察这个没有其他人(好比说接收者)知道的类型,去从讯息堆 M ={m1, m2, m3,..., mj} 中选择送出一个讯息(m),接着接收者会观察这个讯息后从他可行的动作中A = {a1, a2, a3,...., ak} 选一个作为反应动作(a),这里要注意的是接收者除了讯息之外其他都无法得知(如发送者的类型t),接着根据(t, m, a)的组合来决定双方会获得的报酬或回报。

例子:

见附件。

2.信号博弈(不完全信息动态博弈)

问题的难点:

(1)在不完全信息动态博弈中,出现了类型的不同的问题,这样的问题是经典博弈论无法解决的.但是可以通过海萨尼转换将一个不完全信息博弈,转换成不完美但是完全信息的博弈.下面我们都将处理不完美动态博弈.

(2)对于一般的完全信息动态博弈,我们可以采用完美子博弈nash均衡精炼nash均衡.然而,在不完全信息的博弈当中,由于信息的缺失,我们通常难以寻找subgame.

(3)由于类型的未知性,我们需要利用一定的理性方式,去描述这样接受者对发送者类型的推测或者叫信念(belief).



3.引入元素解决方案

我们已经讲过利用海萨尼转换,可以把一个不完全信息博弈转换成完全但不完美信息博弈.所以我们的一个问题解决了.

3.1.元素1:后续博弈(identifysubforms)

动态博弈最基本的精炼nash均衡的方法就是寻找完美子博弈nash均衡.但是在信息集存在下,通常不能够直接寻找到子博弈.所以我们需要引入更加广义的子博弈的概念.

定义:subforms

Condition1)子树只能从整个博弈中分离出来.(2)信息集可以作为子树的根(相对于子博弈的只能是单节点作为根)

通常情况下,我们把参与者i的信息集记为h_{i}属于H_{i}



3.2.元素2:信念(belief)

自然地,在接受者不清楚发送者类型的情况下,通常要对发送者的类型有一个判定,才能进行下一步的决策.这样就十分类似于一个随机决策模型.通常我们要引入概率的概念去理性的表述这样的事情.因为接受者可以观测到发送者的决策类型,但是不能观测到发送者本身的类型,很自然的,我们会想到条件概率.那么这个belif不是随便就能给的,自然要假定我们的参与者是理性的条件下,所以类似在不完全信息博弈的解法中一样,引出了bayes法则.

发送者的信念->对对手的期望收益.(\mu_{i})

在这个例子中:

x=Pr(U|L);y=Pr(U|R)

接受者的信念->对发送者的类型的估计.(\alpha_{i})

r=Pr(I|L);q=Pr(I|R);

利用以上的概率,就可以去描述问题中的“不完全的信息”。但是随之而来的问题是,我们的概率要怎么去计算。->bayes法则。

i.e.

r=PrIL=Pr⁡(L|I)Pr⁡(I)Pr(L|I)PrI+Pr⁡(L|II)Pr⁡(II)=apap+b(1-p)

q=PrIR=Pr⁡(R|I)Pr⁡(I)PrRIPrI+Pr⁡(R|II)Pr⁡(II)=(1-a)p(1-a)p+(1-b)(1-p)

但是有一个问题就是bayes法则对这样条件概率的评估可能存在一定的问题就是无法表示那些概率为0的情况。说来抽象,我自己也不是很明白其中的一些含义(可能和测度有关)。最后是用一致性解决这个问题。



3.3元素3:决策类型

有了以上两个工具,看似已经够了,但是我们需要对问题进行进一步的简化。这个一个信号博弈,有几种类型的决策,搞清楚这几种类型的决策对解决问题是很有必要的。

1.混合策略(Pooling Equilibria)

无论发送者是怎么样的类型,都做同样的决策。

2.分离策略(Separating Equilibria)

不同类型的发送者选择不同的决策。

3.杂合策略(hybrid strategy)

一种类型的发送者选择特定的决策,而另一种类型的发送者随机的选择决策。

4.完全混合策略

两种类型的发送者都随机地选择决策。



4.求解博弈

对于我们这个例子,我们可以求解博弈。

具体求解见附件中,有兴趣交流。



5.总结:从自然走向理性。

什么是理性,是一种思维方式,不得不承认:人是只不过是一根会思想的苇草。帕斯卡尔是一名思想家,物理学家(大气压的单位Pa就是以他命名)。

理性是怎么样的一种思维方式?就是量化的、客观的、咬文嚼字的、利益优先的、利己的、抽象的、概括的。

的确它是形而上的,就像数学,形而上的叫逻辑的思维,宏观的决策,就像运筹帷幄决胜千里之外。而形而下的就是一些繁琐的积分、导数的计算等等。对,思维是形而上的。思维能指导人,运作人。

就像解决一个问题,首先说明一下问题这个概念,它是区别于特例的,问题是没有具体的数字的。是种种特例的抽象形式。解决问题是形而上的,我们叫算法。解决特例是形而下的,我们叫做答案,针对特例的答案。理性的思维是追求算法。特例里面的数据变动一下,我们照样能够轻松解决,需要有这样的习惯,可能前面花费了大量的精力,只要能够对以后的工作提供永久性的便利都是值得的。这样的习惯很重要。

具体点来讲,理性的思维怎么运用到这样一个“不完全信息动态博弈”中呢。

分析问题,一个陌生的问题需要转换成一个我们已经熟悉的问题中去,这是一条捷径。

(1)海萨尼转换;以及引入的第一个元素:(2)后续博弈,都是运用了这样的思维去解决问题。

这样问题就变成一个不完美的动态博弈。难点就在于接受者没有获得完全的信息,这样就产生了主观的评价。在理性的世界里是不喜欢主观的东西的,通常要把主观的东西用客观的公式,参数去表示。

自然就想到了概率中的条件概率,又如何计算,bayes法则就呼之欲出了。从而有了不完全信息动态博弈的贝叶斯纳什均衡。

(3)问题中还有一点就是引入了4种策略,混同的、分离的、混合的等,这四种策略看似实在暴力,其实有他的道理。想一想,如果我们没头没脑地去解这样一个博弈,想来不是很容易,而且均衡的意义难以解释。其实也是一种思维的体现,我们在求解泛函问题或者复杂的函数问题的时候,往往会选择几种特定的函数先去试一试,后来发现这几种函数已经能够产生最优,当然需要证明。那么我们就解决问题了。

这个问题也是的,只不过需要问题中的这4种策略囊括了发送者的所有可能。
回复此楼

» 本帖附件资源列表

  • 欢迎监督和反馈:小木虫仅提供交流平台,不对该内容负责。
    本内容由用户自主发布,如果其内容涉及到知识产权问题,其责任在于用户本人,如对版权有异议,请联系邮箱:xiaomuchong@tal.com
  • 附件 1 : 信号博弈.ppt
  • 2013-08-04 18:36:36, 1.51 M
  • 附件 2 : SEQ.pdf
  • 2013-08-04 18:36:44, 98.47 K
  • 附件 3 : pbe.pdf
  • 2013-08-04 18:36:47, 136.08 K

» 收录本帖的淘帖专辑推荐

收藏与分享

» 猜你喜欢

» 本主题相关价值贴推荐,对您同样有帮助:

gametheory~
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

lcz_article

金虫 (小有名气)


小木虫: 金币+0.5, 给个红包,谢谢回帖
虽然不懂,但感觉总结的还不错哦
2楼2013-08-05 08:41:12
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

daiben06

金虫 (初入文坛)

引用回帖:
2楼: Originally posted by lcz_article at 2013-08-05 08:41:12
虽然不懂,但感觉总结的还不错哦

多谢~您是研究信号理论的吗,想请教您 拉普拉斯变换和Z变换之间的关系和他们对信号处理的意义。不知道能否解释一下~万分感谢~
gametheory~
3楼2013-08-05 17:09:00
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 daiben06 的主题更新
普通表情 高级回复(可上传附件)
信息提示
请填处理意见