Under the complex pattern of human behavior, the conditions for the spontaneous emergence of cooperation have become the focus of many disciplines. As an incentive measure, reward or punishment is one of the important ways to maintain human cooperation. However, reward or punishment is essentially a second-order social dilemma. There has been no good explanation about who implements the reward or punishment and how to reward or punish effectively till now. In this research, the reward or punishment is endogenous as a kind of strategy of participants. By means of stochastic evolutionary game analysis methods, the cooperation behavior in the social dilemma games with reward or punishment strategies and reputation evaluation is revealed in the stochastic evolutionary self-organization system. We focus on the reward or punishment strategies applicable conditions and effective ways. The details are as follows: 1) To study the mechanism of various reward or punishment strategies in unstructured populations to promote the emergence of cooperation, and the impact of the introduction of loner strategy or extortion strategy on the effectiveness of rewards or punishments; 2) To study the influence of network structure, individual learning mechanisms and noise, as well as the introduction of loner strategy or extortion strategy on the effectiveness of rewards or punishments in structured populations; 3) To study the influence of the reputation evaluation mechanism based on different social norms on the evolution of cooperation, to find the social norms that can promote the emergence of cooperation, and analyze the robustness of social norms when reputation information is partly observable or noisy. This project will explain the internalization mechanism of reward or punishment strategies to promote the emergence of cooperation in social dilemmas.
人类复杂行为模式下合作自发涌现的条件已成为多个学科关注的焦点。奖惩作为一种激励手段,是维持人类合作的重要方式之一。然而,奖惩本质上是一个二阶社会困境,由谁来实施奖惩以及如何有效奖惩目前并没有很好的解释。本课题将奖惩内化为参与人的一种策略,拟采用随机演化博弈方法,揭示自组织系统中具有奖惩策略及声誉评价的社会困境博弈在随机演化下的合作涌现规律,探讨奖惩策略适用的条件和有效方式。具体如下:1)研究无结构群体中各种奖惩策略对促进合作涌现的作用机理,以及分离策略和剥削策略的加入对有效奖惩方式的影响;2)研究有结构群体中网络结构、个体学习机制和噪音,以及分离策略和剥削策略的加入对有效奖惩方式的影响;3)研究基于不同社会规范的声誉评价对群体合作行为的影响,寻求能促进合作涌现的社会规范形式,分析声誉信息部分可观测或有噪音时社会规范的鲁棒性。本课题将解释社会困境中促进合作涌现的奖惩策略内部化产生机理。
本课题研究了具有奖惩策略及基于社会规范的声誉评价机制对群体合作行为的微观作用机理,试图从内部化激励的角度为现实中广泛存在的合作行为提供理论依据,并探索了在多策略共存以及在群体交互结构的影响下,各类奖惩适用的范围和条件。项目所做具体工作如下:1)设计了不同形式的惩罚和驱逐机制,包括基于声誉的概率惩罚、依赖于连续背叛次数的分级惩罚、可在传统惩罚和社会驱逐中进行选择的条件惩罚、一方起主导作用的惩罚和驱逐、依赖于背叛者数量的条件驱逐、具有动态成本的驱逐、同步和异步驱逐,等等,研究了不同奖惩方式对社会困境博弈中合作涌现的促进效果。2)在网络博弈中构造了多种声誉评价机制,建立了依赖于声誉的个体行为选择模型,探索了声誉机制对社会困境博弈中合作涌现的影响规律。3)建立了不完全信息和噪音环境下个人具有他人私人意见的间接互惠模型,分别设计了具有 “保留意见”的社会规范、具有保持和反转的标签规则、基于二阶和三阶行动信息的标签规则,研究了间接互惠下不同的标签规则和社会规范对群体合作行为演化的影响规律。4)从基于证据理论的策略学习规则角度探究了在不同的社会困境博弈情景中融合不同的策略学习机制或者信息对群体合作演化的影响。5)构造了具有异质性收益结构的空间公共物品博弈模型,在博弈中设计了基于组间声誉差异的动态规模报酬系数,考虑了社会困境博弈中的折扣和协同效应,探索了具有非线性收益结构的社会困境博弈中的合作行为演化规律。6)将具有同情偏好、公平偏好和公平性策略的个体引入结构化种群中,设置了个体不公平感知的差异性和收益再分配规则,探究了在不同社会困境博弈模型下群体中合作行为的演化特征。依托本项目在国内外重要期刊上发表学术论文34篇(第一作者27篇,第一通讯作者1篇),其中被SCI/SSCI收录30篇,基金委认定的A类中文期刊2篇,其它CSCD核心期刊2篇,出版学术专著1部。以此项目为背景,累计培养硕士生12名,博士生3名。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
黄河流域水资源利用时空演变特征及驱动要素
拥堵路网交通流均衡分配模型
青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化
水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应
基于帮助博弈模型的社会合作演化机制研究
可分离重复博弈:均衡分析与合作涌现
复杂网络上演化博弈合作形成机理与控制策略
IPD模式下参与方合作困境的过程演化及其治理机制研究