一、信息Agent的体系结构与行为设计(论文文献综述)
黎力超[1](2021)在《带扰动的非线性多智能体系统固定时间一致性研究》文中研究表明随着现代科技不断发展,关于群体行为的研究日益受到众多专家学者重视,多智能体系统协同控制是群体行为研究的热点之一。多智能体系统是由大量分布配置的自治或半自治的子系统通过网络连接构成的大规模复杂系统。智能体是物理或抽象的实体,状态量受内部结构、控制输入、外部扰动等多种因素的影响。在实际应用中,大多数智能体带有非线性环节,系统期望在固定时间内实现一致收敛,故本文研究了带扰动的非线性多智能体系统固定时间一致性问题,具体内容如下:首先,本文研究了一类带有不连续动力学和有界扰动的非线性多智能体系统固定时间一致性问题。当系统不存在领导者时,针对具有高度非线性的系统,设计了一种带有辅助信号的控制协议,把原问题转化为智能体成功追踪辅助信号同时由辅助信号达成一致,从而使得整个系统达到一致。设计的辅助信号不在通信信道中传输,可以有效地减小系统计算代价。针对领导跟随系统,设计相应控制协议,使得成功智能体在追踪辅助信号后再追踪系统中实际的领导者,实现固定时间领导跟随一致性。其次,研究了在固定拓扑和切换拓扑下,非线性随机多智能体系统的固定时间一致性问题。针对固定拓扑,设计了一种非线性控制协议,实现固定时间一致性。随后将结论推广至切换拓扑,设计相应控制协议,使得系统达到稳定的条件与切换拓扑子图的驻留时间无关,且切换拓扑子图的并集只需要满足连通条件,即可实现固定时间一致性,模型更具一般性。最后,利用非光滑分析、Lyapunov稳定性理论、代数图论等理论证明系统可在任意初始状态下可达固定时间一致,收敛时间不依赖于智能体的初始状态,同时导出系统全局稳定收敛时间上界。仿真实例进一步验证了理论结果的有效性。
胡大鹏[2](2021)在《基于强化学习的多智能体协作建模方法研究》文中研究表明本文是以《中国制造2025》背景,以达到实现智能制造的要求为目标,通过融合工业场景和互联网技术,在全球化充满不确定的局面下提高中国制造业的竞争力。当前工业中智能制造面临资源难共享、过程难协调、依赖领域专家等普遍问题,本文基于Agent,多Agent系统和强化学习等相关技术,构建了面向工业的多Agent混合式智能控制模型,并对多Agent系统中的Agent协作能力、作业调度策略等关键问题进行研究,以实现工业生产过程智能控制。本文基于多Agent技术,将工业过程的工艺关键点、关键设备抽象成若干Agent,构建了一个三层结构的混合式多Agent智能模型。该模型基于JADE框架从而实现底层基础功能,此外通过一些接口实现基于状态表示学习的多Agent协作方法的智能模块及基于强化学习的多Agent系统作业调度方法的智能模块,从而满足工业需求。本文针对工业中Agent接触的环境复杂,以及Agent对重要特征感知能力差的问题,基于M3DDPG算法,提出了SRL_M3DDPG算法,在保留M3DDPG算法的强鲁棒性特点的同时提高设备Agent对重要特征的获取,从而使设备Agent的动作达到预期效果。改进的算法利用状态表示学习来帮助捕捉特征,通过深度神经网络来构造观测值和状态值的映射,然后M3DDPG中的Actor和Critic网络从新的神经网络中学习,而不是从最初的观察中学习,从而使Agent动作达到预期并且能够适应高维数据。本文针对多Agent系统中的作业调度问题,提出了一种将TS算法和Q-learning相结合的TS_Qlearning算法,该方法通过禁忌搜索算法的禁忌表存储算法的早期训练经验,来指导算法的早期训练。并且,TS_Qlearning算法优化了Q-learning算法解决调度问题中的策略,在保留了Q-learning算法的探索优势的基础上,在训练早期指导算法的训练,从而提高算法训练的质量,从而更好的优化资源配置。
柴小丰[3](2021)在《多智能体系统事件触发编队控制研究》文中提出多智能体系统由多个具备一定感知、计算、执行与通讯功能的智能体组成,和单个个体执行任务相比,多个体协作可以提高任务执行能力与效率,降低单个体成本,增加系统冗余和抗风险能力,因此多智能体系统协同控制问题受到越来越多研究人员的关注。编队控制是多智能体协同控制的重要研究分支之一,目标是使多个智能体根据任务需要,在运动过程中保持或变换队形,其在军事领域和民用领域具有广泛的应用前景,如战斗机编队、卫星编队、无人机表演等。实际系统中,由于通讯带宽和计算资源有限,并且要求系统在指定时间内形成编队,因此研究提高多智能体系统编队控制策略的收敛速度,以及节省有限的计算和通讯资源,具有重要的实际意义。本文主要研究了多智能体系统事件触发编队控制问题,针对一些典型的系统模型与控制目标,设计了不同的分布式控制策略,包括事件触发控制、自触发控制、有限时间控制、固定时间控制与动态事件触发控制等。论文主要研究内容包括以下几个方面:1.针对多智能体系统的时变编队问题,分别设计了基于观测器的事件触发控制策略与自触发控制策略,通过将状态观测误差引入事件触发函数,可以提高状态观测器收敛速度与系统编队精度。两种控制策略均可实现时变编队控制,并且避免Zeno行为,同时自触发策略可以避免智能体之间的连续通讯。2.对于受扰多智能体系统,研究了具有领航者的编队跟踪控制问题,分别设计固定时间事件触发与自触发控制策略。固定时间控制可有效提高系统收敛速度,并且收敛时间与系统初始状态无关;事件触发控制可以降低控制器更新次数,自触发控制可以避免智能体之间的连续通讯。3.针对基于采样数据的多智能体系统,研究了一阶多智能体系统基于采样数据的编队跟踪控制问题,分别设计了有限时间事件触发与自触发策略,后者可以避免连续通讯。4.对于基于采样数据的非线性高阶多智能体系统,研究了基于采样数据的编队控制问题,设计了分布式动态事件触发机制,通过动态调整触发函数参数,可以有效减少系统触发次数。5.目前多智能体协同控制研究多以理论研究与仿真验证为主,本文利用多无人车实验平台,对多智能体编队控制策略进行实验验证,分别设计了基于采样数据的多无人车有限时间事件触发编队跟踪实验与固定时间事件触发编队跟踪实验。通过实验对比,验证了有限时间控制、固定时间控制与事件触发控制与自触发控制的有效性。
赵毓[4](2021)在《多智能体系统自主规避任务决策方法研究》文中提出随着航空航天事业的高速发展,越来越多的飞行器采用群体或多体协同的方式执行任务,呈现出典型的多智能体特征,适于使用多智能体理论对其进行分析和建模,对分布式自主决策技术的需求日益突出。飞行器自主规避是确保其安全性最直接有效的方法,但是当前对相关技术的研究多是基于静态全局规划算法,难以满足动态场景中多实体间实时协同需求。为了解决多实体协同规避问题,本文引用多智能体系统思想对其进行规避任务决策技术研究。多智能体系统有着自主、高效和可扩展的优点,本文将其与强化学习技术相结合,用以设计飞行器决策算法。本文以航天器反拦截、无人机避碰和空间机械臂轨迹规划等典型任务为研究背景,对多智能体自主规避任务决策问题进行研究,结合真实约束条件,实现智能体的实时决策。本文取得主要研究成果如下:在运动分析基础上给出智能体与环境交互的数学模型。针对多智能体系统规避决策问题,建立部分可观马尔科夫决策模型,考虑部分可观的约束条件,结合博弈理论研究了多智能体马尔科夫博弈问题,分析常规回报函数的设计方法,并给出了求解序列决策的三种典型方式。在多智能体强化学习方面,分析了航天器规避机动场景和空间机械臂捕捉场景的决策流程;将策略梯度方法向多智能体系统进行改进研究;提出一种基于策略协调和信度分配的Actor-Critic强化学习方法,用于解决全局可观条件下决策器的训练和策略提升问题,并给出相关收敛性分析;根据任务需求设计各关键环节的神经网络结构和算法流程。分别在航天器反拦截和空间机械臂避障规划等多种任务场景中进行了强化学习训练,通过对累积回报值和成功率的结果对比分析验证了所提方法的正确性和有效性。在强化学习算法应用方面,分析典型任务场景对决策效率的约束情况;针对问题场景设计了进行任务决策的神经网络结构,并对其不同部分设计压缩方法;在神经网络权值聚类和量化的基础上,提出一种自适应分层重构剪枝方法,该方法以重训练的方式对目标神经网络进行动态剪枝和压缩,用于提高决策器运行速度,并压缩其存储空间;对部分可观条件下的任务场景进行强化学习系统设计,详细给出了回报函数的设计方法。分别在有限空域大量无人机场景和多航天器反拦截场景对提出方法进行仿真验证,从决策运行速度、累计回报值和成功率等方面对算法性能进行分析和讨论,并验证了所提强化学习方法对实体数量可变环境的适应性。在任务环境稀疏奖励问题上,对任务场景约束和常规强化学习算法局限性进行分析,设计了案例评价机制;提出逆值法强化学习算法,解决了奖励延迟分配和无奖励引导系统学习效率低的问题;基于马尔科夫博弈理论设计了自学习系统,并结合启发式搜索思想分析了所提算法的收敛性;分析了有扰动状态输入情况,并设计了用于对比分析的有限状态机;分析了算法优势和改进方向。在仿真验证中与前文章节训练所得决策器进行了对比分析,验证了所提算法的正确性和相关性能优势。本文对多智能体决策技术进行探索,研究了信度分配、策略协调、执行提速和稀疏奖励等重要方向,提高了航空航天硬件设备在执行任务中的存活率,所得研究成果对航空航天安全保障技术的发展具有一定的参考价值。
邢霞[5](2021)在《农户农业节水行为驱动机制及引导政策研究 ——以黄河流域河套灌区为例》文中研究说明水资源供需矛盾是限制我国农业可持续发展和粮食安全的主要障碍,倡导农业节水是缓解农业用水矛盾的有效手段。农户作为农业用水主体,其用水行为直接影响着农业水资源的利用效率以及节水农业的发展。但作为有限理性个体,农户的传统农业实践根植于实现自身效用最大化而非环境伦理,在农业生产过程中难免会出现低效和不合理的用水情况。因此,充分重视微观层面的农业用水行为,探究节水行为影响机制,引导农户自觉主动参与农业节水,对于减少水资源消耗、提高用水效率以及促进水资源可持续利用具有重要现实意义。鉴于农业用水主体行为对实现农业节水的重要意义,本文聚焦于农户农业节水行为的内部和外部影响因素,以制度经济学、行为经济学、农业经济学、计量经济学等相关理论与方法为基础,以黄河流域河套灌区为研究区域,旨在挖掘农户内部心理因素和外部情境因素对农业节水行为的作用机制,为水资源管理以及制定相关的节水政策提供研究经验与理论参考依据,以期提升农户的节水积极性,改变粗放灌溉方式,进而有效缓解农业水资源供需矛盾,促进水资源可持续利用。本文主要内容和研究结论如下:(1)从理论角度对农户农业节水行为特征和农业节水行为影响因素展开分析,并以此为基础构建理论模型。首先,基于对农户环境行为内涵和外延的分析,界定农户农业节水行为的概念,并根据农业节水行为表现形式和行为发生动机将农业节水行为划分为习惯型、技术型、社交型和公民型四类。然后,借助计划行为理论、价值—信念—规范理论、负责任的环境行为理论和社会影响理论构建农户农业节水行为理论模型,即农户农业节水行为的实施取决于其农业节水意愿,而意愿的产生则取决于农户心理因素,同时农户行为还受到外界情境因素的引导。最后,基于外部性理论,探讨农户农业节水行为外部性,并在此基础上利用经济学分析探讨农户农业节水行为政策干预的必要性,为后续政策引导研究提供理论依据。(2)依托所构建的农户农业节水行为理论模型,通过阐述变量因素间的关系路径,提出相关研究假设,着重分析、探讨农户心理因素对农业节水行为的驱动效应。首先,采用结构方程模型验证心理因素对农业节水行为意愿、农业节水行为以及农业节水行为意愿对农业节水行为的直接效应。实证结果表明,农户心理因素能够显着地直接影响农户农业节水行为意愿和行为,农业节水行为意愿也是影响农业节水行为的关键因素。其次,利用Amos23软件Bootstrap法,验证农户农业节水行为意愿在心理因素和农业节水行为中的中介效应。研究表明,农业节水行为意愿在心理因素对农业节水行为的影响中存在中介效应作用,对于不同类型的农业节水行为,农业节水行为意愿的中介效应存在差异。最后,考虑到心理因素可能对农业节水行为存在非线性的系统性特征以及农业节水行为本身所具有的复杂性,采用RBF神经网络进一步探讨心理因素对农业节水行为的预测效应。分析表明,心理因素能够有效对农户是否参与农业节水进行预测判别,同时不同心理因素对不同类型农业节水行为的相对重要性排序存在差异。(3)基于负责任的环境行为理论,引入外部情境因素,重点分析和探讨外部情境因素对农户农业节水行为的影响机理。首先,农业节水行为意愿——行为差异分析表明,在农业节水过程中,存在意愿与行为的背离,即意愿不一定能有效地转换为可实现水资源保护目的的实际节水行动,这为研究情境因素的引导效应提供了现实依据。其次,采用分层回归分析,探讨外部情境因素对农业节水行为意愿作用于农业节水行为的调节效应。研究发现,外部情境因素对农业节水行为意愿作用于节水行为的路径有调节作用,但不同外部情境变量对节水行为意愿与行为之间关系的调节作用存在差异。进一步使用process插件程序中的Model14对心理因素、农业节水行为意愿、外部情境因素以及农业节水行为之间存在的有调节的中介效应进行检验,研究结论表明,政策因素在“心理因素-农业节水行为意愿-农业节水行为”的中介路径中存在调节作用。(4)在实证静态分析的基础上,基于复杂适应系统理论,构建基于多Agent的农户农业节水行为仿真模型,借助Netlogo平台仿真模拟不同政策情形对农户农业节水行为涌现的动态引导效果。结果表明,从长期来看,农户农业节水行为在社会规范交互和外部政策因素的引导下会趋于稳定,激励型政策、命令控制型政策和宣传教育型政策均能促进农业节水发生,但不同类型政策对不同类型节水行为的促进效果存在差异。激励型政策对技术型农业节水行为的促进效果最好;命令控制型政策对习惯型农业节水行为的促进效果更好;宣传教育型政策对社交型农业节水行为和公民型农业节水行为的促进效果更好。政策组合效应分析表明,在不同政策组合情形下,四种类型农业节水行为涌现效果存在差异,在政策两两组合的情形下,习惯型农业节水行为在命令控制型政策和宣传教育型政策的组合引导下实施效果更好;技术型农业节水行为在激励型政策和命令控制型政策的组合引导下实施效果更好;社交型农业节水行为和公民型农业节水行为在命令控制型政策和宣传教育型政策的组合引导下实施效果更好。本研究主要创新之处体现在:第一,基于农户农业节水行为动机和节水行为表现形式,从多视角开展对农户节水行为的研究,更为细致地刻画并衡量农户节水行为,从实践上扩展了农业节水行为研究内容,从理论上进一步完善和丰富了农户亲环境行为研究领域;第二,构建了以农户农业节水行为为导向,心理因素为影响变量,外部情境因素为调节变量的农户农业节水行为理论模型,并探析心理因素和外部情境因素对不同类型农业节水行为的影响机理;第三,在实证分析基础上,尝试运用多主体建模与仿真技术构建基于Agent的农户农业节水行为仿真模型,动态模拟政策因素对农户行为的长期动态引导效果,分析政策因素在长期以及不同组合下对农业节水行为产生的影响。
林萍萍[6](2021)在《基于情感分析的人机谈判研究》文中研究说明电子商务的发展使得在线交易日益频繁,在线交易规模也日益扩大。消费者与商家的交互越来越多,不可避免地要进行在线谈判。传统的在线谈判方式是低效的人工谈判,人工谈判已经不能满足广大消费者日益增长的潜在需求。随着人工智能技术的发展,智能主体技术已日益成熟,使得电子商务领域的自动谈判成为了可能。智能主体能够随时与人类进行高效的谈判,节约了大量人工成本。因此,人机谈判吸引越来越多的学者的兴趣。目前有很多关于自动谈判系统的研究,大多数是计算机与计算机的自动谈判系统,而关于人机谈判的研究相对较少。即使有少许关于人机谈判的研究,也往往忽略了人类谈判方的情感因素,不能根据人类谈判方的情感采用相应的谈判策略,从而导致谈判对话生硬,用户体验感较差。设计合理的自动谈判系统可以帮助买家和卖家在合理的时间范围内就价格、数量以及其他条款上达成协议。为此,本文以自动谈判理论、谈判心理学为基础,利用情感分析技术,设计新的谈判策略,并研发出了具备情感能力的人机谈判系统。本文主要有以下几个方面的贡献。第一、综述了情感分析、自动谈判、人机谈判以及对话系统。我们详细分析和比较了情感分析技术以及其广泛应用,对比了情感分析技术在不同领域的应用,并说明可以继续研究的方向。第二、创新性地将情感分析引入到人机谈判中,提出了相应情感分析方法。第三、设计基于情感的人机谈判策略。第四、利用自然语言处理技术、情感分析技术、对话系统技术开发出了人机谈判系统。第五、进行大量实验证实我们融入情感分析的人机谈判系统能够提高谈判双方的联合效用,并且提升人类谈判方的体验感。因此,我们的人机谈判系统是有效的,能很好地满足当下电子商务的需求。
范怡帆[7](2021)在《基于强化学习的人机谈判系统》文中研究说明随着人工智能的兴旺,电子商务行业迎来了新的发展机遇。随着在线交易的频率和规模的增加,商家与客户之间的在线协商和沟通变得越来越频繁。因为它们无法实现谈判,也无法分析用户,因此难以针对特定用户更好地达成交易。在线交易谈判流程的自动化已逐渐成为商家和消费者的潜在需求。但是,现有的在线对话系统(例如淘宝上的阿里小蜜和京东的在线客户服务)无法很好地满足这样的需求。目前,一方面,自动谈判的研究者主要集中在计算机对计算机的谈判上,而对人机谈判的研究不多。另一方面,对话系统的研究人员很少关注自动谈判。因此,在本文中,我们将对话系统的体系结构与自动谈判集成在一起,研发了一个人机谈判系统。它可以代替人工客服来处理许多重复性和多样化的谈判。它可以随时随地与多方进行谈判,从而显着提高谈判效率,并减少企业使用人工客服的成本。具体来说,我们基于微信小程序平台,研发了一个基于强化学习的人机谈判系统。我们的系统能够应对不同的用户或同一用户的不同出价方式,并采用动态谈判策略,提高谈判的效率。本文的主要贡献如下:我们综述了对话系统和自动谈判系统领域中的最新技术,比较了它们的优点和缺点,并建议了进一步研究的方向;我们将强化学习与用户行为建模相结合,设计了一种新颖的谈判策略,这个策略让我们的谈判系统在谈判中可以根据用户的行为来调整谈判策略;我们编写了对话语料和谈判语料库,采用fast Text算法训练识别人类意图的分类器,并且我们用基于特征词抽取的匹配算法来提取谈判对话中与价格相关的结构化信息;我们在微信小程序平台上实现人机谈判系统,该系统包括了分别从用户界面,对话理解,对话谈判管理和对话回应生成四个模块,并使用中文的自然语言与用户进行多轮谈判;我们进行了大量实验来分析我们的系统,通过分析意图识别模型的性能评估对话理解模块的性能,从系统谈判效率、对话成功率和公平性三个方面分析谈判策略的有效性,采用问卷调查的方式分析用户对系统的满意度。实验结果表明,我们研发的系统可以很准确地识别人类对手的意图,与人类对手进行谈判的效率、成功率以及公平性,大部分人类对手对我们的系统表示满意。本文设计和实现的人机谈判对话系统为研究对话系统和自动谈判的学者们提供了一个新的研究方向。
潘昭天[8](2021)在《基于博弈论和多智能体强化学习的城市道路网络交通控制方法研究》文中提出信号交叉口交通流的受控过程对城市道路网络性能具有重要影响。然而,现有城市道路网络交通控制方案优化设计仍处于优化-性能改善-需求增加-性能恶化-再优化的循环困境。当经济、技术、城市建设程度迅速发展引发交通需求变化加速、交通流动态性增强,优化困境面临周期缩短的问题。交通控制方案频繁迭代优化将造成城市交通建设成本增加。抑制相应随机性诱发交通拥堵能力不足是现有交通控制方法面临的主要问题。因此,有必要针对城市道路网络交通流动态、随机性展开城市道路网络控制方法研究。此外,网络节点失效扩增交通拥堵蔓延引发路网性能下降也需要考虑。围绕城市道路网络交通控制方法研究:(1)在城市道路网络分布式的交通控制方法与交通分配、信号控制耦合方法之间,对交通信号控制领域理论体系中作进一步补充完善;(2)使交通信号控制系统具备自适应改进能力,能够随路网拓扑关系及交通需求共同演化,避免迭代优化的循环困境。论文从随机出行需求下的分布式动态交通分配、应对随机出行需求影响的分布式交通信号控制、应对网络节点失效的信号控制系统鲁棒性增强三个方面展开研究。(1)分布式动态交通分配方法,对随机出行需求分配,从根源抑制路网交通拥堵产生,为后续研究的关键基础。构建异构建议者多智能体团体,耦合异构建议者建议约束决策者动作空间,使其在有限动作空间内采用混合策略形式分配出行需求,提升多智能体强化学习在动态交通分配任务方面的运行效率;构建差异化回报函数机制,使智能体在学习中实现用户均衡原则;设计自适应学习率机制,提升方法对随机出行需求以及交通状态变化的敏感性,增强其再学习能力。经验证分析,分布式动态分配方法有效改善城市道路网络中个体出行者平均出行时间、提升网络整体吞吐量水平,且出行需求分配结果满足用户均衡原则。此外,研究也表明,与分布式交通信号控制方法相耦合,能够有效降低路网内出行延误水平。(2)分布式交通信号控制方法,从应对出行需求随机性影响出发维持城市道路网络性能稳定、进而缓解抑制交通拥堵发生、蔓延,是研究中的重要核心。引入博弈中混合策略纳什均衡概念,改进多智能体强化学习决策过程,使智能体隐式获取全局信息,增强其在不同随机出行需求状态下维持路网性能稳定的能力;在混合策略纳什均衡解基础上,引入Jensen-Shannon散度构建自适应学习率机制,增强信号控制智能体对局部交通流状态变化的敏感性,使其具备收敛后再学习能力。经验证分析,分布式交通信号控制方法在应对出行需求骤增、起讫点间出行需求分布骤变以及路网中出行需求分布不均衡、到达率随机引发随机性影响方面具有良好控制效果,将城市道路网络出行延误维持在较低水平。然而,验证也表明其仅适用于城市道路网络流量输入适中的情况下,是一种对城市道路网络时空资源深度挖掘的方法。(3)应对网络节点失效的信号控制鲁棒性增强方法,侧重于在路网结构受损时,强化信号控制方法维持路网性能的能力,是对重要核心的补充。立足于多智能体系统,构建对城市道路网络节点等级度量方法,实现对路网关键节点判别;引入路网节点交通状态,构建节点各向异性影响力传播机制,实现节点交互关系动态演化;根据节点交互结构差异,修正相应信号控制智能体混合策略纳什均衡求解决策过程及回报函数机制。经验证分析,在少量节点失效情况下,论文方法能够较好的将城市道路网络出行延误维持在较低水平,且在节点失效时间增加时有效抑制路网性能下降速度。然而,当路网拓扑结构严重受损、承载能力无法满足出行需求时,该鲁棒性增强机制难以提升信号控制方法性能。综上所述,论文构建动态交通分配方法出行需求分配从根源抑制交通拥堵的形成,该方法可独立执行交通分配任务,与分布式控制耦合使用可以有效抑制拥堵,还是信号控制鲁棒性增强机制的关键接口。针对随机出行需求影响构建的分布式交通信号控制方法,能够在局部交互过程中隐式地感知全局信息,有效缓解、抑制随机出行需求诱发的交通拥堵。而信号控制鲁棒性增强机制,构建节点间交互关系,实现信号控制方法网络节点失效鲁棒性提升。将分布式动态交通分配、分布式交通信号控制、信号控制鲁棒性增强机制相融合,使交通控制系统能够有效应对频繁的优化困境且具跟随城市道路网络共演化的能力。
颜廷若[9](2021)在《具有切换拓扑的多智能体系统协同控制问题研究》文中提出众所周知,鱼群、蚁群、鸟群以及菌落等生物群体可以展现出群体运动行为,这种群体行为并没有全局信息的引导,仅依靠个体之间信息的交流便可以完成复杂的运动。为了研究和模拟这种运动,学者们提出了多智能体系统协同控制问题模型,考虑在有限的局部信息和简单的控制规则下智能体的协同运动。作为一种分布式控制,多智能体之间的协同运动方式在诸如无人机飞行和智能机器人编队等实际问题的应用中受到了广泛的关注,并且取得了丰硕的研究成果。为了将其更好的应用到实际工程中,本论文基于目前已有的研究成果,考虑具有切换拓扑的多智能体系统协同控制问题,研究在更一般的条件下控制算法的设计。具体研究内容如下:1.研究了系统拓扑动态变化时的多智能体蜂拥控制问题。考虑了网络结构不连通的情形,智能体在运动过程中会“逃逸”出若干个孤立个体或者子网络,通过建立这些个体与其最近的具有虚拟领导者信息的智能体的牵制控制,并考虑了实际问题中的速度非线性性质,提出了一种新的切换控制律。通过构造多Lyapunov函数来对系统能量的变化进行分析,利用La Salle不变原理证明了系统的稳定性。理论结果表明虽然能量函数并不随着时间单调递减,但是能量函数一直有界并且渐近地收敛到最小能量。所有智能体的速度都渐进趋于虚拟领导者的速度,且在运动过程中并不会发生碰撞。提出的控制方法仅需要较少的信息智能体就可以获得稳定的蜂拥运动,研究方法在保密通信问题上具有潜在的应用。2.考虑具有非线性动态的多智能体系统,研究了在固定时间内收敛的蜂拥控制问题。仅假设智能体的模型动态是有界的情形下,基于图论和微分方程的性质,提出了高维空间下的固定时间蜂拥控制算法,给出了收敛时间上界的估计。数值模拟结果表明控制系统可以在有限的时间内达到蜂拥,验证了理论分析结果。结果表明提出的算法可以用于处理更为复杂的系统动态模型,为具体问题的应用提供了一种行之有效的方法。3.研究了动态拓扑下带有未知动态的多智能体系统固定时间一致性问题。当网络拓扑不连通时,通过建立孤立个体(或者孤立子网络)与其最近的具有虚拟领导者信息的智能体的牵制控制来设计控制算法。为了保证系统可以在固定时间内达到全局一致,基于图论和微分方程的基本理论,提出了高维空间下的控制算法。通过构造多Lyapunov函数,对控制行为进行稳定性分析,并给出了收敛时间上界的估计。理论结果表明虽然系统的能量函数不是随时间单调递减,但可以在运动过程中始终保持有界,并在固定的时间内达到全局收敛。数值模拟给出了智能体运动的情况,结果表明提出的算法为不连通网络的固定时间控制问题提供了一个有效的方法。4.研究了虚拟领导者信息是异质时,带有未知动态的多智能体系统蜂拥控制问题。考虑到虚拟领导者信息的不确定性,对其速度信息测量提出了一个更弱的约束条件。同时仅考虑智能体系统的未知非线性动态满足有界性条件下的情况,提出了一个新的蜂拥控制算法。为了避免智能体的分裂行为,基于惩罚思想构造了一种新的人工势函数来保证系统的连通性。理论结果表明所有智能体的速度都可以收敛到虚拟领导者的速度,并且在运动过程中不会发生碰撞。最后,通过数值模拟证明了提出算法的有效性。在复杂的运动情况下,论文提出的控制方法具有更好的适用性,在实际工程方面具有良好的应用价值。
于欣佳[10](2020)在《基于Stigmergy和神经内分泌调节机制的多智能体群智能自组织与调控方法研究》文中研究说明随着物联网与泛在感知、人工智能与学习进化、互联网与数字通信、大数据与新计算技术等新信息潮流的迅猛发展,席卷人类社会经济及生产生活的方方面面,以巨大的动能驱动着新一代智能交通、新经济新零售时代下的精准敏捷供应链与智慧物流,以及面向产品全生命周期的网络化与智能化制造等的兴起与飞速发展,使得基于契约化社会分工的一体化生产、运行控制、经营管理体系的规模与日俱增,也面临越来越多的动态多变、不确定性大、高非线性高阶高维高耦合性、异构异形异性等诸多问题,对分工协作、一体化运行、协同工作等的需求亦因此越来越复杂。针对这些复杂性问题的解决,非智能的传统方法已越来越无法有效地因应和难以跨越与克服上述困境。鉴于多智能体系统(Multi-Agent System,MAS)方法及社会性生物群体与人体生理系统在个体智能与群体自组织机制与协调协同方法对于很好地解决这些复杂性具有很大优势,本文围绕“基于共识主动性(Stigmergy)和神经内分泌调节机制的多智能体群智能自组织与调控方法”进行探讨、研究和试验,以为复杂环境下多协作任务基于多智能体群体智能自组织协同求解提供一种新思路、新方法。为此,本文通过对分布式人工智能、小世界网络理论、基于Stigmergy的仿生群智能、神经内分泌调节机制的探究分析,揭示师法人类机体、效法自然的自组织与运行调节机制对构建智能系统、提呈和涌现多智能体群体智能以实现复杂问题协同求解的重要性和作用机理,提出面向多任务协作求解的多智能体自组织调控问题模型及解决思路和方案;进一步地,提出并构建一种具有人脑认知与行为控制机制与结构和基于Stigmergy合作共识主动性与信息素/激素产生传播扩散机理实现对外交互合作的智能Agent模型及基于MAS的智能系统建模方法(The Stigmergy-driven&MAS-based Method of Modelling Intelligent System,SMMMIS),以为在不同层次上构建智能系统提供体系框架和应用范式;为使能处于无序和/或远离平衡态的,具有不同智能能力的多智能个体因应不同复杂环境变化、自发自主动态形成有序、平衡的动态合作联盟—基于SMMMIS的分布式智能系统,通过对自组织的内涵理解、小世界理论机会发现与信息传播机理的揭示,提出了一种基于友元接力算法的多智能体群智能自组织机制;而且,通过对分布式/分散化智能系统传统自组织调控方法、社会性生物系统与智能系统的比较分析、共识主动性的再认知再理解,借鉴人体神经内分泌免疫系统及相互间的关联交互与共同作用、自我调节机制等用于多智能体协作协同解决复杂问题的优势,提出一种基于友元合作共识主动性和人体神经内分泌调节机制的多智能体群智能自组织机制和调控方法,包括友元共识主动性驱动的智能系统自主形成自组织机制下基于DNA双螺旋结构的信息素/激素模型及其传播扩散交互机制与亲和度计算方法、基于自分泌与激素作用机理的多智能体一致性协控制算法等,为探讨多智能体群体智能的形成涌现和发挥作用奠定了坚实基础;针对上述研究内容,在设计面向新一代零售的智慧仓储-无人超市系统一体化运控模型与,及构建多智能AGV协作取货搬运运行控制问题模型的基础上,开展智慧仓储/无人超市环境下支持多智能体协同工作的自组织方法模拟试验系统的设计、搭建与试验研究及结果分析。相关仿真和模拟试验结果表明:从原理上验证了面向复杂环境下多协作任务协同求解所提出的解决方案、智能系统建模方法,基于友元接力搜索算法和友元合作共识主动性的自组织机制及其驱动下的基于神经内分泌调节的群智能自组织调控方法与多智能体一致性调控算法等的合理性、可行性和可用性,可为因应如新一代基于车路协同的智能交通、新一代零售下的电商及敏捷供应链、智慧物流与仓储、配送快递、无人超市,乃至智能制造等复杂应用环境下多协作任务的协同工作和有效实现,提供一种新模型、新方法和应用策略与范式,具有较大的理论指导和实际参考应用价值。
二、信息Agent的体系结构与行为设计(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、信息Agent的体系结构与行为设计(论文提纲范文)
(1)带扰动的非线性多智能体系统固定时间一致性研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景和意义 |
1.2 多智能体系统研究现状 |
1.3 固定时间一致性研究现状 |
1.4 本论文主要内容及结构编排 |
第二章 预备知识 |
2.1 数学知识 |
2.1.1 代数图论 |
2.1.2 矩阵理论 |
2.1.3 稳定性理论分析 |
2.2 一致性相关定义 |
2.3 常用一致性控制协议 |
2.2.1 一阶多智能体系统一致性控制协议 |
2.2.2 二阶多智能体系统一致性控制协议 |
2.2.3 二阶多智能体系统领导-跟随一致性控制协议 |
2.4 非光滑分析理论 |
2.5 基本不等式 |
2.6 本章小结 |
第三章 带有不连续动力学的非线性多智能体系统固定时间一致性 |
3.1 引言 |
3.2 非线性多智能体系统固定时间一般一致性 |
3.2.1 问题描述 |
3.2.2 固定时间一致性控制协议设计 |
3.2.3 系统稳定性分析与证明 |
3.3 非线性多智能体系统固定时间领导-跟随一致性 |
3.3.1 问题描述 |
3.3.2 固定时间领导-跟随一致性控制协议设计 |
3.3.3 领导-跟随系统稳定性分析与证明 |
3.4 仿真分析 |
3.5 本章小结 |
第四章 非线性随机多智能体系统的固定时间一致性 |
4.1 引言 |
4.2 问题描述 |
4.3 固定拓扑下随机多智能体系统的固定时间一致性 |
4.3.1 固定拓扑下固定时间一致性控制协议设计 |
4.3.2 系统稳定性分析与证明 |
4.4 切换拓扑下随机多智能体系统的固定时间一致性 |
4.4.1 切换拓扑下固定时间一致性控制协议设计 |
4.4.2 系统稳定性分析与证明 |
4.5 仿真分析 |
4.6 本章小结 |
第五章 总结与展望 |
5.1 研究总结 |
5.2 研究展望 |
参考文献 |
个人简历 在读期间发表的学术论文 |
致谢 |
(2)基于强化学习的多智能体协作建模方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景及意义 |
1.1.1 研究背景 |
1.1.2 研究目的及意义 |
1.2 国内外研究现状 |
1.2.1 多Agent系统的研究现状 |
1.2.2 强化学习的研究现状 |
1.2.3 多Agent强化学习的研究现状 |
1.3 本文研究内容 |
1.4 本文的技术路线 |
1.5 本文的创新点 |
1.6 全文的组织框架 |
第2章 相关理论介绍 |
2.1 智能制造 |
2.1.1 智能制造的背景 |
2.1.2 智能制造系统对控制模型的要求 |
2.2 Agent相关技术 |
2.2.1 Agent相关概念及特性 |
2.2.2 Agent体系及结构 |
2.2.3 多Agent系统概念 |
2.2.4 多Agent系统体系结构 |
2.3 强化学习与多Agent强化学习方法 |
2.3.1 强化学习 |
2.3.2 多Agent强化学习 |
2.4 本章小结 |
第3章 面向工业的多Agent混合式智能模型 |
3.1 多Agent建模的含义和优势 |
3.2 Agent之间的通信 |
3.2.1 ACL相关介绍 |
3.2.2 利用JADE平台实现ACL |
3.3 面向工业的多Agent混合式智能模型 |
3.3.1 多Agent混合式智能模型的构建 |
3.3.2 多Agent混合式智能模型中各模块功能及主要Agent的结构 |
3.3.3 在JADE平台上构建多Agent混合式智能模型 |
3.4 本章小结 |
第4章 基于状态表示学习的多Agent协作算法 |
4.1 研究背景 |
4.2 MADDPG算法概述 |
4.3 M3DDPG算法概述 |
4.4 SRL_M3DDPG算法概述 |
4.4.1 状态表示学习 |
4.4.2 SRL_M3DDPG算法 |
4.5 仿真实验 |
4.6 本章小结 |
第5章 基于TS_Qlearning的多Agent作业调度 |
5.1 研究背景 |
5.2 作业调度问题描述 |
5.3 强化学习求解作业调度问题 |
5.3.1 调度问题中的强化学习 |
5.3.2 Q-learning算法 |
5.3.3 TS_Qlearning算法 |
5.4 仿真实验 |
5.5 本章小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
在校期间主要研究成果 |
一、发表学术论文 |
二、其他科研成果 |
(3)多智能体系统事件触发编队控制研究(论文提纲范文)
致谢 |
摘要 |
Abstract |
符号清单 |
1 绪论 |
1.1 课题来源 |
1.2 研究背景及意义 |
1.3 国内外研究现状 |
1.3.1 多智能体系统编队控制研究进展 |
1.3.2 多智能体系统事件触发控制研究进展 |
1.4 存在的关键问题 |
1.5 论文的主要内容及结构安排 |
2 理论基础 |
2.1 图论及相关引理 |
2.2 编队相关定义 |
2.3 系统稳定性理论 |
2.4 其它相关引理 |
3 基于状态观测器的多智能体系统事件触发时变编队控制 |
3.1 引言 |
3.2 问题描述 |
3.3 分布式事件触发编队控制策略 |
3.4 分布式自触发编队控制策略 |
3.5 仿真验证 |
3.6 本章小结 |
4 受扰多智能体系统固定时间事件触发编队控制 |
4.1 引言 |
4.2 问题描述 |
4.3 固定时间事件触发实际编队跟踪控制算法设计 |
4.4 固定时间自触发实际编队跟踪控制算法设计 |
4.5 仿真验证 |
4.6 本章小结 |
5 基于采样数据的多智能体系统有限时间事件触发编队控制 |
5.1 引言 |
5.2 问题描述 |
5.3 基于采样数据的有限时间事件触发编队跟踪策略 |
5.4 基于采样数据的有限时间自触发编队跟踪策略 |
5.5 仿真验证 |
5.6 本章小结 |
6 基于采样数据的多智能体系统动态事件触发编队控制 |
6.1 引言 |
6.2 问题描述 |
6.3 基于采样数据的动态事件触发编队控制策略 |
6.4 仿真验证 |
6.5 本章小结 |
7 基于采样数据的多无人车编队跟踪实验 |
7.1 引言 |
7.2 多无人车实验验证平台 |
7.3 无人车运动学模型 |
7.4 基于采样数据的多无人车有限时间事件触发编队跟踪实验 |
7.5 基于采样数据的多无人车固定时间事件触发编队跟踪实验 |
7.6 本章小结 |
8 结论 |
8.1 本文总结 |
8.2 未来展望 |
参考文献 |
作者简历及在学研究成果 |
学位论文数据集 |
(4)多智能体系统自主规避任务决策方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 课题背景与研究意义 |
1.2 典型多智能体系统技术发展 |
1.2.1 无人机集群避碰技术研究现状 |
1.2.2 多自由度空间机械臂避障技术研究现状 |
1.2.3 航天器规避机动算法发展现状 |
1.3 基于自学习理论的决策方法国内外研究现状 |
1.3.1 多智能体深度强化学习方法研究现状 |
1.3.2 深度神经网络压缩及加速方法研究现状 |
1.3.3 稀疏奖励强化学习方法研究现状 |
1.4 主要研究内容及论文结构 |
1.4.1 存在问题及技术难点 |
1.4.2 研究内容及章节安排 |
第2章 多智能体系统决策模型 |
2.1 引言 |
2.2 动力学相关描述 |
2.2.1 多智能体系统运动模型 |
2.2.2 空间拦截器制导律 |
2.3 多智能体部分可观决策模型 |
2.3.1 马尔科夫决策过程理论基础 |
2.3.2 分布式部分可观马尔科夫博弈 |
2.3.3 常规回报函数设计思路 |
2.4 序列决策问题求解方法 |
2.4.1 模糊系统 |
2.4.2 有限状态机 |
2.4.3 蒙特卡洛树搜索 |
2.5 本章小结 |
第3章 基于ACTOR-CRITIC架构的自主决策算法 |
3.1 引言 |
3.2 问题场景描述 |
3.2.1 航天器规避机动问题场景描述 |
3.2.2 空间机械臂轨迹规划场景描述 |
3.2.3 多智能体系统决策流程分析 |
3.3 多智能体策略梯度强化学习方法 |
3.3.1 算法基础理论框架 |
3.3.2 策略梯度算法收敛性分析 |
3.3.3 策略梯度方法在多智能体系统中应用 |
3.4 基于信度分配的多智能体强化学习框架 |
3.4.1 航天器规避决策方法 |
3.4.2 案例优选的空间机械臂决策方法 |
3.4.3 基于信度分配的算法收敛性分析和改进 |
3.4.4 网络结构设计及算法流程 |
3.5 仿真及结果分析 |
3.5.1 基于最优控制理论的对比算法 |
3.5.2 航天器规避机动仿真 |
3.5.3 空间机械臂轨迹规划仿真 |
3.5.4 强化学习算法仿真结果简析 |
3.6 本章小结 |
第4章 多智能体分布式协同避碰决策方法研究 |
4.1 引言 |
4.2 有限空域无人机集群避碰问题分析 |
4.2.1 求解策略的训练方法 |
4.2.2 在线协调和沟通机制 |
4.3 多智能体强化学习系统设计 |
4.3.1 状态空间和动作空间选取 |
4.3.2 系统体系结构和流程分析 |
4.3.3 回报函数设计 |
4.4 仿真及结果分析 |
4.4.1 仿真条件设定 |
4.4.2 训练曲线及场景案例仿真 |
4.4.3 结果分析 |
4.5 本章小结 |
第5章 基于优化神经网络的分布式规避决策方法 |
5.1 引言 |
5.2 多航天器对多拦截器协同规避问题研究 |
5.2.1 状态空间和动作空间选取 |
5.2.2 系统体系结构和流程分析 |
5.2.3 回报函数设计 |
5.3 基于自适应重构方法的深度神经网络优化方法 |
5.3.1 神经网络结构设计 |
5.3.2 权值聚类及量化 |
5.3.3 自适应分层重构剪枝 |
5.4 仿真及结果分析 |
5.4.1 基于微分对策理论的对比算法 |
5.4.2 神经网络优化算法试验及数值仿真 |
5.4.3 强化学习训练及场景案例仿真 |
5.4.4 结果分析 |
5.5 本章小结 |
第6章 基于逆值法的多航天器自学习规避算法 |
6.1 引言 |
6.2 稀疏奖励强化学习算法分析 |
6.2.1 规避任务分析 |
6.2.2 常规强化学习方法局限 |
6.2.3 逆值法强化学习算法 |
6.2.4 算法核心逻辑流程 |
6.3 多智能体稀疏奖励自学习系统设计 |
6.3.1 自学习系统结构设计 |
6.3.2 信念状态估计方法 |
6.3.3 逆值法在案例中的收敛性简析 |
6.3.4 网络结构和算法流程 |
6.4 仿真及结果分析 |
6.4.1 基于有限状态机的对比算法 |
6.4.2 仿真条件设定 |
6.4.3 结果对比分析 |
6.4.4 算法优势及改进分析 |
6.5 本章小结 |
结论 |
参考文献 |
攻读博士学位期间发表的论文及其它成果 |
致谢 |
个人简历 |
(5)农户农业节水行为驱动机制及引导政策研究 ——以黄河流域河套灌区为例(论文提纲范文)
摘要 |
abstract |
1 绪论 |
1.1 研究背景 |
1.1.1 水资源供需矛盾突显农业节水必要性 |
1.1.2 粮食安全隐现催生农业节水迫切性 |
1.1.3 生态文明建设反映推进农业节水必然性 |
1.1.4 农业用水行为对农业节水的重要性 |
1.2 问题提出 |
1.3 文献综述 |
1.3.1 农业节水行为模式研究 |
1.3.2 农业节水行为影响因素研究 |
1.3.3 农业节水行为引导策略研究 |
1.3.4 研究评述 |
1.4 研究意义 |
1.4.1 理论意义 |
1.4.2 现实意义 |
1.5 研究目标与研究内容 |
1.5.1 研究目标 |
1.5.2 研究内容 |
1.6 研究方法 |
1.7 技术路线 |
1.8 研究的创新之处 |
2 理论基础 |
2.1 相关概念界定 |
2.1.1 农户 |
2.1.2 农户农业节水行为 |
2.2 相关基础理论 |
2.2.1 基于农户行为理论的农业节水行为分析 |
2.2.2 基于计划行为理论的农业节水行为分析 |
2.2.3 基于价值-信念-规范理论的农业节水行为分析 |
2.2.4 基于负责任的环境行为理论的农业节水行为分析 |
2.2.5 基于社会影响理论的农业节水行为分析 |
2.2.6 基于外部性理论的农户农业节水行为分析 |
2.3 农户农业节水行为理论模型构建 |
2.4 本章小结 |
3 研究设计 |
3.1 研究区域介绍 |
3.1.1 区域选择依据 |
3.1.2 研究区域自然资源禀赋 |
3.1.3 研究区域经济社会发展状况 |
3.1.4 研究区域水利建设和水资源利用情况 |
3.1.5 研究区域农业节水政策的发展与实践 |
3.2 问卷设计 |
3.2.1 调研方法选择和调研过程 |
3.2.2 调研内容设计 |
3.3 研究变量的设计与测度 |
3.3.1 农户农业节水行为测度 |
3.3.2 农户农业节水行为意愿测度 |
3.3.3 农户心理因素测度 |
3.3.4 外部情境因素测度 |
3.3.5 社会人口学变量测度 |
3.4 农户农业节水行为统计分析 |
3.4.1 农业节水行为现状 |
3.4.2 受访户个人禀赋特征 |
3.4.3 受访户家庭禀赋特征 |
3.4.4 考察量表交叉分析 |
3.5 本章小结 |
4 农户心理因素对农业节水行为驱动效应的实证研究 |
4.1 理论分析与研究假设提出 |
4.2 研究方法 |
4.3 量表检验 |
4.3.1 正态性检验 |
4.3.2 信度检验 |
4.3.3 效度检验 |
4.3.4 变量的相关性检验 |
4.4 实证结果分析 |
4.4.1 农户心理因素作用于农业节水行为的效应分析 |
4.4.2 农户心理因素作用于农业节水行为意愿的效应分析 |
4.4.3 农户农业节水行为意愿作用于农业节水行为的效应分析 |
4.4.4 农户农业节水行为意愿的中介效应分析 |
4.5 本章小结 |
5 农户心理因素对农业节水行为驱动效应的模拟研究 |
5.1 研究方法 |
5.1.1 RBF神经网络模型 |
5.1.2 RBF神经网络结构 |
5.2 农户农业节水行为神经网络模型构建 |
5.2.1 农户节水行为识别 |
5.2.2 模型适用性分析 |
5.2.3 模型构建 |
5.3 模拟结果分析 |
5.3.1 习惯型农业节水行为模拟结果 |
5.3.2 技术型农业节水行为模拟结果 |
5.3.3 社交型农业节水行为模拟结果 |
5.3.4 公民型农业节水行为模拟结果 |
5.4 本章小结 |
6 外部情境因素对农户农业节水行为引导效应的实证研究 |
6.1 理论分析与研究假设提出 |
6.1.1 外部情境因素的调节效应假设 |
6.1.2 外部情境因素的调节中介效应假设 |
6.2 研究方法 |
6.3 量表检验 |
6.3.1 正态性检验 |
6.3.2 信度检验 |
6.3.3 效度检验 |
6.3.4 变量的相关性检验 |
6.4 实证结果分析 |
6.4.1 农业节水行为意愿——行为差异 |
6.4.2 外部情境因素的调节效应分析 |
6.4.3 外部情境因素的调节中介效应分析 |
6.5 本章小结 |
7 外部情境因素对农户节水行为引导效应的仿真研究 |
7.1 研究方法 |
7.1.1 基于Agent的建模与仿真方法介绍 |
7.1.2 基于Agent的建模与仿真流程 |
7.2 农户农业节水行为仿真模型设计 |
7.2.1 农户农业节水行为仿真概念模型构建 |
7.2.2 仿真模型系统设置 |
7.2.3 基于BP人工神经网络的农户农业节水行为模拟 |
7.3 仿真结果分析 |
7.3.1 无政策引导情形与政策最优情形对比分析 |
7.3.2 单个政策情境因素引导效应分析 |
7.3.3 政策情景因素组合效应分析 |
7.4 本章小结 |
8 引导农户农业节水行为的政策建议 |
8.1 农户农业节水行为引导体系构建 |
8.2 基于人口学特征的行为促进策略 |
8.3 基于心理因素的行为驱动策略 |
8.4 基于外部情境因素的行为引导策略 |
8.4.1 社会规范引导策略 |
8.4.2 政策因素引导策略 |
8.5 农户农业节水行为强化策略 |
9 研究结论和展望 |
9.1 研究结论 |
9.2 研究局限和展望 |
致谢 |
参考文献 |
附录:农户农业节水行为调查问卷 |
作者简介 |
(6)基于情感分析的人机谈判研究(论文提纲范文)
摘要 |
Abstract |
第1章 引言 |
1.1 研究背景 |
1.2 动机 |
1.2.1 情感因素对于人类谈判的影响 |
1.2.2 情感因素对于人机谈判的影响 |
1.2.3 研发基于情感的人机谈判系统的意义 |
1.3 研究思路和技术路线 |
1.4 本文的主要贡献 |
1.5 本文的组织结构 |
第2章 文献综述 |
2.1 引言 |
2.2 基于机器学习的情感分析 |
2.2.1 基于线性分类器的方法 |
2.2.2 基于概率分类器的方法 |
2.2.3 其它基于机器学习的方法 |
2.2.4 讨论 |
2.2.5 小结 |
2.3 基于深度学习的情感分析 |
2.3.1 基于卷积神经网络的方法 |
2.3.2 基于循环神经网络的方法 |
2.3.3 混合的方法 |
2.3.4 其它基于深度学习的方法 |
2.3.5 多模态的情感分析 |
2.3.6 小结 |
2.4 情感分析技术的应用 |
2.4.1 商业应用 |
2.4.2 中国的智能客服系统 |
2.4.3 非商业应用 |
2.4.4 关系和事件预测 |
2.4.5 对话系统 |
2.4.6 讨论与挑战 |
2.4.7 小结 |
2.5 自动谈判 |
2.5.1 机器对机器的自动谈判 |
2.5.2 人机自动谈判 |
2.6 对话系统 |
2.6.1 对话理解 |
2.6.2 对话管理 |
2.6.3 对话生成 |
2.7 本章小结 |
第3章 系统结构及原理 |
3.1 引言 |
3.2 模型定义 |
3.3 系统框架 |
3.4 系统主函数 |
3.5 界面设计 |
3.6 情感分类 |
3.6.1 情感分类标准 |
3.6.2 情感强度分类标准 |
3.6.3 情感关键词库 |
3.7 意图特征和情感特征抽取 |
3.7.1 意图特征抽取 |
3.7.2 情感特征抽取 |
3.8 意图分类 |
3.9 情感分类 |
3.10 价格特征词及其值抽取 |
3.11 谈判决策 |
3.11.1 安抚策略 |
3.11.2 让步策略 |
3.11.3 谈判算法 |
3.12 生成回复 |
3.13 本章小结 |
第4章 系统的实现 |
4.1 概述 |
4.2 收集语料与预处理 |
4.3 交互界面 |
4.4 意图和情感特征抽取 |
4.5 意图识别与分类 |
4.6 情感识别与分类 |
4.7 价格特征及其值抽取 |
4.8 谈判策略 |
4.9 生成回复 |
4.10 本章小结 |
第5章 谈判实例与分析 |
5.1 谈判成功样例分析 |
5.2 谈判破裂样例分析 |
5.3 两样例总分析 |
5.4 本章小结 |
第6章 系统评估与分析 |
6.1 意图和情感分类模型的性能评估 |
6.2 谈判成功率 |
6.3 谈判结果的效用 |
6.4 人类谈判对手满意度 |
6.5 本章小结 |
第7章 结束语 |
7.1 总结 |
7.2 展望 |
参考文献 |
附录A 部分意图语料 |
A.1 问候意图类 |
A.2 讲价意图类 |
A.3 破裂意图类 |
A.4 成交意图类 |
附录B 部分情感语料 |
B.1 愤怒情感类 |
B.2 生气情感类 |
B.3 失望情感类 |
B.4 着急情感类 |
B.5 担心情感类 |
B.6 委屈情感类 |
B.7 高兴情感类 |
B.8 感激情感类 |
附录C 部分回复模板 |
C.1 愤怒回复模板库 |
C.2 生气回复模板库 |
C.3 失望回复模板库 |
C.4 着急回复模板库 |
C.5 担心回复模板库 |
C.6 委屈回复模板库 |
C.7 高兴回复模板库 |
C.8 感激回复模板库 |
C.9 问候类回复模板库 |
C.10 讲价类回复模板库 |
C.11 破裂类回复模板库 |
C.12 成交类回复模板库 |
读硕期间获得的成果与奖励 |
致谢 |
(7)基于强化学习的人机谈判系统(论文提纲范文)
摘要 |
Abstract |
第1章 引言 |
1.1 研究背景 |
1.2 研究的动机 |
1.3 技术路线 |
1.4 本文主要贡献 |
1.5 本文结构 |
第2章 文献综述 |
2.1 引言 |
2.2 对话管理 |
2.2.1 对话行为识别 |
2.2.2 对话状态跟踪 |
2.2.3 对话策略 |
2.2.4 本节小结 |
2.3 对话回应生成 |
2.3.1 基于规则的方法 |
2.3.2 基于知识的方法 |
2.3.3 基于深度学习的方法 |
2.3.4 基于生成式的特殊模型 |
2.3.5 基于知识和深度学习的混合方法 |
2.3.6 本节小结 |
2.4 对话系统的评估 |
2.4.1 评估基于任务的对话系统 |
2.4.2 评估开放域对话系统 |
2.4.3 基于学习的评估 |
2.4.4 挑战 |
2.4.5 本节小结 |
2.5 强化学习 |
2.5.1 简介 |
2.5.2 Q学习算法 |
2.5.3 本节小结 |
2.6 人机谈判 |
2.6.1 人机谈判必要性 |
2.6.2 人机谈判策略 |
2.6.3 谈判的相关方法 |
2.6.4 基于强化学习的人机谈判 |
2.6.5 本节小结 |
2.7 本章小结 |
第3章 系统结构 |
3.1 引言 |
3.2 人机谈判对话系统框架 |
3.3 系统模型定义 |
3.4 系统主函数 |
3.5 本章小结 |
第4章 人机谈判系统的用户界面 |
4.1 引言 |
4.2 用户界面的设计 |
4.2.1 基于微信小程序的前端输入 |
4.2.2 基于Flask框架的后台输出 |
4.3 用户界面的实现 |
4.4 本章小结 |
第5章 谈判对话理解 |
5.1 引言 |
5.2 对话理解的方法 |
5.2.1 基于特征词抽取的匹配算法 |
5.2.2 基于fast Text的意图识别 |
5.3 对话理解的实现 |
5.4 本章小结 |
第6章 基于强化学习的对话谈判管理 |
6.1 引言 |
6.2 对话谈判管理的原理 |
6.2.1 用户行为建模 |
6.2.2 基于Q学习的谈判策略 |
6.2.3 基于Q学习与用户行为建模的谈判策略 |
6.3 对话谈判管理的实现 |
6.4 本章小结 |
第7章 谈判回应生成 |
7.1 引言 |
7.2 基于模板匹配的回应生成方法 |
7.3 对话回应生成的实现 |
7.4 本章小结 |
第8章 谈判示例与分析 |
8.1 引言 |
8.2 谈判示例展示 |
8.3 谈判成功示例分析 |
8.4 谈判破裂示例分析 |
8.5 本章小结 |
第9章 系统评估 |
9.1 引言 |
9.2 意图识别模型的性能 |
9.3 价格谈判的衡量指标 |
9.4 用户满意度 |
9.5 本章小结 |
第10章 结束语 |
10.1 总结 |
10.2 展望 |
参考文献 |
附录A 意图识别模型的部分训练语料 |
A.1 问候意图类部分语料 |
A.2 商品询问意图类部分语料 |
A.3 谈判破裂意图类部分语料 |
A.4 谈判成功意图类部分语料 |
附录B 部分回复模板 |
B.1 问候类部分回复模板 |
B.2 商品询问类部分回复模板 |
B.3 谈判成功类部分回复模板 |
B.4 谈判破裂类部分回复模板 |
B.5 价格谈判类部分回复模板 |
读硕期间获得的成果与奖励 |
致谢 |
(8)基于博弈论和多智能体强化学习的城市道路网络交通控制方法研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题来源 |
1.2 研究背景 |
1.3 研究现状综述 |
1.3.1 城市道路网络交通控制 |
1.3.2 城市道路网络动态交通分配 |
1.3.3 城市道路网络中的多智能体强化学习 |
1.3.4 研究现存问题 |
1.4 研究目的及意义 |
1.5 研究内容框架 |
第2章 城市道路网络分布式动态交通分配方法 |
2.1 动态交通分配 |
2.1.1 动态交通分配问题 |
2.1.2 用户均衡和系统最优 |
2.1.3 动态交通分配的主要数学形式 |
2.1.4 动态交通分配模型的缺陷 |
2.2 多智能体强化学习 |
2.2.1 多智能体系统 |
2.2.2 强化学习机制 |
2.2.3 多智能体强化学习算法 |
2.3 动态交通分配决策者智能体架构 |
2.3.1 决策者智能体状态空间 |
2.3.2 决策者智能体动作空间 |
2.3.3 决策者智能体回报函数 |
2.3.4 决策者智能体的学习率机制 |
2.4 动态交通分配空间约束建议者智能体架构 |
2.4.1 建议者智能体的状态空间 |
2.4.2 建议者智能体的动作空间 |
2.4.3 建议者智能体的回报函数 |
2.4.4 建议者智能体的学习率机制 |
2.5 异构建议者多智能体强化学习 |
2.5.1 HAB-MARL 框架的应用 |
2.5.2 HAB-MARL 算法 |
2.6 本章小结 |
第3章 城市道路网络分布式交通信号控制方法 |
3.1 城市道路网络交通信号控制 |
3.1.1 URNTSC优化目标选取 |
3.1.2 URNTSC方法主要形式 |
3.1.3 多智能体强化学习在URNTSC中的应用 |
3.1.4 当前URNTSC方法可改进性 |
3.2 交通管控中的博弈论 |
3.2.1 博弈论形式及基本分类 |
3.2.2 博弈中的均衡解 |
3.2.3 博弈论在交通系统中的应用形式 |
3.3 分布式交通信号控制智能体架构 |
3.3.1 信号控制智能体状态空间 |
3.3.2 信号控制智能体动作空间 |
3.3.3 信号控制智能体决策过程 |
3.3.4 信号控制智能体回报函数 |
3.3.5 信号控制智能体的学习率机制 |
3.4 混合策略纳什均衡多智能体强化学习 |
3.4.1 MSNE-MARL 框架的应用 |
3.4.2 MSNE-MARL 算法 |
3.5 本章小结 |
第4章 城市道路网络交通信号控制鲁棒性增强方法 |
4.1 复杂网络关键节点判别技术 |
4.1.1 图论基础 |
4.1.2 复杂网络理论 |
4.1.3 关键节点判别技术 |
4.1.4 现有关键节点判别技术局限性 |
4.2 节点影响力传播机制 |
4.2.1 社会网络影响力传播机制 |
4.2.2 基于 MAS 的节点影响力传播机制 |
4.2.3 影响力传播机制改进关键点 |
4.3 MAS-AITM的URNTSC鲁棒性增强框架 |
4.3.1 MAS-AITM中节点等级度量及关键节点判别机制 |
4.3.2 MAS-AITM节点交互关系的分类 |
4.3.3 MAS-AITM节点交互关系的各向异性自择机制 |
4.3.4 MAS-AITM节点交互机制 |
4.3.5 URNTSC中鲁棒性增强构建的其他事项 |
4.4 本章小结 |
第5章 数值模拟框架及验证测试 |
5.1 城市道路网络数值模拟框架 |
5.1.1 元胞传输模型 |
5.1.2 基于CTM-DNL的数值模拟框架 |
5.1.3 城市道路网络交叉口转弯比动态构建方法 |
5.2 HAB-MARL分布式动态交通分配方法验证分析 |
5.2.1 出行成本函数选用 |
5.2.2 验证方法选用 |
5.2.3 验证网络选用 |
5.2.4 验证输入值设置 |
5.2.5 HAB-MARL验证分析 |
5.2.6 本节小结 |
5.3 MSNE-MARL分布式交通信号控制方法验证分析 |
5.3.1 验证指标选用 |
5.3.2 验证方法选用 |
5.3.3 验证网络选用 |
5.3.4 验证输入值设置 |
5.3.5 验证方法参数标定 |
5.3.6 MSNE-MARL验证分析 |
5.3.7 本节小结 |
5.4 MAS-AITM的URNTSC鲁棒性增强方法验证分析 |
5.4.1 验证方法选用 |
5.4.2 验证网络选用 |
5.4.3 验证输入值设置 |
5.4.4 MAS-AITM验证分析 |
5.4.5 本节小结 |
5.5 本章小结 |
第6章 总结与展望 |
6.1 工作总结 |
6.2 主要创新点 |
6.3 研究展望 |
参考文献 |
作者简介及在学期间所取得的科研成果 |
致谢 |
(9)具有切换拓扑的多智能体系统协同控制问题研究(论文提纲范文)
中文摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 蜂拥控制问题研究现状 |
1.3 一致性控制问题研究现状 |
1.4 论文主要研究内容 |
第二章 预备知识 |
2.1 符号说明 |
2.2 代数图论 |
2.3 相关定义及不等式 |
2.4 稳定性 |
第三章 基于局部牵制的多智能体蜂拥控制 |
3.1 引言 |
3.2 问题描述 |
3.3 基于局部牵制的蜂拥控制算法 |
3.4 稳定性分析 |
3.5 仿真模拟 |
3.5.1 基于Tanner势函数的蜂拥控制算法 |
3.5.2 基于Olfati势函数的蜂拥控制算法 |
3.5.3 与其他算法的对比 |
3.6 本章小结 |
第四章 高维空间下具有未知动态的多智能体固定时间蜂拥控制 |
4.1 引言 |
4.2 问题描述 |
4.3 高维空间下的固定时间蜂拥控制算法 |
4.4 稳定性分析 |
4.5 仿真模拟 |
4.5.1 不带有未知非线性动态的蜂拥控制算法 |
4.5.2 带有未知非线性动态的蜂拥控制算法 |
4.6 本章小结 |
第五章 基于局部牵制的多智能体固定时间一致性控制 |
5.1 引言 |
5.2 问题描述 |
5.3 基于局部牵制的固定时间一致控制算法 |
5.4 稳定性分析 |
5.5 仿真模拟 |
5.5.1 不带有未知非线性动态的一致性控制算法 |
5.5.2 带有未知非线性动态的一致性控制算法 |
5.6 本章小结 |
第六章 具有不准确速度反馈信息的多智能体蜂拥控制 |
6.1 引言 |
6.2 问题描述 |
6.3 带有不准确速度反馈信息的蜂拥控制算法 |
6.4 稳定性分析 |
6.5 仿真模拟 |
6.5.1 带有不准确速度反馈信息的蜂拥控制算法 |
6.5.2 与其他算法的对比 |
6.6 本章小结 |
总结与展望 |
参考文献 |
作者简介及在学期间所取得的科研成果 |
致谢 |
(10)基于Stigmergy和神经内分泌调节机制的多智能体群智能自组织与调控方法研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题来源 |
1.2 问题背景及意义 |
1.3 国内外相关研究及发展的现状与趋势 |
1.3.1 新一代智能交通和智慧供应链与物流及其基于自组织协同优化的复杂问题求解方法的研究与发展 |
1.3.2 基于多Agent的分布式人工智能理论研究与发展 |
1.3.3 群智能自组织理论与小世界理论的研究情况及其对解决群体协同决策问题的支持 |
1.3.4 仿生智能及神经内分泌调节机制的研究现状与启示 |
1.4 主要研究目标及内容 |
1.4.1 研究目标 |
1.4.2 主要内容 |
1.5 拟解决的问题及难点 |
1.5.1 问题解决 |
1.5.2 主要难点 |
1.6 主要创新及特色 |
1.7 论文结构 |
第2章 面向多任务协同求解的多智能体自组织调控问题的分析描述与建模 |
2.1 概述 |
2.2 复杂环境下多任务协作问题及其求解机制分析 |
2.2.1 新一代智能交通环境下多任务协作问题及其对协同求解的需求 |
2.2.2 智慧敏捷供应链下多任务协作问题及其对协同求解的需求 |
2.2.3 复杂系统及复杂问题的内涵定义与主要特性 |
2.3 基于群智能的多任务协作复杂问题群体协同求解机制分析 |
2.3.1 群智能的提出及内涵定义与特点 |
2.3.2 个体智能与群智能的关系及群智能的形成 |
2.3.3 基于群智能的复杂问题求解机制 |
2.3.4 群智能实现方法分析 |
2.4 面向多任务协同求解和智能系统形成的自组织机制与调控方法的问题模型 |
2.5 基本思路与总体解决方案 |
2.6 本章小结 |
第3章 面向复杂问题求解的智能系统建模方法研究 |
3.1 概述 |
3.2 智能系统的内涵理解与分析 |
3.3 智能体/自治主体的主要特性 |
3.4 Stigmergy驱动下基于MAS的智能系统建模方法 |
3.4.1 群智能中的共识主动性(Stigmergy)机理分析及启示 |
3.4.2 基于大脑认知与行为控制机理的智能体模型 |
3.4.3 基于共识主动性的基于MAS的建模方法 |
3.5 建模方法应用 |
3.6 本章小结 |
第4章 基于小世界理论和友元接力搜索算法的自组织机制研究 |
4.1 概述 |
4.2 自组织及其对智能系统与群智能的作用机理分析 |
4.2.1 自组织及其成因机理 |
4.2.2 自组织对智能系统形成与多智能体群体智能提呈使能的作用 |
4.3 小世界理论及其对自组织的作用 |
4.3.1 小世界效应与小世界理论 |
4.3.2 基于小世界理论的机会发现与信息传播机理分析 |
4.3.3 小世界理论对自组织的启示与作用 |
4.3.4 合作博弈策略对自组织的启示与作用 |
4.4 基于小世界理论的友元接力搜索算法及群智能自组织机制 |
4.4.1 基本原理 |
4.4.2 有任务发起结点的算法设计及自组织机制 |
4.4.3 有任务招引结点的算法及自组织机制 |
4.5 算例验证仿真 |
4.6 本章小结 |
第5章 基于神经内分泌调节机制的群智能自组织调控方法研究 |
5.1 概述 |
5.2 分布式/分散化智能系统的自组织调控机制及方法分析 |
5.2.1 智能系统的分布性与自组织调控方法 |
5.2.2 智能系统与生物系统自组织调控的类比 |
5.3 人体神经内分泌免疫调节机制分析 |
5.3.1 人体神经内分泌免疫系统的生物学基础 |
5.3.2 神经-内分泌-免疫系统的关联与作用机制 |
5.3.3 神经内分泌调节方法及对多智能体群体智能复杂问题求解的作用 |
5.4 基于友元合作共识主动性和人体神经内分泌免疫调节的自组织机制 |
5.4.1 人体神经内分泌免疫调节机制对于群智能自组织的优劣势分析 |
5.4.2 Stigmergy共识主动性的再认知和分析 |
5.4.3 利用信息素/激素传播扩散作用的自组织机制 |
5.5 基于Stigmerg共识主动性与神经内分泌免疫的群体智能一致性自组织与调控方法 |
5.5.1 算法原理与基本思路 |
5.5.2 算法设计与过程 |
5.5.3 模拟仿真与结果分析 |
5.6 本章小结 |
第6章 智慧仓储/无人超市环境下支持多智能体协同决策的自组织方法模拟试验研究与分析 |
6.1 概述 |
6.2 智慧仓储/无人超市概念模型设计 |
6.2.1 智慧仓储与无人超市 |
6.2.2 面向新零售的智慧仓储/无人超市环境下多智能AGV的运行及控制 |
6.3 模拟试验研究问题模型 |
6.4 模拟仿真试验及结果分析 |
6.4.1 模拟仿真试验目的与基本思路 |
6.4.2 模拟试验系统设计实现及运行试验 |
6.4.3 智慧仓储/无人超市环境下多提货任务协作模拟试验 |
6.5 应用范式—可柔性编组智巴系统示例 |
6.6 本章小结 |
第7章 总结与展望 |
7.1 全文总结 |
7.2 今后展望 |
参考文献 |
深圳大学指导教师对研究生学位论文的学术评语 |
深圳大学研究生学位(毕业)论文答辩委员会决议书 |
致谢 |
攻读硕士学位期间的研究成果 |
四、信息Agent的体系结构与行为设计(论文参考文献)
- [1]带扰动的非线性多智能体系统固定时间一致性研究[D]. 黎力超. 华东交通大学, 2021(01)
- [2]基于强化学习的多智能体协作建模方法研究[D]. 胡大鹏. 齐鲁工业大学, 2021(10)
- [3]多智能体系统事件触发编队控制研究[D]. 柴小丰. 北京科技大学, 2021
- [4]多智能体系统自主规避任务决策方法研究[D]. 赵毓. 哈尔滨工业大学, 2021(02)
- [5]农户农业节水行为驱动机制及引导政策研究 ——以黄河流域河套灌区为例[D]. 邢霞. 内蒙古农业大学, 2021(01)
- [6]基于情感分析的人机谈判研究[D]. 林萍萍. 广西师范大学, 2021(09)
- [7]基于强化学习的人机谈判系统[D]. 范怡帆. 广西师范大学, 2021(09)
- [8]基于博弈论和多智能体强化学习的城市道路网络交通控制方法研究[D]. 潘昭天. 吉林大学, 2021(01)
- [9]具有切换拓扑的多智能体系统协同控制问题研究[D]. 颜廷若. 吉林大学, 2021(01)
- [10]基于Stigmergy和神经内分泌调节机制的多智能体群智能自组织与调控方法研究[D]. 于欣佳. 深圳大学, 2020