基于人机协作的无人集群搜索方法研究

基于人机协作的无人集群搜索方法研究

人工智能技术与咨询

点击蓝字

关注我们

关键词: 无人集群 ; 人机协作 ; 动态规划 ; 多Agent系统

摘要:

  人与机器人交互是当前一项研究热点,人与无人集群协作搜索是人机交互的典型场景,通过结合人的复杂推理能力和无人集群的重复精确执行能力以完成更为复杂的任务。以不确定场景下高价值目标搜索为背景,给出了人与无人集群协作搜索问题概念定义;为描述多Agent系统如何在人工辅助下进行选择目标区域进行探索,构建了一种先验态势不确定情况下多Agent动态规划问题模型;提出了一种基于顺次分配的动态规划算法。并对该方法进行了仿真实验,实验结果表明:该算法性能明显高于基准算法。

引言

   无人技术的快速发展使得无人集群逐渐成为人类的合作伙伴。人机交互系统[1]是由指挥员与机器人组成的复杂系统,他们相互协作以实现一个共同的目标。本文聚焦人机交互的一个子类,即指挥员与无人集群协作搜索问题。无人集群是由多个无人平台组成的群体,如无人机集群、无人车集群[2-4]。在无人集群自动规划领域,无人平台会根据其当前状态和附近环境,与相邻无人平台相互交互以及自己的局部控制规则进行自动规划。人机交互系统在未知远程环境和高度非结构化的任务中具有卓越性能,能够减少人员工作量,完成单个无人平台无法完成的任务,且具有更高的故障鲁棒性和可扩展性。现如今,人机交互的性质也发生了变化,由单人与单无人平台协作逐渐发展为多人与单无人平台交互、多人与多无人平台交互、单人与多无人平台交互[6]。一般根据自动化层级来描述机器人自主程度[7],10级表示机器人具有完全自主能力,而1级表示人类需要操控所有行动。现有机器人技术远未达到10级,因此仍需要人为干预来完成复杂任务,例如进行更高级的推理和决策。

   一些学者对人与无人集群协作问题进行过研究。Aamodh提出了一种协作框架,在框架中指挥员能够控制集群的形状和编成[8]。Shishir研究表明适当的人与无人集群协作可以使无人集群受益,从而能够更好地达成目标[9]。指挥员与无人集群协作方式很多,其中一种是指挥员向无人集群提供辅助消息。在很多情况下指挥员能够根据经验或其他消息途径为无人集群提供消息,消息可能降低信息的不确定性,从而降低无人集群决策的复杂度,进而提高系统整体性能。事实上,从指挥员获得所需信息的最直接方法是遇到情况直接询问。假设无人集群具备较高自主能力,能够自己完成任务,偶尔会得到指挥员的支持。指挥员作为消息提供者,主要提供信息状态和决策行动2种方式。作为信息状态提供者,常见的问题框架是HOP-POMDP(human observation provider partially observable markov decision process)[10]。HOP-POMDP考虑了Agent在规划决策时能够咨询指挥员,通过咨询获得必要信息,但指挥员可能提供非完整信息,且不一定能实时响应。作为决策行动提供者,常见的框架为MU-POMDP(model uncertainty partially observable markov decision process)[11]。MU-POMDP考虑了转移函数、观测概率和回报值不确定的规划过程,Agent向指挥员询问一系列“是/否”问题或者描述行动列表,然后由指挥员确定采用何种行动。上述问题模型与本文提出的问题框架有所不同,因而其求解算法无法有效地应用于提出的搜索问题。

    人与无人集群协作决策可以抽象为一种方案空间探索问题。假设存在很多备选目标区域,无人集群选择其中若干区域进行搜索,方案可以认为是无人平台搜索一个目标区域的过程,所有方案的集合称为方案空间。方案空间越大,越有可能包含最有价值的目标。对于方案空间搜索问题,通常将其抽象为一种目标优化问题。根据目标的数量,可以将优化问题分为单目标优化和多目标优化。为了便于分析,多个目标可以整合为单个目标。现有研究中,每个方案的回报值是确定的,可以直接得到而无需经过复杂计算。目前普遍采用帕累托最优方法,如NSGA-II(non dominated sorting genetic algorithm II)和NSGA-III(non dominated sorting genetic algorithm III) [12-13],以及这些算法的扩展算法。这些算法适用于输入输出关系确定的问题中,但难以有效解决本文的问题框架,即无人集群的行动可能产生大量的、甚至无穷多的不同数值的搜索问题。指挥员首先需要确定拟探索方案的先后顺序,然后在已搜索的方案中选择最有价值的若干方案。换句话说,问题的目标是寻找到最优搜索路径,以保证在有限时间和资源内寻找到最优方案。该问题类似于旅行商问题[14-15],最优搜索路径的计算复杂度为O(n22n)O(n22n),其中n表示方案空间中的方案数;但又不同于旅行商问题,本文考虑的路径优选问题中每种方案的价值服从某种分布,准确的价值在方案被探索之前是未知的。考虑到搜索目标需要耗费一定代价,搜索路径根据需求长度可调。Blanco等[16]提出了一种搜索算法,决策者通过花费一定代价以获取未知方案的信息,并提出了停止搜索的条件。Weitzman[17]提出了一种基于评判指标的顺序搜索问题,不过该方法适用于选择一个最优方案的情景。Chen等[18]提出了一种用于人工辅助机器人决策的最优搜索算法,同样该方法只能选取一种最优方案,无法解决本文提出的问题。

   本文考虑的场景是假设具有高度自主性的无人集群在人工干预下对敌方目标区域进行探测,以求在大范围环境中寻找到若干最有价值的区域。由于先期情报不准,无法确定高价值目标具体位置。此外,派遣无人集群执行任务时需要一些代价,一方面需要耗费燃料,另一方面有可能被对手击毁。因此,需要无人集群通过搜索判断不同区域的价值,以便为下一步行动提供支撑。因指挥员能够获取额外的信息以弥补无人集群的不足,即指挥员可以减少无人集群搜索过程的不确定因素,所以在很多情况下,人工干预的无人集群规划是十分必要的[5]。但是指挥员的精力和能力是有限的,难以实时操控每个无人平台,因而无法同时为所有无人平台分析和处理数据。

   鉴于此,本文聚焦于如何以有限的代价和资源寻找到最有价值的目标。高价值目标可以指指挥所、火炮阵地、机场等指挥员感兴趣的事物。本文弱化了实际应用背景,以便提出的问题框架以及求解算法具有一般性。指挥员与无人集群协作搜索问题面临三方面挑战:①各个区域具有不确定性。在派遣无人集群前往目标区域探测之前需要收集先验知识,如卫星图像。先验知识一方面具有不确定性,另一方面能够作为启发式信息辅助决策;②派遣无人集群前往目标区域探测需要花费代价,如油耗、损坏等。因而指挥员需要决定是继续探测下一个地区,还是停止搜索并选择已探测的最有价值的区域;③进行探测的手段很多,例如,无人机实地抵近侦察,或者回传高空侦察数据以寻求人工分析,因此指挥员应权衡不同行动的效用和成本。

1 人机协作搜索问题框架

   本节给出了人与无人集群协作搜索问题的概念定义,并将该问题抽象为一种动态规划问题。

1.1 概念定义

   把地理环境划分为若干区域,无人集群需要在这些区域中找到高价值目标,如果包含的高价值目标越多,则这片区域就越有价值。无人集群的目标是以尽可能少的代价找到价值尽可能高的若干区域。假设每个区域的价值是独立的,在被无人集群探测之前具体数值是未知的。

   定义1(搜索价值):搜索价值是指无人集群探索某个区域的必要性综合度量。

   搜索价值由目标的重要程度决定,目标越重要,该目标所具备的价值就越大,探索这片区域的价值也就越高。考虑到先验态势信息的不准确性,每片区域的价值事先是不确定的。假设不同区域的价值是相互独立的。对于区域u∈Uu∈U,其价值xuxu服从概率分布Fu(xu)Fu(xu),其中U表示所有备选区域,或称为方案空间。无人集群可以采用抵近侦察或者高空侦察的方式获取信息。其中,抵近侦察能够获取区域的确切价值,高空侦察数据需要成功咨询指挥员后才可能获得确切价值。另外,不同行动耗费的成本是不一致的,比如抵近侦察就存在被击落的风险,而高空侦察则不易被击落。

   定义2(搜索代价):搜索代价是指无人集群探索某个区域时的成本综合度量。

   派遣无人集群前往目标地点搜索是需要耗费成本的,记为c∈R+c∈R+。假设采用不同行动搜索不同区域的代价是已知且相互独立的。那么,无人集群在考虑进一步探索时,需要权衡搜索价值和搜索代价的关系,即回报值。回报值可以认为是净效益,本文无人集群的目标是使回报值最大化。

   定义3(回报值):回报值是搜索价值与探索成本之差。

   每个区域的状态分为状态未知、状态已知和状态分析3类,如图1所示。状态未知是指该区域还未被无人集群探索,确切价值尚不可知;状态已知是指该区域已经被无人集群探测过,已经查明了确切价值;状态分析是指该地区正在被无人集探测,无人集群正向指挥员请求数据分析。可以采用多种手段进行探测,不失一般性,无人集群主要有2种手段:①无人集群前往目标区域u进行抵近侦察,采用多个视角和多种传感器收集和处理数据,记为a'uau';②无人集群前往目标区域u进行高空侦察,并请求指挥员进行数据分析,记为a′′uau″。所有行动集合记为A={a'u,a′′u|u∈U}A={au',au″|u∈U}。

图1   方案状态转移关系

Fig. 1   Scheme state transition relationship

1.2 动态规划问题

人与无人集群协作搜索被形式化建模为一类多Agent系统动态规划问题,其中无人平台被抽象为Agent,每个区域被称为一个方案。将备选方案集合记为u∈Uu∈U,将其分为2个互斥集合:①不断增加的已探索方案集合I∈UI∈U;②未探索方案集合I¯∈UI¯∈U,I⋃I¯=UI⋃I¯=U,I⋂I¯=∅I⋂I¯=∅。每个Agent在决策时,可以选择是否从集合I¯I¯中选择一个未探索方案进行探索,此时可以采用抵近侦察和咨询指挥员两种方式获得确切回报值;或者该Agent停止探索并从集合II中选择一个已探索方案作为最终方案。设定整个集群一共选取|K|K个方案,每个Agent只能选择一个最有价值的方案,使探索价值最大化:

求解问题的充分统计量记为(I¯,y)(I¯,y),称为系统状态。系统状态分为2部分:未探索方案信息I¯I¯和已探索方案集合y={y1,y2,⋯,y|I|}y={y1,y2,⋯,yI}。将Agent系统多动态规划问题转化为系统状态评估函数。

定义4(系统状态评估函数)。系统状态评估函数为当已知价值集合为y且未探索方案集合为I¯I¯时,执行最优策略能够获得的期望回报值,记为ψ(I¯,y)ψ(I¯,y)。

由于每个方案探索价值和探索成本是独立的,因此集群的期望回报值可以分解为每个Agent的期望回报值。

式中:ψk(I¯k,yk)ψk(I¯k,yk)为第k个Agent的子系统状态评估函数。对于任意2个Agent w,v∈Kw,v∈K所选择的方案yˆw,yˆvŷw,ŷv,有yˆw≠yˆvŷw≠ŷv,表示每个Agent选择不同的方案。每个Agent都有局部方案空间,不同Agent的方案空间可能交叉Uw⋂Uv≠∅Uw⋂Uv≠∅,也可能不交叉Uw⋂Uv=∅Uw⋂Uv=∅。对于每个子集I¯kI¯k和价值集合ykyk,子系统状态评估函数ψk(I¯k,yk)ψk(I¯k,yk)需要满足式(3)所示的迭代关系。不失一般性,本文以Agent k∈Kk∈K为例进行说明,其中K表示无人集群索引集合。

  式中:ψ'k(I¯,yk)ψ'k(I¯,yk)为Agent k执行抵近侦察行动后的系统状态评估函数;ψ′′k(I¯,yk)ψ″k(I¯,yk)为Agent k执行询问指挥员行动(记为a'a')后的系统状态评估函数;p为指挥员响应并成功分析出该方案价值(记为a′′a″ )的概率;c'i,c′′ici',ci″为对于方案i,Agent执行行动a'a'和行动a′′a″所耗费的成本。当系统状态为(I¯k,yk)(I¯k,yk)时,Agent k需要确定是停止搜索并从集合ykyk选择最大价值yˆkŷk,或是在比较行动a'iai'和行动a′′iai″效果后继续探索未知方案i

   通过上述定义,本文将人与无人集群协作搜索问题建模为一种动态规划问题。该问题特点是递归计算,因此难以直接求解状态评估函数。

2 基于顺次分配的动态规划算法

  本节提出了一种基于顺次分配的动态规划(sequential allocation based dynamic planning,SADP)算法,通过决策指标与采样值之间的大小关系来选择行动。

2.1 决策指标

  对于每个方案i,执行行动a'iai'和行动a′′iai″的决策指标分别记为d'idi'和d′′idi″。决策指标是继续探索与停止探索的综合度量。

  参考文献[18],可以解算式(6)得到:

  根据系统状态ψ(I¯,y)ψ(I¯,y)和指标集合{c'i,c′′i/p|i∈I¯}{ci',ci″/p|i∈I¯},可以设计一种简单但最优的搜索规则,分为判断规则和选择规则。判断规则是指如果Agent要进一步探索未知方案,则选择决策指标最大的未知方案,同时选择对应的行动;停止规则是指如果当前最大价值大于所有未知方案的决策指标时,则停止搜索并选择具有最大价值的方案作为最终方案。

   通过该规则,复杂的系统状态函数计算问题就转化为简单的指标判断问题,且每个指标的计算都是独立的,不受其他方案价值概率分布的影响。

2.2 规划算法

    在探索程序中,首先根据式(6)和(7)计算所有方案所有行动的决策指标,并保存至集合ππ中。其次嵌套遍历所有Agent k∈Kk∈K和每个Agent的未知方案空间UkUk。在嵌套遍历中,应先找出集合ππ中最大指标 d* d*,以及对应的方案i*i*、行动a*a*和代价c*c*。为了便于描述,指标集合是以全集为基础计数,而不以每个Agent的局部集合计数,即π={d'i,d′′i |i∈I¯}π={di',di″ |i∈I¯}。如果最大采样价值大于最大决策指标yˆk≥d*ŷk≥d*,则停止搜索并返回最大采用价值yˆkŷk、最终方案iˆkîk和累积搜索代价;反之则进入仿真程序G,获取是否咨询成功s∈{True, False}s∈{True, False}以及采样价值x。如果获得确切采样价值,那么更新集合IkIk、I¯kI¯k、πkπk和累积搜索代价cc。

  算法1:探索程序

在仿真程序G中,如果采取行动a′′a″,则将生成的随机数r与咨询成功率p对比,以判断能否咨询成功。另外,符号“~”表示采样,x∼Fi(xi)x∼Fi(xi)表示对概率分布Fi(xi)Fi(xi)进行一次采样。

算法2:仿真程序

      

3 仿真实验

3.1 实验设置

假设需要对目标区域进行探测,建立战场高价值目标态势图,为后续行动提供最新支撑。为了完成一系列使命,拟派遣高智能无人集群前往目标区域,并在人工辅助下以尽可能低的探索成本寻找若干高价值目标区域。那么无人集群如何自动规划自身行动是本实验需要解决的问题。

为了评估基于顺次分配的动态规划(sequential allocation based dynamic planning, SADP)算法的性能,定义统计指标:①平均回报值,指多次仿真中K个最高价值减去累积搜索代价的平均值;②平均运行时间,指运行多次仿真的平均时间;③平均探索次数,指每轮无人集群探索未知方案的平均次数;④平均咨询次数,指每轮中无人集群向人类咨询的平均次数。

此外,为了对比SADP算法的性能,设计了在问题框架下2种基准算法:

(1) 快速探索算法(fast exploration algorithm, FEA),其评判指标是最高期望价值与代价之差,即每轮决策选择方案:

当已探索方案中的最高回报值大于该指标集合中的所有指标,则停止探索并选择具有价值最高的方案。

(2) 试触探索算法(touch exploration algorithm,TEA),其核心思想是比较当前最大回报值与下一时刻期望最大回报值相比,如果小于0,则继续探索,反之则停止探索。每轮选择方案:

3.2 方案空间扩展性实验

本节设计了3个典型场景用以评估算法对于方案空间可扩展性的适应程度。一般而言,咨询代价小于抵近侦察代价c′′i<c'i,i∈Ici″<ci',i∈I,但是咨询次数未知。设定所有搜索价值函数服从独立的均匀分布,即Fi(xi)∼U(ai,bi)Fi(xi)∼U(ai,bi),ai∼U(1 000,1 500)ai∼U1 000,1 500,bi∼bi∼U(1 500,2 000)U1 500,2 000,i∈Ii∈I;设定搜索代价也服从独立的均匀分布,即c'i∼U(10, 20)ci'∼U10, 20,c′′i∼U(3, 4)ci″∼U3, 4,i∈Ii∈I;咨询成功概率为p={0,0.1,0.2,⋯,1}p=0,0.1,0.2,⋯,1时,无人集群选取|K|=9K=9个方案,每个场景独立重复运行1 000次仿真。评估3个场景下算法的性能指标:

场景A1:方案空间大小为|I|=50I=50。

场景A2:方案空间大小为|I|=500I=500。

场景A3:方案空间大小为|I|=5 000I=5 000。

场景A1仿真结果如图2所示。实验结果表明在这些场景中SADP回报值远高于FEA和TEA的回报值,SADP运行时间略高于FEA和TEA,FEA和TEA探索次数非常接近,随着p的增加,SADP探索次数波动增长。当p≥0.3p≥0.3时,SADP咨询次数大于FEA和TEA咨询次数。

图2   场景A1仿真结果

Fig. 2   Simulation results in scenario A1

场景A2仿真结果如图3所示。实验结果表明在这些场景中SADP回报值远高于TEA,而TEA回报值高于FEA。SADP运行时高于FEA和TEA。SADP探索次数明显大于FEA和TEA的探索次数。当p>0.2时,SADP咨询次数大于FEA和TEA咨询次数。

图3   场景A2仿真结果

Fig. 3   Simulation results in scenario A2

场景A3仿真结果如图4所示。实验结果表明在大部分场景下,SADP的回报值、运行时间、探索次数和咨询次数大多高于TEA,而TEA的回报值、运行时间、探索次数和咨询次数又大多高于FEA。

图4   场景A3仿真结果

Fig. 4   Simulation results in scenario A3

3.3 参数敏感性实验

设定所有搜索价值函数服从独立的均匀分布,即Fi(xi)∼U(ai,bi)Fi(xi)∼U(ai,bi),ai∼U(1 000,1 500)ai∼U(1 000,1 500),bi∼Ubi∼U(1 500,2 000)(1 500,2 000),i∈Ii∈I;设定搜索代价也服从独立的均匀分布,即c'i∼U(10,20)ci'∼U(10,20),c′′i∼U(3,4)ci″∼U(3,4),i∈Ii∈I。此外,咨询成功概率设为p=0.3p=0.3,方案空间大小设为5 000,无人集群选取|K|={1,3,⋯,19}K=1,3,⋯,19个方案时的回报值、运行时间、搜索次数、咨询次数4项性能指标。每个场景独立重复运行1 000次仿真。

场景B仿真结果如图5所示。实验结果表明随着|K|K的增加,所有算法的回报值、运行时间、搜索次数、咨询次数都逐渐增加。此外在这些场景中,SADP回报值、运行时间、搜索次数、咨询次数高于TEA,而TEA又高于FEA。

图5   场景B仿真结果

Fig. 5   Simulation results in scenario B

3.4 实验分析

   本节设置若干场景,但实验结果具有一些共性。比如在场景A中,随着变量p的增加,回报值略有增加,而运行时间会逐渐减少。这是因为p的增加会减少咨询次数并降低期望咨询代价,从而提高期望回报值。值得说明的是,p=0.3是SADP算法的拐点,当p<0.3时,其回报值、运行时间、探索次数、咨询次数都处于低位,而当p=0.3时有明显的提高。这与实验参数设置有很大关系,当p=0.3时,行动a'a'的代价c'c'基本上大于行动a′′a″的代价c'/pc'/p,因此Agent将采用咨询指挥员而不是采用抵近侦察行动。此时即便搜索路径不变,代价值也会降低,回报值增加,咨询次数增加。进一步,代价c的变化会影响决策指标d的变化,从而影响搜索顺序以及何时停止搜索。决策指标d具有期望回报值类似的意义,cd呈负相关,如果c越小,则d越大。对于场景B,随着变量|K|K增加各项指标随之增加。很显然毕竟选择的方案多了,而每个方案回报值为正,所以回报值肯定增加。同样,运行时间、搜索次数、咨询次数也会增加。

4 结论

     人与无人集群协作搜索是具有广泛的应用价值和重要的研究意义。关于人机交互协作搜索,许多学者将其抽象为一种动态规划问题。其中,大多考虑单个最优方案如何生成,而对于多个最优方案并没有考虑。本文的工作是对之前工作的拓展,主要研究如何选择若干最优的方案。针对人与无人集群交互协作搜索问题,提出了一种多项式事件最优的方案空间探索算法。由于算法采用一种基于判定指标的贪婪搜索方法,使得该算法探索的回报值高于其他基准算法。然而该算法也存在一些不足,主要体现在运行时间比基准算法略长,这可能与判定指标计算的复杂度有关。下一步,可以考虑更为复杂的协作搜索问题,以及如何并行分布计算,以提高问题的适用性和计算效率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481689.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

chatbot1_2 RNN简单实现

chatbot1.2 如何处理多义词的embedding&#xff1f; 每个意思一个向量&#xff0c;多方叠加。在某个切面与其相同意思的向量相近 如何识别和学习词组的向量&#xff1f; 多次出现在一起&#xff0c;认为是词组 如何处理未曾见过的新词&#xff1f; 语境平均&#xff0c;语…

DeepMind创始人Demis Hassabis:AI 的强大,超乎我们的想象

来源&#xff1a;微信公众号“雷锋网”撰文&#xff1a;黄楠、王玥编辑&#xff1a;陈彩娴有人认为 AI 已经穷途末路&#xff0c;但一些绝顶聪明的人还在继续求索。近日&#xff0c;DeepMind 的创始人 Demis Hassabis 作客 Lex Fridman 的播客节目&#xff0c;谈了许多有趣的观…

组网雷达融合处理组件化设计与仿真

人工智能技术与咨询 点击蓝色 关注我们 关键词&#xff1a; 组网雷达 ; 点迹融合 ; 航迹融合 ; 组件化设计 ; 仿真 摘要 数据融合处理是多雷达组网的核心。以典型防空雷达网为参考对象&#xff0c;采用组件化设计方式&#xff0c;将组网数据融合处理过程划分为不同的组件&…

chatbot2 RNN语言模型

基于RNN的语言模型 RNN语言模型理论基础 参考文献 cbow/skip gram 的局限性#### 解决方案 rnn模型细节 数学表示 一个输入一个输出的不是循环神经网络。 RNN语言模型实践 demo1 1A. 优化上一节课的RNN模型 在第一个版本里面&#xff0c;我们将上一节课的代码包装为Class&…

脑机接口:人工智能下一站?

来源&#xff1a;《光明日报》 作者&#xff1a;杨义先、钮心忻&#xff0c;北京邮电大学教授 随着人工智能的发展&#xff0c;脑机接口也逐渐从科幻走进现实。有人希望以此造就“超人”&#xff0c;更多的人则希望能够解决实际问题——让盲人复明、让瘫痪在床的患者重新走路…

仅活了 5 年!谷歌官宣停掉 IoT Core 服务:“现有连接将被关闭”

来源&#xff1a;AI前线整理&#xff1a;冬梅谷歌云 IoT Core 服务推出 5 年后“退役”近日&#xff0c;据外媒报道&#xff0c;谷歌宣布自 2023 年 8 月起&#xff0c;将关闭其物联网&#xff08;IoT Core&#xff09;服务&#xff0c;此次官宣 IoT Core 的退役&#xff0c;也…

tensorflow1、2会话、变量、feed、fetch、最小二乘法

第一节课 tensorboard–可以查看训练效果 安装ananconda&#xff08;略&#xff09; tensorflow简介 tensorflow结构 是个数据流动的趋势&#xff0c; graph1:默认图 graph2&#xff1a;W*xb->ReLU 2-1 基本计算-会话的使用 import tensorflow as tf # 创建一个常量op,1*…

《Nature》十年努力,“合成”胚胎与大脑和跳动的心脏

来源&#xff1a;生物通研究人员已经用小鼠干细胞创造出了模型胚胎&#xff0c;这些干细胞形成了大脑、跳动的心脏和身体所有其他器官的基础——这是重建生命第一阶段的新途径。小鼠胚胎的小脑由Magdalena Zernicka-Goetz教授领导的研究小组在没有卵子或精子的情况下开发了胚胎…

tensorflow3 非线性回归、mnist、简单神经网络

mnist数据集 手写数字的数据集。60000行训练数据集&#xff0c;10000行测试数据集下载地址&#xff1a;http://yann.lecun.com/exdb/mnist/index.html mnist数据集是形状为[60000,784]的张量&#xff0c;60000张图片&#xff0c;每个图片有784个像素点&#xff0c;这些个像素点…

【院士思维】张钹:我们正处在AI算法不可控的危险状态

来源&#xff1a;清华大学人工智能国际治理研究院8月19日&#xff0c;2022世界机器人大会主论坛正式开幕&#xff0c;期间&#xff0c;有三位院士到场&#xff0c;就“未来机器人&#xff1a;目标、路径和挑战”的主题进行了一场深刻的谈话。三位院士分别为中国科学院院士&…

tensorflow4 代价函数、dropout、优化器

这次扔使用上次的mnist数据集分类的简单版本程序&#xff0c;使用不同的代价函数做计算 二次代价函数 激活函数 使用二次代价函数的运行结果 # 使用二次代价函数的结果-精度 # losstf.reduce_mean(tf.square(y-prediction)) # 0.8322 # 0.8698 # 0.8818 # 0.8882 # 0.8935 #…

强化学习先驱Richard Sutton:将开发新型计算智能体

来源&#xff1a;机器之心编辑&#xff1a;陈萍、小舟DeepMind 和阿尔伯塔大学联合成立的人工智能实验室未来几年要研究什么&#xff1f;2017 年&#xff0c;DeepMind 在加拿大的 Edmonton 成立了其首个英国之外的人工智能研究实验室&#xff0c;并和阿尔伯塔大学大学紧密合作&…

不隐身的“隐身战斗机”

7月19日&#xff0c;韩国KF-21战斗机原型机完成首飞&#xff0c;韩国国防部将该机定位为4代半战斗机。凭借该机&#xff0c;韩国将成为第9个能够研制超音速战斗机的国家。 所谓4代半战斗机&#xff0c;即部分采用隐身技术&#xff0c;同时无法完全达到5代机性能标准的战斗机。…

国科大高级人工智能笔记1-搜索

1.搜索问题 搜索问题——对原问题的建模 构成&#xff1a; 状态空间 包含环境中每一个细节搜索状态&#xff1a;只保留行动需要的细节 后继函数 行动&#xff0c;消耗 初始状态和目标测试 解&#xff1a; 一个行动序列&#xff0c;将初始状态–>目标状态 表示 状态空间图 搜…

自学成才的人工智能显示出与大脑工作方式的相似之处

来源&#xff1a;ScienceAI编译&#xff1a;白菜叶十年来&#xff0c;许多最令人印象深刻的人工智能系统都是使用大量标记数据进行教学的。例如&#xff0c;可以将图像标记为「虎斑猫」或「虎猫」&#xff0c;以「训练」人工神经网络以正确区分虎斑和虎。该战略既取得了惊人的成…

国科大高级人工智能2-人工神经网络(MLP、Hopfield)

常见组合函数 常见激活函数 结构 前馈神经网络&#xff08;单向&#xff09;反馈/循环神经网络 学习方法 学习模型 增量迭代 类型 监督无监督 学习策略 Hebbrian Learning 若两端的神经元同时激活&#xff0c;增强联接权重Unsupervised Learning循环&#xff1f;ωij(t1)ω…

Nature:AI的瓶颈突破在于「实体人工智能(PAI)」

来源&#xff1a;公众号机器之能作者&#xff1a;AslanMiriyev 、 Mirko Kovač翻译&#xff1a;Panda近些年人工智能领域已经取得了突飞猛进的进步&#xff0c;但这些进步大都集中于数字人工智能领域&#xff0c;对于能和我们这种生物体一样执行日常任务的实体人工智能&#x…

国科大高级人工智能3-DNN(BM/RBM/DBN/DBM)

1.深层、浅层、BP 出现背景优点缺点浅层神经网络为了解决非线性问题可以拟合任何函数参数多&#xff0c;神经元多&#xff0c;需要更多的计算资源和数据BP算法&#xff08;对p(labelinput)建模为了计算神经网络损失回传深度神经网络&#xff08;>5)&#xff08;时代背景数据…

世界元宇宙大会—李伯虎院士主旨报告:工业元宇宙模式、技术与应用初探

来源&#xff1a;北京物联网智能技术应用协会未来智能实验室的主要工作包括&#xff1a;建立AI智能系统智商评测体系&#xff0c;开展世界人工智能智商评测&#xff1b;开展互联网&#xff08;城市&#xff09;大脑研究计划&#xff0c;构建互联网&#xff08;城市&#xff09;…

国科大高级人工智能+prml4-CNN

文章目录CNN卷积paddingpoolingBP其他CNNResNets残差网络——图像数据应用CNN Hebb学习律&#xff08;无监督 如果两个神经元在同一时刻被激发&#xff0c;则他们之间的联系应该被强化对神经元的重复刺激&#xff0c;使得神经元之间的突触强度增加 Delta学习律&#xff08;有监…