美军推进生成式人工智能在指挥控制领域的测试运用
发布时间:2023-10-11简介
伴随着ChatGPT大语言模型在商用领域的成功应用,美军正不断推进以大语言模型为代表的生成式人工智能技术的军事化应用,2023年8月,美国国防部成立了生成式人工智能工作组-利马工作组,美国空军和陆军也正在测试生成式人工智能技术,希望利用该技术提升指挥官的决策效率。
生成式人工智能是一种人工智能算法,该算法可针对用户需求,利用前期输入的数据和用户提供的相关资料,生成新的输出数据提供给用户, ChatGPT聊天机器人程序就是该技术的典型应用。美国防部认为,大型语言模型等生成式人工智能技术,在全球范围内的影响力正不断扩大,美军迫切需要提高生成式人工智能模型的速度和交互能力等,以提高任务效率。美国国防部成立的利马工作组的主要职责是评估、利用和提升生成式人工智能技术能力,并通过生成式人工智能模型,帮助美军提升在作战能力、军事管理、卫生健康、战备及政策等领域的行动能力。
1
美国空军对生成式人工智能技术的测试
2023年7月,美国空军在第6次全球信息优势演习(GIDE)中首次测试使用大语言模型执行军事任务,希望利用人工智能系统生成的数据来辅助决策、获取目标信息并支持火力打击任务。在测试中,美国空军通过电话向美军某支部队查询信息,测试期间使用的人工智能工具仅用10分钟就完成了查询,而传统方式下该查询过程可能需花费数小时,甚至数天时间。测试中,美国空军使用了5种人工智能模型,向模型提供了秘密级作战信息,国防部未透露正在测试的语言模型型号,但美国Scale AI公司称,该公司的Donovan系统是正在测试的平台之一。
美国国防部首席数字和人工智能官Margie Palmieri表示,目前生成式人工智能的评价标准仍然不明确,只能通过使用案例来判断生成式人工智能技术的应用效果,并且生成式人工智能技术存在提供错误信息的缺点,这对美军的战场应用来说是一个重大缺陷,因此需要在类似全球信息优势演习这样的活动中对不同模型进行测试。美国国防部负责关键技术的副首席技术官Maynard Holliday表示,国防部不会在当前实例中部署像ChatGPT这样的商用现货技术,未来可能会与业界和学术界合作对相应的技术进行裁剪,以满足军事需求。国防部还寻求能够综合语言、视觉和信号信息的多模态生成式人工智能算法,来响应联合全域指挥控制(JADC2)概念中对联合作战的要求。
2
美国陆军对生成式人工智能技术的测试
2023年5月,美国陆军选择将Scale AI公司的大语言模型Donovan系统用于第18空降师的加密网络,用于该空降师部队的决策制定。Donovan系统是该公司的联邦人工智能平台,可帮助作战人员、分析人员和决策者加速战场态势的理解、计划和行动速度,Donovan系统使用了基于人类反馈的强化学习算法来持续微调系统模型,以便在任务目标发生变化时不断适应新任务。
军事计划人员面临的关键挑战之一是存在大量可支持决策制定的信息,而这些信息的格式不统一。在Donovan系统的帮助下,决策人员不需要增加参谋人员的数量就能在快速变化的战场环境中更快、更好地做出有依据的决策。Donovan系统获取了超过10万页实战数据,如任务命令、态势报告、情报报告等,帮助没有编程或训练经验的参谋人员在几分钟之内理解和管理不断增长的数据。Donovan系统还支持联合全域指挥控制,可加速计划速度,保证国防部开展跨战区作战司令部之间的协同。例如,空中任务指令周期目前需要三天,而Donovan平台能够将该计划周期缩短到几个小时。
在美军举行的红龙演习中,第18空降师将Donovan系统用于以下战场场景:
(1)通过接收实时数据来实时理解友军和敌军部队的作战行动,这些实时数据包括命令、态势报告和情报报告。Donovan系统能够帮助指挥官更好地使用参谋人员,更便捷地确定新型解决方案,并评估快速变化的态势。
(2)通过接收战场报告、部队观测信息,实现对情报融合的背景理解,从而减少作战计划周期。
(3)通过接收有关潜在冲突区域的开源数据来支持危机计划制定,提供有关战场的态势洞察,支持战场情报准备工作,从而为指挥官提供决策优势。
3
美国海军陆战队对生成式人工智能系统的测试
2023年4月,美国Scale AI公司与美国海军陆战队大学的教授合作开发了Hermes大语言模型,用于测试该模型在战役级作战规划方面的能力。学生们通过使用“Hermes军事规划大型语言模型”来理解对手治国方略的各个方面内容,从而塑造作战策略,大语言模型有助于军事规划者在多个维度上观察战场。
由于设计团队将对手的理论和条令数据加载到语料库中,学生们可以提出“什么是联合封锁?”、“X国如何使用柴油潜艇?”等问题。Hermes大语言模型在帮助学生回答与条令相关的问题方面表现出色,这些问题有助于制定敌方的行动方案。
学生团队还使用该模型来理解各地区经济间的联系、特定国家的政治时间表(如选举)、特定国家的主要基础设施投资(如中国的“一带一路”倡议)。通过不同层次的分析,学生团体可熟悉作战环境中的各种环节,以更好地开发对抗性作战概念。除了事实问题之外,学生们还对抗环境中使用“Hermes军事规划大型语言模型”生成关于时间优势和位置优势的假想状况,通过分析这些假想状况,学生团体完善了他们的行动方案。
在大型语言模型的帮助下,学生团体通过提出和获取问题答案的形式,能够更好地了解作战环境、时间、空间和作战部队之间的关系,这个实验表明,有必要开始将大型语言模型集成到军事规划过程中。
4
Scale AI公司的Donovan系统简介
Donovan系统是美国Schale AI公司于2023年5月推出的军用决策辅助系统,与ChagGPT相比,该系统不仅能够从几十年的情报数据中学习,还能够提供其答案的原文出处和发布时间,Donovan系统的工作流程主要包括以下内容:
(1)吸收数据
Donovan系统可吸收不同来源的数据,包括云端数据或预置数据,并能够分析各种类型的数据,包括:电子邮件、情报报告、命令、卫星图像等。
(2)理解数据
Donovan系统能够理解并组织数据,使其与大语言模型交互,大语言模型可根据用户需求进行定制和微调。
(3)信息查询
作战人员和分析人员可在聊天窗口问Donovan系统各种问题,问题类型包括传感器反馈信息、态势图问题和模型给出的答案出处。
图1 信息查询
(4)生成行动方案
Donovan系统可生成行动方案(COA)、总结报告和其他可利用的战场洞察信息,帮助作战人员实现其任务目标。
图2 生成行动方案
(5)持续学习和改进模型
Donovan系统可持续学习并根据部队需求不断调整模型来满足部队需求。
5
Donovan系统的主要能力
Donovan系统的主要能力如下:
(1)情报处理和告警:能够持续更新情报信息,跟踪指挥官重点关注的内容,根据最新报告为指挥官提供决策支持。
(2)报告总结和翻译:对非结构化文件进行理解,并生成摘要,减少翻译、评估文件所需的时间,快速发现几千个文件之间的关系。
图3 报告总结和翻译
(3)生成行动方案并辅助决策:能够更快地完成决策环闭环,为作战人员提供有依据的决策。
6
美军目前的生成式人工智能测试分析
目前,美军正在开展生成式人工智能系统的测试工作,生成式人工智能在军事领域具有应用潜力的领域是指挥控制领域,生成式人工智能模型有助于综合和总结大量信息,回答广泛和具体问题,撰写初步作战方案,并提出建议。这些都是可以帮助提升人类的认知能力,使其能够更明智、更快地做出决策,并拟制敌人难以预测的行动方案。美国陆军和空军的演习中,生成式人工智能系统都帮助指挥官大幅缩短了决策时间,对于解决指挥官决策过程中的关键信息需求有较好的辅助作用。
但是,生成式人工智能技术仍存在一些缺陷,如模型产生的认知偏差、机器幻觉,训练人工智能模型的数据如果受到人为影响会对训练结果产生偏差,这也是美军成立利马工作组希望解决的问题,该工作组的成立初衷是解决生成式人工智能技术可能被误用带来的问题,并尝试发现生成式人工智能可带来的真正益处。未来,美军希望解决的生成式人工智能问题包括:如何度量模型的性能、如何制定可信赖人工智能的度量标准和框架、如何管理训练模型所用的数据等,美军也正在与商业界合作来共同解决上述问题。
来源:防务快讯