一、 核心定位与目标

本书被定义为“务实的设计指南” 。如果说作者的前作关注“构建什么”,那么本书则专注于“如何构建” 。它通过收集 2025 年智能体爆发年期间,各大模型实验室和初创公司的成功与失败案例,提炼出了一套可落地的架构范式 。 二、 主要内容模块 全书分为五个核心部分,涵盖了智能体生命周期的关键环节: * 第一部分:配置智能体 (Configure Your Agents)

探讨如何从“愿望清单”转向可运行的系统 。 *

关键范式:在白板上规划能力(Whiteboard Capabilities) 、智能体架构的演进 、动态智能体 以及人机回环(Human-in-the-Loop)设计 。 * 第二部分:上下文工程 (Engineer Agent Context)

探讨如何解决上下文溢出(Context Overflow)和模型注意力不集中的问题 。 *

关键范式:谨慎执行并行化 、子智能体间共享上下文 、上下文压缩技术 以及将错误信息反馈至上下文以实现自愈 。 * 第三部分:评估智能体响应 (Evaluate Agent Responses)

针对 AI 输出的非确定性(Nondeterministic),建立生产级评估体系 。 *

关键范式:定义失败模式(Failure Modes) 、建立测试套件 、让领域专家(SMEs)参与数据标注 以及利用“LLM-as-judge”评估生产数据 。 * 第四部分:保障智能体安全 (Secure Your Agents)

应对智能体特有的安全威胁 。 *

关键范式:预防“致命三要素” (The Lethal Trifecta:私有数据访问、不可信内容暴露、外部通信能力) 、沙盒化代码执行 以及实现细粒度的权限控制 。 * 第五部分:智能体的未来 (The Future of Agents)

展望 2025-2035 智能体十年的发展趋势,包括智能体模拟、自主学习和合成评估 。

三、 书中强调的核心观点

反对“单体巨型智能体” (Monolithic Mega-agents):建议通过迭代发现架构,从小规模的专业化专家出发,再通过路由逻辑(Router)进行协作 。 1.

上下文不仅是空间,更是艺术:单纯扩大上下文窗口并不能解决问题,过大的上下文会导致“上下文腐烂” (Context Rot),使模型失去识别重要信息的能力 。 1.

专家标注优于开发者标注:作者认为软件工程师通常不是特定领域的专家,在医疗、法律等垂直领域,必须由领域专家进行标注以建立“黄金答案”数据集 。

成为VIP会员查看完整内容
68

摘要:AI 智能体(AI Agents)——即结合了基座模型与推理、规划、记忆及工具调用能力的系统——正迅速成为自然语言意图与现实世界计算之间的实用接口。本综述综合分析了新兴的 AI 智能体架构景观,重点关注以下三个维度:(i) 审议与推理(如:思维链式分解、自我反思与验证、以及约束感知决策);(ii) 规划与控制(从反应式策略到层级化及多步规划器);(iii) 工具调用与环境交互(检索、代码执行、API 接口及多模态感知)。 我们将前序工作组织为一个统一的分类体系,涵盖了智能体组件(策略/大语言模型核心、记忆、世界模型、规划器、工具路由及批判器)、编排模式(单智能体与多智能体;中心化与去中心化协作)以及部署场景(离线分析与在线交互辅助;安全敏感型与开放式任务)。此外,本文探讨了设计的关键权衡——包括延迟与准确性、自主性与可控性、以及能力与可靠性——并强调了评估工作的复杂性,这种复杂性源于非确定性、长程信用分配(long-horizon credit assignment)、工具与环境的可变性,以及重试机制和上下文增长等隐性成本。 最后,我们总结了测量与基准测试实践(任务集、人类偏好与效能指标、约束下的成功率、鲁棒性与安全性),并指出了亟待解决的挑战,包括工具行为的验证与护栏机制、可扩展的记忆与上下文管理、智能体决策的可解释性,以及真实工作负载下的可重复评估。

1.1 动机 (Motivation)

基座模型已使自然语言成为计算的实用接口,但大多数现实任务并非单轮问答。这些任务涉及从多个来源搜集信息、维护跨时间的执行状态、在不同工具间进行选择,以及在特定约束(延迟、权限、安全和成本)下执行多步动作。AI 智能体通过将基座模型与执行循环(Execution Loop)耦合,填补了这一空白;该循环能够观察环境、制定规划、调用工具、更新记忆并验证结果 [10, 31]。换言之,智能体不仅是文本生成器,更是一个控制器,负责将意图转化为在现实世界(软件仓库、浏览器、企业系统或物理机器人)中执行的程序。

1.2 背景 (Background)

现代数字化工作分散在各种界面和 API 之中:知识分布高度碎片化(文档、数据库、仪表盘),动作通过工具介导(搜索、代码执行、工单系统),而成功与否取决于端到端的最终结果,而非回复的“似真性”(Plausibility)。由于存在幻觉(Hallucinations)、缺乏**接地性(Grounding)**以及无法执行或验证动作,纯对话系统在这些场景中往往表现不佳。工具增强(Tool-augmented)与检索增强(RAG)设计通过将断言绑定至证据,并使中间产物可检查,从而提升了可靠性 [24, 64]。模块化的工具路由(如 MRKL 风格)通过将语言理解与专用工具分离,并强制执行可审计的结构化接口,进一步提升了治理能力 [21, 50]。

1.3 综述 (Overview)

在当前时代,智能体尤为重要,原因有三: * 任务范畴扩展:从写作辅助转向工作流自动化。代码智能体可端到端解决问题 [20, 61],Web 智能体能在多变环境下操作真实网站 [14, 62, 67],企业助手则能在政策约束下编排多步操作。 * 部署模式演进:部署日益呈现出交互性长程性(Long-horizon)特征。微小错误会随时间累积,且非确定性(如采样、工具故障)使可重复性变得复杂,这促使了验证循环与基于追踪(Trace-based)评估的发展 [29, 44, 65]。 * 安全与防护压力:提示词注入(Prompt Injection)、不可信的检索内容以及具有副作用(Side-effecting)的工具,要求在最终回复之外建立深度防御的对齐机制与护栏 [5]。

目前,若干技术趋势使实用的智能体系统成为可能。基座模型提供了强大的泛化能力、指令遵循能力以及涌现的语境学习(In-context Learning)能力,支持在不重训的情况下快速适配 [9, 36]。对齐与偏好优化(如 RLHF)提升了易用性并减少了有害行为,使智能体在面对真实用户输入时更具鲁棒性 [11, 37]。工具调用通过 Schema 和 API 将语言转化为可执行动作 [40, 50],而检索与记忆则将决策锚定在外部证据和持久状态中 [24, 38, 50]。**推理与行动(Reasoning-and-acting)**的编排模式将审议与环境交互交替进行,提升了接地性并能从失败中恢复 [53, 64]。最后,多模态感知通过将语言锚定在视觉输入中,将动作空间扩展到了图形用户界面(GUI)、文档及具身环境 [26, 28, 45]。

1.4 当前局限 (Current Gaps)

尽管进展迅速,智能体系统在规模化应用中仍受限于可靠性、可重复性和治理能力。长程任务会放大复合错误,而非确定性(采样、工具变动)使得在缺乏标准化协议和完整追踪记录的情况下,评估与调试变得极其困难 [29, 30, 44]。以工具为中心的智能体也引入了新的安全风险:不可信的检索内容和提示词注入可能操纵工具的使用,且具有副作用的动作需要比纯文本审核更强的约束机制 [5, 21, 48]。最后,系统层面的权衡——如自主性 vs. 可控性延迟 vs. 可靠性以及能力 vs. 安全性——在跨领域和不同部署场景下尚未得到深入理解 [49, 66]。 本综述综合了推理、规划、工具使用及部署领域的新兴智能体架构。我们沿以下维度组织研究全景:(i) 学习策略与系统优化 (§3);(ii) 强调不同能力与评估体系的应用任务 (§5)。在全文中,我们将重点探讨循环往复的设计权衡,并强调在现实工具和环境多变性下的可重复评估

成为VIP会员查看完整内容
51

一般而言,将“思考蜂群”视为一种协同解决问题过程,其中一群个体以去中心化和自组织的方式共同工作,从而可以利用群体的集体智能,以比任何个体单独行动更有效的方式解决复杂问题。这包括之前来自生物学的例子,但其范围更广,涵盖:

  1. 生物群体:哺乳动物、昆虫、鱼类、细菌、病毒和细胞,包括人脑中的神经元
  2. 人类群体:头脑风暴会议、焦点小组、抗议活动和快闪活动
  3. 机器(机器人)群体:协同工作以执行复杂任务的物理机器人
  4. 机器(计算)群体:包括人工智能、机器人和软件病毒在内的网络机器人
  5. 人机群体:为解决复杂问题而进行的协同思考,如社交媒体、机器人牧群和僵尸网络

尽管包含排斥、对齐和吸引等简单局部社会互动规则的模型已足以生成蜂群形态,但这些来自自然的实例让我们有理由断言,还有更多可能性。本文代表了对未来技术发展的思想领导力至关重要的一小部分跨学科视角。将本书结构安排为如下所述的五个部分。

第一部分:思考蜂群的基础

“思考蜂群”这个标题有两层含义。第一,是关于蜂群的思考:它是一系列探索蜂群主题思想的文章和论文的合集。第二,是对一个更精炼理念的探索:蜂群不仅仅是遵循由简单、相同的自动机通过局部互动来实现全局效果的传统概念;而是指那些既能个体思考又能集体思考的蜂群。

第一章是一次为期一天研讨会的结果,来自学术界、工业界和政府部门的研究人员与专业人士齐聚一堂,共同探讨“思考蜂群”这一主题。该讨论的定义性特征体现在这里对“蜂群”和“思考”概念的广泛理解,以及两者如何可能交织在一起。因此,一个思考蜂群既包括个体将其能动性让渡给集体,也包括集体将其自身让渡给个体。它是由具有思考能力的实体构成的系统——这些实体拥有独立于集体之外的自身能动性、目的和“生命”,有其独特的表现形式,但它们也共享信息、目标,并可能服从于集体。

在这篇引言部分,首先探讨了群体机器人学的传统观点。第二章通过科学计量学分析了开放文献中的研究人员如何讨论自主性、集群和协同。这为术语提供了一个清晰的基线,以补充第一章提出的功能和本体论“模型”。第三章从群体智能和群体优化的视角,阐述了关于蜂群的各种定义。本章有助于形成蜂群的概念化,为后续章节奠定框架。

这三章植根于始于贝尼和王[108]的传统,但第四章带领读者开启了一段背离传统的哲学之旅,它运用“嵌合”概念,挑战了从生物学角度思考蜂群的假设。最后,本部分以探讨大众媒体如何呈现蜂群概念作结。第五章始于对认知的关切,鉴于当前全球对致命性自主武器系统的关注,这一点具有现实意义,并建立了一个基于价值的视角,为后续讨论提供参考。

第二部分:思考蜂群——行为

当人类观察任何自主系统时,他们通常首先看到的,除了其静态物理外观,就是它如何在时间和空间中动态地行为,包括孤立状态下的行为以及对刺激的响应。在第一章中,作者讨论了描述我们如何解读所看到的“具身外观”和“观察到的行为”的重要概念,提出了核心问题:外观如何影响我们对一个系统的感知,特别是其“承载价值的程度”?它如何支持“可解释性”、信任和保证等基本要求?对此,我们或许可以补充以下问题:我们看到的是否真正代表了正在发生的情况?如果不是,我们能否超越显而易见的外观,看到隐藏的东西?

作为系统的使用者和监管者,对系统的外部观察(无论是其外观还是行为)通常是我们了解系统本身、其内在能力及其倾向的唯一信息来源。作为设计者,外观(静态和动态)是将我们的设计与系统所处的更广泛社会系统联系起来的接口。系统的行为方式是我们理解、预测并最终信任该系统的基础。难以理解或混乱的行为会削弱用户的信任,但可能会增加对对手的不可预测性。合作和主动行为暗示了一定程度的智能或意图,而这种智能或意图可能并不存在,从而产生不切实际的期望。

第六章探讨了在缺乏内部知识的情况下观察一个系统时所面临的解读挑战,提出了一个诠释学框架和一种实验方法,以更好地理解我们如何解读一个系统,以及这种解读如何产生信任。然而,某些类型的行为是否或多或少更重要?诠释学的研究能否说明,一个系统表达情感或展示“助人”行为的能力,是否会以牺牲有效性为代价来增强可解释性?第七章为我们提供了一条从噪声中识别连贯行为和结构的途径。当我们观察任何大规模系统时,在混乱中发现连贯性是一个基本挑战,并且这仍然是可解释性概念的核心。第八章将故事分析和数学结合起来,应用信息论中的技术来更好地预测社会行为。作者建议,观察到的行为可以被转换并存储在信息域中,使得智能体能够在信息论领域对行为事件进行推理。

最后,本部分以两章结束。第九章通过审视海上自主系统的监管现状以及集群如何可能挑战这些方法,探讨了如何从监管角度构建行为框架的问题。第十章讨论了设计选择与所需法律之间的关系,这为前一章的监管工作提供了一个互补的视角。与第六、七章不同,这两章从一组预期的行为(合法性)出发,阐明了在现实世界条件下运行的系统产生这种行为所需的设计要求和政策选择。

第三部分:思考蜂群——拓扑与架构

与对系统外观的观察不同,底层的架构拓扑和推理机制(感知、规划和反应)是开发者做出的设计选择。它们是“如何”,而行为是“什么”。这并不意味着一个主题比另一个更重要。我们设计系统是为了展现期望的行为,并且我们根据可行的工程解决方案来调整我们的预期行为。在引言中,我们提出了以下问题:什么控制拓扑支配着系统或蜂群的功能?它是既定的、动态的还是演化的?系统如何在拓扑模型之间转换,并保持目的和功能的连贯性?“思考蜂群”如何思考?认知策略的常规流程和过程是什么,它们与其他三个主题的关系如何?

在这一系列论文中,作者探索了设计能够展现理想(或至少非不良)行为结果的系统的方法,提供了对技术途径、方法和实验结果的见解。本部分从第十一章开始,该章规定了一种架构拓扑,它提供了一个多智能体系统,能够灵活地实例化智能体(虚拟和真实)社群,这些智能体可以在动态环境中进行交流和协作。他们的工作建立在帕斯克的“对话骨架”基础上,通过引入态势感知、意义建构以及诸如“框架”和“类比”等叙事手段来扩展它。

第十二章提出了一种仅使用局部互动和通用通信拓扑的控制机制,以从多智能体系统中产生不同的行为模式,突出了一种通过局部互动和简单认知架构来实现行为属性的方法。最后,第十三章涵盖广泛领域,包括对集群系统各要素的全面回顾。为此,它与本文的许多主题层面都相关。然而,吉汉在水下集群机器人学挑战背景下对集群架构的回顾尤其值得注意,不一定是因为它全面,而是因为它突出了由施加于工程师的概念性假设和限制所产生的拓扑架构。尚待回答的问题是,随着自主性的发展,这些假设是否仍然有效。

第四部分:思考蜂群——认知

认知是思考的核心。在前面的部分中,我们提出了定义、形式和行为以及拓扑。所有这些对于实现有效且合乎道德地使用群体机器人学的目标都至关重要。然而,任何自主系统,尤其是思考蜂群的核心,是其接收输入、根据其“所知”和“意图”进行校准,然后行动的过程。

机器认知,即使在单个系统中,也是一个在学术文献中已经并将继续深入探讨的主题。本部分从三个视角探讨了蜂群可能如何思考,以及这种认知过程如何能支持智能的集体和个体行为。这三章中的每一章都对蜂群如何思考和学习的概念提出了不同的视角。前两章明确地在向蜂群传授行为的背景下解决了这个问题。第三章将多种机器认知方法综合成一个更复杂的整体。

第十四章探讨了使用遗传算法框架,并利用模拟让集群智能体在一个网络因局部效应而中断的复杂环境中,通过行为测试、构建/进化和选择的过程(该过程使用模式匹配规则来实现变化环境中的选择),学习如何进行最佳通信,从而在蜂群中灌输丰富行为的挑战。

第十五章提出了一个课程体系,以系统化学习过程,并在设计行为中融入专家知识,重点讨论了三种课程设计方法,即以学习者为中心、以教师为中心和混合式,并使用了一系列案例研究。史密斯和侯赛因从概念对立面共同考察了行为。

第十六章在很多方面是本书的完美结尾。约翰逊等人是试图为终端用户解决现实世界中端到端集群问题的现场机器人专家。他们的章节从人类意图、人类和机器人感知的概念开始,通过应用从机器学习到信息熵的一系列技术,部署了一个多机器人系统,该系统能动态地(个体和集体)响应人类在地面上的行为,同时协调整个系统的努力以实现全局效果。

第五部分:思考蜂群——未来之路

第十七章通过汲取所有章节的线索,提出了仍悬而未决或至少需要进一步研究的问题,以此作为本书的总结。本章探讨了各种各样的问题,从社会科学和人文问题,到关于建模、模拟和机器人学的技术问题。

成为VIP会员查看完整内容
47

军事决策过程(MDMP)是一种系统化、迭代式的方法,旨在分析复杂情况并制定有效的作战计划。尽管在高级参谋层级存在AI工具,但在营级层级仍存在显著空白,此类自动化系统几乎不存在,这为提升效率提供了机会。本文介绍了我们通过开发基于文本的AI工具来解决这一缺陷的研究,该工具旨在自动化MDMP过程中的行动方案(CoA)制定步骤,专门用于营级规划。采用的方法包括理解作战需求、构建定制AI模型,并针对真实战术场景检验模型能力。我们的研究结果显示出细微差别。虽然我们的解决方案在简化特定场景的计划生成方面展现出潜力,但也暴露了当前大语言模型(LLMs)固有的局限性,包括数据解释、集成和生成一致输出方面的问题。面临的挑战包括缺乏稳健的视觉图形集成或输出。这些发现警示了在当前状态下使用AI规划工具的风险,并为未来研究提出了建议,主张在领域特定数据集上增强模型训练和视觉数据集成,这可以提升AI在军事规划背景下的有效性。从我们的探索中得出的见解有助于奠定对AI在军事行动中作用的基础理解,并为自动化战术决策框架的进一步发展铺平道路。

本文结构如下:第2节详细介绍了我们的AI辅助工具开发方法和测试案例。第3节展示了测试案例结果和关键经验教训。第4节在更广泛背景下检视我们的发现,并识别军事AI规划工具的更广泛局限性。第5节以对未来工作的建议作为结论。

一、研究背景与意义

本论文针对美国国防部在营级战术规划中存在的自动化工具缺失问题,开展了一项创新性研究。军事决策过程(MDMP)作为美军系统性作战规划方法,在高级参谋层面已存在AI辅助工具,但在营级作战单位却几乎没有任何自动化系统支持。这一空白为提升作战效率提供了重要机会。

研究团队通过美国小企业创新研究计划(SBIR)提出的挑战,开发了基于文本的AI工具,专门用于自动化MDMP过程中的行动方案(CoA)制定步骤。该研究不仅展示了AI在特定场景下简化计划生成的潜力,同时揭示了当前大语言模型在军事规划应用中存在的根本性局限。

二、研究方法论

2.1 技术架构设计

研究团队采用三阶段策略:探索性研究、原型开发、测试与持续开发。在技术选型上,基于以下需求考量:

  • 处理军事条令和战术文档的能力
  • 可搜索的数据库存储
  • 按需相关信息检索
  • 依据军事条令生成战术计划

团队选择检索增强生成(RAG) 技术路线,该方案允许模型从外部知识源(如向量数据库)检索相关信息来增强文本生成过程。具体实施采用Palantir Technologies的AI平台(AIP),该平台提供云托管、文档导入简化等优势,且美军已在安全网络中使用Palantir工具,增强了部署的现实性。

2.2 测试框架设计

研究团队设计了五个测试套件,系统评估模型性能:

测试套件Alpha:聚焦于提示设计和模型设置对生成营级作战命令(OPORD)的影响,评估系统提示、任务提示和温度设置三个关键变量。

测试套件Bravo:测试模型在生成火力计划产品方面的条令推理能力,包括火力概念(CoF)和资产同步矩阵等需要结构化推理的规划产品。

测试套件Charline:评估连级战术规划中的推理能力,使用最详细的场景描述来检验模型的实际战术规划能力。

测试套件Delta:评估生成符合条令的营级行动方案的能力,重点关注与上级指令的一致性、连贯的分阶段机动规划等五个关键要求。

测试套件Echo:比较不同模型和配置在战术规划任务中的性能表现,寻找最优设置。

三、核心研究发现

3.1 提示工程的关键作用

测试套件Alpha的结果表明,系统提示B与更具指导性的任务提示B组合,配合温度设置0.7,能够产生最详细和战术有用的输出。评估采用五类评分标准:结构遵循性、单位任务特异性、条令合理性、灵活性和执行准备度。

表1展示了详细的评估标准,其中5分代表符合标准的即用型OPORD,1分代表不可用或严重错误的OPORD。结果显示,优化提示设计结合适度可变性模型配置,能显著提升生成可用营级OPORD的能力。

3.2 结构化输出的可靠性

测试套件Bravo发现,当通过系统提示或用户提示提供定义好的模板时,模型展现出生成结构化规划产品的一致能力。虽然输出保真度在迭代间略有变化,但模型总体上能够遵循条令结构和格式期望。

生成的资产同步矩阵同样显示了连贯的任务分配,将飞机分配到适当的时间块和任务角色中。这表明LLM在良好结构的提示和条令模板指导下,能够可靠生成详细、战术准确的规划产品。

3.3 连级规划的能力与风险

测试套件Charline揭示了模型在连级作战命令生成中的双重表现:一方面,模型在没有格式化模板或结构化指导的情况下,成功将书面战术场景转化为协调三个机动排的连贯CoA叙事;另一方面,发现了一个关键安全缺陷——模型指示Alpha排的火力支援元素向攻击部队的进入点转移火力,这一基本战术错误违背了标准条令,会造成高误伤风险。

这一疏忽表明模型缺乏内部安全验证机制,即使是新手指挥官通常也会应用这种验证。此外,模型将地形处理为文本而非三维空间,导致分配了可能缺乏实际视线的火力位置。

3.4 多模型性能比较

测试套件Echo发现,基于GPT-4o的架构始终优于其他替代方案,在大多数类别中获得了完美的结构分数(10分)和近乎完美的连贯性评级。而GPT-3.5表现出混合的连贯能力,经常省略整个必需部分。Claude 3.7在生成连贯的指挥官意图和作战概念方面优于Gemini 1.5。

温度测试(0.7对比0)证实了早期测试套件的发现:较高设置会略微降低输出结构,同时保持相似的连贯性水平,允许增加新颖性而不牺牲操作可用性。

四、技术局限性分析

4.1 视觉能力缺失

有效的任务规划不仅需要理解书面命令和条令指导,还需要解析视觉输入的能力,特别是卫星图像、战术地图和规划幻灯片。然而,当前模型缺乏空间推理和视觉解析能力,无法深入分析地形或从图像输入中应用军事符号系统。

4.2 信任与可解释性问题

使用当前可用的AI规划工具需要对其成功性抱有盲目信任。LLM规划器无法一致地列出或解释其考虑或忽略了哪些因素,这本质上是一个可解释性问题:模型无法解释其如何基于输入和权重达成决策,人类操作员也无法验证给定输出。

4.3 数据访问限制

军事作战命令、行动方案示例以及真实作战中成败分析等数据几乎都是机密信息,无法用于训练非密模型。本研究项目必须在非密级别创建特定的模板和示例,这些模板和示例经过简化但随时间推移越来越详细。

4.4 单次执行限制

Palantir AIP平台设计为连续管道,不适用于反馈用户修正。对于可能希望向AI代理输入新细节或修正的任务规划人员来说,这种工作流程并非最优。

五、未来研究方向

5.1 空间智能集成

前沿多模态深度学习模型有望克服许多现有限制。这一发展轨迹与AI研究的更广泛发展相一致,领先学者将空间智能视为生成式AI的下一个关键前沿。世界实验室的Fei-Fei Li等行业领袖正在推广“空间智能AI”,通过大世界模型(LWM)来“感知、生成和与3D世界交互”。

5.2 基于代理的模拟环境

添加基于代理的模拟环境和反馈循环将显著增强系统评估和改进自身计划的能力。通过在动态交互环境中模拟AI生成的CoA,系统可以识别弱点,如暴露的路线、不良时机或有缺陷的任务组织。反馈循环将允许系统基于模拟结果修订其计划,随时间提高战术真实性和适应性。

5.3 人机协作优化

需要从将AI视为武器平台转向将其视为非直接战斗问题的解决方案提供者,这些问题仍然受到有意义的人类控制。AI工具可以协助减少认知偏见和时间强度,但不应完全取代军事背景下的人类决策者。

六、结论与启示

本研究通过系统性的测试框架,揭示了LLM在战术任务规划中的实际能力与局限。研究表明,虽然现有技术能够生成结构良好的战术规划文档,但在实战可靠性、安全性和空间推理方面仍存在重大挑战。

最重要的是,研究发现即使模型能够生成条令对齐的计划,人类验证对于作战可靠性仍然至关重要。当前LLM可以支持最小指导下的连级规划,但基本战术错误的风险要求保持严格的人类监督机制。

未来的研究应当聚焦于开发集成空间推理、视觉理解和动态模拟的下一代规划系统,同时建立相应的人机协作框架,确保AI在军事规划中的应用既高效又安全。这一研究为理解AI在军事行动中的作用奠定了基础,为自动化战术决策框架的进一步发展铺平了道路。

本研究的实际意义在于为国防部门提供了明确的技术路线图:在追求自动化效率的同时,必须投资于安全验证机制和人类监督系统,确保AI辅助规划既提升效率又不牺牲战术可靠性和人员安全。

成为VIP会员查看完整内容
42

**

**

**

**

本手册系统阐述了AI智能体(AI Agents)如何赋能企业,通过自动化复杂工作流程、提升信息处理与决策效率,实现“更智能地工作”。报告基于Google Cloud及其Gemini平台的技术能力,展示了10个可直接部署的AI智能体应用场景,旨在帮助企业降低成本、节省时间并创造指数级价值。 核心价值与趋势

AI智能体超越了传统自动化工具或聊天机器人,能够代表员工执行包含信息搜集、深度理解、决策与行动在内的端到端任务。预测显示,到2028年,33%的企业软件将包含智能体AI,自主完成15%的日常工作决策。AI智能体通过整合内外部数据源、利用专业知识库并代表员工行动,正重新定义“常规工作”。 十大应用场景概览

企业数据智能搜索:通过统一的多模态搜索(如Gemini Enterprise),员工可瞬时跨文档、邮件、CRM等系统获取信息,无需切换应用,奠定智能体AI的数据基础。 1. 复杂文档转播客:利用预构建智能体(如NotebookLM),将财务报告、市场分析等复杂文档转换为易于消化的音频摘要,提升信息吸收效率。 1. 分钟级创意生成:借助“创意生成”智能体,通过多智能体协作生成、评估并筛选海量想法,快速产出最优方案清单,加速产品与战略创新。 1. 按需专家咨询:“深度研究”智能体可根据单一指令,制定研究计划,从网络及企业内数百个来源获取信息,并综合生成深度主题报告,助员工快速掌握新领域。 1. 多智能体规模化个性化客服:结合Customer Engagement Suite与Gemini Enterprise,构建可自动响应查询、提供实时坐席辅助、并生成运营洞察的多智能体系统,提升客服效率与客户体验。 1. 提升营销参与与转化率:智能体连接关键营销系统,分析客户数据,自动生成符合品牌调性的个性化内容,助力策划与优化高互动、高转化营销活动。 1. 缩短销售周期:为销售团队提供跨部门客户信息即时访问,自动化文档查找、潜在客户分析及行政任务,使其更专注于客户关系培育。 1. 提示级代码调试与优化:集成至开发流程的智能体(如Gemini Code Assist)可协助分析日志、识别代码模式与瓶颈,复用现有代码,自动化故障排查,提升开发效率。 1. 简化人力资源流程:智能体连接HR系统,自动化入职管理、政策查询、员工情绪分析与培训计划制定,提升HR运营效率与员工体验。 1. 构建专属AI智能体:通过“智能体库”(Agent Gallery)使用预构建方案,或通过“智能体设计器”(Agent Designer)以无代码方式创建连接企业数据的定制化智能体,赋能每位员工解决特定工作流问题。

实施路径与技术基础

技术栈:Google Cloud的Gemini Enterprise与Vertex AI平台构成了智能体能力的核心,提供统一搜索、多模态理解、安全数据连接及智能体构建与管理工具。 * 可访问性:企业可根据需求,从使用预构建智能体、通过无代码界面自定义,到由开发者在Vertex AI上深度构建,灵活开启智能体之旅。 * 互操作性:支持开放的Agent2Agent协议,确保与不同平台构建的智能体及数据源的互连。

结论

AI智能体正从客户服务、营销销售延伸至研发、人力资源等全业务流程,驱动根本性的效率变革与价值创造。本手册通过具体场景、客户案例(如Seattle Children’s、Verizon、Decathlon)及实操提示,为企业提供了部署AI智能体的清晰路线图,标志着工作方式向更智能、协作和自动化方向的演进已进入大规模实践阶段。

成为VIP会员查看完整内容
41

技术对冲突与战争的影响是复杂的,且可追溯至远古时期,它不断迫使冲突与战争的特征发生转变,并促使人类持续进行适应过程。然而近几十年的数字革命已将变革的速度和规模提升到如此程度,以至于等式中的人力一方难以跟上步伐。人类的态度与行为、法律、伦理、流程和制度的演进更为缓慢。但恰恰是人与技术之间接口的质量,决定了二者在冲突中配对的效能。本书审视了人类如何与技术接口及融合的多个方面,为“心智-技术联结”提供了重要的脉络勾勒。

本书共有六个部分,下文将予以说明。本书作者们所呈现的学术与实务专长,并不能指望为“心智-技术联结”所引发的诸多问题提供全部答案。相反,我们希望本书能开启视野,并帮助构建出更好的问题。

第一部分:心智-技术熔炉:创新与伦理

本书开篇探讨构建心智-技术能力的基础性问题。第一章探讨了人工智能在美国军方等组织中的应用,以及它们如何应对在此关键时刻出现的独特挑战,例如自动化偏见——即人类操作员倾向于将责任卸给他们所操作的自动化工具的趋势。在第二章中,詹姆斯·乔达诺提出了社会在构建“心智-技术联结”时必须提出的关键伦理问题。他以神经科学和技术当前及新兴的发展作为“心智-技术”融合最字面化的范例。

第二部分:新战争迷雾中的指挥、控制与情报

当寻求将致命武力应用于正确区域或控制升级中的冲突时,没有什么问题比“我们感知到了什么?”更重要。但感知并非如此简单。卡尔·冯·克劳塞维茨描述了拿破仑时代冲突中的“战争迷雾”,但这同样适用于此前及之后的每一场重大较量,并且必将弥漫于未来通过运用人工智能等技术的一整套系统所进行的较量中。迷雾依然存在,但其特性已发生变化。

已经从肉眼到望远镜,再到雷达,经历了官僚体系中的不同思考层次——如今越来越多的传感器将产生更多数据,然后更多的人工智能将帮助将这些数据转化为更多信息。例如,在大国竞争场景中,各方将通过更多技术层面来感知世界。分析人员和决策者应如何依赖每一个新的信息源,权衡不同信息源的重要性,整合它们,或考虑其效用如何随情境变化?如果新系统被欺骗了呢?成功需要能够共同管理这种新型“迷雾”的人与机器,以不仅在数据和信息上占据优势,在知识与智慧上也同样如此。

在第三章中,英国政府通信总部前主任戴维·奥曼德爵士探讨了情报史上的经验教训,这些教训为“心智-技术联结”提供了借鉴。可以预期,“心智-技术联结”未来的科学突破(例如,大规模利用量子计算)必将带来新的信息优势。

第四章从应对战争迷雾的作战人员的视角出发——例如上世纪80年代悲剧性击落民用客机的“文森尼斯”号巡洋舰上的官兵。他们阐明了过去在人机协同方面汲取的教训,当前使人机协同成为可能所需的赋能因素,以及未来人机协同的愿景。

但感知仅仅是做出并传达更好、更快、更明智决策的输入。在最基本的层面上,指挥与控制体现了国防部如何做出作战决策。正如德军在1940年5月所展示的,比竞争对手更快决策和执行联合行动的能力能产生毁灭性效果。指挥与控制的未来是什么?人类的指挥官和参谋人员将是成功——与失败——的核心。技术将至关重要,而我们应对指挥与控制之道最显著的变化可能来自信息技术、传感器、人工智能和自动化的飞速发展。这些人与机器如何接口与融合,将成为成功的决策支持、作战管理、后勤保障以及跨多个权力杠杆整合的关键。

第五章中,蒂姆·格雷森(国防高级研究计划局战略技术办公室前主任,近期担任空军部长高级顾问)剖析了博伊德著名的“观察-调整-决策-行动”循环,为在人与机器之间分配决策的认知负荷提供了一个模板。随着迈向日益复杂的战区、战略和企业级问题,我们需要像操作员一样思考,开发类似的人工智能驱动决策辅助工具,并以同等的作战实用性和速度行动——避免陷入将本已高度复杂的挑战过度复杂化的体制陷阱。

在第六章中,迈克尔·格罗恩中将(美国海军陆战队退役,联合人工智能中心前主任)为国防领域的心智-技术协同提供了一个令人信服的愿景,这必须同时利用整合与想象力。

在第七章中,约翰(杰克)·N·T·沙纳汉中将(美国空军退役,联合人工智能中心创始主任)认为,人类正在见证人类历史上第三次重大革命——数字革命——的早期轮廓,这场革命在新旧技术所产生的效应上存在根本差异。优化人类与人工智能赋能机器的整合,取决于重新设计人机接口,以及重新校准和平衡人与机器的角色与责任——这将是我们这个时代未来军事与情报行动的核心。

第三部分:效能增强

本节论述“心智-技术联结”不断变化的方面将如何影响单兵作战人员。第八章审视了新的技术驱动因素,包括新型传感器、人工智能、生成式人工智能、脑机接口、认知增强药物、大规模个性化以及用于监测参战人员生理状态的技术。在美国,作战人员的效能可能在毫秒级到数年级的时间尺度上以多种方式得到增强,美国应如何制定策略在此世界中展开竞争,并恪守其价值观?

第九章,威廉·凯斯比尔(前空军军官,曾在国防高级研究计划局领导神经科学和生理学方面的创新工作,后转入私营部门)讨论了生理智能的前景。通过可穿戴传感器进行的广泛数据收集以及日益增长的实验数据表明,评估和预测作战人员在关键任务上的表现具有广阔前景。这种能力有助于提升盟军人员的表现,并能更好刻画敌军的优势与弱点。

第十章介绍了用于生理监测的民用技术。他探讨了这些技术如何能适配于军事用途——展示了这个时代“心智-技术联结”关键的双重用途性质。他还解释了如何通过有原则地应用这些技术,以确定当前哪些能够有效量化,哪些还不能。

第四部分:中国与俄罗斯的心智-技术

1939年,苏联入侵芬兰。人数处于劣势但机动灵活的芬兰部队所造成的重创,使许多人认为苏联军队腐朽而软弱。然而两年之内,苏联就学会了如何应对德国的闪电战,将人的因素与T-34坦克等卓越装备相结合。从摧毁了大半个欧洲的世界大战的灰烬中,苏联于1945年崛起为一个真正的超级大国。1957年,它发射了斯普特尼克号——世界上第一颗人造卫星,证明苏联在某些关键战略技术上已经超越了美国。

低估对手的学习或创新能力很少会有好结果。2022年,许多西方观察家在俄罗斯乌克兰全面战争期间嘲笑其适应能力,但到2023年底,俄罗斯已明确展现出其学习和适应的能力——尤其是在操作FPV无人机方面。俄罗斯在叙利亚的战争实验室中进行了学习,并且正在乌克兰学习。其仍然是印度的主要武器供应国。俄罗斯多年来也一直在思考如何将新技术与人的因素结合起来。不受许多束缚西方大国的伦理顾虑的约束,俄罗斯的创新构成了清晰而重大的威胁。

第十一章探讨了俄罗斯军方尝试用现代技术提升人类作战人员能力的工作。虽然俄罗斯对乌克兰行动暴露了其在军事技术、概念和人员运用方面的问题,但负责构思高科技作战的俄罗斯军事机构、院校、国防工业企业和研发中心,始终保持着对人与技术联结的关注。

中国现在擅长从人工智能到量子的各种技术。中国现在拥有技术,而且中国已证明他们拥有战斗的意志和技能——但将二者结合起来的“心智-技术联结”又如何呢?最近的研究表明,“心智-技术联结”是一个日益关键的领域,尤其是在中国的思维中。在这个至关重要的战争领域,中国能否超越美国?

第十二章描述了认知域在冲突中取得胜利的至高重要性,特别突出了心理过程与技术接口的融合。

第五部分:意志与效能抑制问题

如果单兵作战人员或整个军事单位缺乏战斗意志,那么世界上所有的技术——即使是最好的技术——也无法保证战争的成功。哪些因素激励士兵勇敢作战?或者导致其无法做到?当今使用的技术以及为未来战场开发的技术将如何影响战斗意志?

第五部分审视个体和小单位层面的决心、勇气、胆量和意志,以及在我们这个新技术时代如何利用这些特质。还探讨了对手的信息作战如何能够针对这些因素——以及美国及其盟友如何防御此类行动。

第十三章将人描述为“心智-技术联结”中最重要的元素。目前在对人类增强、监测以及人机编队的投资上,优先顺序是错误的。技术设计和快速列装优先于有条不紊的研究,以预测新技术对预期使用和应用的士兵造成的认知和心理影响。他提出了弥补这一差距的方法。

第十四章,理解神经科学在影响“战斗意志”方面能做什么和不能做什么,取决于更广泛地将军事组织理解为一个复杂系统,其中士兵之间的关系与士兵本身同样重要。从复杂系统的视角看待战斗意志,为神经科学的发现贡献于战斗意志创造了空间。同时,这为设定切合实际的期望、有效性衡量标准以及在个体和群体层面提高军事效能的努力之间进行权衡建立了一个框架。

第十五章,对手可能如何利用信息作战来削弱联合部队及盟国军队的军事效能。生成式人工智能将如何影响此类信息作战?“深度伪造”已经出现,“元宇宙”又如何?人类认知将始终是信息作战的最终目标,而人类认知始终存在弱点。影响力行动的大规模个性化即将到来;对抗它需要新的人机团队和组织。

第六部分:来自人类的结论——与来自机器的结论

第十六章包含了由三个人——本书的三位编者——撰写的结论。旨在用人类大脑将本书的不同线索汇聚起来。勾勒出可能的前进道路——这是这些人类作者基于为本书供稿的众多专家的见解所提出的。

第十七章探索生成式人工智能这项非凡的新技术如何与人类接口和融合。毕竟,大型的新模型是从人类这里学习的。

第十八章呈现由生成式人工智能撰写的结论。将看到生成式人工智能从本书中获取了什么,以及它能为国家安全实践者制造出什么产品。本章包含几个由生成式人工智能创造的作品,包括摘要、潜在的指标与警告,以及模仿现实世界实践者风格的见解。

成为VIP会员查看完整内容
35

有人-无人编队(MUM-T)运用概念被认为是美国陆军航空兵的战斗力倍增器。这种有人与无人平台的协同运用能产生增强的态势感知能力、更高的杀伤力以及改进的生存能力。协同无人有人智能编队(SUMIT)项目是一个6.3级科技项目,旨在评估执行MUM-T想定期间,创新自主性、决策辅助和人机接口技术对空中任务指挥官的影响。SUMIT的主要目的是识别能够提升战斗效能的有人-无人编队(MUM-T)系统能力,并就评估这些能力的度量标准提供建议。

美国陆军战斗能力发展司令部航空与导弹中心招募了40名具有相关经验的志愿者参与者,在可重构旋翼飞行模拟器中完成具有挑战性的MUM-T想定片段。在利用集成的供应商建议设计方案进行的五轮系统评估过程中,结果表明存在许多有影响力的能力,值得纳入未来陆军MUM-T系统并进行进一步评估。这些能力包括辅助目标识别、协同交战、高层级任务分配、任务共享、任务排队、按需信息提供、自动化透明度、传感器扫描历史与当前扫描状态、任务完成通知、即时直接控制可用性以及快速应对突发威胁的能力。本报告描述了征集创新MUM-T设计解决方案的过程、用于评估这些方案的方法,以及由此得出的结论,这些结论识别了能提升战斗效能的MUM-T系统能力,并为未来MUM-T系统评估工作提供了方法论建议。

A. 背景

有人-无人编队(MUM-T)是美国陆军航空兵的一项关键能力和战斗力倍增器。纳入MUM-T能力——定义为有人与无人平台的协同运用——能够驱动增强的态势感知、更高的杀伤力和改进的生存能力。结合有人和无人平台的固有优势可产生协同效应和压倒性优势,形成不对称优势。美国陆军MUM-T系统通过使旋翼航空器操作员能够利用无人航空系统来实现这一点,从而提供增加的战场空间感知能力和效应范围。这种额外的信息以已知威胁位置和沿飞行路线的飞行危险、已知的阵地安全性、发射阵位对目标的视线、以及目标区域内友军、威胁和平民的已知位置等形式呈现。此外,有人平台能够执行协同交战以在不暴露自身的情况下打击目标,并获得自上而下的战损和武器效应全景。主要挑战在于如何向操作员(例如空中任务指挥官)提供这种增加了的信息量和控制权,而不会使其信息过载或分散其在战场上本已极其繁重任务的注意力。基于可靠的人因工程和人与系统集成原则进行适当设计,集成的MUM-T能力可以在降低人员生命风险的同时,提高态势感知和任务效能。

B. 当前有人-无人编队的局限性

当前的MUM-T系统,例如AH-64E“阿帕奇”副驾驶射手站中的系统,存在显著局限性。按设计,AH-64E MUM-T系统可以有效地在互操作性等级3级运行,允许副驾驶射手接收并控制来自单一UAS的传感器有效载荷视频,但由于需要持续手动控制传感器和副驾驶射手持续进行视觉信息处理,该控制界面带来了高工作负荷。尽管AH-64E MUM-T系统可以提供LOI 4级控制(允许除起飞和着陆外对飞行器平台进行指挥控制),但为了保持对飞行器位置、朝向和周围环境的感知而进一步增加的认知负荷,导致陆军MUM-T用户在战斗中很少使用LOI 4级UAS控制。其他局限性包括依赖数十个面板按钮,要求副驾驶射手记住三级深度的面板按钮菜单层级结构;在UAS资产之间切换的复杂连接程序;以及对于已搜索区域缺乏视觉反馈。随着陆军开发未来垂直起降下一代航空平台,改进MUM-T界面设计以克服这些局限性、提供直观的多飞行器指挥控制系统的时机已经成熟。

C. 协同无人有人智能编队的目的

美国陆军战斗能力发展司令部航空与导弹中心设计并执行了协同无人有人智能编队(SUMIT)项目,主要出于两个目的:确定哪些能力将提高未来MUM-T系统的战斗效能,并识别和推荐评估此影响的度量标准。SUMIT的次要目的是开发和演示一种模块化开放系统架构研究飞行模拟器,该模拟器可以大大减少集成第三方软件和硬件设计概念所需的时间,以用于后续的测试、演示和评估。这项工作的成果是未来MUM-T技术系统的构建模块。这些构建模块将使陆军能够在技术投资、研究和开发方面做出明智的决策。

SUMIT项目始于一份广泛机构公告,该公告征集创新的MUM-T设计解决方案以支持两轮评估。SUMIT广泛机构公告的既定目标是评估新的和近期的自主性、决策辅助和人机接口技术在执行利用MUM-T能力的美国陆军航空兵任务中的影响。SUMIT项目的总体方法是让经验丰富的美国陆军航空兵在政府拥有的可重构研究飞行模拟器中执行真实的MUM-T任务。通过对多个创新的MUM-T设计解决方案进行集成和执行探索性评估,SUMIT项目旨在为美国陆军航空兵如何评估未来平台的新型MUM-T系统提供信息。为此,政府寻求供应商的设计解决方案来执行许多复杂的功能能力。通过SUMIT广泛机构公告寻求的部分能力如下所示:

• 任务规划
• 团队与协作管理
• 对实时任务执行的监督
• 针对环境事件或变化为团队进行动态重新规划
• 根据资产或子团队的性能特征为其分配任务
• 协调资产之间的目标移交
• 为团队中的所有资产创建并协调路线计划
• 为团队态势感知提供持续的状态更新
• 支持LOI 2-5的控制权移交
• 跟踪实体位置数据
• 维护限制空域数据
• 协助空中任务指挥官进行目标交战射击方案制定

在随后的方案评估和选择之后,三家供应商获得合同奖励,以开发其MUM-T软件设计解决方案并将其集成到政府拥有的未来开放旋翼机座舱环境固定基研究飞行模拟器中,如第二.B节所示。未来开放旋翼机座舱环境模拟器是可重构的,能够评估创新的MUM-T设计解决方案和能力。未来开放旋翼机座舱环境团队与供应商合作,快速集成新型MUM-T系统进行评估。Infoscitex公司开发了“自主性协同无人与有人系统任务分配与执行”系统,如图1所示。Toyon Research公司开发了“去中心化资产管理器”,如图2所示。通用电气航空事业部开发了“任务操作管理系统”,如图3所示。

在将这些系统集成到未来开放旋翼机座舱环境模拟器之后,SUMIT团队邀请了实验试飞员以及具有相关作战经验的退役和现役美国陆军航空兵,执行一系列任务想定片段,以协助政府评估MUM-T能力对空中任务指挥官角色的影响。这些评估为士兵提供了与一项科技项目的接触点,该项目将直接影响未来作战人员的效能。SUMIT项目并非旨在通过竞争性筛选来确定哪种设计解决方案最优。相反,采用探索性评估方法被认为更符合SUMIT的目标,即识别有影响力的能力和度量标准。因此,本研究的主要结论来源于对飞行员反馈、主题专家和评估员观察结果以及已定义的、可追溯的度量标准进行的综合归纳。

成为VIP会员查看完整内容
36

近年来,美国海军和美国空军正式在各自条令中采纳了任务式指挥。这对两个军种而言均标志着一种转变,据称它们此前曾过度集中化指挥与控制。转向更为分散的指挥与控制,部分是为了应对大国日益增长的威胁。各方普遍预期,在与美国发生武装冲突时,对手会攻击并破坏美军的指挥与控制体系,而分散化指挥与控制将使美军在此类攻击下不易陷入瘫痪。然而,在各军种正在制定的作战概念中,也存在一些要求指挥与控制集中化的要素。此外,部分观点主张应扩展任务式指挥的概念,以纳入相关指挥官之间基于共享理解和上级指挥官意图的、参与部队行动的“横向”协调与同步。

表:美空军2021年版《空军条令文件1:空军》中界定的集中指挥、分布式控制与分散执行原则

集中指挥
集中指挥赋予指挥官(通常为联合部队空中组成部队指挥官)运用任务式指挥这一指挥控制理念来规划、指导与协调军事行动的职责权力。它使空中组成部队指挥官能够应对环境变化,并实现优先级排序与平衡,同时仍允许下级层级发挥主动性。它在作战层级保持了灵活性与多能性。

分布式控制
分布式控制使指挥官(通常为联合部队空中组成部队指挥官)能够将规划与协调活动委派到分散地点或下级层级,以实现有效的控制幅度。它允许下级指挥官基于清晰传达的指挥官意图,应对作战环境变化并利用稍纵即逝的机会。指挥官应通过任务式命令及否决式指挥,在力所能及的最低层级向下级赋权。

分散执行
分散执行是通过授权以实现有效的控制幅度,并在战术层面培养有纪律的主动性。它允许下级在动态情况下利用稍纵即逝的机会。为实现分散执行,联合部队空中组成部队指挥官及下级层级运用任务式命令并清晰传达指挥官意图,以赋能前线决策者(例如,打击编队领队、空战管制官、前沿空中管制员),使其做出有效的现场决策。

提纲

引言:军事指挥与控制中的集中化与分散化

  1. 何为“任务式指挥”?

  2. 美国空军:从“集中控制”到“分布式控制”
    (1) “集中控制与分散执行”作为空中力量的“基本组织原则”
    (2) 对集中控制与分散执行原则及任务式指挥的拟议修改
    (3) 敏捷战斗部署中的任务式指挥

  3. 美国海军:分布式海上行动与任务式指挥
    (1) 海军指挥与控制的集中化
    (2) 海军内部对任务式指挥的呼吁

  4. 分布式行动中的“统一行动”
    (1) 部队分散与火力集中
    (2) 任务式指挥中的横向协调

结论:任务式指挥中的分散化与统一行动

成为VIP会员查看完整内容
34
登陆后查看更多精品内容
VIP会员
本周荟萃主题
区块链
区块链(Blockchain)是由节点参与的分布式数据库系统,它的特点是不可更改,不可伪造,也可以将其理解为账簿系统(ledger)。它是比特币的一个重要概念,完整比特币区块链的副本,记录了其代币(token)的每一笔交易。通过这些信息,我们可以找到每一个地址,在历史上任何一点所拥有的价值。
深度学习
机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。
机器学习
“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。”

——中文维基百科
强化学习
强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。
推荐系统
推荐系统,是指根据用户的习惯、偏好或兴趣,从不断到来的大规模信息中识别满足用户兴趣的信息的过程。推荐推荐任务中的信息往往称为物品(Item)。根据具体应用背景的不同,这些物品可以是新闻、电影、音乐、广告、商品等各种对象。推荐系统利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,个性化推荐系统应运而生。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。
卷积神经网络
在深度学习中,卷积神经网络(CNN或ConvNet)是一类深度神经网络,最常用于分析视觉图像。基于它们的共享权重架构和平移不变性特征,它们也被称为位移不变或空间不变的人工神经网络(SIANN)。它们在图像和视频识别,推荐系统,图像分类,医学图像分析,自然语言处理,和财务时间序列中都有应用。
计算机网络
计算机网络( Computer Networks )指将地理位置不同的多台计算机及其外部设备,通过通信线路连接起来,在网络操作系统及网络通信协议的管理和协调下,实现资源共享和信息传递的计算机系统。
命名实体识别
命名实体识别(NER)(也称为实体标识,实体组块和实体提取)是信息抽取的子任务,旨在将非结构化文本中提到的命名实体定位和分类为预定义类别,例如人员姓名、地名、机构名、专有名词等。
机器翻译
机器翻译,又称为自动翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。它是计算语言学的一个分支,是人工智能的终极目标之一,具有重要的科学研究价值。
计算机视觉
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。
微信扫码咨询专知VIP会员