《信任但需验证：军事决策背景下的大型语言模型品格、能力与控制》2026最新59页报告 - 专知VIP

会员服务 ·

13

军事防务 · 大型语言模型 ·

《信任但需验证：军事决策背景下的大型语言模型品格、能力与控制》2026最新59页报告

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

随着大型语言模型从语言奇观演变为战略工具，军方必须面对一个关键问题：何时以及如何能够信任这些机器？本文提出一个务实的框架，用于评估大型语言模型在军事决策背景下的可信度。借鉴成熟的人类信任模型并针对算法时代进行调整，“信任三角”——品格、能力与控制——为高级军事领导者提供了一种结构化方法，用以评估旨在增强而非取代人类判断的大型语言模型。

分析涵盖了军事决策支持的全过程，从数据聚合到兵棋推演与规划。分析表明，尽管大型语言模型在加速常规参谋任务方面已具实用性，但将其整合到更具分析性和操作性的角色中，则需要新的可信度标准。利用源自TrustLLM评估套件的加权指标，本文对当前模型进行了比较评估，揭示了它们在伦理对齐、事实可靠性及压力下的鲁棒性方面存在的显著差异。

结论清晰但非最终定论：没有模型是完美的，但某些模型比其他模型更适合军事用途——并且它们正在快速改进。本文还指出了当前评估框架中的关键差距，特别是在衡量透明度与可问责性方面。为解决这些问题，建议对诸如透明度评估分数和归因可追溯性分数等标准化指标进行进一步研究。信任，无论在战争还是技术中，都是赢得的。本文旨在帮助军事领导者区分仅仅是能够执行的系统，与那些值得指挥层信赖的系统。

成为VIP会员查看完整内容

21

相关内容

军事防务

军事防务数据板块介绍：系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块，其核心在于整合全球新兴国防技术（军事人工智能、无人系统等）、热点案例（俄乌战争、美以伊战争）等方面的最新时讯、研究报告/论文、条令法规、案例分析，为战略研判、情报分析、决策支持等提供知识支撑。

《ARMOR 2025：一个面向军事领域的基准，用于评估大语言模型安全性》

《ARMOR 2025：一个面向军事领域的基准，用于评估大语言模型安全性》

专知会员服务

21+阅读 · 5月7日

《大语言模型作为战术规划支持工具——来自两项应用研究的结论》2026最新100页报告

《大语言模型作为战术规划支持工具——来自两项应用研究的结论》2026最新100页报告

专知会员服务

25+阅读 · 4月15日

《军事大语言模型的拒绝率测量与消除》

《军事大语言模型的拒绝率测量与消除》

专知会员服务

14+阅读 · 3月13日

《战争迷雾条件下军事决策神经网络架构设计》最新119页报告

《战争迷雾条件下军事决策神经网络架构设计》最新119页报告

专知会员服务

37+阅读 · 3月9日

《军事应用中的AI：建立信任》最新报告

《军事应用中的AI：建立信任》最新报告

专知会员服务

25+阅读 · 2025年12月29日

《美国防部大语言模型应用中的网络安全挑战与缓解措施》报告

《美国防部大语言模型应用中的网络安全挑战与缓解措施》报告

专知会员服务

24+阅读 · 2025年12月9日

《程序性知识提高代理型大语言模型工作流程》美海军研究实验室43页

《程序性知识提高代理型大语言模型工作流程》美海军研究实验室43页

专知会员服务

25+阅读 · 2025年11月26日

《战争迷雾中的红线与灰色地带：基于大语言模型的军事决策风险、区域偏见基准测试》2025最新54页报告

《战争迷雾中的红线与灰色地带：基于大语言模型的军事决策风险、区域偏见基准测试》2025最新54页报告

专知会员服务

36+阅读 · 2025年10月10日

《幻觉还是事实：国防大型语言模型的可信度评估研究》2025最新109页

《幻觉还是事实：国防大型语言模型的可信度评估研究》2025最新109页

专知会员服务

35+阅读 · 2025年9月16日

【博士论文】负责任大型语言模型:安全性、公平性、可信性，142页pdf

【博士论文】负责任大型语言模型:安全性、公平性、可信性，142页pdf

专知会员服务

34+阅读 · 2024年1月26日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

52+阅读 · 2022年11月16日

推荐！《用于兵棋推演和建模的人工智能》兰德、耶鲁大学2022最新16页论文

推荐！《用于兵棋推演和建模的人工智能》兰德、耶鲁大学2022最新16页论文

专知

54+阅读 · 2022年11月14日

【美海军·系统顶点项目报告】《用于防空和导弹防御的自动作战管理辅助工具（AI）的安全风险评估》162页PDF

【美海军·系统顶点项目报告】《用于防空和导弹防御的自动作战管理辅助工具（AI）的安全风险评估》162页PDF

专知

40+阅读 · 2022年10月19日

【美国陆军】《人工智能系统能否提高陆军任务指挥过程中的信息收集效率？》39页技术报告

【美国陆军】《人工智能系统能否提高陆军任务指挥过程中的信息收集效率？》39页技术报告

专知

52+阅读 · 2022年8月31日

推荐！【中文版】《利用人工智能辅助指挥官进行复杂决策》美国海陆空军10位技术专家联合撰写

推荐！【中文版】《利用人工智能辅助指挥官进行复杂决策》美国海陆空军10位技术专家联合撰写

专知

86+阅读 · 2022年8月29日

推荐！【中文版】《人工智能和仿真技术在军事决策中的作用》北约技术报告

推荐！【中文版】《人工智能和仿真技术在军事决策中的作用》北约技术报告

专知

112+阅读 · 2022年8月20日

北约384页技术报告《评估和沟通情报中的不确定性以支持决策》

北约384页技术报告《评估和沟通情报中的不确定性以支持决策》

专知

36+阅读 · 2022年7月26日

推荐！【中文版】《可信人工智能：重新思考未来军事指挥》英智库皇家国防安全联合军种研究所2022最新48页报告

推荐！【中文版】《可信人工智能：重新思考未来军事指挥》英智库皇家国防安全联合军种研究所2022最新48页报告

专知

69+阅读 · 2022年7月20日

美国陆军研究实验室《支持C2互操作性和传感器融合的全球信息网络架构评估》2022年技术总结报告

美国陆军研究实验室《支持C2互操作性和传感器融合的全球信息网络架构评估》2022年技术总结报告

专知

64+阅读 · 2022年7月15日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

94+阅读 · 2022年4月17日

考虑不确定性的结构动力学响应模型可信度确认方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

云环境多用户的情景化动态信任决策模型及算法的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

面向复杂情报的大数据分析方法与决策支持

国家自然科学基金

44+阅读 · 2014年12月31日

信任、投资者参与模式与股票市场发展研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于仿真大数据的武器装备体系复杂性机理及效能评估方法研究

国家自然科学基金

75+阅读 · 2014年12月31日

互联网金融三维信任机制及参与者信任感知与交易决策

国家自然科学基金

0+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

面向军事情报的多媒体大数据分析与展示

国家自然科学基金

46+阅读 · 2014年12月31日

装备作战需求论证质量评估方法研究

国家自然科学基金

34+阅读 · 2012年12月31日

From Agent Traces to Trust: A Survey of Evidence Tracing and Execution Provenance in LLM Agents

Arxiv

1+阅读 · 6月14日

Trust Between AI Agents: Measuring Formation, Breakage, and Recovery, with Implications for Governing Multi-Agent Systems

Arxiv

0+阅读 · 6月12日

When Should Agent Trust Be Conditional? Characterizing and Attacking Skill-Conditional Reputation in Agent Swarms

Arxiv

0+阅读 · 6月12日

Trusted Uncertainty in Large Language Models: A Unified Framework for Confidence Calibration and Risk-Controlled Refusal

Arxiv

0+阅读 · 6月11日

From Agent Traces to Trust: Evidence Tracing and Execution Provenance in LLM Agents

Arxiv

0+阅读 · 6月3日

Probing Outcome-Level Resemblance and Mechanism-Level Alignment in LLM Risk Decisions: Evidence from the St. Petersburg Game

Arxiv

0+阅读 · 6月3日

Truthful AI Advisors: A Pre-Specified Benchmark for Large Language Model Honesty Under Preference Misalignment

Arxiv

0+阅读 · 5月31日

Trustworthy Recommendation in the Era of Large Language Models: Opportunities and Challenges

Arxiv

0+阅读 · 5月30日

Proof-Carrying Certificates for LLM Pipelines: A Trust-Boundary Architecture

Arxiv

0+阅读 · 5月13日

Augmented Large Language Models with Parametric Knowledge Guiding

Arxiv

20+阅读 · 2023年5月8日

VIP会员

相关主题

大型语言模型

最新内容

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

5+阅读 · 今天4:35

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

3+阅读 · 今天4:24

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

3+阅读 · 今天4:18

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 今天4:15

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 今天4:08

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

7+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

7+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

7+阅读 · 7月31日

“史诗怒火”行动：现代多域作战的重要节点

“史诗怒火”行动：现代多域作战的重要节点

专知会员服务

8+阅读 · 7月30日

《下一代无线网络中的多无人机通信资源管理》

《下一代无线网络中的多无人机通信资源管理》

专知会员服务

8+阅读 · 7月30日

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

专知会员服务

9+阅读 · 7月30日

《人机协同在安全关键型操作决策中的应用》120页

《人机协同在安全关键型操作决策中的应用》120页

专知会员服务

8+阅读 · 7月30日

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

专知会员服务

6+阅读 · 7月30日

相关VIP内容

《ARMOR 2025：一个面向军事领域的基准，用于评估大语言模型安全性》

《ARMOR 2025：一个面向军事领域的基准，用于评估大语言模型安全性》

专知会员服务

21+阅读 · 5月7日

《大语言模型作为战术规划支持工具——来自两项应用研究的结论》2026最新100页报告

《大语言模型作为战术规划支持工具——来自两项应用研究的结论》2026最新100页报告

专知会员服务

25+阅读 · 4月15日

《军事大语言模型的拒绝率测量与消除》

《军事大语言模型的拒绝率测量与消除》

专知会员服务

14+阅读 · 3月13日

《战争迷雾条件下军事决策神经网络架构设计》最新119页报告

《战争迷雾条件下军事决策神经网络架构设计》最新119页报告

专知会员服务

37+阅读 · 3月9日

《军事应用中的AI：建立信任》最新报告

《军事应用中的AI：建立信任》最新报告

专知会员服务

25+阅读 · 2025年12月29日

《美国防部大语言模型应用中的网络安全挑战与缓解措施》报告

《美国防部大语言模型应用中的网络安全挑战与缓解措施》报告

专知会员服务

24+阅读 · 2025年12月9日

《程序性知识提高代理型大语言模型工作流程》美海军研究实验室43页

《程序性知识提高代理型大语言模型工作流程》美海军研究实验室43页

专知会员服务

25+阅读 · 2025年11月26日

《战争迷雾中的红线与灰色地带：基于大语言模型的军事决策风险、区域偏见基准测试》2025最新54页报告

《战争迷雾中的红线与灰色地带：基于大语言模型的军事决策风险、区域偏见基准测试》2025最新54页报告

专知会员服务

36+阅读 · 2025年10月10日

《幻觉还是事实：国防大型语言模型的可信度评估研究》2025最新109页

《幻觉还是事实：国防大型语言模型的可信度评估研究》2025最新109页

专知会员服务

35+阅读 · 2025年9月16日

【博士论文】负责任大型语言模型:安全性、公平性、可信性，142页pdf

【博士论文】负责任大型语言模型:安全性、公平性、可信性，142页pdf

专知会员服务

34+阅读 · 2024年1月26日

热门VIP内容

开通专知VIP会员享更多权益服务

隐身技术前沿综述：物理机理、工程实践与战略展望

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

相关资讯

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

52+阅读 · 2022年11月16日

推荐！《用于兵棋推演和建模的人工智能》兰德、耶鲁大学2022最新16页论文

推荐！《用于兵棋推演和建模的人工智能》兰德、耶鲁大学2022最新16页论文

专知

54+阅读 · 2022年11月14日

【美海军·系统顶点项目报告】《用于防空和导弹防御的自动作战管理辅助工具（AI）的安全风险评估》162页PDF

【美海军·系统顶点项目报告】《用于防空和导弹防御的自动作战管理辅助工具（AI）的安全风险评估》162页PDF

专知

40+阅读 · 2022年10月19日

【美国陆军】《人工智能系统能否提高陆军任务指挥过程中的信息收集效率？》39页技术报告

【美国陆军】《人工智能系统能否提高陆军任务指挥过程中的信息收集效率？》39页技术报告

专知

52+阅读 · 2022年8月31日

推荐！【中文版】《利用人工智能辅助指挥官进行复杂决策》美国海陆空军10位技术专家联合撰写

推荐！【中文版】《利用人工智能辅助指挥官进行复杂决策》美国海陆空军10位技术专家联合撰写

专知

86+阅读 · 2022年8月29日

推荐！【中文版】《人工智能和仿真技术在军事决策中的作用》北约技术报告

推荐！【中文版】《人工智能和仿真技术在军事决策中的作用》北约技术报告

专知

112+阅读 · 2022年8月20日

北约384页技术报告《评估和沟通情报中的不确定性以支持决策》

北约384页技术报告《评估和沟通情报中的不确定性以支持决策》

专知

36+阅读 · 2022年7月26日

推荐！【中文版】《可信人工智能：重新思考未来军事指挥》英智库皇家国防安全联合军种研究所2022最新48页报告

推荐！【中文版】《可信人工智能：重新思考未来军事指挥》英智库皇家国防安全联合军种研究所2022最新48页报告

专知

69+阅读 · 2022年7月20日

美国陆军研究实验室《支持C2互操作性和传感器融合的全球信息网络架构评估》2022年技术总结报告

美国陆军研究实验室《支持C2互操作性和传感器融合的全球信息网络架构评估》2022年技术总结报告

专知

64+阅读 · 2022年7月15日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

94+阅读 · 2022年4月17日

相关基金

考虑不确定性的结构动力学响应模型可信度确认方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

云环境多用户的情景化动态信任决策模型及算法的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

面向复杂情报的大数据分析方法与决策支持

国家自然科学基金

44+阅读 · 2014年12月31日

信任、投资者参与模式与股票市场发展研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于仿真大数据的武器装备体系复杂性机理及效能评估方法研究

国家自然科学基金

75+阅读 · 2014年12月31日

互联网金融三维信任机制及参与者信任感知与交易决策

国家自然科学基金

0+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

面向军事情报的多媒体大数据分析与展示

国家自然科学基金

46+阅读 · 2014年12月31日

装备作战需求论证质量评估方法研究

国家自然科学基金

34+阅读 · 2012年12月31日

相关论文

From Agent Traces to Trust: A Survey of Evidence Tracing and Execution Provenance in LLM Agents

Arxiv

1+阅读 · 6月14日

Trust Between AI Agents: Measuring Formation, Breakage, and Recovery, with Implications for Governing Multi-Agent Systems

Arxiv

0+阅读 · 6月12日

When Should Agent Trust Be Conditional? Characterizing and Attacking Skill-Conditional Reputation in Agent Swarms

Arxiv

0+阅读 · 6月12日

Trusted Uncertainty in Large Language Models: A Unified Framework for Confidence Calibration and Risk-Controlled Refusal

Arxiv

0+阅读 · 6月11日

From Agent Traces to Trust: Evidence Tracing and Execution Provenance in LLM Agents

Arxiv

0+阅读 · 6月3日

Probing Outcome-Level Resemblance and Mechanism-Level Alignment in LLM Risk Decisions: Evidence from the St. Petersburg Game

Arxiv

0+阅读 · 6月3日

Truthful AI Advisors: A Pre-Specified Benchmark for Large Language Model Honesty Under Preference Misalignment

Arxiv

0+阅读 · 5月31日

Trustworthy Recommendation in the Era of Large Language Models: Opportunities and Challenges

Arxiv

0+阅读 · 5月30日

Proof-Carrying Certificates for LLM Pipelines: A Trust-Boundary Architecture

Arxiv

0+阅读 · 5月13日

Augmented Large Language Models with Parametric Knowledge Guiding

Arxiv

20+阅读 · 2023年5月8日

微信扫码咨询专知VIP会员