2026年2月28日,一枚美国炸弹击中了伊朗南部米纳布市的Shajareh Tayyibah女子学校。超过175人丧生,其中大部分是学生。宣称的目标是附近的一处伊朗军事设施。至今仍有争议——并且可能永远无法完全厘清——的是,这所学校如何成为了人类历史上技术最先进军队的瞄准目标。
军方官员最初对“为何这所学校出现在目标清单上”的困惑,已让位于一种更令人不安的可能性:错误可能并非源于人类情报分析员对卫星图像的误判,而是源于一个以机器速度处理海量数据的人工智能系统。该系统名为“Maven智能系统”,由数据挖掘公司Palantir Technologies构建,并集成了由Anthropic开发的先进AI模型Claude。
这不仅仅是一个关于单一悲剧错误的故事,尽管那个错误本身需要得到清算。这是一个关于战争本身根本性变革的故事——是关于生死决策权从公共机构向私营公司悄然、且在很大程度上无需担责地转移的故事。随着美国和以色列推进其对伊朗的行动,他们正借助硅谷编写的算法、在私有平台上处理、并受服务条款而非条约约束的工具进行这场战争。萦绕在那所女子学校废墟上的问题,是五角大楼、国会乃至美国公众都尚未回答的问题:当一个AI系统协助杀害了175名儿童时,谁应承担责任?
I. 硅谷战场
Maven智能系统代表了五角大楼在人工智能赋能战争领域最大胆的尝试。该系统最初为处理无人机传来的海量全动态视频而开发,如今已远超其初始职能。如今,它充当美国目标打击行动的“中枢神经系统”,摄入机密卫星图像、信号情报、监控录像以及天知道还有什么——然后为军事指挥官生成优先目标建议。
使当前冲突不同的是Anthropic的Claude的集成。根据多份报告,Claude的大型语言模型能力已与Maven的分析架构配对,以“借助AI,利用海量机密数据来策划攻击”。该系统不仅识别潜在目标;它还提供精确坐标、评估可能结果,并以人类分析师无法企及的速度帮助军事规划人员理解情报报告。
数字是惊人的。在“史诗之怒行动”的头24小时内,美军打击了伊朗境内约1000个目标。若由人类主导目标选定流程,需要数千名分析师工作数周才能生成如此多经过验证的瞄准点。而AI将这个时间压缩到了数小时。领导美国中央司令部的布拉德·库珀海军上将坦率地承认了这种转变:“这些系统帮助我们在几秒钟内筛选海量数据,以便我们的领导层能够拨开迷雾,比敌人反应更快地做出更明智的决策。”
库珀的声明回避了这种“速度”所代表的军事决策性质的深刻转变。“杀伤链”——从识别目标到攻击目标的步骤序列——已被急剧压缩。曾经需要多级人工审核的决策,现在流经的流程中,人类操作员是监督者而非发起者。正如官员们反复强调的,人类仍然“在回路中”,但回路本身已围绕机器的能力重新设计,而非相反。
新美国安全中心的军事人工智能专家保罗·沙雷捕捉到了这一刻的矛盾心态:该系统使得规划能够“以机器速度而非人类速度”进行,但人类必须监督它,因为它“有时会犯错”。当然,问题在于人类监督者能否有效地审查以机器速度生成的决策——或者“人在回路”是否只是有效算法目标选择的遮羞布。
II. 学校与系统
Shajareh Tayyibah学校位于一处伊朗军事设施附近。在Maven处理的庞大数据集(来源不明的卫星图像、信号截获、生活模式分析)中,出现了错误。这所学校被错误归类为军事目标的一部分。到炸弹落下时,没有任何人类审核员发现这个错误,或者即使有人发现,纠正也已为时过晚。
《华盛顿邮报》援引一位美国官员的话报道,对于为何该学校出现在目标清单上存在“一些困惑”。这种困惑本身就很有启示性。在传统的目标选定过程中,每个目标都由能够解释其推理、引用其来源并为其判断辩护的人类分析员构建。在人工智能赋能的流程中,推理链即使对系统的创建者来说也可能是不透明的。像Claude这样的大型语言模型并不以人类易于重构的方式“思考”。它们识别模式,做出概率性判断,并生成输出——但要解释为何特定的输入会产生特定的输出,是出了名的困难。
这并非假设性的担忧。OpenAI于2025年9月发布的一项重大研究发现,所有主要的AI聊天机器人都会“幻觉”或周期性编造答案。Anthropic自身的首席执行官达里奥·阿莫代也承认:“我不能告诉你,即使是我们构建的系统,也有100%的把握保证其完美可靠。”然而,这些系统现在正被用于在实战中生成目标建议。
AI在米纳布学校袭击中的确切作用仍不清楚。美国官员尚未确认目标是源自Maven、由Claude标记,还是来自其他来源。但AI错误导致175名儿童死亡的可能性已引发调查呼吁。夏威夷州众议员、众议院军事委员会成员吉尔·户田直截了当地表示:“我们需要进行完整、公正的审查,以确定AI在与伊朗的战争中是否已经造成伤害或危及生命。”
如果进行审查,也将面临巨大障碍。目标选定过程的机密性意味着,即使是军事委员会成员也无法了解AI的使用情况。委员会主席迈克·罗杰斯承认了这一点:“我没有了解到那种细节的程度。我已经忙不过来了。我不寻求那种细节。”资深民主党人亚当·史密斯承认,国会需要关于战场AI使用的“更多信息”。
这是问责缺口的缩影:宪法授权监督军队的人不知道军队用AI在做什么,军队可能不完全理解其AI系统在做什么,而构建这些系统的公司则在层层专有保密的面纱后运作。
III. 战争中的公司
Palantir Technologies成立于2003年,资金来自中情局的风险投资部门In-Q-Tel。自成立之初,该公司就与国家安全体系深度交织,为情报机构和军事指挥部构建数据分析工具。Maven智能系统代表了这二十年合作的顶峰——一个能够大规模处理机密数据并向作战人员提供可操作情报的平台。
Anthropic通往战场的道路则更为曲折。这家由前OpenAI研究员创立的公司,将自己定位为AI行业中负责任的替代者,致力于安全和合乎道德的部署。其“宪法AI”框架旨在使AI系统与人类价值观对齐。其可接受使用政策曾明确禁止军事应用。
该政策与五角大楼的要求发生了冲突。根据多份报告,国防部要求Anthropic为军事行动提供不受限制的Claude访问权限。Anthropic的领导层以对国内大规模监控和完全自主武器的担忧为由拒绝了。争端迅速升级。在对伊朗打击行动的前夕,五角大楼宣布Anthropic为“供应链风险”——这一指定实际上禁止了该公司未来的国防工作。
然而,即使官僚机器逐渐走向分离,Claude仍与Maven集成,并继续支持目标选定行动。军事指挥官已变得依赖该系统。正如一位美国官员所言,如果Anthropic试图停止其AI的运行,政府将动用其权力没收该技术:“他的决定不能让任何一个美国人丧生。”
这一事件揭示了科技公司与国家安全体系之间关系的本质。公司政策、道德框架和可接受使用指南最终只是纸墙。当五角大楼想要获得一项技术时,它往往能得到——无论是通过合作、强制,还是直接无视公司的反对。Anthropic反对军事应用的原则性立场,在军方决定其在实战中需要Claude的那一刻,便宣告终结。
该公司已提起诉讼,质疑其“供应链风险”的指定。但木已成舟。Claude已帮助策划了对伊朗境内约1000个目标的打击。无论法庭如何裁决,这项技术已然沾血。
IV. 国会的黑洞
美国国会拥有宣战和监督军队的宪法责任。然而,在AI赋能战争方面,即使是军事委员会的高级成员也如同在黑暗中摸索。
罗杰斯众议员承认他对AI目标选定实践缺乏“细节了解”,这引人注目但并不意外。保密制度在行政部门和国会之间造成了固有的信息不对称。但问题更深层。商业AI系统融入军事行动的进程如此迅速,且几乎没有公开辩论,以至于国会甚至尚未发展出提出正确问题的语汇。
亚利桑那州参议员马克·凯利已开始施压寻求答案。他在最近的一次听证会上指出:“像Anthropic这样的公司和AI行业的其他公司已经发布了他们自己关于如何部署先进AI系统的安全框架。但国会尚未就AI如何在致命军事行动中使用,制定任何明确的法定框架。”
凯利指出的差距不仅是监管上的,更是民主层面的。私营公司制定的安全框架,无论其意图多么良好,都不能替代民选代表制定的法律。当Anthropic决定其AI不应用于自主武器时,这个决定反映的是其高管、或许还有股东的判断。当国会决定AI是否以及如何能用于战争时,这个决定反映的——至少在理论上——是美国人民的意志。
但国会尚未做出任何决定。自当前冲突开始以来,它没有举行过关于军事AI的严肃听证会。它没有通过为算法目标选定设立护栏的立法。它甚至没有要求全面说明AI系统在伊朗行动中的使用情况。结果是,关于生死的重大决定正在被默认做出——被技术发展的势头,被军事优势的需要,被五角大楼与少数几家科技公司之间的合同关系。
前中情局分析员、参议员埃莉萨·斯洛特金表达了许多人的不安:“真正取决于人类,在这个案例中是国防部长,要确保在可预见的未来有人类冗余,而这正是我们目前缺乏信心的。”
V. 问责真空
AI Now Institute的首席科学家海迪·克拉夫对军方拥抱AI赋能目标选定提出了尖锐批评:“‘速度’在这里被推销为一种战略,这非常危险,当你考虑到这些模型有多么不准确时,它实际上是对不分青红皂白目标选择的掩饰。”
如果克拉夫是正确的——而米纳布学校袭击表明她可能是——那么核心问题就变成了问责。当AI系统协助杀害平民时,谁应负责?
战争中分配责任的法律框架是为人类做出目标决策的世界设计的。指挥官对其下属的行为负责。情报分析员对其评估的准确性负责。飞行员对他们投下的炸弹负责。但是,当一个目标建议来自于一个在TB级数据上训练、使用连其创造者都不完全理解的算法的AI系统时,责任链就变得混乱了。
米纳布袭击是未能发现错误的分析员的错吗?是信任系统建议的指挥官的错吗?是在有缺陷的数据上训练模型程序员的错吗?是尽管知道其局限性仍将系统卖给五角大楼的高管的错吗?是未能履行监督职责的国会议员的错吗?实际上,答案可能根本无人负责。
这不是假设性的担忧。国际机器人军备控制委员会主席彼得·阿萨罗警告说,AI赋能目标选定会造成道德风险:“如果出了问题,那么谁负责?”他暗示,对伊朗学校的轰炸可能正是这样一个案例——一个错误可能源于“数据库错误”或“数据有多旧”,而非任何人的有意决定。
军方将倾向于利用AI作为规避问责的盾牌。当出现问题时,过错可以归咎于算法——一台不能被军事法庭审判、不能在国会作证、不能被追究责任的机器。而设计、购买和部署该系统的人类将置身幕后,他们的责任被分散在无数从未达到罪责水平的决策中。
VI. 代际鸿沟
战略与国际研究中心的本杰明·詹森参与AI在军事决策中应用的测试已超过十年。他对现状的评估发人深省:世界各国的军队“尚未从根本上重新思考我们如何计划、如何开展行动,以利用AI的能力”。他认为,我们正处于这场变革的“开端”。
这个开端已经夺走了175名女学生的生命。接下来会是什么?
轨迹不难预测。随着AI系统变得更加复杂,它们将被委托做出更多决策。随着对手采用类似技术,进一步压缩杀伤链的压力将增大。随着人类习惯于监督而非发起目标决策,他们有效审查AI建议的能力将会萎缩。保罗·沙雷的警告——人类必须监督AI,因为它“有时会犯错”——将随着作战速度超过人类认知速度而越来越难以遵循。
一些国会议员已在呼吁设立护栏。加利福尼亚州众议员萨拉·雅各布斯要求国会“对军方使用AI实施严格护栏,并保证在每次使用致命武力的决策中都有人类参与,因为一旦出错,对平民和执行这些任务的军人都可能是毁灭性的。”
但护栏是不够的。根本问题不在于人类是否仍“在回路中”,而在于回路本身的设计是否保留了有意义的人类自主性。一个只是对AI生成的目标建议盖橡皮图章的人类并未行使有意义的判断。一个无法重构AI建议背后推理的人类无法有意义地审查它。一个面临保持作战节奏巨大压力的人类无法有意识地停下来质疑机器。
法国军队AI机构负责人伯特兰·洪德皮埃尔坚称,AI“在无人控制下运行”是“科幻小说”。至少在法国,“军事指挥官处于行动和这些系统设计的核心。”但美国不是法国,Maven也不是法国系统。将Claude集成到美国目标选定行动中,代表了一种赌注,即AI可以在不削弱人类控制的情况下增强军事效能。米纳布学校袭击则代表了这一赌注所蕴含的风险。
VII. 未选择的道路
事情本不必如此。当五角大楼最初就军事应用接触Anthropic时,该公司有机会设立可能塑造整个行业国防合同方式的红线。其领导层本可以坚持有意义的人类审查要求、AI局限性的透明度以及对目标选定决策的独立审计。它本可以要求其技术不得用于平民保护不足的冲突。它本可以拒绝与缺乏问责机制的系统集成。
然而,Anthropic试图走一条中间路线:拒绝不受限制的访问,同时继续提供将用于战争的技术。结果是两头落空——该公司的技术帮助策划了对1000个目标的打击,其中包括至少一个造成175名儿童死亡的目标,而其原则性立场为其赢得了“供应链风险”的指定和一场诉讼。这种道德姿态未能让任何人满意,也未能保护任何人。
然而,更大的失败属于政治体系。国会多年来已知AI将改变战争形态。它举行过听证会,委托过研究,听取过简报。但对于参议员凯利正确要求的法定框架,它几乎一事无成。结果是我们现在正用为模拟时代设计的规则,打一场AI赋能的战争。
与先前几代武器技术的对比具有启发性。当核武器出现时,美国建立了由文官控制、程序保障和国会监督组成的精细体系。当遥控飞机进入武器库时,国会要求目标选定实践和附带伤亡的透明度。但AI到来得如此之快,其后果又如此分散,以至于政治体系尚未跟上。
它可能无法及时赶上。对伊行动将继续,无论有无国会监督。Maven将继续处理数据,Claude将继续生成建议,炸弹将继续落下。其中一些炸弹会击中预定目标。一些则不会。而当它们没有击中时,问责真空将继续存在。
VIII. 废墟之声
Shajareh Tayyibah学校如今已成废墟。在那里被杀害的175名儿童,已超出任何调查、任何问责机制、任何美国将来可能做出的道歉所能触及的范围。她们的家人将在余生中试图理解,他们的女儿如何成为一场并非由她们发动的战争的牺牲品,死于一种她们从未听闻的技术,被她们无法想象的算法锁定为目标。
她们的死亡向美国人民、向国会、向军队、向那些其技术促成了此次打击的公司提出了一个问题。这不是一个关于AI准确性、杀伤链压缩或人机协同的技术问题。这是一个关于在我们发动的战争中,由谁来决定谁生谁死的道德和政治问题。
如果答案是“一种算法”,那么我们就已放弃了民主问责制的某些根本。如果答案是“一家公司”,那么我们就已将本应属于公共领域的事务私有化了。如果答案是“没有人”,那么我们就创造了一个可以毫无后果地杀人的系统——一个将不断杀人,直到有人有勇气阻止它的系统。
那所学校的废墟不会再说话。但它无需说话。它提出的问题足够清晰。唯一的问题是,我们是否有意愿去回答它。
在米纳布袭击事件发生后的数周里,五角大楼没有公布任何关于目标错误原因的调查结果。Anthropic没有就其技术是否扮演了任何角色发表评论。Palantir没有回应置评请求。国会尚未就伊朗行动中的AI目标选定安排听证会。战争仍在继续。