Predicting how populations respond to policy interventions is a fundamental challenge in computational social science and public policy. Traditional approaches rely on aggregate statistical models that capture historical correlations but lack mechanistic interpretability and struggle with novel policy scenarios. We present a general framework for constructing Social Digital Twins - virtual population replicas where Large Language Models (LLMs) serve as cognitive engines for individual agents. Each agent, characterized by demographic and psychographic attributes, receives policy signals and outputs multi-dimensional behavioral probability vectors. A calibration layer maps aggregated agent responses to observable population-level metrics, enabling validation against real-world data and deployment for counterfactual policy analysis. We instantiate this framework in the domain of pandemic response, using COVID-19 as a case study with rich observational data. On a held-out test period, our calibrated digital twin achieves a 20.7% improvement in macro-averaged prediction error over gradient boosting baselines across six behavioral categories. Counterfactual experiments demonstrate monotonic and bounded responses to policy variations, establishing behavioral plausibility. The framework is domain-agnostic: the same architecture applies to transportation policy, economic interventions, environmental regulations, or any setting where policy affects population behavior. We discuss implications for policy simulation, limitations of the approach, and directions for extending LLM-based digital twins beyond pandemic response.


翻译:预测人口如何响应政策干预是计算社会科学与公共政策领域的一项基础性挑战。传统方法依赖于捕捉历史相关性的宏观统计模型,但缺乏机制可解释性,且难以应对新型政策情景。我们提出一个构建社会数字孪生的通用框架——该虚拟人口副本以大型语言模型作为个体智能体的认知引擎。每个具有人口统计学与心理特征属性的智能体接收政策信号,并输出多维行为概率向量。校准层将聚合的智能体响应映射至可观测的宏观人口指标,从而支持基于真实世界数据的验证,并可用于反事实政策分析。我们在疫情响应领域实例化了该框架,以拥有丰富观测数据的COVID-19作为案例进行研究。在保留测试时段内,经校准的数字孪生在六个行为类别上的宏观平均预测误差较梯度提升基线模型降低了20.7%。反事实实验表明,模型对政策变化呈现单调且有界的响应,验证了其行为合理性。该框架具有领域无关性:同一架构可适用于交通政策、经济干预、环境监管或任何政策影响群体行为的场景。我们讨论了该框架对政策模拟的启示、方法的局限性,以及将基于大语言模型的数字孪生拓展至疫情响应以外领域的发展方向。

0
下载
关闭预览

相关内容

数字孪生是一个虚拟模型,用于准确地反映物理对象。 所研究的对象(例如风力涡轮)会配备各种与重要功能领域相关的传感器。 这些传感器产生与物理对象不同方面的性能相关的数据,如能量输出、温度、天气条件等等。 然后,这些数据将转发到处理系统并应用于数字副本。
基于大语言模型智能体的社会认知模拟
专知会员服务
13+阅读 · 2月22日
LLMS4ALL:大语言模型在各学科科研与应用中的综述
专知会员服务
36+阅读 · 2025年10月4日
大语言模型在规划与调度问题上的应用
专知会员服务
51+阅读 · 2025年1月12日
《以人为中心的大型语言模型(LLM)研究综述》
专知会员服务
41+阅读 · 2024年11月25日
基于无人协同博弈数字孪生的系统模型构建
专知会员服务
44+阅读 · 2024年3月28日
《数字孪生在军事领域的应用》中文版
专知会员服务
120+阅读 · 2023年8月17日
数字孪生模型构建理论及应用
专知会员服务
230+阅读 · 2022年4月19日
重磅!数字孪生技术应用白皮书(2021)
专知
14+阅读 · 2021年12月8日
【数字孪生】面向智能制造的数字孪生
产业智能官
52+阅读 · 2020年5月10日
【数字孪生】数字孪生技术从概念到应用
产业智能官
95+阅读 · 2020年2月16日
【数字孪生】数字孪生技术发展趋势与安全风险浅析
产业智能官
54+阅读 · 2019年8月28日
【数字孪生】超棒PPT解读Digital Twin十大领域应用!
产业智能官
103+阅读 · 2019年3月26日
【数字孪生】数字化孪生“双胞胎”技术及应用
产业智能官
22+阅读 · 2018年8月12日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
25+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
VIP会员
相关VIP内容
基于大语言模型智能体的社会认知模拟
专知会员服务
13+阅读 · 2月22日
LLMS4ALL:大语言模型在各学科科研与应用中的综述
专知会员服务
36+阅读 · 2025年10月4日
大语言模型在规划与调度问题上的应用
专知会员服务
51+阅读 · 2025年1月12日
《以人为中心的大型语言模型(LLM)研究综述》
专知会员服务
41+阅读 · 2024年11月25日
基于无人协同博弈数字孪生的系统模型构建
专知会员服务
44+阅读 · 2024年3月28日
《数字孪生在军事领域的应用》中文版
专知会员服务
120+阅读 · 2023年8月17日
数字孪生模型构建理论及应用
专知会员服务
230+阅读 · 2022年4月19日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
11+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
25+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员