Create an idea, prototype it, evaluate if users like it, then learn. It is the circle of business. If AI can operate in all parts of the circle, it will enable rapid iteration and learning speeds for businesses. Experiment platforms that deploy experiments to evaluate return on investment for businesses are abundant, but systems that help businesses learn personalization, mechanisms, and what to ideate next, are rare. Among technologies that do exist, they cannot be well orchestrated in a single software interface that can be safely and efficiently leveraged by an AI agent. These challenges make it difficult to teach an AI agent how to learn within a robust experimentation framework, and difficult for an AI agent to operate and iterate for the business. We offer a two part solution: one half that is rooted in mathematical reductions to contain complexity, and one half that is rooted in software design to optimize for orchestration, software safety, and multiplicity. Our solution, a software framework, moves beyond the simple treatment effect computed as a difference in means. To create a better understanding of a business and its customers, we enrich causal analysis with heterogeneous effects, policy algorithms, mediation analysis, and forecasts of effects. To have an AI complete the iteration cycle faster, we further enrich the analysis with variance reduction and anytime valid inference. The enrichments are made compatible across different types of experiments, and are presented in a single software interface that is usable in an AI agent. We evaluate the approach on various objectives in experiment analysis, and show that the framework improves code correctness, reduces lines of code, and is more performant than a baseline analysis constructed by a vanilla agent.


翻译:构思一个想法,构建原型,评估用户是否喜欢,然后学习——这是商业的循环。若人工智能能够参与该循环的所有环节,企业便能够实现快速的迭代与学习。当前,部署实验以评估商业投资回报率的实验平台比比皆是,但能够帮助企业学习个性化策略、机制设计以及下一步创新方向的系统却十分罕见。即便存在相关技术,它们也难以被整合到一个统一、安全且能被人工智能智能体高效利用的软件接口中。这些挑战使得在稳健的实验框架内训练人工智能智能体学习变得困难,也使其难以为企业进行自动化操作与迭代。我们提出一个双模块解决方案:其一基于数学简化以控制复杂度,其二基于软件设计以优化编排、安全性与兼容性。我们的解决方案是一个软件框架,其超越了基于均值差异计算的简单处理效应。为更深入地理解企业及其客户,我们通过异质性效应、策略算法、中介分析及效应预测来丰富因果分析。为让人工智能更快完成迭代周期,我们进一步引入方差缩减与随时有效推断来增强分析。这些增强功能兼容不同类型的实验,并集成在统一的软件接口中,可供人工智能智能体直接使用。我们在实验分析的多项目标上评估了该方法,结果表明该框架提升了代码正确性,减少了代码行数,且性能优于由基础智能体构建的基线分析。

0
下载
关闭预览

相关内容

首篇「Test-Time Scaling」全景综述,深入剖析AI深思之道
专知会员服务
15+阅读 · 2025年5月14日
清华大学崔鹏:可信智能决策框架及实践
专知会员服务
76+阅读 · 2023年5月1日
【ChatGPT系列报告】AIGC行业研究框架与投资逻辑,39页pdf
专知会员服务
67+阅读 · 2023年4月22日
重磅!AI框架发展白皮书(2022年),44页pdf
专知
28+阅读 · 2022年2月27日
完备的 AI 学习路线,最详细的资源整理!
新智元
18+阅读 · 2019年5月4日
《美团机器学习实践》—— 思维导图
图灵教育
22+阅读 · 2019年1月17日
【强化学习】强化学习+深度学习=人工智能
产业智能官
55+阅读 · 2017年8月11日
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
25+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
11+阅读 · 2013年12月31日
VIP会员
相关主题
最新内容
ICML 2026 | 自回归Boltzmann生成器重塑分子采样
专知会员服务
0+阅读 · 47分钟前
GNN跨域综述:从消息传递到图基础模型
专知会员服务
0+阅读 · 49分钟前
无人机自主控制与人工智能:系统性综述
专知会员服务
10+阅读 · 今天7:25
巡飞弹与反无人机系统——现代战场的两大支柱
专知会员服务
3+阅读 · 今天6:54
《打造“黄金舰队”》57页报告
专知会员服务
3+阅读 · 今天6:52
《北约数字教官网络发展路径》128页报告
专知会员服务
2+阅读 · 今天6:33
ECCV 2026 | MIMFlow:MIM与归一化流统一图像生成
专知会员服务
7+阅读 · 6月25日
网状网络及其在军事领域的运用
专知会员服务
8+阅读 · 6月25日
无美国参与的欧洲战争方式(万字长文)
专知会员服务
8+阅读 · 6月25日
《国防领域敏感性分析白皮书》
专知会员服务
9+阅读 · 6月25日
相关VIP内容
首篇「Test-Time Scaling」全景综述,深入剖析AI深思之道
专知会员服务
15+阅读 · 2025年5月14日
清华大学崔鹏:可信智能决策框架及实践
专知会员服务
76+阅读 · 2023年5月1日
【ChatGPT系列报告】AIGC行业研究框架与投资逻辑,39页pdf
专知会员服务
67+阅读 · 2023年4月22日
相关基金
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
25+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2013年12月31日
国家自然科学基金
11+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员