Sandpiper: Orchestrated AI-Annotation for Educational Discourse at Scale - 专知论文

会员服务 ·

0

系统 · 协同 · 标注 · 分析 · 引擎 ·

Sandpiper: Orchestrated AI-Annotation for Educational Discourse at Scale

翻译：沙锥鸟：面向大规模教育对话的协同式人工智能标注系统

Daryl Hedley,Doug Pietrzak,Jorge Dias,Ian Burden,Bakhtawar Ahtisham,Zhuqian Zhou,Kirk Vanacore,Josh Marland,Rachel Slama,Justin Reich,Kenneth Koedinger,René Kizilcec

Digital educational environments are expanding toward complex AI and human discourse, providing researchers with an abundance of data that offers deep insights into learning and instructional processes. However, traditional qualitative analysis remains a labor-intensive bottleneck, severely limiting the scale at which this research can be conducted. We present Sandpiper, a mixed-initiative system designed to serve as a bridge between high-volume conversational data and human qualitative expertise. By tightly coupling interactive researcher dashboards with agentic Large Language Model (LLM) engines, the platform enables scalable analysis without sacrificing methodological rigor. Sandpiper addresses critical barriers to AI adoption in education by implementing context-aware, automated de-identification workflows supported by secure, university-housed infrastructure to ensure data privacy. Furthermore, the system employs schema-constrained orchestration to eliminate LLM hallucinations and enforces strict adherence to qualitative codebooks. An integrated evaluations engine allows for the continuous benchmarking of AI performance against human labels, fostering an iterative approach to model refinement and validation. We propose a user study to evaluate the system's efficacy in improving research efficiency, inter-rater reliability, and researcher trust in AI-assisted qualitative workflows.

翻译：数字教育环境正朝着复杂的人工智能与人类对话方向发展，为研究者提供了大量能够深入揭示学习与教学过程的数据。然而，传统的质性分析方法依然是劳动密集型的瓶颈，严重制约了此类研究的开展规模。本文提出沙锥鸟系统——一种混合主动式系统，旨在构建海量对话数据与人类质性分析专长之间的桥梁。该系统通过将交互式研究者仪表板与智能体化大语言模型引擎紧密耦合，在保持方法论严谨性的同时实现了可扩展的分析。沙锥鸟通过部署情境感知的自动化去身份识别工作流（依托于安全的大学内部基础设施以确保数据隐私），解决了教育领域人工智能应用的关键障碍。此外，该系统采用模式约束的协同机制以消除大语言模型的幻觉现象，并确保严格遵循质性编码手册。集成的评估引擎支持持续以人工标注为基准对人工智能性能进行测评，从而形成模型优化与验证的迭代流程。我们提出一项用户研究方案，以评估本系统在提升研究效率、评分者间信度及研究者对人工智能辅助质性工作流信任度方面的效能。

0

相关内容

可信智能教育：关于进展、挑战与未来方向的系统性视角

可信智能教育：关于进展、挑战与未来方向的系统性视角

专知会员服务

16+阅读 · 2月1日

联合国教科文组织发布《生成式AI与教育未来》应用指南，48页pdf

联合国教科文组织发布《生成式AI与教育未来》应用指南，48页pdf

专知会员服务

49+阅读 · 2023年9月13日

《全球中小学人工智能教育支撑环境白皮书（2022年）》北京师范大学智慧学习研究院

《全球中小学人工智能教育支撑环境白皮书（2022年）》北京师范大学智慧学习研究院

专知会员服务

38+阅读 · 2022年7月20日

人工智能赋能教育专题《人工智能 + 教育：关键技术及典型应用场景》，北京师范大学

人工智能赋能教育专题《人工智能 + 教育：关键技术及典型应用场景》，北京师范大学

专知会员服务

62+阅读 · 2022年3月24日

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

专知会员服务

71+阅读 · 2019年11月25日

【Freddy Lecue博士】Thales嵌入式可解释AI：关键系统中AI的采用（Thales Embedded Explainable AI: Towards the Adoption of AI in Critical Systems.），AI Accelerator Summit 2019

【Freddy Lecue博士】Thales嵌入式可解释AI：关键系统中AI的采用（Thales Embedded Explainable AI: Towards the Adoption of AI in Critical Systems.），AI Accelerator Summit 2019

专知会员服务

21+阅读 · 2019年11月11日

【课程推荐】人工普遍智能（Artificial General Intelligence）

【课程推荐】人工普遍智能（Artificial General Intelligence）

专知会员服务

12+阅读 · 2019年11月10日

多模态教育数据挖掘: 中国K12教育场景案例分析，好未来AI Lab负责人刘子韬，第八届全国社会媒体处理大会SMP2019

多模态教育数据挖掘: 中国K12教育场景案例分析，好未来AI Lab负责人刘子韬，第八届全国社会媒体处理大会SMP2019

专知会员服务

35+阅读 · 2019年10月24日

智能教育发展现状与未来趋势，科大讯飞AI研究院竺博副院长，第八届全国社会媒体处理大会SMP2019

智能教育发展现状与未来趋势，科大讯飞AI研究院竺博副院长，第八届全国社会媒体处理大会SMP2019

专知会员服务

13+阅读 · 2019年10月24日

智能教育发展现状与未来趋势，哈尔滨工业大学刘挺教授，第八届全国社会媒体处理大会SMP2019

智能教育发展现状与未来趋势，哈尔滨工业大学刘挺教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

10+阅读 · 2019年10月24日

AAAI 2020 | 中科大：智能教育系统中的神经认知诊断，从数据中学习交互函数

AAAI 2020 | 中科大：智能教育系统中的神经认知诊断，从数据中学习交互函数

AI科技评论

24+阅读 · 2020年1月11日

浅谈群体智能——新一代AI的重要方向

浅谈群体智能——新一代AI的重要方向

中国科学院自动化研究所

44+阅读 · 2019年10月16日

人工智能在教育领域的应用探析

人工智能在教育领域的应用探析

MOOC

14+阅读 · 2019年3月16日

美国DARPA204页可解释人工智能文献综述论文《Explanation in Human-AI Systems》

美国DARPA204页可解释人工智能文献综述论文《Explanation in Human-AI Systems》

人工智能学家

26+阅读 · 2019年2月9日

知识在检索式对话系统的应用

知识在检索式对话系统的应用

微信AI

32+阅读 · 2018年9月20日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

教育部发布重磅AI计划，将建设100个“AI+”特色专业

教育部发布重磅AI计划，将建设100个“AI+”特色专业

AI100

18+阅读 · 2018年4月9日

一文读懂智能对话系统

一文读懂智能对话系统

数据派THU

16+阅读 · 2018年1月27日

【干货】一文读懂智能对话系统，当前研究综述和未来趋势

【干货】一文读懂智能对话系统，当前研究综述和未来趋势

新智元

13+阅读 · 2018年1月23日

群体智能：新一代人工智能的重要方向

群体智能：新一代人工智能的重要方向

走向智能论坛

12+阅读 · 2017年8月16日

基于虚拟现实的认知负荷与情绪干扰交互性分析关键技术研究

国家自然科学基金

1+阅读 · 2017年12月31日

面向多用户行为的无线识别关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

个性化特征大数据支持下的交互式进化计算及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

大数据环境下协同商务智能构建中的关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

面向大规模数据流的集成学习模型与方法研究

国家自然科学基金

5+阅读 · 2014年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

12+阅读 · 2008年12月31日

THETA: A Textual Hybrid Embedding-based Topic Analysis Framework and AI Scientist Agent for Scalable Computational Social Science

Arxiv

0+阅读 · 4月14日

Sandpiper: Orchestrated AI-Annotation for Educational Discourse at Scale

Arxiv

0+阅读 · 4月5日

Efficient Human-in-the-Loop Active Learning: A Novel Framework for Data Labeling in AI Systems

Arxiv

0+阅读 · 3月29日

FACET: Teacher-Centred LLM-Based Multi-Agent Systems-Towards Personalized Educational Worksheets

FACET: Teacher-Centred LLM-Based Multi-Agent Systems-Towards Personalized Educational Worksheets

Arxiv

0+阅读 · 3月18日

FACET: Multi-Agent AI Supporting Teachers in Scaling Differentiated Learning for Diverse Students

FACET: Multi-Agent AI Supporting Teachers in Scaling Differentiated Learning for Diverse Students

Arxiv

0+阅读 · 3月18日

FACET: Teacher-Centred LLM-Based Multi-Agent Systems-Towards Personalized Educational Worksheets

Arxiv

0+阅读 · 3月17日

FACET: Multi-Agent AI Supporting Teachers in Scaling Differentiated Learning for Diverse Students

Arxiv

0+阅读 · 3月17日

HACHIMI: Scalable and Controllable Student Persona Generation via Orchestrated Agents

Arxiv

0+阅读 · 3月9日

THETA: A Textual Hybrid Embedding-based Topic Analysis Framework and AI Scientist Agent for Scalable Computational Social Science

Arxiv

0+阅读 · 3月6日

The Path to Conversational AI Tutors: Integrating Tutoring Best Practices and Targeted Technologies to Produce Scalable AI Agents

Arxiv

0+阅读 · 2月22日

VIP会员

文章信息

相关主题

最新内容

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

专知会员服务

0+阅读 · 今天15:43

比利时发布用于实时战场军事装备识别的离线人工智能系统

比利时发布用于实时战场军事装备识别的离线人工智能系统

专知会员服务

0+阅读 · 今天15:41

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

专知会员服务

0+阅读 · 今天15:37

超越网格：作战环境对炮兵的影响

超越网格：作战环境对炮兵的影响

专知会员服务

0+阅读 · 今天15:35

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

专知会员服务

4+阅读 · 今天12:11

综述 | 推理时控制：可信大语言模型的运行时治理全景

综述 | 推理时控制：可信大语言模型的运行时治理全景

专知会员服务

3+阅读 · 今天12:10

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

4+阅读 · 5月30日

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

5+阅读 · 5月30日

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

4+阅读 · 5月30日

美以伊战争：首次人工智能战争——军事自主性困境

美以伊战争：首次人工智能战争——军事自主性困境

专知会员服务

5+阅读 · 5月30日

《Palantir任务保障性软件安全标准（MA-S2）》

《Palantir任务保障性软件安全标准（MA-S2）》

专知会员服务

14+阅读 · 5月30日

《美海军利用扩展现实增强知识流动研究》300页报告

《美海军利用扩展现实增强知识流动研究》300页报告

专知会员服务

8+阅读 · 5月30日

基于声学的无人机检测技术综述

基于声学的无人机检测技术综述

专知会员服务

8+阅读 · 5月30日

《当代混合战争分析框架：俄乌战争经验教训》

《当代混合战争分析框架：俄乌战争经验教训》

专知会员服务

9+阅读 · 5月30日

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

专知会员服务

12+阅读 · 5月29日

相关VIP内容

可信智能教育：关于进展、挑战与未来方向的系统性视角

可信智能教育：关于进展、挑战与未来方向的系统性视角

专知会员服务

16+阅读 · 2月1日

联合国教科文组织发布《生成式AI与教育未来》应用指南，48页pdf

联合国教科文组织发布《生成式AI与教育未来》应用指南，48页pdf

专知会员服务

49+阅读 · 2023年9月13日

《全球中小学人工智能教育支撑环境白皮书（2022年）》北京师范大学智慧学习研究院

《全球中小学人工智能教育支撑环境白皮书（2022年）》北京师范大学智慧学习研究院

专知会员服务

38+阅读 · 2022年7月20日

人工智能赋能教育专题《人工智能 + 教育：关键技术及典型应用场景》，北京师范大学

人工智能赋能教育专题《人工智能 + 教育：关键技术及典型应用场景》，北京师范大学

专知会员服务

62+阅读 · 2022年3月24日

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

【EMNLP2019教程】端到端学习对话人工智能，附237页PPT下载

专知会员服务

71+阅读 · 2019年11月25日

【Freddy Lecue博士】Thales嵌入式可解释AI：关键系统中AI的采用（Thales Embedded Explainable AI: Towards the Adoption of AI in Critical Systems.），AI Accelerator Summit 2019

【Freddy Lecue博士】Thales嵌入式可解释AI：关键系统中AI的采用（Thales Embedded Explainable AI: Towards the Adoption of AI in Critical Systems.），AI Accelerator Summit 2019

专知会员服务

21+阅读 · 2019年11月11日

【课程推荐】人工普遍智能（Artificial General Intelligence）

【课程推荐】人工普遍智能（Artificial General Intelligence）

专知会员服务

12+阅读 · 2019年11月10日

多模态教育数据挖掘: 中国K12教育场景案例分析，好未来AI Lab负责人刘子韬，第八届全国社会媒体处理大会SMP2019

多模态教育数据挖掘: 中国K12教育场景案例分析，好未来AI Lab负责人刘子韬，第八届全国社会媒体处理大会SMP2019

专知会员服务

35+阅读 · 2019年10月24日

智能教育发展现状与未来趋势，科大讯飞AI研究院竺博副院长，第八届全国社会媒体处理大会SMP2019

智能教育发展现状与未来趋势，科大讯飞AI研究院竺博副院长，第八届全国社会媒体处理大会SMP2019

专知会员服务

13+阅读 · 2019年10月24日

智能教育发展现状与未来趋势，哈尔滨工业大学刘挺教授，第八届全国社会媒体处理大会SMP2019

智能教育发展现状与未来趋势，哈尔滨工业大学刘挺教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

10+阅读 · 2019年10月24日

热门VIP内容

开通专知VIP会员享更多权益服务

比利时发布用于实时战场军事装备识别的离线人工智能系统

超越网格：作战环境对炮兵的影响

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

相关资讯

AAAI 2020 | 中科大：智能教育系统中的神经认知诊断，从数据中学习交互函数

AAAI 2020 | 中科大：智能教育系统中的神经认知诊断，从数据中学习交互函数

AI科技评论

24+阅读 · 2020年1月11日

浅谈群体智能——新一代AI的重要方向

浅谈群体智能——新一代AI的重要方向

中国科学院自动化研究所

44+阅读 · 2019年10月16日

人工智能在教育领域的应用探析

人工智能在教育领域的应用探析

MOOC

14+阅读 · 2019年3月16日

美国DARPA204页可解释人工智能文献综述论文《Explanation in Human-AI Systems》

美国DARPA204页可解释人工智能文献综述论文《Explanation in Human-AI Systems》

人工智能学家

26+阅读 · 2019年2月9日

知识在检索式对话系统的应用

知识在检索式对话系统的应用

微信AI

32+阅读 · 2018年9月20日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

教育部发布重磅AI计划，将建设100个“AI+”特色专业

教育部发布重磅AI计划，将建设100个“AI+”特色专业

AI100

18+阅读 · 2018年4月9日

一文读懂智能对话系统

一文读懂智能对话系统

数据派THU

16+阅读 · 2018年1月27日

【干货】一文读懂智能对话系统，当前研究综述和未来趋势

【干货】一文读懂智能对话系统，当前研究综述和未来趋势

新智元

13+阅读 · 2018年1月23日

群体智能：新一代人工智能的重要方向

群体智能：新一代人工智能的重要方向

走向智能论坛

12+阅读 · 2017年8月16日

相关论文

THETA: A Textual Hybrid Embedding-based Topic Analysis Framework and AI Scientist Agent for Scalable Computational Social Science

Arxiv

0+阅读 · 4月14日

Sandpiper: Orchestrated AI-Annotation for Educational Discourse at Scale

Arxiv

0+阅读 · 4月5日

Efficient Human-in-the-Loop Active Learning: A Novel Framework for Data Labeling in AI Systems

Arxiv

0+阅读 · 3月29日

FACET: Teacher-Centred LLM-Based Multi-Agent Systems-Towards Personalized Educational Worksheets

FACET: Teacher-Centred LLM-Based Multi-Agent Systems-Towards Personalized Educational Worksheets

Arxiv

0+阅读 · 3月18日

FACET: Multi-Agent AI Supporting Teachers in Scaling Differentiated Learning for Diverse Students

FACET: Multi-Agent AI Supporting Teachers in Scaling Differentiated Learning for Diverse Students

Arxiv

0+阅读 · 3月18日

FACET: Teacher-Centred LLM-Based Multi-Agent Systems-Towards Personalized Educational Worksheets

Arxiv

0+阅读 · 3月17日

FACET: Multi-Agent AI Supporting Teachers in Scaling Differentiated Learning for Diverse Students

Arxiv

0+阅读 · 3月17日

HACHIMI: Scalable and Controllable Student Persona Generation via Orchestrated Agents

Arxiv

0+阅读 · 3月9日

THETA: A Textual Hybrid Embedding-based Topic Analysis Framework and AI Scientist Agent for Scalable Computational Social Science

Arxiv

0+阅读 · 3月6日

The Path to Conversational AI Tutors: Integrating Tutoring Best Practices and Targeted Technologies to Produce Scalable AI Agents

Arxiv

0+阅读 · 2月22日

相关基金

基于虚拟现实的认知负荷与情绪干扰交互性分析关键技术研究

国家自然科学基金

1+阅读 · 2017年12月31日

面向多用户行为的无线识别关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

个性化特征大数据支持下的交互式进化计算及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

大数据环境下协同商务智能构建中的关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

面向大规模数据流的集成学习模型与方法研究

国家自然科学基金

5+阅读 · 2014年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

12+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员