Assessing Task-based Chatbots: Snapshot and Curated Datasets for Dialogflow - 专知论文

会员服务 ·

0

Chatbot · 数据集 · 机器人 · 包含 · 实证研究 ·

Assessing Task-based Chatbots: Snapshot and Curated Datasets for Dialogflow

翻译：评估基于任务的聊天机器人：用于Dialogflow的快照与精选数据集

Elena Masserini,Diego Clerissi,Daniela Micucci,Leonardo Mariani

from arxiv, 4 pages, 5 figures, Accepted at International Conference on Mining Software Repositories (MSR) 2026

In recent years, chatbots have gained widespread adoption thanks to their ability to assist users at any time and across diverse domains. However, the lack of large-scale curated datasets limits research on their quality and reliability. This paper presents TOFU-D, a snapshot of 1,788 Dialogflow chatbots from GitHub, and COD, a curated subset of TOFU-D including 185 validated chatbots. The two datasets capture a wide range of domains, languages, and implementation patterns, offering a sound basis for empirical studies on chatbot quality and security. A preliminary assessment using the Botium testing framework and the Bandit static analyzer revealed gaps in test coverage and frequent security vulnerabilities in several chatbots, highlighting the need for systematic, multi-Platform research on chatbot quality and security.

翻译：近年来，聊天机器人因其能够随时随地在不同领域为用户提供协助而获得广泛应用。然而，大规模精选数据集的缺乏限制了对聊天机器人质量与可靠性的研究。本文提出TOFU-D——一个包含GitHub上1,788个Dialogflow聊天机器人的快照数据集，以及COD——一个包含185个已验证聊天机器人的TOFU-D精选子集。这两个数据集涵盖了广泛的领域、语言与实现模式，为聊天机器人质量与安全的实证研究提供了可靠基础。通过Botium测试框架与Bandit静态分析器进行的初步评估显示，部分聊天机器人存在测试覆盖不足及常见安全漏洞，凸显了对聊天机器人质量与安全开展系统性、多平台研究的必要性。

0

相关内容

Chatbot

Chatbot，聊天机器人。 chatbot是场交互革命，也是一个多技术融合的平台。上图给出了构建一个chatbot需要具备的组件，简单地说chatbot = NLU(Natural Language Understanding) + NLG(Natural Language Generation)。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【新书】聊天机器人和文本生成

【新书】聊天机器人和文本生成

专知会员服务

32+阅读 · 2024年8月8日

基于大型语言模型的AI聊天机器人的完整综述

基于大型语言模型的AI聊天机器人的完整综述

专知会员服务

43+阅读 · 2024年6月26日

五角大楼正在开发大模型：类似 ChatGPT 的人工智能聊天机器人原型可能在今年推出

五角大楼正在开发大模型：类似 ChatGPT 的人工智能聊天机器人原型可能在今年推出

专知会员服务

16+阅读 · 2024年6月13日

【新书】《聊天机器人之书：从ELIZA到ChatGPT》，167页pdf

【新书】《聊天机器人之书：从ELIZA到ChatGPT》，167页pdf

专知会员服务

45+阅读 · 2024年2月6日

【ChatGPT系列报告】算力、数据与模型综合分析，46页Slides

【ChatGPT系列报告】算力、数据与模型综合分析，46页Slides

专知会员服务

155+阅读 · 2023年3月1日

检索式聊天机器人技术综述

检索式聊天机器人技术综述

专知会员服务

53+阅读 · 2021年11月28日

基于生成模型的闲聊机器人自动评价方法综述

专知会员服务

33+阅读 · 2021年4月18日

【干货书】用Python构建聊天机器人，205页pdf，使用自然语言处理和机器学习

【干货书】用Python构建聊天机器人，205页pdf，使用自然语言处理和机器学习

专知会员服务

220+阅读 · 2020年6月14日

【O'Reilly TensorFlow Conference 2019】基于TensorFlow的实时流数据机器学习（Machine learning over real-time streaming data with TensorFlow）

【O'Reilly TensorFlow Conference 2019】基于TensorFlow的实时流数据机器学习（Machine learning over real-time streaming data with TensorFlow）

专知会员服务

28+阅读 · 2019年11月14日

第二代聊天机器人，加拿大滑铁卢大学李明教授，CCKS-2019：知识智能

第二代聊天机器人，加拿大滑铁卢大学李明教授，CCKS-2019：知识智能

专知会员服务

16+阅读 · 2019年10月25日

基于金融-司法领域(兼有闲聊性质)的聊天机器人

基于金融-司法领域(兼有闲聊性质)的聊天机器人

专知

10+阅读 · 2019年7月8日

关于聊天机器人，这里有一份中文聊天语料库资源

关于聊天机器人，这里有一份中文聊天语料库资源

AINLP

68+阅读 · 2019年4月4日

【论文推荐】最新7篇聊天机器人（Chatbot）相关论文—触动你的心、DeepProbe、饮食推荐、知识学习、交互、挑战、管理

【论文推荐】最新7篇聊天机器人（Chatbot）相关论文—触动你的心、DeepProbe、饮食推荐、知识学习、交互、挑战、管理

专知

12+阅读 · 2018年3月15日

资源 | DeepPavlov：一个训练对话系统和聊天机器人的开源库

资源 | DeepPavlov：一个训练对话系统和聊天机器人的开源库

机器之心

22+阅读 · 2018年2月27日

Facebook 正改进聊天机器人的对话能力，让它们学会「闲聊」

Facebook 正改进聊天机器人的对话能力，让它们学会「闲聊」

极客公园

10+阅读 · 2018年1月31日

【论文推荐】最新5篇聊天机器人（Chatbot）相关论文—深度强化学习、社交聊天机器人小冰、对话聊天助手、序列-序列、动态词汇

【论文推荐】最新5篇聊天机器人（Chatbot）相关论文—深度强化学习、社交聊天机器人小冰、对话聊天助手、序列-序列、动态词汇

专知

23+阅读 · 2018年1月30日

Tensorflow实战系列，手把手教你构建一个Chatbot（博文+视频）

Tensorflow实战系列，手把手教你构建一个Chatbot（博文+视频）

专知

10+阅读 · 2017年12月30日

赛尔原创 | 聊天机器人中用户出行消费意图识别方法研究

赛尔原创 | 聊天机器人中用户出行消费意图识别方法研究

哈工大SCIR

19+阅读 · 2017年10月30日

视频教程【第10期】 | 如何通过调用API来搭建一个聊天机器人

视频教程【第10期】 | 如何通过调用API来搭建一个聊天机器人

AI100

10+阅读 · 2017年8月25日

当知识图谱遇上聊天机器人

当知识图谱遇上聊天机器人

PaperWeekly

34+阅读 · 2017年7月16日

面向互联网大数据的用户兴趣挖掘及预测研究

国家自然科学基金

6+阅读 · 2017年12月31日

基于略图挖掘的在不同时空域的网络流式数据实时处理

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

不确定数据流的分布并行Skyline查询技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于多存储介质的在线社交网络数据节能存储研究

国家自然科学基金

0+阅读 · 2015年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

大数据环境下基于社交网络的图像搜索技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

社交网络环境下基于协同过滤的上下文感知推荐系统研究

国家自然科学基金

6+阅读 · 2014年12月31日

基于人眼关注度与情感分析的电子商务智能推荐计算

国家自然科学基金

0+阅读 · 2014年12月31日

Automated Testing of Task-based Chatbots: How Far Are We?

Arxiv

0+阅读 · 2月13日

Why do we Trust Chatbots? From Normative Principles to Behavioral Drivers

Arxiv

0+阅读 · 2月11日

Why do we Trust Chatbots? From Normative Principles to Behavioral Drivers

Arxiv

0+阅读 · 2月9日

Disclose with Care: Designing Privacy Controls in Interview Chatbots

Arxiv

0+阅读 · 2月1日

CHOIR: A Chatbot-mediated Organizational Memory Leveraging Communication in University Research Labs

Arxiv

0+阅读 · 1月31日

Does My Chatbot Have an Agenda? Understanding Human and AI Agency in Human-Human-like Chatbot Interaction

Arxiv

0+阅读 · 1月30日

Bridging Instead of Replacing Online Coding Communities with AI through Community-Enriched Chatbot Designs

Arxiv

0+阅读 · 1月28日

ShareChat: A Dataset of Chatbot Conversations in the Wild

Arxiv

0+阅读 · 1月27日

A Checklist for Trustworthy, Safe, and User-Friendly Mental Health Chatbots

Arxiv

0+阅读 · 1月21日

When Generative AI Is Intimate, Sexy, and Violent: Examining Not-Safe-For-Work (NSFW) Chatbots on FlowGPT

Arxiv

0+阅读 · 1月20日

VIP会员

文章信息

相关主题

最新内容

2025年大语言模型进展报告

2025年大语言模型进展报告

专知会员服务

1+阅读 · 今天13:30

多智能体协作机制

多智能体协作机制

专知会员服务

1+阅读 · 今天13:26

非对称优势：美海军开发低成本反无人机技术

非对称优势：美海军开发低成本反无人机技术

专知会员服务

4+阅读 · 今天4:39

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

专知会员服务

14+阅读 · 今天2:52

《美战争部小企业创新研究（SBIR）计划》

《美战争部小企业创新研究（SBIR）计划》

专知会员服务

6+阅读 · 今天2:48

《军事模拟：将军事条令与目标融入AI智能体》

《军事模拟：将军事条令与目标融入AI智能体》

专知会员服务

9+阅读 · 今天2:43

【NTU博士论文】3D人体动作生成

【NTU博士论文】3D人体动作生成

专知会员服务

7+阅读 · 4月24日

DeepSeek-V4：百万 Token 上下文背后，大模型正在进入“长程智能”时代（附中英文pdf版）

DeepSeek-V4：百万 Token 上下文背后，大模型正在进入“长程智能”时代（附中英文pdf版）

专知会员服务

8+阅读 · 4月24日

以色列军事技术对美国军力发展的持续性赋能

以色列军事技术对美国军力发展的持续性赋能

专知会员服务

8+阅读 · 4月24日

战场之外的较量：美伊冲突中的认知战与心理博弈

战场之外的较量：美伊冲突中的认知战与心理博弈

专知会员服务

6+阅读 · 4月24日

俄乌战争中乌克兰防空能力演变与见解（中文版）

俄乌战争中乌克兰防空能力演变与见解（中文版）

专知会员服务

7+阅读 · 4月24日

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

专知会员服务

10+阅读 · 4月24日

《深度强化学习在兵棋推演中的应用》40页报告

《深度强化学习在兵棋推演中的应用》40页报告

专知会员服务

14+阅读 · 4月24日

《多域作战面临复杂现实》

《多域作战面临复杂现实》

专知会员服务

10+阅读 · 4月24日

《印度的多域作战：条令与能力发展》报告

《印度的多域作战：条令与能力发展》报告

专知会员服务

5+阅读 · 4月24日

相关VIP内容

【新书】聊天机器人和文本生成

【新书】聊天机器人和文本生成

专知会员服务

32+阅读 · 2024年8月8日

基于大型语言模型的AI聊天机器人的完整综述

基于大型语言模型的AI聊天机器人的完整综述

专知会员服务

43+阅读 · 2024年6月26日

五角大楼正在开发大模型：类似 ChatGPT 的人工智能聊天机器人原型可能在今年推出

五角大楼正在开发大模型：类似 ChatGPT 的人工智能聊天机器人原型可能在今年推出

专知会员服务

16+阅读 · 2024年6月13日

【新书】《聊天机器人之书：从ELIZA到ChatGPT》，167页pdf

【新书】《聊天机器人之书：从ELIZA到ChatGPT》，167页pdf

专知会员服务

45+阅读 · 2024年2月6日

【ChatGPT系列报告】算力、数据与模型综合分析，46页Slides

【ChatGPT系列报告】算力、数据与模型综合分析，46页Slides

专知会员服务

155+阅读 · 2023年3月1日

检索式聊天机器人技术综述

检索式聊天机器人技术综述

专知会员服务

53+阅读 · 2021年11月28日

基于生成模型的闲聊机器人自动评价方法综述

专知会员服务

33+阅读 · 2021年4月18日

【干货书】用Python构建聊天机器人，205页pdf，使用自然语言处理和机器学习

【干货书】用Python构建聊天机器人，205页pdf，使用自然语言处理和机器学习

专知会员服务

220+阅读 · 2020年6月14日

【O'Reilly TensorFlow Conference 2019】基于TensorFlow的实时流数据机器学习（Machine learning over real-time streaming data with TensorFlow）

【O'Reilly TensorFlow Conference 2019】基于TensorFlow的实时流数据机器学习（Machine learning over real-time streaming data with TensorFlow）

专知会员服务

28+阅读 · 2019年11月14日

第二代聊天机器人，加拿大滑铁卢大学李明教授，CCKS-2019：知识智能

第二代聊天机器人，加拿大滑铁卢大学李明教授，CCKS-2019：知识智能

专知会员服务

16+阅读 · 2019年10月25日

热门VIP内容

开通专知VIP会员享更多权益服务

多智能体协作机制

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

2025年大语言模型进展报告

非对称优势：美海军开发低成本反无人机技术

相关资讯

基于金融-司法领域(兼有闲聊性质)的聊天机器人

基于金融-司法领域(兼有闲聊性质)的聊天机器人

专知

10+阅读 · 2019年7月8日

关于聊天机器人，这里有一份中文聊天语料库资源

关于聊天机器人，这里有一份中文聊天语料库资源

AINLP

68+阅读 · 2019年4月4日

【论文推荐】最新7篇聊天机器人（Chatbot）相关论文—触动你的心、DeepProbe、饮食推荐、知识学习、交互、挑战、管理

【论文推荐】最新7篇聊天机器人（Chatbot）相关论文—触动你的心、DeepProbe、饮食推荐、知识学习、交互、挑战、管理

专知

12+阅读 · 2018年3月15日

资源 | DeepPavlov：一个训练对话系统和聊天机器人的开源库

资源 | DeepPavlov：一个训练对话系统和聊天机器人的开源库

机器之心

22+阅读 · 2018年2月27日

Facebook 正改进聊天机器人的对话能力，让它们学会「闲聊」

Facebook 正改进聊天机器人的对话能力，让它们学会「闲聊」

极客公园

10+阅读 · 2018年1月31日

【论文推荐】最新5篇聊天机器人（Chatbot）相关论文—深度强化学习、社交聊天机器人小冰、对话聊天助手、序列-序列、动态词汇

【论文推荐】最新5篇聊天机器人（Chatbot）相关论文—深度强化学习、社交聊天机器人小冰、对话聊天助手、序列-序列、动态词汇

专知

23+阅读 · 2018年1月30日

Tensorflow实战系列，手把手教你构建一个Chatbot（博文+视频）

Tensorflow实战系列，手把手教你构建一个Chatbot（博文+视频）

专知

10+阅读 · 2017年12月30日

赛尔原创 | 聊天机器人中用户出行消费意图识别方法研究

赛尔原创 | 聊天机器人中用户出行消费意图识别方法研究

哈工大SCIR

19+阅读 · 2017年10月30日

视频教程【第10期】 | 如何通过调用API来搭建一个聊天机器人

视频教程【第10期】 | 如何通过调用API来搭建一个聊天机器人

AI100

10+阅读 · 2017年8月25日

当知识图谱遇上聊天机器人

当知识图谱遇上聊天机器人

PaperWeekly

34+阅读 · 2017年7月16日

相关论文

Automated Testing of Task-based Chatbots: How Far Are We?

Arxiv

0+阅读 · 2月13日

Why do we Trust Chatbots? From Normative Principles to Behavioral Drivers

Arxiv

0+阅读 · 2月11日

Why do we Trust Chatbots? From Normative Principles to Behavioral Drivers

Arxiv

0+阅读 · 2月9日

Disclose with Care: Designing Privacy Controls in Interview Chatbots

Arxiv

0+阅读 · 2月1日

CHOIR: A Chatbot-mediated Organizational Memory Leveraging Communication in University Research Labs

Arxiv

0+阅读 · 1月31日

Does My Chatbot Have an Agenda? Understanding Human and AI Agency in Human-Human-like Chatbot Interaction

Arxiv

0+阅读 · 1月30日

Bridging Instead of Replacing Online Coding Communities with AI through Community-Enriched Chatbot Designs

Arxiv

0+阅读 · 1月28日

ShareChat: A Dataset of Chatbot Conversations in the Wild

Arxiv

0+阅读 · 1月27日

A Checklist for Trustworthy, Safe, and User-Friendly Mental Health Chatbots

Arxiv

0+阅读 · 1月21日

When Generative AI Is Intimate, Sexy, and Violent: Examining Not-Safe-For-Work (NSFW) Chatbots on FlowGPT

Arxiv

0+阅读 · 1月20日

相关基金

面向互联网大数据的用户兴趣挖掘及预测研究

国家自然科学基金

6+阅读 · 2017年12月31日

基于略图挖掘的在不同时空域的网络流式数据实时处理

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

不确定数据流的分布并行Skyline查询技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于多存储介质的在线社交网络数据节能存储研究

国家自然科学基金

0+阅读 · 2015年12月31日

非结构环境下基于三维肢体动作理解的工业机器人交互技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

大数据环境下基于社交网络的图像搜索技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

社交网络环境下基于协同过滤的上下文感知推荐系统研究

国家自然科学基金

6+阅读 · 2014年12月31日

基于人眼关注度与情感分析的电子商务智能推荐计算

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员