成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
多轮对话
关注
2
综合
百科
VIP
热门
动态
论文
精华
TurnWise: The Gap between Single- and Multi-turn Language Model Capabilities
Arxiv
0+阅读 · 3月17日
When Tables Go Crazy: Evaluating Multimodal Models on French Financial Documents
Arxiv
0+阅读 · 3月16日
Do LLMs Benefit From Their Own Words?
Arxiv
0+阅读 · 2月27日
Non-Collaborative User Simulators for Tool Agents
Arxiv
0+阅读 · 3月4日
AIDG: Evaluating Asymmetry Between Information Extraction and Containment in Multi-Turn Dialogue
Arxiv
0+阅读 · 2月19日
DIAL: Direct Iterative Adversarial Learning for Realistic Multi-Turn Dialogue Simulation
Arxiv
0+阅读 · 2月18日
Visual Memory Injection Attacks for Multi-Turn Conversations
Arxiv
0+阅读 · 2月17日
Intermittent Semi-Working Mask: A New Masking Paradigm for LLMs
Arxiv
0+阅读 · 2月17日
Affective Flow Language Model for Emotional Support Conversation
Arxiv
0+阅读 · 2月9日
Intent Mismatch Causes LLMs to Get Lost in Multi-Turn Conversation
Arxiv
0+阅读 · 2月7日
SafeDialBench: A Fine-Grained Safety Evaluation Benchmark for Large Language Models in Multi-Turn Dialogues with Diverse Jailbreak Attacks
Arxiv
0+阅读 · 2月7日
When Tables Go Crazy: Evaluating Multimodal Models on French Financial Documents
Arxiv
0+阅读 · 2月12日
MENASpeechBank: A Reference Voice Bank with Persona-Conditioned Multi-Turn Conversations for AudioLLMs
Arxiv
0+阅读 · 2月3日
Beyond In-Domain Detection: SpikeScore for Cross-Domain Hallucination Detection
Arxiv
0+阅读 · 2月15日
MTR-DuplexBench: Towards a Comprehensive Evaluation of Multi-Round Conversations for Full-Duplex Speech Language Models
Arxiv
0+阅读 · 2月8日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top