成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
工具使用
关注
0
综合
百科
VIP
热门
动态
论文
精华
ToolRM: Outcome Reward Models for Tool-Calling Large Language Models
Arxiv
0+阅读 · 1月7日
WebAnchor: Anchoring Agent Planning to Stabilize Long-Horizon Web Reasoning
Arxiv
0+阅读 · 1月6日
TravelBench: A Broader Real-World Benchmark for Multi-Turn and Tool-Using Travel Planning
Arxiv
0+阅读 · 1月5日
RIMRULE: Improving Tool-Using Language Agents via MDL-Guided Rule Learning
Arxiv
0+阅读 · 1月5日
From Failure to Mastery: Generating Hard Samples for Tool-use Agents
Arxiv
0+阅读 · 1月4日
RIMRULE: Improving Tool-Using Language Agents via MDL-Guided Rule Learning
Arxiv
0+阅读 · 2025年12月31日
MCPAgentBench: A Real-world Task Benchmark for Evaluating LLM Agent MCP Tool Use
Arxiv
0+阅读 · 2025年12月31日
TPTU: Large Language Model-based AI Agents for Task Planning and Tool Usage
Arxiv
0+阅读 · 2025年12月29日
AWPO: Enhancing Tool-Use of Large Language Models through Explicit Integration of Reasoning Rewards
Arxiv
0+阅读 · 2025年12月22日
AWPO: Enhancing Tool-Use of Large Language Models through Explicit Integration of Reasoning Rewards
Arxiv
0+阅读 · 2025年12月23日
iTool: Reinforced Fine-Tuning with Dynamic Deficiency Calibration for Advanced Tool Use
Arxiv
0+阅读 · 2025年11月7日
M^3-Bench: Multi-Modal, Multi-Hop, Multi-Threaded Tool-Using MLLM Agent Benchmark
Arxiv
0+阅读 · 2025年12月13日
M^3-Bench: Multi-Modal, Multi-Hop, Multi-Threaded Tool-Using MLLM Agent Benchmark
Arxiv
0+阅读 · 2025年11月30日
Training Multi-Image Vision Agents via End2End Reinforcement Learning
Arxiv
0+阅读 · 2025年12月16日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top