成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
自动评估
关注
0
综合
百科
VIP
热门
动态
论文
精华
Ara-HOPE: Human-Centric Post-Editing Evaluation for Dialectal Arabic to Modern Standard Arabic Translation
Arxiv
0+阅读 · 2月14日
Machine Learning for Detection and Severity Estimation of Sweetpotato Weevil Damage in Field and Lab Conditions
Arxiv
0+阅读 · 2月6日
FM SO.P: A Progressive Task Mixture Framework with Automatic Evaluation for Cross-Domain SOP Understanding
Arxiv
0+阅读 · 2月10日
Argument Rarity-based Originality Assessment for AI-Assisted Writing
Arxiv
0+阅读 · 2月2日
ALiiCE: Evaluating Positional Fine-grained Citation Generation
Arxiv
0+阅读 · 2月2日
Towards Automatic Evaluation and High-Quality Pseudo-Parallel Dataset Construction for Audio Editing: A Human-in-the-Loop Method
Arxiv
0+阅读 · 2月1日
PsyProbe: Proactive and Interpretable Dialogue through User State Modeling for Exploratory Counseling
Arxiv
0+阅读 · 1月27日
AudioEval: Automatic Dual-Perspective and Multi-Dimensional Evaluation of Text-to-Audio-Generation
Arxiv
0+阅读 · 1月29日
AEQ-Bench: Measuring Empathy of Omni-Modal Large Models
Arxiv
0+阅读 · 1月15日
CE-RM: A Pointwise Generative Reward Model Optimized via Two-Stage Rollout and Unified Criteria
Arxiv
0+阅读 · 1月28日
Trustworthy Evaluation of Robotic Manipulation: A New Benchmark and AutoEval Methods
Arxiv
0+阅读 · 1月26日
AgentHallu: Benchmarking Automated Hallucination Attribution of LLM-based Agents
Arxiv
0+阅读 · 1月11日
Pearmut: Human Evaluation of Translation Made Trivial
Arxiv
0+阅读 · 1月10日
ThreatLinker: An NLP-based Methodology to Automatically Estimate CVE Relevance for CAPEC Attack Patterns
Arxiv
0+阅读 · 1月12日
What do the metrics mean? A critical analysis of the use of Automated Evaluation Metrics in Interpreting
Arxiv
0+阅读 · 1月9日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top