成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
评估指标
关注
2
综合
百科
VIP
热门
动态
论文
精华
PolyGraph Discrepancy: a classifier-based metric for graph generation
Arxiv
0+阅读 · 3月17日
Do Metrics for Counterfactual Explanations Align with User Perception?
Arxiv
0+阅读 · 3月16日
A Simple and Efficient Jailbreak Method Exploiting LLMs' Helpfulness
Arxiv
0+阅读 · 2月24日
Beyond Mimicry: Toward Lifelong Adaptability in Imitation Learning
Arxiv
0+阅读 · 2月23日
The Counterfactual Combine: A Causal Framework for Player Evaluation
Arxiv
0+阅读 · 2月26日
Terminology Rarity Predicts Catastrophic Failure in LLM Translation of Low-Resource Ancient Languages: Evidence from Ancient Greek
Arxiv
0+阅读 · 2月27日
Analysis of Terms of Service on Social Media Platforms: Consent Challenges and Assessment Metrics
Arxiv
0+阅读 · 3月5日
Classroom AI: Large Language Models as Grade-Specific Teachers
Arxiv
0+阅读 · 3月6日
Perception Characteristics Distance: Measuring Stability and Robustness of Perception System in Dynamic Conditions under a Certain Decision Rule
Arxiv
0+阅读 · 2月22日
Inclusive Ranking of Indian States via Bayesian Bradley-Terry Model
Arxiv
0+阅读 · 2月20日
"I think this is fair": Uncovering the Complexities of Stakeholder Decision-Making in AI Fairness Assessment
Arxiv
0+阅读 · 2月26日
Evaluating Text Style Transfer: A Nine-Language Benchmark for Text Detoxification
Arxiv
0+阅读 · 3月4日
Unveiling Downstream Performance Scaling of LLMs: A Clustering-Based Perspective
Arxiv
0+阅读 · 3月9日
BanglaSummEval: Reference-Free Factual Consistency Evaluation for Bangla Summarization
Arxiv
0+阅读 · 2月18日
WarpRec: Unifying Academic Rigor and Industrial Scale for Responsible, Reproducible, and Efficient Recommendation
Arxiv
0+阅读 · 2月19日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top