成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
评论员
关注
1
综合
百科
VIP
热门
动态
论文
精华
Critic-Guided Reinforcement Unlearning in Text-to-Image Diffusion
Arxiv
0+阅读 · 2月15日
Implicit Actor Critic Coupling via a Supervised Learning Framework for RLVR
Arxiv
0+阅读 · 2月16日
Stabilizing the Q-Gradient Field for Policy Smoothness in Actor-Critic
Arxiv
0+阅读 · 1月30日
Scaling Effects and Uncertainty Quantification in Neural Actor Critic Algorithms
Arxiv
0+阅读 · 1月25日
Guided by the Plan: Enhancing Faithful Autoregressive Text-to-Audio Generation with Guided Decoding
Arxiv
0+阅读 · 1月18日
New Adaptive Mechanism for Large Neighborhood Search using Dual Actor-Critic
Arxiv
0+阅读 · 1月16日
SWE-SQL: Illuminating LLM Pathways to Solve User SQL Issues in Real-World Applications
Arxiv
0+阅读 · 1月24日
Actor-Critic Cooperative Compensation to Model Predictive Control for Off-Road Autonomous Vehicles Under Unknown Dynamics
Arxiv
0+阅读 · 1月26日
IF-CRITIC: Towards a Fine-Grained LLM Critic for Instruction-Following Evaluation
Arxiv
0+阅读 · 1月8日
Generation of Geodesics with Actor-Critic Reinforcement Learning to Predict Midpoints
Arxiv
0+阅读 · 1月5日
LLM-Assisted Abstract Screening with OLIVER: Evaluating Calibration and Single-Model vs. Actor-Critic Configurations in Literature Reviews
Arxiv
0+阅读 · 2025年12月23日
Reinforcement Learning Position Control of a Quadrotor Using Soft Actor-Critic (SAC)
Arxiv
0+阅读 · 2025年12月20日
Design Challenges and User Needs in Disaster Support Mobile Apps: A Large-Scale Analysis of Features and Reviews
Arxiv
0+阅读 · 2025年11月12日
CareMedEval dataset: Evaluating Critical Appraisal and Reasoning in the Biomedical Field
Arxiv
0+阅读 · 2025年11月5日
Deep Reinforcement Learning for Automated Stock Trading: An Ensemble Strategy
Arxiv
0+阅读 · 2025年11月15日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top