TD论文 - 专知

会员服务 ·

Stakeholder Criteria in Technical Debt Decision-Making: A Practitioner-Informed Taxonomy

Arxiv

0+阅读 · 6月18日

Horizon Adaptive Offline Policy Learning via Value Stitching

Arxiv

0+阅读 · 6月19日

CoMo: Learning Continuous Latent Motion from Internet Videos for Scalable Robot Learning

Arxiv

0+阅读 · 6月18日

On the Variance of Temporal Difference Learning and its Reduction Using Control Variates

Arxiv

0+阅读 · 6月18日

A Diffusion Approximation for Temporal-Difference Learning with Linear Features under Markovian Noise

Arxiv

0+阅读 · 6月16日

Stabilizing Short Duration Speaker Verification through Neural Re-scoring with Hybrid Enrollment

Arxiv

0+阅读 · 6月15日

$λ$-Reachability: Geometric-Horizon Safety Bellman Equations for Humanoid Safety

Arxiv

0+阅读 · 6月14日

Temporal Difference Learning for Diffusion Models

Arxiv

0+阅读 · 6月13日

Bayesian Tensor Decomposition with Diffusion Model Prior

Arxiv

0+阅读 · 6月15日

Fast and Robust Convergence Rate for TD(0) with Linear Function Approximation, Universal Learning Steps and I.I.D. Samples

Arxiv

0+阅读 · 6月5日

CustomDancer: Customized Dance Recommendation by Text-Dance Retrieval

Arxiv

0+阅读 · 5月1日

Watts and Debts of Agentic Frameworks: An Empirical Study (Registered Report)

Arxiv

0+阅读 · 6月9日

TagDebt: A Bot to Support Technical Debt Management

Arxiv

0+阅读 · 5月28日

Reinforcement Learning with Action Chunking

Arxiv

0+阅读 · 5月11日

Multi-Step First: A Lightweight Deep Reinforcement Learning Strategy for Robust Continuous Control with Partial Observability

Arxiv

0+阅读 · 3月21日

参考链接

微信扫码咨询专知VIP会员