成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
多媒体
关注
4
综合
百科
VIP
热门
动态
论文
精华
Transform and Entropy Coding in AV2
Arxiv
0+阅读 · 1月6日
FCMBench: A Comprehensive Financial Credit Multimodal Benchmark for Real-world Applications
Arxiv
0+阅读 · 1月6日
Robust Mesh Saliency GT Acquisition in VR via View Cone Sampling and Geometric Smoothing
Arxiv
0+阅读 · 1月6日
Omni2Sound: Towards Unified Video-Text-to-Audio Generation
Arxiv
0+阅读 · 1月6日
Towards Unbiased Cross-Modal Representation Learning for Food Image-to-Recipe Retrieval
Arxiv
0+阅读 · 1月6日
SyncLipMAE: Contrastive Masked Pretraining for Audio-Visual Talking-Face Representation
Arxiv
0+阅读 · 1月6日
UniSRCodec: Unified and Low-Bitrate Single Codebook Codec with Sub-Band Reconstruction
Arxiv
0+阅读 · 1月6日
The perceptual gap between video see-through displays and natural human vision
Arxiv
0+阅读 · 1月6日
Resolution deficits drive simulator sickness and compromise reading performance in virtual environments
Arxiv
0+阅读 · 1月6日
A Versatile Multimodal Agent for Multimedia Content Generation
Arxiv
0+阅读 · 1月6日
Listen to the Unexpected: Self-Supervised Surprise Detection for Efficient Viewport Prediction
Arxiv
0+阅读 · 1月6日
pyAMPACT: A Score-Audio Alignment Toolkit for Performance Data Estimation and Multi-modal Processing
Arxiv
0+阅读 · 1月5日
MIND Your Reasoning: A Meta-Cognitive Intuitive-Reflective Network for Dual-Reasoning in Multimodal Stance Detection
Arxiv
0+阅读 · 1月5日
Pedagogical Reflections on the Holistic Cognitive Development (HCD) Framework and AI-Augmented Learning in Creative Computing
Arxiv
0+阅读 · 1月5日
LinMU: Multimodal Understanding Made Linear
Arxiv
0+阅读 · 1月4日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top