成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
语料
关注
0
综合
百科
VIP
热门
动态
论文
精华
A path to natural language through tokenisation and transformers
Arxiv
0+阅读 · 1月6日
Bridging OLAP and RAG: A Multidimensional Approach to the Design of Corpus Partitioning
Arxiv
0+阅读 · 1月7日
V-FAT: Benchmarking Visual Fidelity Against Text-bias
Arxiv
0+阅读 · 1月8日
Is This Collection Worth My LLM's Time? Automatically Measuring Information Potential in Text Corpora
Arxiv
0+阅读 · 1月8日
Beyond Scaling: Measuring and Predicting the Upper Bound of Knowledge Retention in Language Model Pre-Training
Arxiv
0+阅读 · 1月7日
BENYO-S2ST-Corpus-1: A Bilingual English-to-Yoruba Direct Speech-to-Speech Translation Corpus
Arxiv
0+阅读 · 1月7日
LEMAS: Large A 150K-Hour Large-scale Extensible Multilingual Audio Suite with Generative Speech Models
Arxiv
0+阅读 · 1月4日
OptiSet: Unified Optimizing Set Selection and Ranking for Retrieval-Augmented Generation
Arxiv
0+阅读 · 1月8日
PM4Bench: Benchmarking Large Vision-Language Models with Parallel Multilingual Multi-Modal Multi-task Corpus
Arxiv
0+阅读 · 1月7日
Surprisal and Metaphor Novelty: Moderate Correlations and Divergent Scaling Effects
Arxiv
0+阅读 · 1月8日
Improving Indigenous Language Machine Translation with Synthetic Data and Language-Specific Preprocessing
Arxiv
0+阅读 · 1月6日
Limited Linguistic Diversity in Embodied AI Datasets
Arxiv
0+阅读 · 1月6日
UniversalRAG: Retrieval-Augmented Generation over Corpora of Diverse Modalities and Granularities
Arxiv
0+阅读 · 1月6日
CREAM: Continual Retrieval on Dynamic Streaming Corpora with Adaptive Soft Memory
Arxiv
0+阅读 · 1月6日
ARCADE: A City-Scale Corpus for Fine-Grained Arabic Dialect Tagging
Arxiv
0+阅读 · 1月5日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top