成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
平行语料
关注
0
综合
百科
VIP
热门
动态
论文
精华
Anything Goes? A Crosslinguistic Study of (Im)possible Language Learning in LMs
Arxiv
0+阅读 · 6月13日
AthDGC: An Open Diachronic Greek Treebank with Indo-European Parallels
Arxiv
0+阅读 · 6月13日
Translators as Invisible Teachers of AI: Copyright, Translation Memory, and the Political Economy of Linguistic Data
Arxiv
0+阅读 · 5月24日
GhanaNLP Parallel Corpora: Comprehensive Multilingual Resources for Low-Resource Ghanaian Languages
Arxiv
0+阅读 · 3月30日
CodePivot: Bootstrapping Multilingual Transpilation in LLMs via Reinforcement Learning without Parallel Corpora
Arxiv
0+阅读 · 4月20日
MimicLM: Zero-Shot Voice Imitation through Autoregressive Modeling of Pseudo-Parallel Speech Corpora
Arxiv
0+阅读 · 4月13日
NepTam: A Nepali-Tamang Parallel Corpus and Baseline Machine Translation Experiments
Arxiv
0+阅读 · 3月14日
The Mediomatix Corpus: Parallel Data for Romansh Language Varieties via Comparable Schoolbooks
Arxiv
0+阅读 · 2月13日
The Role of Mixed-Language Documents for Multilingual Large Language Model Pretraining
Arxiv
0+阅读 · 1月23日
The taggedPBC: Annotating a massive parallel corpus for crosslinguistic investigations
Arxiv
0+阅读 · 1月24日
Get away with less: Need of source side data curation to build parallel corpus for low resource Machine Translation
Arxiv
0+阅读 · 1月13日
VietMix: A Naturally-Occurring Parallel Corpus and Augmentation Framework for Vietnamese-English Code-Mixed Machine Translation
Arxiv
0+阅读 · 1月9日
AlignAR: Generative Sentence Alignment for Arabic-English Parallel Corpora of Legal and Literary Texts
Arxiv
0+阅读 · 1月1日
The Role of Mixed-Language Documents for Multilingual Large Language Model Pretraining
Arxiv
0+阅读 · 1月1日
AlignAR: Generative Sentence Alignment for Arabic-English Parallel Corpora of Legal and Literary Texts
Arxiv
0+阅读 · 2025年12月26日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top