Uni-Parser Technical Report - 专知论文

会员服务 ·

0

模态 · 文档解析 · 结构 · GPU · 报告 ·

Uni-Parser Technical Report

翻译：Uni-Parser 技术报告

Xi Fang,Haoyi Tao,Shuwen Yang,Chaozheng Huang,Suyang Zhong,Haocheng Lu,Han Lyu,Xinyu Li,Linfeng Zhang,Guolin Ke

This technical report introduces Uni-Parser, an industrial-grade document parsing engine tailored for scientific literature and patents, delivering high throughput, robust accuracy, and cost efficiency. Unlike pipeline-based document parsing methods, Uni-Parser employs a modular, loosely coupled multi-expert architecture that preserves fine-grained cross-modal alignments across text, equations, tables, figures, and chemical structures, while remaining easily extensible to emerging modalities. The system incorporates adaptive GPU load balancing, distributed inference, dynamic module orchestration, and configurable modes that support either holistic or modality-specific parsing. Optimized for large-scale cloud deployment, Uni-Parser achieves a processing rate of up to 20 PDF pages per second on 8 x NVIDIA RTX 4090D GPUs, enabling cost-efficient inference across billions of pages. This level of scalability facilitates a broad spectrum of downstream applications, ranging from literature retrieval and summarization to the extraction of chemical structures, reaction schemes, and bioactivity data, as well as the curation of large-scale corpora for training next-generation large language models and AI4Science models.

翻译：本技术报告介绍了 Uni-Parser，一个专为科学文献和专利设计的工业级文档解析引擎，具备高吞吐量、鲁棒的准确性和成本效益。与基于流水线的文档解析方法不同，Uni-Parser 采用了一种模块化、松耦合的多专家架构，该架构保留了文本、公式、表格、图形和化学结构之间细粒度的跨模态对齐，同时易于扩展到新兴模态。该系统集成了自适应 GPU 负载均衡、分布式推理、动态模块编排和可配置模式，支持整体解析或特定模态解析。针对大规模云部署进行了优化，Uni-Parser 在 8 块 NVIDIA RTX 4090D GPU 上实现了高达每秒 20 页 PDF 的处理速率，从而能够在数十亿页规模上实现经济高效的推理。这种可扩展性为广泛的下游应用提供了便利，范围涵盖文献检索与摘要、化学结构、反应方案和生物活性数据的提取，以及为训练下一代大语言模型和 AI4Science 模型而进行的大规模语料库构建。

0

相关内容

《未来士兵技术进展》报告

《未来士兵技术进展》报告

专知会员服务

29+阅读 · 2025年12月9日

《深度解析Palantir》报告，71页ppt

《深度解析Palantir》报告，71页ppt

专知会员服务

210+阅读 · 2025年1月22日

《GenAI技术落地白皮书》，19页

《GenAI技术落地白皮书》，19页

专知会员服务

59+阅读 · 2024年6月23日

GPT-4o核心技术？哈工大最新《Uni-MoE：使用专家混合模型扩展统一多模态大语言模型》

GPT-4o核心技术？哈工大最新《Uni-MoE：使用专家混合模型扩展统一多模态大语言模型》

专知会员服务

35+阅读 · 2024年5月26日

《TextCycleGAN 技术报告》

《TextCycleGAN 技术报告》

专知会员服务

34+阅读 · 2023年5月4日

《可配置的无人水下航行器（UUV）电场和磁场传感器网络》美国爱达荷大学30页项目技术报告

《可配置的无人水下航行器（UUV）电场和磁场传感器网络》美国爱达荷大学30页项目技术报告

专知会员服务

35+阅读 · 2022年11月23日

2022年【科技棱镜——聚焦科技引领的商业变革】，37页pdf！Thoughtworks 科技棱镜未来技术趋势分析报告

2022年【科技棱镜——聚焦科技引领的商业变革】，37页pdf！Thoughtworks 科技棱镜未来技术趋势分析报告

专知会员服务

17+阅读 · 2022年2月18日

微软亚洲研究院新论文-《多模态预训练语言模型UniViLM》面向多模态理解和生成的统一视频和语言预训练模型

微软亚洲研究院新论文-《多模态预训练语言模型UniViLM》面向多模态理解和生成的统一视频和语言预训练模型

专知会员服务

109+阅读 · 2020年2月19日

PaperRobot: Automated Scientific Knowledge Graph Construction and Paper Writing，伊利诺伊大学香槟分校计算机科学系Heng Ji教授，CCKS-2019：知识智能

PaperRobot: Automated Scientific Knowledge Graph Construction and Paper Writing，伊利诺伊大学香槟分校计算机科学系Heng Ji教授，CCKS-2019：知识智能

专知会员服务

32+阅读 · 2019年10月25日

文档分析与识别技术回顾与反思，中国科学院自动化研究所刘成林研究员，VALSE2019: 让机器像人一样阅读：文字检测与识别新趋势

文档分析与识别技术回顾与反思，中国科学院自动化研究所刘成林研究员，VALSE2019: 让机器像人一样阅读：文字检测与识别新趋势

专知会员服务

38+阅读 · 2019年10月24日

GPT-4视频讲解！附Slides，OpenAI 《GPT-4 技术报告》中英文版下载,151页pdf

GPT-4视频讲解！附Slides，OpenAI 《GPT-4 技术报告》中英文版下载,151页pdf

专知

22+阅读 · 2023年4月10日

《开发新型飞行器数字孪生原型的框架》北约科学与技术组织2022最新14页技术报告

《开发新型飞行器数字孪生原型的框架》北约科学与技术组织2022最新14页技术报告

专知

24+阅读 · 2022年10月24日

智库兰德2022最新发布《2035年新兴技术：基于典型场景的未来军事突发事件技术评估》118页研究报告

智库兰德2022最新发布《2035年新兴技术：基于典型场景的未来军事突发事件技术评估》118页研究报告

专知

53+阅读 · 2022年10月13日

美国陆军研究实验室《支持C2互操作性和传感器融合的全球信息网络架构评估》2022年技术总结报告

美国陆军研究实验室《支持C2互操作性和传感器融合的全球信息网络架构评估》2022年技术总结报告

专知

64+阅读 · 2022年7月15日

LeCun力荐，PyTorch官方权威教程书来了，意外的通俗易懂

LeCun力荐，PyTorch官方权威教程书来了，意外的通俗易懂

机器之心

22+阅读 · 2019年11月22日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

44+阅读 · 2019年1月3日

技术动态 | TechKG：一个面向中文学术领域的大型知识图谱

技术动态 | TechKG：一个面向中文学术领域的大型知识图谱

开放知识图谱

25+阅读 · 2018年12月20日

Jupyter Notebook的三大短板，都被这个新工具补齐了

Jupyter Notebook的三大短板，都被这个新工具补齐了

量子位

71+阅读 · 2018年9月10日

【数字孪生】数字孪生系列报道：15家单位22位作者研究成果，数字孪生应用探索

【数字孪生】数字孪生系列报道：15家单位22位作者研究成果，数字孪生应用探索

产业智能官

53+阅读 · 2018年5月17日

Github 项目推荐 | Scikit-learn（sklearn）官方文档中文版

Github 项目推荐 | Scikit-learn（sklearn）官方文档中文版

AI研习社

10+阅读 · 2018年4月5日

云计算环境中面向内容的密文检索关键技术研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

网络空间安全关键技术研究

国家自然科学基金

20+阅读 · 2015年12月31日

纳米制造战略研究和学术交流

国家自然科学基金

1+阅读 · 2015年12月31日

可与MPSoC高度融合的片上自主测试-自主修复关键技术研究：针对自然、人为可靠性威胁

国家自然科学基金

0+阅读 · 2015年12月31日

基于先验信息压缩感知SAR成像的信息理论限及实用算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

高采样率、高量化分辨率一体化全光模数转换关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据的高时效并行计算机系统结构与技术

国家自然科学基金

0+阅读 · 2014年12月31日

建立纳米制造技术信息平台的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于UGC的应急响应决策支持系统关键技术研究

国家自然科学基金

13+阅读 · 2014年12月31日

LuxMT Technical Report

Arxiv

0+阅读 · 2月17日

Kelix Technical Report

Arxiv

0+阅读 · 2月12日

HoloBrain-0 Technical Report

Arxiv

0+阅读 · 2月12日

Kelix Technique Report

Arxiv

0+阅读 · 2月10日

UniLiP: Adapting CLIP for Unified Multimodal Understanding, Generation and Editing

Arxiv

0+阅读 · 2月9日

ERNIE 5.0 Technical Report

Arxiv

0+阅读 · 2月4日

OpenOneRec Technical Report

Arxiv

0+阅读 · 2月4日

HunyuanImage 3.0 Technical Report

Arxiv

0+阅读 · 2月2日

UniCon: A Unified System for Efficient Robot Learning Transfers

Arxiv

0+阅读 · 1月21日

TranslateGemma Technical Report

Arxiv

0+阅读 · 1月15日

VIP会员

文章信息

相关主题

最新内容

对抗环境下超视距目标打击的情报支援

对抗环境下超视距目标打击的情报支援

专知会员服务

3+阅读 · 今天14:49

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

专知会员服务

1+阅读 · 今天14:25

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

专知会员服务

2+阅读 · 今天13:57

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

专知会员服务

2+阅读 · 今天13:27

《无人机对海面作战影响评估》

《无人机对海面作战影响评估》

专知会员服务

11+阅读 · 7月21日

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

专知会员服务

10+阅读 · 7月21日

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

专知会员服务

4+阅读 · 7月21日

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

专知会员服务

6+阅读 · 7月21日

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

专知会员服务

8+阅读 · 7月21日

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

6+阅读 · 7月20日

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

8+阅读 · 7月20日

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

6+阅读 · 7月20日

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

9+阅读 · 7月20日

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

专知会员服务

8+阅读 · 7月20日

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

专知会员服务

10+阅读 · 7月20日

相关VIP内容

《未来士兵技术进展》报告

《未来士兵技术进展》报告

专知会员服务

29+阅读 · 2025年12月9日

《深度解析Palantir》报告，71页ppt

《深度解析Palantir》报告，71页ppt

专知会员服务

210+阅读 · 2025年1月22日

《GenAI技术落地白皮书》，19页

《GenAI技术落地白皮书》，19页

专知会员服务

59+阅读 · 2024年6月23日

GPT-4o核心技术？哈工大最新《Uni-MoE：使用专家混合模型扩展统一多模态大语言模型》

GPT-4o核心技术？哈工大最新《Uni-MoE：使用专家混合模型扩展统一多模态大语言模型》

专知会员服务

35+阅读 · 2024年5月26日

《TextCycleGAN 技术报告》

《TextCycleGAN 技术报告》

专知会员服务

34+阅读 · 2023年5月4日

《可配置的无人水下航行器（UUV）电场和磁场传感器网络》美国爱达荷大学30页项目技术报告

《可配置的无人水下航行器（UUV）电场和磁场传感器网络》美国爱达荷大学30页项目技术报告

专知会员服务

35+阅读 · 2022年11月23日

2022年【科技棱镜——聚焦科技引领的商业变革】，37页pdf！Thoughtworks 科技棱镜未来技术趋势分析报告

2022年【科技棱镜——聚焦科技引领的商业变革】，37页pdf！Thoughtworks 科技棱镜未来技术趋势分析报告

专知会员服务

17+阅读 · 2022年2月18日

微软亚洲研究院新论文-《多模态预训练语言模型UniViLM》面向多模态理解和生成的统一视频和语言预训练模型

微软亚洲研究院新论文-《多模态预训练语言模型UniViLM》面向多模态理解和生成的统一视频和语言预训练模型

专知会员服务

109+阅读 · 2020年2月19日

PaperRobot: Automated Scientific Knowledge Graph Construction and Paper Writing，伊利诺伊大学香槟分校计算机科学系Heng Ji教授，CCKS-2019：知识智能

PaperRobot: Automated Scientific Knowledge Graph Construction and Paper Writing，伊利诺伊大学香槟分校计算机科学系Heng Ji教授，CCKS-2019：知识智能

专知会员服务

32+阅读 · 2019年10月25日

文档分析与识别技术回顾与反思，中国科学院自动化研究所刘成林研究员，VALSE2019: 让机器像人一样阅读：文字检测与识别新趋势

文档分析与识别技术回顾与反思，中国科学院自动化研究所刘成林研究员，VALSE2019: 让机器像人一样阅读：文字检测与识别新趋势

专知会员服务

38+阅读 · 2019年10月24日

热门VIP内容

开通专知VIP会员享更多权益服务

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

对抗环境下超视距目标打击的情报支援

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

相关资讯

GPT-4视频讲解！附Slides，OpenAI 《GPT-4 技术报告》中英文版下载,151页pdf

GPT-4视频讲解！附Slides，OpenAI 《GPT-4 技术报告》中英文版下载,151页pdf

专知

22+阅读 · 2023年4月10日

《开发新型飞行器数字孪生原型的框架》北约科学与技术组织2022最新14页技术报告

《开发新型飞行器数字孪生原型的框架》北约科学与技术组织2022最新14页技术报告

专知

24+阅读 · 2022年10月24日

智库兰德2022最新发布《2035年新兴技术：基于典型场景的未来军事突发事件技术评估》118页研究报告

智库兰德2022最新发布《2035年新兴技术：基于典型场景的未来军事突发事件技术评估》118页研究报告

专知

53+阅读 · 2022年10月13日

美国陆军研究实验室《支持C2互操作性和传感器融合的全球信息网络架构评估》2022年技术总结报告

美国陆军研究实验室《支持C2互操作性和传感器融合的全球信息网络架构评估》2022年技术总结报告

专知

64+阅读 · 2022年7月15日

LeCun力荐，PyTorch官方权威教程书来了，意外的通俗易懂

LeCun力荐，PyTorch官方权威教程书来了，意外的通俗易懂

机器之心

22+阅读 · 2019年11月22日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

44+阅读 · 2019年1月3日

技术动态 | TechKG：一个面向中文学术领域的大型知识图谱

技术动态 | TechKG：一个面向中文学术领域的大型知识图谱

开放知识图谱

25+阅读 · 2018年12月20日

Jupyter Notebook的三大短板，都被这个新工具补齐了

Jupyter Notebook的三大短板，都被这个新工具补齐了

量子位

71+阅读 · 2018年9月10日

【数字孪生】数字孪生系列报道：15家单位22位作者研究成果，数字孪生应用探索

【数字孪生】数字孪生系列报道：15家单位22位作者研究成果，数字孪生应用探索

产业智能官

53+阅读 · 2018年5月17日

Github 项目推荐 | Scikit-learn（sklearn）官方文档中文版

Github 项目推荐 | Scikit-learn（sklearn）官方文档中文版

AI研习社

10+阅读 · 2018年4月5日

相关论文

LuxMT Technical Report

Arxiv

0+阅读 · 2月17日

Kelix Technical Report

Arxiv

0+阅读 · 2月12日

HoloBrain-0 Technical Report

Arxiv

0+阅读 · 2月12日

Kelix Technique Report

Arxiv

0+阅读 · 2月10日

UniLiP: Adapting CLIP for Unified Multimodal Understanding, Generation and Editing

Arxiv

0+阅读 · 2月9日

ERNIE 5.0 Technical Report

Arxiv

0+阅读 · 2月4日

OpenOneRec Technical Report

Arxiv

0+阅读 · 2月4日

HunyuanImage 3.0 Technical Report

Arxiv

0+阅读 · 2月2日

UniCon: A Unified System for Efficient Robot Learning Transfers

Arxiv

0+阅读 · 1月21日

TranslateGemma Technical Report

Arxiv

0+阅读 · 1月15日

相关基金

云计算环境中面向内容的密文检索关键技术研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

网络空间安全关键技术研究

国家自然科学基金

20+阅读 · 2015年12月31日

纳米制造战略研究和学术交流

国家自然科学基金

1+阅读 · 2015年12月31日

可与MPSoC高度融合的片上自主测试-自主修复关键技术研究：针对自然、人为可靠性威胁

国家自然科学基金

0+阅读 · 2015年12月31日

基于先验信息压缩感知SAR成像的信息理论限及实用算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

高采样率、高量化分辨率一体化全光模数转换关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据的高时效并行计算机系统结构与技术

国家自然科学基金

0+阅读 · 2014年12月31日

建立纳米制造技术信息平台的研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于UGC的应急响应决策支持系统关键技术研究

国家自然科学基金

13+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员