Scientific discovery is severely bottlenecked by the inability of manual curation to keep pace with exponential publication rates. This creates a widening knowledge gap. This is especially stark in photovoltaics, where the leading database for perovskite solar cells has been stagnant since 2021 despite massive ongoing research output. Here, we resolve this challenge by establishing an autonomous, self-updating living database (PERLA). Our pipeline integrates large language models with physics-aware validation to extract complex device data from the continuous literature stream, achieving human-level precision (>90%) and eliminating annotator variance. By employing this system on the previously inaccessible post-2021 literature, we uncover critical evolutionary trends hidden by data lag: the field has decisively shifted toward inverted architectures employing self-assembled monolayers and formamidinium-rich compositions, driving a clear trajectory of sustained voltage loss reduction. PERLA transforms static publications into dynamic knowledge resources that enable data-driven discovery to operate at the speed of publication.


翻译:科学发现正因人工整理无法跟上指数级增长的论文发表速度而遭遇严重瓶颈,这导致了日益扩大的知识鸿沟。在光伏领域,这一矛盾尤为突出:尽管相关研究持续大量产出,钙钛矿太阳能电池领域的主要数据库自2021年以来便陷入停滞。本研究通过构建自主、持续更新的活体数据库(PERLA)解决了这一难题。我们的流程将大语言模型与物理感知验证相结合,从持续涌现的文献流中提取复杂的器件数据,实现了人类水平的精确度(>90%)并消除了标注者偏差。通过对此前无法获取的2021年后文献应用该系统,我们揭示了被数据滞后所掩盖的关键演进趋势:该领域已明确转向采用自组装单分子层和富甲脒成分的反型结构,推动电压损耗持续降低的清晰发展路径。PERLA将静态文献转化为动态知识资源,使数据驱动型发现能够以论文发表的速度同步推进。

0
下载
关闭预览

相关内容

数据库( Database )或数据库管理系统( Database management systems )是按照数据结构来组织、存储和管理数据的仓库。目前数据管理不再仅仅是存储和管理数据,而转变成用户所需要的各种数据管理的方式。
最新,DeepSeek-R1论文登上Nature封面,附83页补充材料
专知会员服务
27+阅读 · 2025年9月18日
专知会员服务
55+阅读 · 2021年10月1日
数据库发展研究报告(2021年)
专知会员服务
50+阅读 · 2021年6月29日
DataFun,就这?!
DataFunTalk
38+阅读 · 2020年9月27日
牛!中国版Sci-Hub,还能下载中文文献!
材料科学与工程
26+阅读 · 2018年8月26日
【资源】史上最全数据集汇总
七月在线实验室
18+阅读 · 2018年4月24日
CycleGAN:图片风格,想换就换 | ICCV 2017论文解读
PaperWeekly
12+阅读 · 2018年3月14日
Deep Learning(深度学习)各种资料网址
数据挖掘入门与实战
11+阅读 · 2017年10月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2月16日
VIP会员
相关资讯
DataFun,就这?!
DataFunTalk
38+阅读 · 2020年9月27日
牛!中国版Sci-Hub,还能下载中文文献!
材料科学与工程
26+阅读 · 2018年8月26日
【资源】史上最全数据集汇总
七月在线实验室
18+阅读 · 2018年4月24日
CycleGAN:图片风格,想换就换 | ICCV 2017论文解读
PaperWeekly
12+阅读 · 2018年3月14日
Deep Learning(深度学习)各种资料网址
数据挖掘入门与实战
11+阅读 · 2017年10月31日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员