SolarGPT-QA: A Domain-Adaptive Large Language Model for Educational Question Answering in Space Weather and Heliophysics - 专知论文

会员服务 ·

0

自动问答 · 问答 · 域自适应 · 自适应 · 领域自适应 ·

SolarGPT-QA: A Domain-Adaptive Large Language Model for Educational Question Answering in Space Weather and Heliophysics

翻译：SolarGPT-QA：面向空间天气与太阳物理教育问答的领域自适应大语言模型

Santosh Chapagain,MohammadReza EskandariNasab,Onur Vural,Shah Muhammad Hamdi,Soukaina Filali Boubrahimi

from arxiv, This is preliminary work towards a broader SolarGPT framework

Solar activity, including solar flares, coronal mass ejections (CMEs), and geomagnetic storms, can significantly impact satellites, aviation, power grids, data centers, and space missions. Extreme solar events can cause substantial economic damage with limited advance warning, underscoring the importance of early-warning systems, accurate forecasting, and effective education in space science. Although large language models (LLMs) perform well on general tasks, they often lack domain-specific knowledge and pedagogical capability to clearly explain complex space science concepts. We introduce SolarGPT-QA, a question answering system based on a domain-adapted large language model built on the LLaMA-3 base model. The model is trained using scientific literature and large-scale question-answer data generated with GPT-4 and refined using Grok-3 in a student-friendly storytelling style. Human pairwise evaluations show that SolarGPT-QA outperforms general-purpose models in zero-shot settings and achieves competitive performance compared to instruction-tuned models for educational explanations in space weather and heliophysics. A small pilot student comprehension study further suggests improved clarity and accessibility of the generated explanations. Ablation experiments indicate that combining domain-adaptive pretraining with pedagogical fine-tuning is important for balancing scientific accuracy and educational effectiveness. This work represents an initial step toward a broader SolarGPT framework for space science education and forecasting.

翻译：太阳活动（包括太阳耀斑、日冕物质抛射和地磁暴）会对卫星、航空、电网、数据中心及空间任务产生显著影响。极端太阳事件预警时间有限，可能造成重大经济损失，这凸显了空间科学领域早期预警系统、精准预报和有效教育的重要性。尽管大语言模型在通用任务上表现良好，但它们通常缺乏领域专业知识以及清晰解释复杂空间科学概念的教学能力。本文介绍了SolarGPT-QA——一个基于领域自适应大语言模型的问答系统，该模型以LLaMA-3基础模型为架构。模型通过科学文献以及由GPT-4生成并经Grok-3以学生友好的叙事风格优化的大规模问答数据进行训练。人工配对评估表明，在零样本设置下，SolarGPT-QA优于通用模型，并在空间天气与太阳物理的教育解释任务上取得了与指令微调模型相当的性能。一项小规模试点学生理解研究进一步表明，所生成解释的清晰度和可理解性得到提升。消融实验证明，结合领域自适应预训练与教学微调对于平衡科学准确性与教育效果至关重要。本工作为构建更广泛的面向空间科学教育与预报的SolarGPT框架迈出了初步步伐。

0

相关内容

自动问答

自动问答（Question Answering, QA）是指利用计算机自动回答用户所提出的问题以满足用户知识需求的任务。不同于现有搜索引擎，问答系统是信息服务的一种高级形式，系统返回用户的不再是基于关键词匹配排序的文档列表，而是精准的自然语言答案。近年来，随着人工智能的飞速发展，自动问答已经成为倍受关注且发展前景广泛的研究方向。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【牛津博士论文】面向视觉、物理与语言应用的可信机器学习模型

【牛津博士论文】面向视觉、物理与语言应用的可信机器学习模型

专知会员服务

19+阅读 · 2025年10月5日

【剑桥博士论文】利用深度学习方法预测与建模空间天气

【剑桥博士论文】利用深度学习方法预测与建模空间天气

专知会员服务

15+阅读 · 2025年5月2日

大型语言模型驱动空间智能综述：具身智能体、智慧城市与地球科学的进展

大型语言模型驱动空间智能综述：具身智能体、智慧城市与地球科学的进展

专知会员服务

32+阅读 · 2025年4月19日

【AAAI2025】通过自适应多方面检索增强，利用大型语言模型进行知识图谱问答

【AAAI2025】通过自适应多方面检索增强，利用大型语言模型进行知识图谱问答

专知会员服务

31+阅读 · 2024年12月26日

西工大等最新《大型语言模型机器人技术》综述，详述多模态 GPT-4V 机器人技术

西工大等最新《大型语言模型机器人技术》综述，详述多模态 GPT-4V 机器人技术

专知会员服务

80+阅读 · 2024年1月10日

大型语言模型被称为太空部队的 “游戏规则改变器”

大型语言模型被称为太空部队的 “游戏规则改变器”

专知会员服务

34+阅读 · 2023年12月15日

大模型+自动驾驶=？普渡大学等最新《自动驾驶领域多模态大型语言模型》综述

大模型+自动驾驶=？普渡大学等最新《自动驾驶领域多模态大型语言模型》综述

专知会员服务

76+阅读 · 2023年11月27日

学习地球科学知识理解和利用的基础语言模型

学习地球科学知识理解和利用的基础语言模型

专知会员服务

30+阅读 · 2023年6月10日

ChatGPT有什么用? 论大语言模型在教育中的机遇与挑战

ChatGPT有什么用? 论大语言模型在教育中的机遇与挑战

专知会员服务

78+阅读 · 2023年2月15日

《大语言模型进展》69页ppt，谷歌研究科学家Jason Wei

《大语言模型进展》69页ppt，谷歌研究科学家Jason Wei

专知会员服务

88+阅读 · 2022年10月29日

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

专知

29+阅读 · 2023年4月11日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

26+阅读 · 2023年4月4日

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

专知

75+阅读 · 2022年11月19日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

最新必读【预训练语言模型(BERT/XLNet等)】论文，Google/微软/华为ICLR2020提交论文

最新必读【预训练语言模型(BERT/XLNet等)】论文，Google/微软/华为ICLR2020提交论文

专知

36+阅读 · 2019年9月29日

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

新智元

10+阅读 · 2019年7月2日

NLP博士答辩41页PPT，面向自然语言处理的神经网络迁移学习

NLP博士答辩41页PPT，面向自然语言处理的神经网络迁移学习

新智元

30+阅读 · 2019年3月1日

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

论智

11+阅读 · 2018年10月9日

自然语言处理中的Attention Model：是什么及为什么

自然语言处理中的Attention Model：是什么及为什么

新智元

11+阅读 · 2017年7月13日

射频能量收集及其与太阳能收集一体化关键技术研究

国家自然科学基金

1+阅读 · 2017年12月31日

大型射电望远镜重力模型构建关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

北斗IGSO/MEO卫星偏航姿态模式下的光压摄动理论和模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

近地空间目标全极化高分辨雷达成像中的波形设计及信号处理相关技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

分布式空间太阳能电站的队形设计与协同控制

国家自然科学基金

1+阅读 · 2015年12月31日

面向时域天文的高精度测光研究

国家自然科学基金

0+阅读 · 2015年12月31日

日球电流片对行星际扰动影响的模拟研究

国家自然科学基金

0+阅读 · 2015年12月31日

粒子湍流介质对太阳光退相干性质影响研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多源遥感数据和GIS的城市太阳能资源时空分布调查与利用评价

国家自然科学基金

0+阅读 · 2014年12月31日

极轨气象卫星红外通道太阳污染时相规律与订正模型研究

国家自然科学基金

0+阅读 · 2014年12月31日

Enhancing Large Language Models (LLMs) for Telecom using Dynamic Knowledge Graphs and Explainable Retrieval-Augmented Generation

Enhancing Large Language Models (LLMs) for Telecom using Dynamic Knowledge Graphs and Explainable Retrieval-Augmented Generation

Arxiv

0+阅读 · 2月19日

ComptonUNet: A Deep Learning Model for GRB Localization with Compton Cameras under Noisy and Low-Statistic Conditions

Arxiv

0+阅读 · 2月19日

Towards EnergyGPT: A Large Language Model Specialized for the Energy Sector

Arxiv

0+阅读 · 2月7日

GeoResponder: Towards Building Geospatial LLMs for Time-Critical Disaster Response

Arxiv

0+阅读 · 2月3日

StefaLand: An Efficient Geoscience Foundation Model That Improves Dynamic Land-Surface Predictions

Arxiv

0+阅读 · 2月2日

Defects and Inconsistencies in Solar Flare Data Sources: Implications for Machine Learning Forecasting

Arxiv

0+阅读 · 1月30日

Helios: A Foundational Language Model for Smart Energy Knowledge Reasoning and Application

Arxiv

0+阅读 · 1月30日

Towards Resiliency in Large Language Model Serving with KevlarFlow

Arxiv

0+阅读 · 1月30日

Evaluating Large Language Models for Time Series Anomaly Detection in Aerospace Software

Arxiv

0+阅读 · 1月29日

Evaluating Large Language Models for Time Series Anomaly Detection in Aerospace Software

Arxiv

0+阅读 · 1月18日

VIP会员

文章信息

相关主题

领域自适应

最新内容

深入Project Maven：为何人工智能在战场上依然失灵

深入Project Maven：为何人工智能在战场上依然失灵

专知会员服务

4+阅读 · 今天15:21

锻造未来士兵：外骨骼、基因工程与赛博格

锻造未来士兵：外骨骼、基因工程与赛博格

专知会员服务

0+阅读 · 今天15:12

《无人机系统（UAS）通信网状网络试验性部署》50页报告

《无人机系统（UAS）通信网状网络试验性部署》50页报告

专知会员服务

2+阅读 · 今天15:06

《无人机蜂群通信技术研究》50页

《无人机蜂群通信技术研究》50页

专知会员服务

4+阅读 · 今天14:55

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

专知会员服务

9+阅读 · 7月18日

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

专知会员服务

7+阅读 · 7月18日

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

专知会员服务

9+阅读 · 7月18日

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

专知会员服务

6+阅读 · 7月18日

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

专知会员服务

9+阅读 · 7月17日

《边缘端实时无线感知赋能现场多机器人部署》200页

《边缘端实时无线感知赋能现场多机器人部署》200页

专知会员服务

9+阅读 · 7月17日

战力倍增器：自主武器系统与乌克兰及加沙冲突

战力倍增器：自主武器系统与乌克兰及加沙冲突

专知会员服务

5+阅读 · 7月17日

人工智能赋能战场情报：提速决策进程

人工智能赋能战场情报：提速决策进程

专知会员服务

3+阅读 · 7月17日

《拥抱新兴技术：面向未来军官的教育革新》

《拥抱新兴技术：面向未来军官的教育革新》

专知会员服务

7+阅读 · 7月17日

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

专知会员服务

5+阅读 · 7月17日

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

专知会员服务

6+阅读 · 7月17日

相关VIP内容

【牛津博士论文】面向视觉、物理与语言应用的可信机器学习模型

【牛津博士论文】面向视觉、物理与语言应用的可信机器学习模型

专知会员服务

19+阅读 · 2025年10月5日

【剑桥博士论文】利用深度学习方法预测与建模空间天气

【剑桥博士论文】利用深度学习方法预测与建模空间天气

专知会员服务

15+阅读 · 2025年5月2日

大型语言模型驱动空间智能综述：具身智能体、智慧城市与地球科学的进展

大型语言模型驱动空间智能综述：具身智能体、智慧城市与地球科学的进展

专知会员服务

32+阅读 · 2025年4月19日

【AAAI2025】通过自适应多方面检索增强，利用大型语言模型进行知识图谱问答

【AAAI2025】通过自适应多方面检索增强，利用大型语言模型进行知识图谱问答

专知会员服务

31+阅读 · 2024年12月26日

西工大等最新《大型语言模型机器人技术》综述，详述多模态 GPT-4V 机器人技术

西工大等最新《大型语言模型机器人技术》综述，详述多模态 GPT-4V 机器人技术

专知会员服务

80+阅读 · 2024年1月10日

大型语言模型被称为太空部队的 “游戏规则改变器”

大型语言模型被称为太空部队的 “游戏规则改变器”

专知会员服务

34+阅读 · 2023年12月15日

大模型+自动驾驶=？普渡大学等最新《自动驾驶领域多模态大型语言模型》综述

大模型+自动驾驶=？普渡大学等最新《自动驾驶领域多模态大型语言模型》综述

专知会员服务

76+阅读 · 2023年11月27日

学习地球科学知识理解和利用的基础语言模型

学习地球科学知识理解和利用的基础语言模型

专知会员服务

30+阅读 · 2023年6月10日

ChatGPT有什么用? 论大语言模型在教育中的机遇与挑战

ChatGPT有什么用? 论大语言模型在教育中的机遇与挑战

专知会员服务

78+阅读 · 2023年2月15日

《大语言模型进展》69页ppt，谷歌研究科学家Jason Wei

《大语言模型进展》69页ppt，谷歌研究科学家Jason Wei

专知会员服务

88+阅读 · 2022年10月29日

热门VIP内容

开通专知VIP会员享更多权益服务

锻造未来士兵：外骨骼、基因工程与赛博格

《无人机蜂群通信技术研究》50页

深入Project Maven：为何人工智能在战场上依然失灵

《无人机系统（UAS）通信网状网络试验性部署》50页报告

相关资讯

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

ChatGPT大模型如何做科学研究? CMU提出《大模型智能体系统》，高推理展现出大型语言模型的新兴自主科学研究能力

专知

17+阅读 · 2023年4月12日

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

ChatGPT背后大模型如何高效训练？京东探索研究院等最新《大规模深度学习模型高效训练研究》综述，60页pdf详述五大类训练方法

专知

29+阅读 · 2023年4月11日

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

从T5到GPT-4最新最全梳理，人大等《大型语言模型综述》，51页pdf详述大模型进展

专知

26+阅读 · 2023年4月4日

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

《自主任务规划和管理系统的当前进展：AUV 和 UAV 视角》华盛顿大学等23页论文

专知

75+阅读 · 2022年11月19日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

最新必读【预训练语言模型(BERT/XLNet等)】论文，Google/微软/华为ICLR2020提交论文

最新必读【预训练语言模型(BERT/XLNet等)】论文，Google/微软/华为ICLR2020提交论文

专知

36+阅读 · 2019年9月29日

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

港中大等打造光流预测新模型SelFlow，自监督学习攻克遮挡难题 | CVPR 2019

新智元

10+阅读 · 2019年7月2日

NLP博士答辩41页PPT，面向自然语言处理的神经网络迁移学习

NLP博士答辩41页PPT，面向自然语言处理的神经网络迁移学习

新智元

30+阅读 · 2019年3月1日

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

论智

11+阅读 · 2018年10月9日

自然语言处理中的Attention Model：是什么及为什么

自然语言处理中的Attention Model：是什么及为什么

新智元

11+阅读 · 2017年7月13日

相关论文

Enhancing Large Language Models (LLMs) for Telecom using Dynamic Knowledge Graphs and Explainable Retrieval-Augmented Generation

Enhancing Large Language Models (LLMs) for Telecom using Dynamic Knowledge Graphs and Explainable Retrieval-Augmented Generation

Arxiv

0+阅读 · 2月19日

ComptonUNet: A Deep Learning Model for GRB Localization with Compton Cameras under Noisy and Low-Statistic Conditions

Arxiv

0+阅读 · 2月19日

Towards EnergyGPT: A Large Language Model Specialized for the Energy Sector

Arxiv

0+阅读 · 2月7日

GeoResponder: Towards Building Geospatial LLMs for Time-Critical Disaster Response

Arxiv

0+阅读 · 2月3日

StefaLand: An Efficient Geoscience Foundation Model That Improves Dynamic Land-Surface Predictions

Arxiv

0+阅读 · 2月2日

Defects and Inconsistencies in Solar Flare Data Sources: Implications for Machine Learning Forecasting

Arxiv

0+阅读 · 1月30日

Helios: A Foundational Language Model for Smart Energy Knowledge Reasoning and Application

Arxiv

0+阅读 · 1月30日

Towards Resiliency in Large Language Model Serving with KevlarFlow

Arxiv

0+阅读 · 1月30日

Evaluating Large Language Models for Time Series Anomaly Detection in Aerospace Software

Arxiv

0+阅读 · 1月29日

Evaluating Large Language Models for Time Series Anomaly Detection in Aerospace Software

Arxiv

0+阅读 · 1月18日

相关基金

射频能量收集及其与太阳能收集一体化关键技术研究

国家自然科学基金

1+阅读 · 2017年12月31日

大型射电望远镜重力模型构建关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

北斗IGSO/MEO卫星偏航姿态模式下的光压摄动理论和模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

近地空间目标全极化高分辨雷达成像中的波形设计及信号处理相关技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

分布式空间太阳能电站的队形设计与协同控制

国家自然科学基金

1+阅读 · 2015年12月31日

面向时域天文的高精度测光研究

国家自然科学基金

0+阅读 · 2015年12月31日

日球电流片对行星际扰动影响的模拟研究

国家自然科学基金

0+阅读 · 2015年12月31日

粒子湍流介质对太阳光退相干性质影响研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多源遥感数据和GIS的城市太阳能资源时空分布调查与利用评价

国家自然科学基金

0+阅读 · 2014年12月31日

极轨气象卫星红外通道太阳污染时相规律与订正模型研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员