UniSkill: A Dataset for Matching University Curricula to Professional Competencies - 专知论文

会员服务 ·

0

课程 · 数据集 · 大学 · 系统 · 标注 ·

UniSkill: A Dataset for Matching University Curricula to Professional Competencies

翻译：UniSkill：大学课程与职业能力匹配数据集

Nurlan Musazade,Joszef Mezei,Mike Zhang

from arxiv, LREC 2026

Skill extraction and recommendation systems have been studied from recruiter, applicant, and education perspectives. While AI applications in job advertisements have received broad attention, deficiencies in the instructed skills side remain a challenge. In this work, we address the scarcity of publicly available datasets by releasing both manually annotated and synthetic datasets of skills from the European Skills, Competences, Qualifications and Occupations (ESCO) taxonomy and university course pairs and publishing corresponding annotation guidelines. Specifically, we match graduate-level university courses with skills from the Systems Analysts and Management and Organization Analyst ESCO occupation groups at two granularities: course title with a skill, and course sentence with a skill. We train language models on this dataset to serve as a baseline for retrieval and recommendation systems for course-to-skill and skill-to-course matching. We evaluate the models on a portion of the annotated data. Our BERT model achieves 87% F1-score, showing that course and skill matching is a feasible task.

翻译：技能提取与推荐系统已从招聘者、求职者和教育者视角得到广泛研究。尽管人工智能在招聘广告中的应用备受关注，但教学技能侧的不足仍是挑战。本研究通过发布基于欧洲技能、能力、资格与职业（ESCO）分类体系的大学课程-技能对人工标注与合成数据集，并公开相应标注指南，以解决公开数据集稀缺问题。具体而言，我们在两个粒度上将研究生课程与ESCO分类中系统分析师、管理与组织分析师职业组的技能进行匹配：课程名称与技能匹配、课程语句与技能匹配。基于此数据集训练语言模型，为课程-技能双向匹配的检索与推荐系统提供基线。模型在部分标注数据上进行评估，其中BERT模型达到87%的F1分数，证明课程与技能匹配是可行任务。

0

相关内容

课程是指学校学生所应学习的学科总和及其进程与安排。课程是对教育的目标、教学内容、教学活动方式的规划和设计，是教学计划、教学大纲等诸多方面实施过程的总和。广义的课程是指学校为实现培养目标而选择的教育内容及其进程的总和，它包括学校老师所教授的各门学科和有目的、有计划的教育活动。狭义的课程是指某一门学科。专知上对国内外最新AI+X的课程进行了收集与索引，涵盖斯坦福大学、CMU、MIT、清华、北大等名校开放课程。

麦考瑞大学最新知识图谱构建综述，37页内容358篇文献系统阐述大数据视野下知识图谱构建全过程方法及其最新进展

麦考瑞大学最新知识图谱构建综述，37页内容358篇文献系统阐述大数据视野下知识图谱构建全过程方法及其最新进展

专知会员服务

53+阅读 · 2023年2月27日

《全球中小学人工智能教育支撑环境白皮书（2022年）》北京师范大学智慧学习研究院

《全球中小学人工智能教育支撑环境白皮书（2022年）》北京师范大学智慧学习研究院

专知会员服务

39+阅读 · 2022年7月20日

人工智能赋能教育专题《人工智能 + 教育：关键技术及典型应用场景》，北京师范大学

人工智能赋能教育专题《人工智能 + 教育：关键技术及典型应用场景》，北京师范大学

专知会员服务

64+阅读 · 2022年3月24日

【深度推荐系统：基础与进展】密歇根州立大学、香港理工大学、百度专家联合推出教程，Deep Recommender System: Fundamentals and Advances

【深度推荐系统：基础与进展】密歇根州立大学、香港理工大学、百度专家联合推出教程，Deep Recommender System: Fundamentals and Advances

专知会员服务

20+阅读 · 2022年2月25日

【WWW2021】面向推荐学习公平表示：一种图视角

专知会员服务

30+阅读 · 2021年2月21日

可解释强化学习，Explainable Reinforcement Learning: A Survey

可解释强化学习，Explainable Reinforcement Learning: A Survey

专知会员服务

133+阅读 · 2020年5月14日

【NLPCC2019 Tutorial】个性化推荐的基础与趋势（Foundations and Trends for Personalized Recommendation）附145页ppt，清华大学张敏老师

【NLPCC2019 Tutorial】个性化推荐的基础与趋势（Foundations and Trends for Personalized Recommendation）附145页ppt，清华大学张敏老师

专知会员服务

68+阅读 · 2019年11月22日

智能教育发展现状与未来趋势，科大讯飞AI研究院竺博副院长，第八届全国社会媒体处理大会SMP2019

智能教育发展现状与未来趋势，科大讯飞AI研究院竺博副院长，第八届全国社会媒体处理大会SMP2019

专知会员服务

13+阅读 · 2019年10月24日

智能教育发展现状与未来趋势，哈尔滨工业大学刘挺教授，第八届全国社会媒体处理大会SMP2019

智能教育发展现状与未来趋势，哈尔滨工业大学刘挺教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

10+阅读 · 2019年10月24日

【报告推荐】《人工智能之信息检索与推荐》报告，附72页PDF下载

【报告推荐】《人工智能之信息检索与推荐》报告，附72页PDF下载

专知会员服务

87+阅读 · 2019年9月7日

不可错过！斯坦福《人工智能医学健康》课程，全面阐述AI在医学的应用，附Slides

不可错过！斯坦福《人工智能医学健康》课程，全面阐述AI在医学的应用，附Slides

专知

11+阅读 · 2022年10月24日

【数据集】OCR_DataSet：有关OCR的数据集并统一标注格式

【数据集】OCR_DataSet：有关OCR的数据集并统一标注格式

AINLP

18+阅读 · 2020年4月10日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

国科大UCAS《信息论与机器学习》课程，中国科学院自动化研究所胡包钢研究员

国科大UCAS《信息论与机器学习》课程，中国科学院自动化研究所胡包钢研究员

专知

17+阅读 · 2020年2月14日

清华大学、中国人工智能学会联合发布《2019人工智能发展报告》，391页pdf详述进展

清华大学、中国人工智能学会联合发布《2019人工智能发展报告》，391页pdf详述进展

专知

24+阅读 · 2019年12月1日

东南大学2019年最新研究生精品课程《知识图谱》资源分享

东南大学2019年最新研究生精品课程《知识图谱》资源分享

深度学习与NLP

63+阅读 · 2019年9月14日

AMiner发布《人工智能之信息检索与推荐》报告，附72页PDF下载

AMiner发布《人工智能之信息检索与推荐》报告，附72页PDF下载

专知

23+阅读 · 2019年9月6日

全球竞争力教育指标国际比较及政策建议——基于世界经济论坛《2018年全球竞争力报告》数据

全球竞争力教育指标国际比较及政策建议——基于世界经济论坛《2018年全球竞争力报告》数据

MOOC

29+阅读 · 2019年2月23日

最全数据科学学习资源：Python、线性代数、机器学习...

最全数据科学学习资源：Python、线性代数、机器学习...

人工智能头条

12+阅读 · 2018年5月14日

【论文推荐】最新七篇推荐系统相关论文—协同度量学习、SQL-Rank、用户行为与神经网络、隐私价格、贝叶斯、 IoT、序列感知

【论文推荐】最新七篇推荐系统相关论文—协同度量学习、SQL-Rank、用户行为与神经网络、隐私价格、贝叶斯、 IoT、序列感知

专知

10+阅读 · 2018年3月9日

支持产品创新设计的大数据知识萃取研究

国家自然科学基金

8+阅读 · 2015年12月31日

多重排序数据的整合分析

国家自然科学基金

0+阅读 · 2015年12月31日

心理与教育测量中项目反应时间数据的统计建模及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

数据分析算法的融合与人才培养

国家自然科学基金

7+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

面向大规模数据流的集成学习模型与方法研究

国家自然科学基金

5+阅读 · 2014年12月31日

基于领域知识和链路预测的个性化推荐研究

国家自然科学基金

4+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

KG-First, LLM-Fallback: A Hybrid Microservice for Grounded Skill Search and Explanation

Arxiv

0+阅读 · 5月2日

Understanding the Skills Gap between Higher Education Institutions and the Software Engineering Industry

Arxiv

0+阅读 · 4月29日

A Unified Multi-Layer Framework for Skill Acquisition from Imperfect Human Demonstrations

Arxiv

0+阅读 · 4月9日

NIRVANA: A Comprehensive Dataset for Reproducing How Students Use Generative AI for Essay Writing

Arxiv

0+阅读 · 4月8日

Synapse: Evolving Job-Person Fit with Explainable Two-phase Retrieval and LLM-guided Genetic Resume Optimization

Arxiv

0+阅读 · 4月2日

UniScale: Synergistic Entire Space Data and Model Scaling for Search Ranking

Arxiv

0+阅读 · 3月27日

From School AI Readiness to Student AI Literacy: A National Multilevel Mediation Analysis of Institutional Capacity and Teacher Capability

Arxiv

0+阅读 · 3月20日

Empowering Future Cybersecurity Leaders: Advancing Students through FINDS Education for Digital Forensic Excellence

Arxiv

0+阅读 · 3月14日

Using a Human-AI Teaming Approach to Create and Curate Scientific Datasets with the SCILIRE System

Arxiv

0+阅读 · 3月13日

InterPilot: Exploring the Design Space of AI-assisted Job Interview Support for HR Professionals

Arxiv

0+阅读 · 2月24日

VIP会员

文章信息

相关主题

最新内容

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

专知会员服务

0+阅读 · 今天8:28

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

4+阅读 · 7月20日

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

6+阅读 · 7月20日

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

6+阅读 · 7月20日

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

6+阅读 · 7月20日

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

专知会员服务

4+阅读 · 7月20日

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

专知会员服务

7+阅读 · 7月20日

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

专知会员服务

6+阅读 · 7月20日

深入Project Maven：为何人工智能在战场上依然失灵

深入Project Maven：为何人工智能在战场上依然失灵

专知会员服务

14+阅读 · 7月19日

锻造未来士兵：外骨骼、基因工程与赛博格

锻造未来士兵：外骨骼、基因工程与赛博格

专知会员服务

7+阅读 · 7月19日

《无人机系统（UAS）通信网状网络试验性部署》50页报告

《无人机系统（UAS）通信网状网络试验性部署》50页报告

专知会员服务

9+阅读 · 7月19日

《无人机蜂群通信技术研究》50页

《无人机蜂群通信技术研究》50页

专知会员服务

10+阅读 · 7月19日

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

专知会员服务

15+阅读 · 7月18日

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

专知会员服务

8+阅读 · 7月18日

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

专知会员服务

16+阅读 · 7月18日

相关VIP内容

麦考瑞大学最新知识图谱构建综述，37页内容358篇文献系统阐述大数据视野下知识图谱构建全过程方法及其最新进展

麦考瑞大学最新知识图谱构建综述，37页内容358篇文献系统阐述大数据视野下知识图谱构建全过程方法及其最新进展

专知会员服务

53+阅读 · 2023年2月27日

《全球中小学人工智能教育支撑环境白皮书（2022年）》北京师范大学智慧学习研究院

《全球中小学人工智能教育支撑环境白皮书（2022年）》北京师范大学智慧学习研究院

专知会员服务

39+阅读 · 2022年7月20日

人工智能赋能教育专题《人工智能 + 教育：关键技术及典型应用场景》，北京师范大学

人工智能赋能教育专题《人工智能 + 教育：关键技术及典型应用场景》，北京师范大学

专知会员服务

64+阅读 · 2022年3月24日

【深度推荐系统：基础与进展】密歇根州立大学、香港理工大学、百度专家联合推出教程，Deep Recommender System: Fundamentals and Advances

【深度推荐系统：基础与进展】密歇根州立大学、香港理工大学、百度专家联合推出教程，Deep Recommender System: Fundamentals and Advances

专知会员服务

20+阅读 · 2022年2月25日

【WWW2021】面向推荐学习公平表示：一种图视角

专知会员服务

30+阅读 · 2021年2月21日

可解释强化学习，Explainable Reinforcement Learning: A Survey

可解释强化学习，Explainable Reinforcement Learning: A Survey

专知会员服务

133+阅读 · 2020年5月14日

【NLPCC2019 Tutorial】个性化推荐的基础与趋势（Foundations and Trends for Personalized Recommendation）附145页ppt，清华大学张敏老师

【NLPCC2019 Tutorial】个性化推荐的基础与趋势（Foundations and Trends for Personalized Recommendation）附145页ppt，清华大学张敏老师

专知会员服务

68+阅读 · 2019年11月22日

智能教育发展现状与未来趋势，科大讯飞AI研究院竺博副院长，第八届全国社会媒体处理大会SMP2019

智能教育发展现状与未来趋势，科大讯飞AI研究院竺博副院长，第八届全国社会媒体处理大会SMP2019

专知会员服务

13+阅读 · 2019年10月24日

智能教育发展现状与未来趋势，哈尔滨工业大学刘挺教授，第八届全国社会媒体处理大会SMP2019

智能教育发展现状与未来趋势，哈尔滨工业大学刘挺教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

10+阅读 · 2019年10月24日

【报告推荐】《人工智能之信息检索与推荐》报告，附72页PDF下载

【报告推荐】《人工智能之信息检索与推荐》报告，附72页PDF下载

专知会员服务

87+阅读 · 2019年9月7日

热门VIP内容

开通专知VIP会员享更多权益服务

印度精确打击与指挥架构的断层

美空军AI完成F-16战斗机自主空战历史性试飞

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

相关资讯

不可错过！斯坦福《人工智能医学健康》课程，全面阐述AI在医学的应用，附Slides

不可错过！斯坦福《人工智能医学健康》课程，全面阐述AI在医学的应用，附Slides

专知

11+阅读 · 2022年10月24日

【数据集】OCR_DataSet：有关OCR的数据集并统一标注格式

【数据集】OCR_DataSet：有关OCR的数据集并统一标注格式

AINLP

18+阅读 · 2020年4月10日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

国科大UCAS《信息论与机器学习》课程，中国科学院自动化研究所胡包钢研究员

国科大UCAS《信息论与机器学习》课程，中国科学院自动化研究所胡包钢研究员

专知

17+阅读 · 2020年2月14日

清华大学、中国人工智能学会联合发布《2019人工智能发展报告》，391页pdf详述进展

清华大学、中国人工智能学会联合发布《2019人工智能发展报告》，391页pdf详述进展

专知

24+阅读 · 2019年12月1日

东南大学2019年最新研究生精品课程《知识图谱》资源分享

东南大学2019年最新研究生精品课程《知识图谱》资源分享

深度学习与NLP

63+阅读 · 2019年9月14日

AMiner发布《人工智能之信息检索与推荐》报告，附72页PDF下载

AMiner发布《人工智能之信息检索与推荐》报告，附72页PDF下载

专知

23+阅读 · 2019年9月6日

全球竞争力教育指标国际比较及政策建议——基于世界经济论坛《2018年全球竞争力报告》数据

全球竞争力教育指标国际比较及政策建议——基于世界经济论坛《2018年全球竞争力报告》数据

MOOC

29+阅读 · 2019年2月23日

最全数据科学学习资源：Python、线性代数、机器学习...

最全数据科学学习资源：Python、线性代数、机器学习...

人工智能头条

12+阅读 · 2018年5月14日

【论文推荐】最新七篇推荐系统相关论文—协同度量学习、SQL-Rank、用户行为与神经网络、隐私价格、贝叶斯、 IoT、序列感知

【论文推荐】最新七篇推荐系统相关论文—协同度量学习、SQL-Rank、用户行为与神经网络、隐私价格、贝叶斯、 IoT、序列感知

专知

10+阅读 · 2018年3月9日

相关论文

KG-First, LLM-Fallback: A Hybrid Microservice for Grounded Skill Search and Explanation

Arxiv

0+阅读 · 5月2日

Understanding the Skills Gap between Higher Education Institutions and the Software Engineering Industry

Arxiv

0+阅读 · 4月29日

A Unified Multi-Layer Framework for Skill Acquisition from Imperfect Human Demonstrations

Arxiv

0+阅读 · 4月9日

NIRVANA: A Comprehensive Dataset for Reproducing How Students Use Generative AI for Essay Writing

Arxiv

0+阅读 · 4月8日

Synapse: Evolving Job-Person Fit with Explainable Two-phase Retrieval and LLM-guided Genetic Resume Optimization

Arxiv

0+阅读 · 4月2日

UniScale: Synergistic Entire Space Data and Model Scaling for Search Ranking

Arxiv

0+阅读 · 3月27日

From School AI Readiness to Student AI Literacy: A National Multilevel Mediation Analysis of Institutional Capacity and Teacher Capability

Arxiv

0+阅读 · 3月20日

Empowering Future Cybersecurity Leaders: Advancing Students through FINDS Education for Digital Forensic Excellence

Arxiv

0+阅读 · 3月14日

Using a Human-AI Teaming Approach to Create and Curate Scientific Datasets with the SCILIRE System

Arxiv

0+阅读 · 3月13日

InterPilot: Exploring the Design Space of AI-assisted Job Interview Support for HR Professionals

Arxiv

0+阅读 · 2月24日

相关基金

支持产品创新设计的大数据知识萃取研究

国家自然科学基金

8+阅读 · 2015年12月31日

多重排序数据的整合分析

国家自然科学基金

0+阅读 · 2015年12月31日

心理与教育测量中项目反应时间数据的统计建模及其应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于相依数据的梯度学习理论研究

国家自然科学基金

1+阅读 · 2015年12月31日

数据分析算法的融合与人才培养

国家自然科学基金

7+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于认知计算的大数据分析方法

国家自然科学基金

25+阅读 · 2014年12月31日

面向大规模数据流的集成学习模型与方法研究

国家自然科学基金

5+阅读 · 2014年12月31日

基于领域知识和链路预测的个性化推荐研究

国家自然科学基金

4+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员