意大利大学生写作中语言能力的泊松因子混合模型分析 (A Poisson Factor Mixture Model for the Analysis of Linguistic Competence in Italian University Students' Writing) - 专知论文

会员服务 ·

0

大学 · 分析 · 因子 · 混合 · 混合模型 ·

A Poisson Factor Mixture Model for the Analysis of Linguistic Competence in Italian University Students' Writing

翻译：意大利大学生写作中语言能力的泊松因子混合模型分析

Silvia Dallari,Laura Anderlucci,Nicola Grandi,Angela Montanari

Public debate on the alleged decline of language skills among younger generations often focuses on university students, the most highly educated segment of the population. Rather than addressing the ill posed question of linguistic decline, this paper examines how formal written Italian is currently used by university students and whether systematic patterns of competence and heterogeneity can be identified. The analysis is based on data from the UniversITA project, which collected formal texts written by a large and nationally representative sample of Italian university students. Texts were annotated for linguistically motivated features covering orthography, lexicon, syntax, morphosyntax, coherence, register, and sentence structure, yielding low frequency multivariate count data. To analyse these data, we propose a novel model-based clustering approach based on a Poisson factor mixture model that accounts for dependence among linguistic features and unobserved population heterogeneity. The results identify two correlated dimensions of writing competence, interpretable as communicative competence and linguistic grammatical competence. When educational and socio demographic information is incorporated, distinct student profiles emerge that are associated with field of study and educational background. These findings provide quantitative evidence on contemporary writing and offer insights relevant for language education and higher education policy.

翻译：关于年轻一代语言能力下降的公共讨论常聚焦于大学生这一受教育程度最高的人群。本文不探讨语言能力下降这一不恰当的问题，而是考察大学生如何运用正式的书面意大利语，以及能否识别出系统性的能力模式和异质性。分析基于UniversITA项目的数据，该项目收集了具有全国代表性的意大利大学生样本所撰写的正式文本。文本在语言学特征上进行了标注，涵盖正字法、词汇、句法、形态句法、连贯性、语域和句子结构，从而产生了低频率的多元计数数据。为分析这些数据，我们提出了一种基于泊松因子混合模型的新型模型聚类方法，该方法考虑了语言特征间的依赖关系和未观测到的群体异质性。结果识别出写作能力的两个相关维度，可解释为交际能力和语言语法能力。当纳入教育和社会人口学信息时，出现了不同的学生特征，这些特征与学习领域和教育背景相关。这些发现为当代写作提供了定量证据，并为语言教育和高等教育政策提供了相关见解。

0

相关内容

人类接受高层次教育、进行原创性研究的场所。现在的大学一般包括一个能授予硕士和博士学位的研究生院和数个专业学院，以及能授予学士学位的一个本科生院。大学还包括高等专科学校

大型语言模型的规模效应局限

大型语言模型的规模效应局限

专知会员服务

14+阅读 · 2025年11月18日

【新书】实践大型语言模型：语言理解与生成

【新书】实践大型语言模型：语言理解与生成

专知会员服务

69+阅读 · 2024年10月1日

大语言模型对齐研究综述

大语言模型对齐研究综述

专知会员服务

56+阅读 · 2024年8月1日

【NTU博士论文】语言模型自适应迁移学习

【NTU博士论文】语言模型自适应迁移学习

专知会员服务

38+阅读 · 2023年12月20日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

110+阅读 · 2023年12月19日

《大型语言模型归因》综述

《大型语言模型归因》综述

专知会员服务

75+阅读 · 2023年11月8日

大模型哪家强？清华最新《大语言模型综合性能评估报告》权威评测，26页ppt

大模型哪家强？清华最新《大语言模型综合性能评估报告》权威评测，26页ppt

专知会员服务

157+阅读 · 2023年8月8日

【慕尼黑大学博士论文】大型预训练语言模型的可比性、评估和基准测试，154页pdf

【慕尼黑大学博士论文】大型预训练语言模型的可比性、评估和基准测试，154页pdf

专知会员服务

47+阅读 · 2023年4月19日

【多伦多大学博士论文】整合语言学理论与神经语言模型，104页pdf

【多伦多大学博士论文】整合语言学理论与神经语言模型，104页pdf

专知会员服务

25+阅读 · 2022年8月3日

【康奈尔大学】语言数学模型课程，ECE 594: Mathematical Models of Language

【康奈尔大学】语言数学模型课程，ECE 594: Mathematical Models of Language

专知会员服务

11+阅读 · 2022年2月27日

「知识增强预训练语言模型」最新研究综述

「知识增强预训练语言模型」最新研究综述

专知

18+阅读 · 2022年11月18日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

绝对干货！NLP预训练模型：从transformer到albert

绝对干货！NLP预训练模型：从transformer到albert

新智元

13+阅读 · 2019年11月10日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

NLP Chinese Corpus：大规模中文自然语言处理语料

NLP Chinese Corpus：大规模中文自然语言处理语料

PaperWeekly

14+阅读 · 2019年2月18日

MIT&哈佛大学最新综述文章：NLP模型的分析方法

MIT&哈佛大学最新综述文章：NLP模型的分析方法

专知

24+阅读 · 2018年12月26日

国内外混合式教学研究现状述评——基于混合式教学的分析框架

国内外混合式教学研究现状述评——基于混合式教学的分析框架

MOOC

53+阅读 · 2018年6月2日

【好文解析】ICASSP最佳学生论文：深度对抗声学模型训练框架

【好文解析】ICASSP最佳学生论文：深度对抗声学模型训练框架

中国科学院自动化研究所

13+阅读 · 2018年4月28日

【干货】基于注意力机制的神经匹配模型用于短文本检索

【干货】基于注意力机制的神经匹配模型用于短文本检索

专知

11+阅读 · 2018年1月11日

第二语言韵律焦点产出、合成与评价的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于形态和多词的有限语料蒙汉互译调序优化方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

精神压力下基于物理模型的变异语音生成机理探索及检测方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

维吾尔语韵律结构的分析与预测模型的研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

维吾尔语单元集优化关键技术研究及其在语音识别中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

Toward Beginner-Friendly LLMs for Language Learning: Controlling Difficulty in Conversation

Arxiv

0+阅读 · 2月18日

Which course? Discourse! Teaching Discourse and Generation in the Era of LLMs

Arxiv

0+阅读 · 2月9日

How Should We Model the Probability of a Language?

Arxiv

0+阅读 · 2月9日

Luth: Efficient French Specialization for Small Language Models and Cross-Lingual Transfer

Arxiv

0+阅读 · 2月9日

The Roots of Performance Disparity in Multilingual Language Models: Intrinsic Modeling Difficulty or Design Choices?

Arxiv

0+阅读 · 2月7日

Efficient Attention Mechanisms for Large Language Models: A Survey

Arxiv

0+阅读 · 2月7日

Language Steering for Multilingual In-Context Learning

Arxiv

0+阅读 · 2月2日

A Survey of LLM Alignment: Instruction Understanding, Intention Reasoning, and Reliable Generation

Arxiv

0+阅读 · 1月29日

Epistemic Diversity and Knowledge Collapse in Large Language Models

Arxiv

0+阅读 · 1月28日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

499+阅读 · 2023年3月31日

VIP会员

文章信息

相关主题

相关VIP内容

大型语言模型的规模效应局限

大型语言模型的规模效应局限

专知会员服务

14+阅读 · 2025年11月18日

【新书】实践大型语言模型：语言理解与生成

【新书】实践大型语言模型：语言理解与生成

专知会员服务

69+阅读 · 2024年10月1日

大语言模型对齐研究综述

大语言模型对齐研究综述

专知会员服务

56+阅读 · 2024年8月1日

【NTU博士论文】语言模型自适应迁移学习

【NTU博士论文】语言模型自适应迁移学习

专知会员服务

38+阅读 · 2023年12月20日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

110+阅读 · 2023年12月19日

《大型语言模型归因》综述

《大型语言模型归因》综述

专知会员服务

75+阅读 · 2023年11月8日

大模型哪家强？清华最新《大语言模型综合性能评估报告》权威评测，26页ppt

大模型哪家强？清华最新《大语言模型综合性能评估报告》权威评测，26页ppt

专知会员服务

157+阅读 · 2023年8月8日

【慕尼黑大学博士论文】大型预训练语言模型的可比性、评估和基准测试，154页pdf

【慕尼黑大学博士论文】大型预训练语言模型的可比性、评估和基准测试，154页pdf

专知会员服务

47+阅读 · 2023年4月19日

【多伦多大学博士论文】整合语言学理论与神经语言模型，104页pdf

【多伦多大学博士论文】整合语言学理论与神经语言模型，104页pdf

专知会员服务

25+阅读 · 2022年8月3日

【康奈尔大学】语言数学模型课程，ECE 594: Mathematical Models of Language

【康奈尔大学】语言数学模型课程，ECE 594: Mathematical Models of Language

专知会员服务

11+阅读 · 2022年2月27日

热门VIP内容

开通专知VIP会员享更多权益服务

《无人机与战争：被忽视的环境影响及无人机保护潜力》

俄罗斯规划未来无人机驱动军队

《整合杀伤链：一个用于边缘目标验证与战术推理的零样本框架》最新资料

《人工智能、武器与影响力：前沿模型在模拟核危机中展现复杂推理》2026最新46页报告

相关资讯

「知识增强预训练语言模型」最新研究综述

「知识增强预训练语言模型」最新研究综述

专知

18+阅读 · 2022年11月18日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

绝对干货！NLP预训练模型：从transformer到albert

绝对干货！NLP预训练模型：从transformer到albert

新智元

13+阅读 · 2019年11月10日

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

《小样本学习(Few-shot learning)》最新41页综述论文，来自港科大和第四范式

专知

363+阅读 · 2019年4月12日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

NLP Chinese Corpus：大规模中文自然语言处理语料

NLP Chinese Corpus：大规模中文自然语言处理语料

PaperWeekly

14+阅读 · 2019年2月18日

MIT&哈佛大学最新综述文章：NLP模型的分析方法

MIT&哈佛大学最新综述文章：NLP模型的分析方法

专知

24+阅读 · 2018年12月26日

国内外混合式教学研究现状述评——基于混合式教学的分析框架

国内外混合式教学研究现状述评——基于混合式教学的分析框架

MOOC

53+阅读 · 2018年6月2日

【好文解析】ICASSP最佳学生论文：深度对抗声学模型训练框架

【好文解析】ICASSP最佳学生论文：深度对抗声学模型训练框架

中国科学院自动化研究所

13+阅读 · 2018年4月28日

【干货】基于注意力机制的神经匹配模型用于短文本检索

【干货】基于注意力机制的神经匹配模型用于短文本检索

专知

11+阅读 · 2018年1月11日

相关论文

Toward Beginner-Friendly LLMs for Language Learning: Controlling Difficulty in Conversation

Arxiv

0+阅读 · 2月18日

Which course? Discourse! Teaching Discourse and Generation in the Era of LLMs

Arxiv

0+阅读 · 2月9日

How Should We Model the Probability of a Language?

Arxiv

0+阅读 · 2月9日

Luth: Efficient French Specialization for Small Language Models and Cross-Lingual Transfer

Arxiv

0+阅读 · 2月9日

The Roots of Performance Disparity in Multilingual Language Models: Intrinsic Modeling Difficulty or Design Choices?

Arxiv

0+阅读 · 2月7日

Efficient Attention Mechanisms for Large Language Models: A Survey

Arxiv

0+阅读 · 2月7日

Language Steering for Multilingual In-Context Learning

Arxiv

0+阅读 · 2月2日

A Survey of LLM Alignment: Instruction Understanding, Intention Reasoning, and Reliable Generation

Arxiv

0+阅读 · 1月29日

Epistemic Diversity and Knowledge Collapse in Large Language Models

Arxiv

0+阅读 · 1月28日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

499+阅读 · 2023年3月31日

相关基金

第二语言韵律焦点产出、合成与评价的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于形态和多词的有限语料蒙汉互译调序优化方法

国家自然科学基金

0+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

精神压力下基于物理模型的变异语音生成机理探索及检测方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

维吾尔语韵律结构的分析与预测模型的研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

维吾尔语单元集优化关键技术研究及其在语音识别中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员