Enhancing Zero-shot Personalized Image Aesthetics Assessment with Profile-aware Multimodal LLM - 专知论文

会员服务 ·

0

样本 · 零样本 · 用户画像 · 多模 · 模态 ·

Enhancing Zero-shot Personalized Image Aesthetics Assessment with Profile-aware Multimodal LLM

翻译：增强零样本个性化图像美学评估：基于用户画像感知的多模态大语言模型

Chun Wang,Chenfeng Wei,Chenyang Liu,Weihong Deng

Personalized image aesthetics assessment (PIAA) aims to predict an individual user's subjective rating of an image, which requires modeling user-specific aesthetic preferences. Existing methods rely on historical user ratings for this modeling and therefore struggle when such data are unavailable. We address this zero-shot setting by using user profiles as contextual signals for personalization and adopting a profile-based personalization paradigm. We introduce P-MLLM, a profile-aware multimodal LLM that augments a frozen LLM with selective fusion modules for controlled visual integration. These modules selectively integrate visual information into the model's evolving hidden states during profile-conditioned reasoning, allowing visual information to be incorporated in a profile-aware manner. Experiments on recent PIAA benchmarks show that P-MLLM achieves competitive zero-shot performance and remains effective even with coarse profile information, highlighting the potential of profile-based personalization for zero-shot PIAA.

翻译：个性化图像美学评估（PIAA）旨在预测个体用户对图像的主观评分，这需要建模用户特定的审美偏好。现有方法依赖用户历史评分数据进行建模，因此在缺乏此类数据时表现不佳。针对这一零样本设定，我们采用用户画像作为个性化上下文信号，并提出基于画像的个性化范式。我们引入P-MLLM——一种画像感知的多模态大语言模型，该模型通过选择性融合模块增强固定参数的LLM，实现可控的视觉信息整合。这些模块在基于画像的推理过程中，将视觉信息选择性地融入模型动态变化的隐状态，实现画像感知的视觉信息融合。在最新PIAA基准上的实验表明，P-MLLM在零样本场景下取得具有竞争力的性能，即便使用粗粒度画像信息仍保持有效性，突显了基于画像的个性化范式在零样本PIAA任务中的潜力。

0

相关内容

《评估用于军事空军基地作战监控的视觉语言模型：卫星图像中的零样本飞机检测》

《评估用于军事空军基地作战监控的视觉语言模型：卫星图像中的零样本飞机检测》

专知会员服务

13+阅读 · 5月12日

大模型时代的个性化生成：综述

大模型时代的个性化生成：综述

专知会员服务

43+阅读 · 2025年3月10日

基于深度生成模型的个性化图像生成：十年综述

基于深度生成模型的个性化图像生成：十年综述

专知会员服务

19+阅读 · 2025年2月19日

大规模语言模型的个性化：综述

大规模语言模型的个性化：综述

专知会员服务

43+阅读 · 2024年11月4日

大模型如何做用户建模？在大型语言模型时代的用户建模：当前研究与未来方向

大模型如何做用户建模？在大型语言模型时代的用户建模：当前研究与未来方向

专知会员服务

45+阅读 · 2023年12月26日

【IJCAI2021】User-as-Graph: 基于异构图池化的新闻推荐用户建模

专知会员服务

23+阅读 · 2021年8月25日

【CVPR2021】基于相似性分布距离的无监督人脸图像质量评价

专知会员服务

32+阅读 · 2021年3月19日

【上海交通大学王鸿伟博士论文】基于网络特征学习的个性化推荐系统

【上海交通大学王鸿伟博士论文】基于网络特征学习的个性化推荐系统

专知会员服务

40+阅读 · 2020年12月11日

【CIKM2020-北大】Set-Sequence-Graph:一种利用评论来获取推荐的多视图方法

专知会员服务

21+阅读 · 2020年9月22日

【AAAI2020论文-清华大学】基于人物稀疏数据的预训练个性化对话生成模型（A Pre-training Based Personalized Dialogue Generation Model with Persona-sparse Data）

【AAAI2020论文-清华大学】基于人物稀疏数据的预训练个性化对话生成模型（A Pre-training Based Personalized Dialogue Generation Model with Persona-sparse Data）

专知会员服务

29+阅读 · 2019年11月15日

用户画像基础

用户画像基础

DataFunTalk

12+阅读 · 2020年8月1日

数据中台：基于标签体系的360°用户画像

数据中台：基于标签体系的360°用户画像

THU数据派

13+阅读 · 2020年7月25日

专家报告 | 个性化图像美学评价

专家报告 | 个性化图像美学评价

中国图象图形学报

14+阅读 · 2020年7月15日

用户画像技术及方法论

用户画像技术及方法论

DataFunTalk

13+阅读 · 2020年5月27日

一行命令搞定图像质量评价

一行命令搞定图像质量评价

计算机视觉life

12+阅读 · 2019年12月31日

用户研究：如何做用户画像分析

用户研究：如何做用户画像分析

产品100干货速递

46+阅读 · 2019年5月9日

六种人体姿态估计的深度学习模型和代码总结

六种人体姿态估计的深度学习模型和代码总结

论智

19+阅读 · 2018年6月27日

图像美学质量评价技术发展趋势

图像美学质量评价技术发展趋势

科技导报

19+阅读 · 2018年6月25日

【知识图谱】复旦大学：基于知识图谱的用户画像技术研究

【知识图谱】复旦大学：基于知识图谱的用户画像技术研究

产业智能官

40+阅读 · 2017年10月31日

【大数据】如何用大数据构建精准用户画像？

【大数据】如何用大数据构建精准用户画像？

产业智能官

12+阅读 · 2017年9月21日

大数据环境下弱监督深度学习的人脸美丽预测研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

基于内容感知编辑算子的复合型人脸图像真实感绘制

国家自然科学基金

0+阅读 · 2015年12月31日

新媒体语境下旅游形象量化投射模型构建与评估研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于人脸表情、身体姿态和语音的多模态情感识别方法研究

国家自然科学基金

10+阅读 · 2015年12月31日

移动社会网络中情境感知的多维个性化信任评价研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向情感认知的产品造型特征与用户意象需求层次映射机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

数据驱动的人体图像语义分割研究

国家自然科学基金

5+阅读 · 2014年12月31日

基于深度学习的四元数小波彩色图像质量评价及其应用

国家自然科学基金

0+阅读 · 2014年12月31日

超光谱、全偏振、立体形貌的多模态成像研究

国家自然科学基金

0+阅读 · 2014年12月31日

Boosting Image Quality Assessment Performance: Unsupervised Score Fusion by Deep Maximum a Posteriori Estimation

Arxiv

0+阅读 · 5月28日

AlbumFill: Album-Guided Reasoning and Retrieval for Personalized Image Completion

Arxiv

0+阅读 · 5月4日

How Personal Characteristics Shape User Exploration of Diverse Movie Recommendations with a LLM-Based Multi-Agent System

Arxiv

0+阅读 · 4月27日

One Persona, Many Cues, Different Results: How Sociodemographic Cues Impact LLM Personalization

Arxiv

0+阅读 · 4月24日

StyleID: A Perception-Aware Dataset and Metric for Stylization-Agnostic Facial Identity Recognition

Arxiv

0+阅读 · 4月23日

Discrete Preference Learning for Personalized Multimodal Generation

Arxiv

0+阅读 · 4月22日

From Hidden Profiles to Governable Personalization: Recommender Systems in the Age of LLM Agents

Arxiv

0+阅读 · 4月22日

Towards Context-Aware Image Anonymization with Multi-Agent Reasoning

Arxiv

0+阅读 · 4月10日

PeReGrINE: Evaluating Personalized Review Fidelity with User Item Graph Context

Arxiv

0+阅读 · 4月9日

Vision-Language Models vs Human: Perceptual Image Quality Assessment

Arxiv

0+阅读 · 3月25日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

2+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

3+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

5+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

4+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

4+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

5+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

3+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

6+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

9+阅读 · 6月22日

相关VIP内容

《评估用于军事空军基地作战监控的视觉语言模型：卫星图像中的零样本飞机检测》

《评估用于军事空军基地作战监控的视觉语言模型：卫星图像中的零样本飞机检测》

专知会员服务

13+阅读 · 5月12日

大模型时代的个性化生成：综述

大模型时代的个性化生成：综述

专知会员服务

43+阅读 · 2025年3月10日

基于深度生成模型的个性化图像生成：十年综述

基于深度生成模型的个性化图像生成：十年综述

专知会员服务

19+阅读 · 2025年2月19日

大规模语言模型的个性化：综述

大规模语言模型的个性化：综述

专知会员服务

43+阅读 · 2024年11月4日

大模型如何做用户建模？在大型语言模型时代的用户建模：当前研究与未来方向

大模型如何做用户建模？在大型语言模型时代的用户建模：当前研究与未来方向

专知会员服务

45+阅读 · 2023年12月26日

【IJCAI2021】User-as-Graph: 基于异构图池化的新闻推荐用户建模

专知会员服务

23+阅读 · 2021年8月25日

【CVPR2021】基于相似性分布距离的无监督人脸图像质量评价

专知会员服务

32+阅读 · 2021年3月19日

【上海交通大学王鸿伟博士论文】基于网络特征学习的个性化推荐系统

【上海交通大学王鸿伟博士论文】基于网络特征学习的个性化推荐系统

专知会员服务

40+阅读 · 2020年12月11日

【CIKM2020-北大】Set-Sequence-Graph:一种利用评论来获取推荐的多视图方法

专知会员服务

21+阅读 · 2020年9月22日

【AAAI2020论文-清华大学】基于人物稀疏数据的预训练个性化对话生成模型（A Pre-training Based Personalized Dialogue Generation Model with Persona-sparse Data）

【AAAI2020论文-清华大学】基于人物稀疏数据的预训练个性化对话生成模型（A Pre-training Based Personalized Dialogue Generation Model with Persona-sparse Data）

专知会员服务

29+阅读 · 2019年11月15日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

用户画像基础

用户画像基础

DataFunTalk

12+阅读 · 2020年8月1日

数据中台：基于标签体系的360°用户画像

数据中台：基于标签体系的360°用户画像

THU数据派

13+阅读 · 2020年7月25日

专家报告 | 个性化图像美学评价

专家报告 | 个性化图像美学评价

中国图象图形学报

14+阅读 · 2020年7月15日

用户画像技术及方法论

用户画像技术及方法论

DataFunTalk

13+阅读 · 2020年5月27日

一行命令搞定图像质量评价

一行命令搞定图像质量评价

计算机视觉life

12+阅读 · 2019年12月31日

用户研究：如何做用户画像分析

用户研究：如何做用户画像分析

产品100干货速递

46+阅读 · 2019年5月9日

六种人体姿态估计的深度学习模型和代码总结

六种人体姿态估计的深度学习模型和代码总结

论智

19+阅读 · 2018年6月27日

图像美学质量评价技术发展趋势

图像美学质量评价技术发展趋势

科技导报

19+阅读 · 2018年6月25日

【知识图谱】复旦大学：基于知识图谱的用户画像技术研究

【知识图谱】复旦大学：基于知识图谱的用户画像技术研究

产业智能官

40+阅读 · 2017年10月31日

【大数据】如何用大数据构建精准用户画像？

【大数据】如何用大数据构建精准用户画像？

产业智能官

12+阅读 · 2017年9月21日

相关论文

Boosting Image Quality Assessment Performance: Unsupervised Score Fusion by Deep Maximum a Posteriori Estimation

Arxiv

0+阅读 · 5月28日

AlbumFill: Album-Guided Reasoning and Retrieval for Personalized Image Completion

Arxiv

0+阅读 · 5月4日

How Personal Characteristics Shape User Exploration of Diverse Movie Recommendations with a LLM-Based Multi-Agent System

Arxiv

0+阅读 · 4月27日

One Persona, Many Cues, Different Results: How Sociodemographic Cues Impact LLM Personalization

Arxiv

0+阅读 · 4月24日

StyleID: A Perception-Aware Dataset and Metric for Stylization-Agnostic Facial Identity Recognition

Arxiv

0+阅读 · 4月23日

Discrete Preference Learning for Personalized Multimodal Generation

Arxiv

0+阅读 · 4月22日

From Hidden Profiles to Governable Personalization: Recommender Systems in the Age of LLM Agents

Arxiv

0+阅读 · 4月22日

Towards Context-Aware Image Anonymization with Multi-Agent Reasoning

Arxiv

0+阅读 · 4月10日

PeReGrINE: Evaluating Personalized Review Fidelity with User Item Graph Context

Arxiv

0+阅读 · 4月9日

Vision-Language Models vs Human: Perceptual Image Quality Assessment

Arxiv

0+阅读 · 3月25日

相关基金

大数据环境下弱监督深度学习的人脸美丽预测研究

国家自然科学基金

3+阅读 · 2017年12月31日

基于深度学习的多尺度本质图像提取方法

国家自然科学基金

5+阅读 · 2015年12月31日

基于内容感知编辑算子的复合型人脸图像真实感绘制

国家自然科学基金

0+阅读 · 2015年12月31日

新媒体语境下旅游形象量化投射模型构建与评估研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于人脸表情、身体姿态和语音的多模态情感识别方法研究

国家自然科学基金

10+阅读 · 2015年12月31日

移动社会网络中情境感知的多维个性化信任评价研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向情感认知的产品造型特征与用户意象需求层次映射机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

数据驱动的人体图像语义分割研究

国家自然科学基金

5+阅读 · 2014年12月31日

基于深度学习的四元数小波彩色图像质量评价及其应用

国家自然科学基金

0+阅读 · 2014年12月31日

超光谱、全偏振、立体形貌的多模态成像研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员