Plotting correlated data - 专知论文

会员服务 ·

0

数据点 · 误差条 · 不确定 · 不确定度 · 关联 ·

Plotting correlated data

翻译：关联数据绘图

from arxiv, 13 pages, 10 figures, Added comparison to Parallel Coordinates Plots and reference to other work. Fixed a bug in the "2D projections" plot

A very common task in data visualization is to plot many data points with some measured y-value as a function of fixed x-values. Uncertainties on the y-values are typically presented as vertical error bars that represent either a Frequentist confidence interval or Bayesian credible interval for each data point. Most of the time, these error bars represent a 68\% confidence/credibility level, which leads to the intuition that a model fits the data reasonably well if its prediction lies within the error bars of roughly two thirds of the data points. Unfortunately, this and other intuitions no longer work when the uncertainties of the data points are correlated. If the error bars only show the square root of diagonal elements of some covariance matrix with non-negligible off-diagonal elements, we simply do not have enough information in the plot to judge whether a drawn model line agrees well with the data or not. In this paper we will demonstrate this problem and discuss ways to add more information to the plots to make it easier to judge the agreement between the data and some model prediction in the plot, as well as glean some insight where the model might be deficient. This is done by explicitly showing the contribution of the first principal component of the uncertainties, and by displaying the conditional uncertainties of all data points.

翻译：数据可视化中一个极为常见的任务是将大量数据点绘制成以固定x值为自变量、实测y值为因变量的图形。y值的不确定度通常用垂直误差条表示，这些误差条代表每个数据点的频率派置信区间或贝叶斯可信区间。大多数情况下，这些误差条对应68%置信/可信水平，由此产生一种直觉：若模型的预测值落在约三分之二数据点误差条范围内，则可认为模型与数据拟合良好。遗憾的是，当数据点的不确定度存在关联时，这种直觉及其他类似判断将不再成立。如果误差条仅展示某个非对角元素不可忽略的协方差矩阵对角元素的平方根，我们便无法仅凭图形判断所绘模型曲线与数据的吻合程度。本文旨在论证此问题的严重性，并探讨如何在图形中补充更多信息，以更便捷地评估数据与模型预测的一致性，同时洞察模型可能存在的缺陷。所提出的方法包括显式展示不确定度的第一主成分贡献，以及呈现所有数据点的条件不确定度。

0

相关内容

数据点

【CVPR2024】GroupContrast：语义感知的自监督表示学习用于三维理解

【CVPR2024】GroupContrast：语义感知的自监督表示学习用于三维理解

专知会员服务

18+阅读 · 2024年3月15日

【博士论文】结构化数据自动可视化关键技术研究

【博士论文】结构化数据自动可视化关键技术研究

专知会员服务

47+阅读 · 2023年12月6日

【2023新书】使用Python进行数据可视化：探索Matplotlib、Seaborn和Bokeh进行交互式可视化

【2023新书】使用Python进行数据可视化：探索Matplotlib、Seaborn和Bokeh进行交互式可视化

专知会员服务

72+阅读 · 2023年11月18日

图上的不均衡数据怎么处理？新加坡国立大学最新《不均衡图学习》综述，详述问题、技术和未来方向

图上的不均衡数据怎么处理？新加坡国立大学最新《不均衡图学习》综述，详述问题、技术和未来方向

专知会员服务

33+阅读 · 2023年8月31日

【2023新书】用Python和JavaScript实现数据可视化:抓取、清理、探索和转换数据，569页pdf

【2023新书】用Python和JavaScript实现数据可视化:抓取、清理、探索和转换数据，569页pdf

专知会员服务

82+阅读 · 2023年2月8日

《将机器学习应用于共同作战图像（COP）与共同战术图像（CTP）数据过滤》美海军2022最新176页报告

《将机器学习应用于共同作战图像（COP）与共同战术图像（CTP）数据过滤》美海军2022最新176页报告

专知会员服务

62+阅读 · 2022年12月12日

【Pisa大学博士论文】图贝叶斯深度学习，Bayesian Deep Learning for Graphs ，201页pdf

【Pisa大学博士论文】图贝叶斯深度学习，Bayesian Deep Learning for Graphs ，201页pdf

专知会员服务

47+阅读 · 2022年2月28日

【开放书】数据可视化基础，《Fundamentals of Data Visualization》

专知会员服务

65+阅读 · 2021年6月13日

【KDD2020-清华大学】理解图表示学习中的负采样，Understanding Negative Sampling

【KDD2020-清华大学】理解图表示学习中的负采样，Understanding Negative Sampling

专知会员服务

63+阅读 · 2020年5月23日

【实用书】图数据分析与可视化，538页pdf，发现关联数据中的商机

【实用书】图数据分析与可视化，538页pdf，发现关联数据中的商机

专知会员服务

117+阅读 · 2020年4月12日

【数据集】OCR_DataSet：有关OCR的数据集并统一标注格式

【数据集】OCR_DataSet：有关OCR的数据集并统一标注格式

AINLP

18+阅读 · 2020年4月10日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

用一行tf.data实现数据Shuffle、Batch划分、异步预加载等

用一行tf.data实现数据Shuffle、Batch划分、异步预加载等

专知

21+阅读 · 2019年3月26日

图像分割最新资料汇总（语义分割、实例分割、视频分割、医疗图像分割、自动驾驶…）

图像分割最新资料汇总（语义分割、实例分割、视频分割、医疗图像分割、自动驾驶…）

人工智能前沿讲习班

144+阅读 · 2019年3月15日

下载 | 954页《数据可视化》手册

下载 | 954页《数据可视化》手册

机器学习算法与Python学习

22+阅读 · 2019年1月3日

954页《数据可视化》手册（下载），台湾中央陈君厚研究员

954页《数据可视化》手册（下载），台湾中央陈君厚研究员

专知

21+阅读 · 2019年1月2日

相关性≠因果：概率图模型和do-calculus

相关性≠因果：概率图模型和do-calculus

论智

31+阅读 · 2018年10月29日

详解常见的损失函数

详解常见的损失函数

七月在线实验室

20+阅读 · 2018年7月12日

图上的归纳表示学习

图上的归纳表示学习

科技创新与创业

23+阅读 · 2017年11月9日

分布无关的概率图模型结构学习方法的研究

国家自然科学基金

4+阅读 · 2015年12月31日

不确定数据流的分布并行Skyline查询技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

函数数据变换模型及降维方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

整数关系探测的误差可控算法与应用

国家自然科学基金

0+阅读 · 2015年12月31日

复杂数据下带有形状约束的半参数模型统计推断

国家自然科学基金

3+阅读 · 2014年12月31日

纵向数据的动态半参数建模及其统计推断

国家自然科学基金

0+阅读 · 2014年12月31日

基于概率图的文本检索模型及算法研究

国家自然科学基金

2+阅读 · 2014年12月31日

相依回归模型与扩散过程的统计推断及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

语义关联的地理视频数据自适应组织方法

国家自然科学基金

1+阅读 · 2014年12月31日

概率图模型学习及其在数据分析中的应用研究

国家自然科学基金

16+阅读 · 2013年12月31日

Invariant Image Reparameterisation: Bridging Symbolic and Numerical Methods for Identifiability Analysis and Model Reduction

Invariant Image Reparameterisation: Bridging Symbolic and Numerical Methods for Identifiability Analysis and Model Reduction

Arxiv

0+阅读 · 5月4日

Plotting correlated data

Arxiv

0+阅读 · 5月4日

Plotting correlated data

Arxiv

0+阅读 · 4月28日

DataClaw: An Autonomous Data Agent with Instant Messaging Integration

Arxiv

0+阅读 · 4月27日

Refined thresholds for inconsistency: The effect of the graph associated with incomplete pairwise comparisons

Arxiv

0+阅读 · 4月13日

Investigating Performance and Practices with Univariate Distribution Charts

Arxiv

0+阅读 · 4月9日

Graph-Informed Adversarial Modeling: Infimal Subadditivity of Interpolative Divergences

Arxiv

0+阅读 · 4月2日

Finite Population Identification and Design-Based Sensitivity Analysis

Arxiv

0+阅读 · 3月26日

An Information-Theoretic Diagnostic Analytics Framework for Mapping Past-Future Dependence in Horizon-Specific Forecastability

Arxiv

0+阅读 · 3月24日

On the identifiability of causal graphs with multiple environments

Arxiv

0+阅读 · 3月18日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

3+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

4+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

6+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

5+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

8+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

21+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

【CVPR2024】GroupContrast：语义感知的自监督表示学习用于三维理解

【CVPR2024】GroupContrast：语义感知的自监督表示学习用于三维理解

专知会员服务

18+阅读 · 2024年3月15日

【博士论文】结构化数据自动可视化关键技术研究

【博士论文】结构化数据自动可视化关键技术研究

专知会员服务

47+阅读 · 2023年12月6日

【2023新书】使用Python进行数据可视化：探索Matplotlib、Seaborn和Bokeh进行交互式可视化

【2023新书】使用Python进行数据可视化：探索Matplotlib、Seaborn和Bokeh进行交互式可视化

专知会员服务

72+阅读 · 2023年11月18日

图上的不均衡数据怎么处理？新加坡国立大学最新《不均衡图学习》综述，详述问题、技术和未来方向

图上的不均衡数据怎么处理？新加坡国立大学最新《不均衡图学习》综述，详述问题、技术和未来方向

专知会员服务

33+阅读 · 2023年8月31日

【2023新书】用Python和JavaScript实现数据可视化:抓取、清理、探索和转换数据，569页pdf

【2023新书】用Python和JavaScript实现数据可视化:抓取、清理、探索和转换数据，569页pdf

专知会员服务

82+阅读 · 2023年2月8日

《将机器学习应用于共同作战图像（COP）与共同战术图像（CTP）数据过滤》美海军2022最新176页报告

《将机器学习应用于共同作战图像（COP）与共同战术图像（CTP）数据过滤》美海军2022最新176页报告

专知会员服务

62+阅读 · 2022年12月12日

【Pisa大学博士论文】图贝叶斯深度学习，Bayesian Deep Learning for Graphs ，201页pdf

【Pisa大学博士论文】图贝叶斯深度学习，Bayesian Deep Learning for Graphs ，201页pdf

专知会员服务

47+阅读 · 2022年2月28日

【开放书】数据可视化基础，《Fundamentals of Data Visualization》

专知会员服务

65+阅读 · 2021年6月13日

【KDD2020-清华大学】理解图表示学习中的负采样，Understanding Negative Sampling

【KDD2020-清华大学】理解图表示学习中的负采样，Understanding Negative Sampling

专知会员服务

63+阅读 · 2020年5月23日

【实用书】图数据分析与可视化，538页pdf，发现关联数据中的商机

【实用书】图数据分析与可视化，538页pdf，发现关联数据中的商机

专知会员服务

117+阅读 · 2020年4月12日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

【数据集】OCR_DataSet：有关OCR的数据集并统一标注格式

【数据集】OCR_DataSet：有关OCR的数据集并统一标注格式

AINLP

18+阅读 · 2020年4月10日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

用一行tf.data实现数据Shuffle、Batch划分、异步预加载等

用一行tf.data实现数据Shuffle、Batch划分、异步预加载等

专知

21+阅读 · 2019年3月26日

图像分割最新资料汇总（语义分割、实例分割、视频分割、医疗图像分割、自动驾驶…）

图像分割最新资料汇总（语义分割、实例分割、视频分割、医疗图像分割、自动驾驶…）

人工智能前沿讲习班

144+阅读 · 2019年3月15日

下载 | 954页《数据可视化》手册

下载 | 954页《数据可视化》手册

机器学习算法与Python学习

22+阅读 · 2019年1月3日

954页《数据可视化》手册（下载），台湾中央陈君厚研究员

954页《数据可视化》手册（下载），台湾中央陈君厚研究员

专知

21+阅读 · 2019年1月2日

相关性≠因果：概率图模型和do-calculus

相关性≠因果：概率图模型和do-calculus

论智

31+阅读 · 2018年10月29日

详解常见的损失函数

详解常见的损失函数

七月在线实验室

20+阅读 · 2018年7月12日

图上的归纳表示学习

图上的归纳表示学习

科技创新与创业

23+阅读 · 2017年11月9日

相关论文

Invariant Image Reparameterisation: Bridging Symbolic and Numerical Methods for Identifiability Analysis and Model Reduction

Invariant Image Reparameterisation: Bridging Symbolic and Numerical Methods for Identifiability Analysis and Model Reduction

Arxiv

0+阅读 · 5月4日

Plotting correlated data

Arxiv

0+阅读 · 5月4日

Plotting correlated data

Arxiv

0+阅读 · 4月28日

DataClaw: An Autonomous Data Agent with Instant Messaging Integration

Arxiv

0+阅读 · 4月27日

Refined thresholds for inconsistency: The effect of the graph associated with incomplete pairwise comparisons

Arxiv

0+阅读 · 4月13日

Investigating Performance and Practices with Univariate Distribution Charts

Arxiv

0+阅读 · 4月9日

Graph-Informed Adversarial Modeling: Infimal Subadditivity of Interpolative Divergences

Arxiv

0+阅读 · 4月2日

Finite Population Identification and Design-Based Sensitivity Analysis

Arxiv

0+阅读 · 3月26日

An Information-Theoretic Diagnostic Analytics Framework for Mapping Past-Future Dependence in Horizon-Specific Forecastability

Arxiv

0+阅读 · 3月24日

On the identifiability of causal graphs with multiple environments

Arxiv

0+阅读 · 3月18日

相关基金

分布无关的概率图模型结构学习方法的研究

国家自然科学基金

4+阅读 · 2015年12月31日

不确定数据流的分布并行Skyline查询技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

函数数据变换模型及降维方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

整数关系探测的误差可控算法与应用

国家自然科学基金

0+阅读 · 2015年12月31日

复杂数据下带有形状约束的半参数模型统计推断

国家自然科学基金

3+阅读 · 2014年12月31日

纵向数据的动态半参数建模及其统计推断

国家自然科学基金

0+阅读 · 2014年12月31日

基于概率图的文本检索模型及算法研究

国家自然科学基金

2+阅读 · 2014年12月31日

相依回归模型与扩散过程的统计推断及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

语义关联的地理视频数据自适应组织方法

国家自然科学基金

1+阅读 · 2014年12月31日

概率图模型学习及其在数据分析中的应用研究

国家自然科学基金

16+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员