《用于代码弱点识别的 LLVM 中间表示》CMU - 专知VIP

会员服务 ·

6

军事防务 · 代码弱点 · 机器学习 · 中间表示 · CMU ·

2022 年 12 月 12 日

《用于代码弱点识别的 LLVM 中间表示》CMU

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

最近在代码弱点识别方面的努力，除了抽象语法树等更多的结构性特征外，还注重在源代码文本上训练统计机器学习（ML）模型，作为特征空间。LLVM中间表示法（IR）可以通过标准化代码、减少词汇量以及消除关于语法和内存的一些上下文敏感性来帮助ML模型。我们研究了LLVM IR对训练统计和机器学习模型的好处，包括词包模型、BiLSTM和一些品种的转换模型。我们将这些基于LLVM IR的模型与基于源代码C的模型在两组不同的数据上进行了比较：合成数据和更自然的数据。我们发现，虽然使用LLVM IR特征并不能产生比基于C语言的模型更准确的模型，但我们能够识别出上下文特定的LLVM IR和C语言标记，这些标记有助于表明存在的弱点。此外，对于一个给定的数据集，我们发现在使用更复杂、更耗时的模型之前，任何统计或ML模型是否有利于代码弱点的识别，词包模型可以成为强有力的指标。

成为VIP会员查看完整内容

15

相关内容

军事防务

军事防务数据板块介绍：系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块，其核心在于整合全球新兴国防技术（军事人工智能、无人系统等）、热点案例（俄乌战争、美以伊战争）等方面的最新时讯、研究报告/论文、条令法规、案例分析，为战略研判、情报分析、决策支持等提供知识支撑。

【CMU博士论文】无人工监督的视觉表示与识别，126页pdf

【CMU博士论文】无人工监督的视觉表示与识别，126页pdf

专知会员服务

35+阅读 · 2022年12月14日

【牛津大学博士论文】鲁棒神经网络:评估与构建

【牛津大学博士论文】鲁棒神经网络:评估与构建

专知会员服务

35+阅读 · 2022年10月23日

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

专知会员服务

57+阅读 · 2022年4月19日

《用于胸部 X 射线自动肺部疾病分析的深度学习》汉堡科技大学博士论文

《用于胸部 X 射线自动肺部疾病分析的深度学习》汉堡科技大学博士论文

专知会员服务

35+阅读 · 2022年4月17日

【NeurIPS2021】用于视频分割的密集无监督学习

【NeurIPS2021】用于视频分割的密集无监督学习

专知会员服务

15+阅读 · 2021年11月14日

【Hinton新论文】语言建模目标检测Pix2seq

【Hinton新论文】语言建模目标检测Pix2seq

专知会员服务

26+阅读 · 2021年9月23日

【哥伦比亚大学博士论文】深度概率图建模147页pdf

【哥伦比亚大学博士论文】深度概率图建模147页pdf

专知会员服务

90+阅读 · 2021年4月27日

《深度潜变量模型的编码视角》博士论文，154页pdf阐述深度潜变量模型(DLVM)中的统计推理与编码的关系

《深度潜变量模型的编码视角》博士论文，154页pdf阐述深度潜变量模型(DLVM)中的统计推理与编码的关系

专知会员服务

22+阅读 · 2021年1月21日

【牛津大学博士论文】解释深度神经网络，134页pdf

【牛津大学博士论文】解释深度神经网络，134页pdf

专知会员服务

221+阅读 · 2020年10月8日

【ACL2020】TriggerNER:使用实体触发器学习作为解释用于命名实体识别

【ACL2020】TriggerNER:使用实体触发器学习作为解释用于命名实体识别

专知会员服务

23+阅读 · 2020年4月18日

训练ViT和MAE减少一半计算量！Sea和北大联合提出高效优化器Adan，深度模型都能用

训练ViT和MAE减少一半计算量！Sea和北大联合提出高效优化器Adan，深度模型都能用

新智元

0+阅读 · 2022年10月26日

利用 OpenCV+ConvNets 检测几何图形

利用 OpenCV+ConvNets 检测几何图形

极市平台

0+阅读 · 2022年1月26日

开发人员如何正确地在产品中使用 GPT-3？

开发人员如何正确地在产品中使用 GPT-3？

InfoQ

2+阅读 · 2022年1月13日

开发人员如何正确地在产品中使用GPT-3？

开发人员如何正确地在产品中使用GPT-3？

AI前线

0+阅读 · 2022年1月12日

用于研究翻译中性别偏见的数据集

用于研究翻译中性别偏见的数据集

TensorFlow

0+阅读 · 2021年8月19日

安利一个开源的好工具Label Studio, 闭环数据标注和模型训练

安利一个开源的好工具Label Studio, 闭环数据标注和模型训练

AINLP

27+阅读 · 2020年12月30日

图神经网络如何用于知识图谱？这篇《图神经网络知识图谱补全》综述论文帮你总结好了

图神经网络如何用于知识图谱？这篇《图神经网络知识图谱补全》综述论文帮你总结好了

专知

39+阅读 · 2020年7月29日

近期必读的5篇顶会WWW 2020【图神经网络（GNN）】相关论文-Part2

近期必读的5篇顶会WWW 2020【图神经网络（GNN）】相关论文-Part2

专知

58+阅读 · 2020年3月11日

CMU2018春季课程：神经网络自然语言处理课程（附PPT和代码）

CMU2018春季课程：神经网络自然语言处理课程（附PPT和代码）

专知

12+阅读 · 2018年2月2日

教程帖：用TensorFlow自制Taylor Swift识别器

教程帖：用TensorFlow自制Taylor Swift识别器

论智

13+阅读 · 2018年1月17日

基于反模式自动检测的代码质量分析与重构

国家自然科学基金

0+阅读 · 2014年12月31日

维吾尔语命名实体间语义关系抽取理论方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

视频时空兴趣点检测与描述的几何代数方法

国家自然科学基金

0+阅读 · 2013年12月31日

基于核范数低秩表示的基因转录模块识别

国家自然科学基金

0+阅读 · 2013年12月31日

癌症体细胞拷贝数变异功能模式的鉴定方法与应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

癌症生物标记识别的基因网络研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于主题发现的图像语义理解与识别

国家自然科学基金

1+阅读 · 2011年12月31日

基于半监督结构化学习的跨语言映射研究

国家自然科学基金

2+阅读 · 2011年12月31日

丛流形学习及其在物体识别中的应用

国家自然科学基金

0+阅读 · 2010年12月31日

转录因子AHA-1/AHR-1介导神经细胞特异识别的作用机制

国家自然科学基金

0+阅读 · 2009年12月31日

Predicting the cardinality of a reduced Gröbner basis

Arxiv

0+阅读 · 2023年2月10日

Short-Term Aggregated Residential Load Forecasting using BiLSTM and CNN-BiLSTM

Arxiv

0+阅读 · 2023年2月10日

Explanation Selection Using Unlabeled Data for In-Context Learning

Explanation Selection Using Unlabeled Data for In-Context Learning

Arxiv

0+阅读 · 2023年2月9日

GFM: Building Geospatial Foundation Models via Continual Pretraining

Arxiv

0+阅读 · 2023年2月9日

Fast Parallel Degree+1 List Coloring

Arxiv

0+阅读 · 2023年2月8日

Fast Linear Model Trees by PILOT

Arxiv

0+阅读 · 2023年2月8日

VQA and Visual Reasoning: An Overview of Recent Datasets, Methods and Challenges

Arxiv

11+阅读 · 2022年12月26日

CSKG: The CommonSense Knowledge Graph

CSKG: The CommonSense Knowledge Graph

Arxiv

18+阅读 · 2020年12月21日

Pre-Training with Whole Word Masking for Chinese BERT

Arxiv

11+阅读 · 2019年6月19日

Estimating Node Importance in Knowledge Graphs Using Graph Neural Networks

Arxiv

25+阅读 · 2019年5月21日

VIP会员

相关主题

最新内容

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

2+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

4+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

5+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

6+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

9+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

6+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

9+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

7+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

13+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

8+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

6+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

8+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

10+阅读 · 6月17日

相关VIP内容

【CMU博士论文】无人工监督的视觉表示与识别，126页pdf

【CMU博士论文】无人工监督的视觉表示与识别，126页pdf

专知会员服务

35+阅读 · 2022年12月14日

【牛津大学博士论文】鲁棒神经网络:评估与构建

【牛津大学博士论文】鲁棒神经网络:评估与构建

专知会员服务

35+阅读 · 2022年10月23日

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

专知会员服务

57+阅读 · 2022年4月19日

《用于胸部 X 射线自动肺部疾病分析的深度学习》汉堡科技大学博士论文

《用于胸部 X 射线自动肺部疾病分析的深度学习》汉堡科技大学博士论文

专知会员服务

35+阅读 · 2022年4月17日

【NeurIPS2021】用于视频分割的密集无监督学习

【NeurIPS2021】用于视频分割的密集无监督学习

专知会员服务

15+阅读 · 2021年11月14日

【Hinton新论文】语言建模目标检测Pix2seq

【Hinton新论文】语言建模目标检测Pix2seq

专知会员服务

26+阅读 · 2021年9月23日

【哥伦比亚大学博士论文】深度概率图建模147页pdf

【哥伦比亚大学博士论文】深度概率图建模147页pdf

专知会员服务

90+阅读 · 2021年4月27日

《深度潜变量模型的编码视角》博士论文，154页pdf阐述深度潜变量模型(DLVM)中的统计推理与编码的关系

《深度潜变量模型的编码视角》博士论文，154页pdf阐述深度潜变量模型(DLVM)中的统计推理与编码的关系

专知会员服务

22+阅读 · 2021年1月21日

【牛津大学博士论文】解释深度神经网络，134页pdf

【牛津大学博士论文】解释深度神经网络，134页pdf

专知会员服务

221+阅读 · 2020年10月8日

【ACL2020】TriggerNER:使用实体触发器学习作为解释用于命名实体识别

【ACL2020】TriggerNER:使用实体触发器学习作为解释用于命名实体识别

专知会员服务

23+阅读 · 2020年4月18日

热门VIP内容

开通专知VIP会员享更多权益服务

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

相关资讯

训练ViT和MAE减少一半计算量！Sea和北大联合提出高效优化器Adan，深度模型都能用

训练ViT和MAE减少一半计算量！Sea和北大联合提出高效优化器Adan，深度模型都能用

新智元

0+阅读 · 2022年10月26日

利用 OpenCV+ConvNets 检测几何图形

利用 OpenCV+ConvNets 检测几何图形

极市平台

0+阅读 · 2022年1月26日

开发人员如何正确地在产品中使用 GPT-3？

开发人员如何正确地在产品中使用 GPT-3？

InfoQ

2+阅读 · 2022年1月13日

开发人员如何正确地在产品中使用GPT-3？

开发人员如何正确地在产品中使用GPT-3？

AI前线

0+阅读 · 2022年1月12日

用于研究翻译中性别偏见的数据集

用于研究翻译中性别偏见的数据集

TensorFlow

0+阅读 · 2021年8月19日

安利一个开源的好工具Label Studio, 闭环数据标注和模型训练

安利一个开源的好工具Label Studio, 闭环数据标注和模型训练

AINLP

27+阅读 · 2020年12月30日

图神经网络如何用于知识图谱？这篇《图神经网络知识图谱补全》综述论文帮你总结好了

图神经网络如何用于知识图谱？这篇《图神经网络知识图谱补全》综述论文帮你总结好了

专知

39+阅读 · 2020年7月29日

近期必读的5篇顶会WWW 2020【图神经网络（GNN）】相关论文-Part2

近期必读的5篇顶会WWW 2020【图神经网络（GNN）】相关论文-Part2

专知

58+阅读 · 2020年3月11日

CMU2018春季课程：神经网络自然语言处理课程（附PPT和代码）

CMU2018春季课程：神经网络自然语言处理课程（附PPT和代码）

专知

12+阅读 · 2018年2月2日

教程帖：用TensorFlow自制Taylor Swift识别器

教程帖：用TensorFlow自制Taylor Swift识别器

论智

13+阅读 · 2018年1月17日

相关基金

基于反模式自动检测的代码质量分析与重构

国家自然科学基金

0+阅读 · 2014年12月31日

维吾尔语命名实体间语义关系抽取理论方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

视频时空兴趣点检测与描述的几何代数方法

国家自然科学基金

0+阅读 · 2013年12月31日

基于核范数低秩表示的基因转录模块识别

国家自然科学基金

0+阅读 · 2013年12月31日

癌症体细胞拷贝数变异功能模式的鉴定方法与应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

癌症生物标记识别的基因网络研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于主题发现的图像语义理解与识别

国家自然科学基金

1+阅读 · 2011年12月31日

基于半监督结构化学习的跨语言映射研究

国家自然科学基金

2+阅读 · 2011年12月31日

丛流形学习及其在物体识别中的应用

国家自然科学基金

0+阅读 · 2010年12月31日

转录因子AHA-1/AHR-1介导神经细胞特异识别的作用机制

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Predicting the cardinality of a reduced Gröbner basis

Arxiv

0+阅读 · 2023年2月10日

Short-Term Aggregated Residential Load Forecasting using BiLSTM and CNN-BiLSTM

Arxiv

0+阅读 · 2023年2月10日

Explanation Selection Using Unlabeled Data for In-Context Learning

Explanation Selection Using Unlabeled Data for In-Context Learning

Arxiv

0+阅读 · 2023年2月9日

GFM: Building Geospatial Foundation Models via Continual Pretraining

Arxiv

0+阅读 · 2023年2月9日

Fast Parallel Degree+1 List Coloring

Arxiv

0+阅读 · 2023年2月8日

Fast Linear Model Trees by PILOT

Arxiv

0+阅读 · 2023年2月8日

VQA and Visual Reasoning: An Overview of Recent Datasets, Methods and Challenges

Arxiv

11+阅读 · 2022年12月26日

CSKG: The CommonSense Knowledge Graph

CSKG: The CommonSense Knowledge Graph

Arxiv

18+阅读 · 2020年12月21日

Pre-Training with Whole Word Masking for Chinese BERT

Arxiv

11+阅读 · 2019年6月19日

Estimating Node Importance in Knowledge Graphs Using Graph Neural Networks

Arxiv

25+阅读 · 2019年5月21日

微信扫码咨询专知VIP会员