Zero-shot Evaluation of Deep Learning for Java Code Clone Detection - 专知论文

会员服务 ·

0

克隆检测 · 代码 · 样本 · 样本评估 · 检测器 ·

Zero-shot Evaluation of Deep Learning for Java Code Clone Detection

翻译：深度学习在Java代码克隆检测中的零样本评估

Thomas S. Heinze

Deep Learning (DL) is becoming more and more widespread in clone detection, motivated by achieving near-perfect performance for this task. In particular in case of semantic code clones, which share only limited syntax but implement the same or similar functionality, Deep Learning appears to outperform conventional tools. In this paper, we want to investigate the generalizability of DL-based clone detectors for Java. We therefore replicate and evaluate the performance of five state-of-the-art DL-based clone detectors, including Transformers like CodeBERT and single-task models like FA-AST+GMN, in a zero-shot evaluation scenario, where we train/fine-tune and evaluate on different datasets and functionalities. Our experiments demonstrate that the models' generalizability to unseen code is limited. Further analysis reveals that the conventional clone detector NiCad even outperforms the DL-based clone detectors in such a zero-shot evaluation scenario.

翻译：深度学习在克隆检测中日益普及，其动机是实现该任务的近乎完美性能。特别是在语义代码克隆（仅共享有限语法但实现相同或相似功能）的情况下，深度学习似乎优于传统工具。本文旨在探究基于深度学习的克隆检测器在Java中的泛化能力。为此，我们在零样本评估场景中复现并评估了五种最先进的基于深度学习的克隆检测器的性能，包括CodeBERT等Transformer模型和FA-AST+GMN等单任务模型。在此场景中，我们在不同数据集和功能上进行训练/微调与评估。实验表明，这些模型对未见代码的泛化能力有限。进一步分析显示，传统克隆检测器NiCad在此类零样本评估场景中甚至优于基于深度学习的克隆检测器。

0

相关内容

克隆检测

零样本量化：综述

零样本量化：综述

专知会员服务

13+阅读 · 2025年5月15日

浙大《深度学习低样本目标检测》综述论文

浙大《深度学习低样本目标检测》综述论文

专知会员服务

76+阅读 · 2021年12月13日

深度学习中的单阶段小目标检测方法综述

深度学习中的单阶段小目标检测方法综述

专知会员服务

47+阅读 · 2021年11月23日

基于深度学习的小目标检测方法综述

专知会员服务

125+阅读 · 2021年4月29日

最新《深度学习视频异常检测》2020综述论文，21页pdf

最新《深度学习视频异常检测》2020综述论文，21页pdf

专知会员服务

86+阅读 · 2020年9月30日

零样本文本分类，Zero-Shot Learning for Text Classification

零样本文本分类，Zero-Shot Learning for Text Classification

专知会员服务

97+阅读 · 2020年5月31日

【自动化学报】零样本学习研究进展，中国石油大学

【自动化学报】零样本学习研究进展，中国石油大学

专知会员服务

88+阅读 · 2020年1月27日

【O’Reilly讲座】基于深度学习的异常检测方法用于检测大型数据集的质量：Anomaly detection using deep learning to measure the quality of large datasets

【O’Reilly讲座】基于深度学习的异常检测方法用于检测大型数据集的质量：Anomaly detection using deep learning to measure the quality of large datasets

专知会员服务

31+阅读 · 2020年1月11日

【目标检测 | 2019最新综述】基于深度学习的目标检测综述，附30页PDF， A Survey of Deep Learning-based Object Detection（From Fast R-CNN to NAS-FPN）

【目标检测 | 2019最新综述】基于深度学习的目标检测综述，附30页PDF， A Survey of Deep Learning-based Object Detection（From Fast R-CNN to NAS-FPN）

专知会员服务

56+阅读 · 2019年11月15日

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

专知会员服务

218+阅读 · 2019年10月18日

零样本文本分类，Zero-Shot Learning for Text Classification

零样本文本分类，Zero-Shot Learning for Text Classification

专知

16+阅读 · 2020年5月31日

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

专知

137+阅读 · 2019年1月14日

Zero-Shot Learning相关资源大列表

Zero-Shot Learning相关资源大列表

专知

52+阅读 · 2019年1月1日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

从零开始深度学习：利用numpy手写一个感知机

从零开始深度学习：利用numpy手写一个感知机

数萃大数据

10+阅读 · 2018年6月10日

深度学习时代的目标检测算法

深度学习时代的目标检测算法

炼数成金订阅号

40+阅读 · 2018年3月19日

综述：深度学习时代的目标检测算法

综述：深度学习时代的目标检测算法

极市平台

27+阅读 · 2018年3月17日

资深算法工程师万宫玺：Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 分享总结

资深算法工程师万宫玺：Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 分享总结

AI研习社

11+阅读 · 2018年1月4日

【下载】JAVA程序员深度学习实用指引《Deep Learning: Practical Neural Networks》

【下载】JAVA程序员深度学习实用指引《Deep Learning: Practical Neural Networks》

专知

12+阅读 · 2017年12月7日

深度学习目标检测概览

深度学习目标检测概览

AI研习社

46+阅读 · 2017年10月13日

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于海量软件片段比对的恶意代码检测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于网络活动分析的窃密木马检测技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

31+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

基于自学习对比度视觉注意模型和自适应深度特征的无分类目标检测

国家自然科学基金

2+阅读 · 2015年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

Deep-testing: the case of dependence detection

Arxiv

0+阅读 · 4月29日

DeepDetect: Learning All-in-One Dense Keypoints

Arxiv

0+阅读 · 4月20日

jMT: Testing Correctness of Java Memory Models (Extended Version)

Arxiv

0+阅读 · 4月17日

Zeroth-Order Optimization at the Edge of Stability

Arxiv

0+阅读 · 4月16日

Machine learning methods for finite population parameter estimation in survey sampling

Arxiv

0+阅读 · 4月1日

Dynamic Tokenization via Reinforcement Patching: End-to-end Training and Zero-shot Transfer

Arxiv

0+阅读 · 3月27日

Maximum Entropy Behavior Exploration for Sim2Real Zero-Shot Reinforcement Learning

Arxiv

0+阅读 · 3月26日

A Survey of Deep Learning for Low-Shot Object Detection

Arxiv

21+阅读 · 2021年12月6日

Deep learning: a statistical viewpoint

Arxiv

18+阅读 · 2021年3月16日

Deep Learning for Sentiment Analysis : A Survey

Arxiv

25+阅读 · 2018年1月24日

VIP会员

文章信息

相关主题

最新内容

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

4+阅读 · 今天8:00

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

2+阅读 · 今天7:44

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

2+阅读 · 今天7:28

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

3+阅读 · 今天7:18

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

专知会员服务

4+阅读 · 今天7:07

军事欺骗：供作战战术指挥官使用的工具

军事欺骗：供作战战术指挥官使用的工具

专知会员服务

3+阅读 · 今天7:03

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

4+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

5+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

10+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

4+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

5+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

8+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

7+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

4+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

相关VIP内容

零样本量化：综述

零样本量化：综述

专知会员服务

13+阅读 · 2025年5月15日

浙大《深度学习低样本目标检测》综述论文

浙大《深度学习低样本目标检测》综述论文

专知会员服务

76+阅读 · 2021年12月13日

深度学习中的单阶段小目标检测方法综述

深度学习中的单阶段小目标检测方法综述

专知会员服务

47+阅读 · 2021年11月23日

基于深度学习的小目标检测方法综述

专知会员服务

125+阅读 · 2021年4月29日

最新《深度学习视频异常检测》2020综述论文，21页pdf

最新《深度学习视频异常检测》2020综述论文，21页pdf

专知会员服务

86+阅读 · 2020年9月30日

零样本文本分类，Zero-Shot Learning for Text Classification

零样本文本分类，Zero-Shot Learning for Text Classification

专知会员服务

97+阅读 · 2020年5月31日

【自动化学报】零样本学习研究进展，中国石油大学

【自动化学报】零样本学习研究进展，中国石油大学

专知会员服务

88+阅读 · 2020年1月27日

【O’Reilly讲座】基于深度学习的异常检测方法用于检测大型数据集的质量：Anomaly detection using deep learning to measure the quality of large datasets

【O’Reilly讲座】基于深度学习的异常检测方法用于检测大型数据集的质量：Anomaly detection using deep learning to measure the quality of large datasets

专知会员服务

31+阅读 · 2020年1月11日

【目标检测 | 2019最新综述】基于深度学习的目标检测综述，附30页PDF， A Survey of Deep Learning-based Object Detection（From Fast R-CNN to NAS-FPN）

【目标检测 | 2019最新综述】基于深度学习的目标检测综述，附30页PDF， A Survey of Deep Learning-based Object Detection（From Fast R-CNN to NAS-FPN）

专知会员服务

56+阅读 · 2019年11月15日

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

专知会员服务

218+阅读 · 2019年10月18日

热门VIP内容

开通专知VIP会员享更多权益服务

重新思考无人机时代的生存能力

在人工智能加速决策环境中拓展OODA循环

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

装甲突击旅：现代战争思考、战斗与组织

相关资讯

零样本文本分类，Zero-Shot Learning for Text Classification

零样本文本分类，Zero-Shot Learning for Text Classification

专知

16+阅读 · 2020年5月31日

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

专知

137+阅读 · 2019年1月14日

Zero-Shot Learning相关资源大列表

Zero-Shot Learning相关资源大列表

专知

52+阅读 · 2019年1月1日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

从零开始深度学习：利用numpy手写一个感知机

从零开始深度学习：利用numpy手写一个感知机

数萃大数据

10+阅读 · 2018年6月10日

深度学习时代的目标检测算法

深度学习时代的目标检测算法

炼数成金订阅号

40+阅读 · 2018年3月19日

综述：深度学习时代的目标检测算法

综述：深度学习时代的目标检测算法

极市平台

27+阅读 · 2018年3月17日

资深算法工程师万宫玺：Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 分享总结

资深算法工程师万宫玺：Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 分享总结

AI研习社

11+阅读 · 2018年1月4日

【下载】JAVA程序员深度学习实用指引《Deep Learning: Practical Neural Networks》

【下载】JAVA程序员深度学习实用指引《Deep Learning: Practical Neural Networks》

专知

12+阅读 · 2017年12月7日

深度学习目标检测概览

深度学习目标检测概览

AI研习社

46+阅读 · 2017年10月13日

相关论文

Deep-testing: the case of dependence detection

Arxiv

0+阅读 · 4月29日

DeepDetect: Learning All-in-One Dense Keypoints

Arxiv

0+阅读 · 4月20日

jMT: Testing Correctness of Java Memory Models (Extended Version)

Arxiv

0+阅读 · 4月17日

Zeroth-Order Optimization at the Edge of Stability

Arxiv

0+阅读 · 4月16日

Machine learning methods for finite population parameter estimation in survey sampling

Arxiv

0+阅读 · 4月1日

Dynamic Tokenization via Reinforcement Patching: End-to-end Training and Zero-shot Transfer

Arxiv

0+阅读 · 3月27日

Maximum Entropy Behavior Exploration for Sim2Real Zero-Shot Reinforcement Learning

Arxiv

0+阅读 · 3月26日

A Survey of Deep Learning for Low-Shot Object Detection

Arxiv

21+阅读 · 2021年12月6日

Deep learning: a statistical viewpoint

Arxiv

18+阅读 · 2021年3月16日

Deep Learning for Sentiment Analysis : A Survey

Arxiv

25+阅读 · 2018年1月24日

相关基金

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于海量软件片段比对的恶意代码检测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于网络活动分析的窃密木马检测技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

31+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

基于自学习对比度视觉注意模型和自适应深度特征的无分类目标检测

国家自然科学基金

2+阅读 · 2015年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

语音识别中的稀疏性深度学习

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员