Processing-in-memory for genomics workloads - 专知论文

会员服务 ·

0

组学 · 内存 · 负载 · 高能效 · 能效 ·

Processing-in-memory for genomics workloads

翻译：基于内存内处理的基因组学工作负载处理

William Andrew Simon,Leonid Yavits,Konstantina Koliogeorgi,Yann Falevoz,Yoshihiro Shibuya,Dominique Lavenier,Irem Boybat,Klea Zambaku,Berkan Şahin,Mohammad Sadrosadati,Onur Mutlu,Abu Sebastian,Rayan Chikhi,The BioPIM Consortium,Can Alkan

Low-cost, high-throughput DNA and RNA sequencing (HTS) data is the backbone of the life sciences. Genome sequencing is now becoming a part of Predictive, Preventive, Personalized, and Participatory (termed 'P4') medicine. All genomic data are currently processed in energy-hungry computer clusters and centers, necessitating data transfer, consuming substantial energy, and wasting valuable time. Therefore, there is a need for fast, energy-efficient, and cost-efficient technologies that enable genomics research without requiring data centers and cloud platforms. We recently launched the BioPIM Project to leverage emerging processing-in-memory (PIM) technologies to enable energy- and cost-efficient analysis of bioinformatics workloads. The BioPIM Project focuses on co-designing algorithms and data structures commonly used in genomics with several PIM architectures to achieve the highest cost, energy, and time savings.

翻译：低成本、高通量的DNA与RNA测序（HTS）数据是生命科学研究的基石。基因组测序正逐渐成为预测性、预防性、个性化及参与性（统称为“P4”）医学的组成部分。目前，所有基因组数据均在能耗巨大的计算机集群和中心进行处理，这既需要数据传输，又消耗大量能源，并浪费宝贵时间。因此，亟需开发快速、高能效且低成本的技术，以实现在无需依赖数据中心和云平台的情况下开展基因组学研究。我们近期启动了BioPIM项目，旨在利用新兴的内存内处理（PIM）技术，实现对生物信息学工作负载的高能效与低成本分析。BioPIM项目聚焦于将基因组学中常用的算法和数据结构与多种PIM架构进行协同设计，以实现最大程度的成本、能源与时间节约。

0

相关内容

【博士论文】通过新算法与技术实现快速、准确、高效的实时基因组分析

【博士论文】通过新算法与技术实现快速、准确、高效的实时基因组分析

专知会员服务

11+阅读 · 2025年3月13日

深度学习在人类基因组学中的应用：下一代测序数据的综述

深度学习在人类基因组学中的应用：下一代测序数据的综述

专知会员服务

17+阅读 · 2023年9月2日

【干货书】计算基因组学，463页pdf

【干货书】计算基因组学，463页pdf

专知会员服务

48+阅读 · 2022年12月30日

【2022新书】深度学习基因组学:生命科学和生物技术中基因组学应用的数据驱动方法

【2022新书】深度学习基因组学:生命科学和生物技术中基因组学应用的数据驱动方法

专知会员服务

74+阅读 · 2022年11月22日

《蛋白质组学数据的深度学习》207页博士论文，英国女王大学

《蛋白质组学数据的深度学习》207页博士论文，英国女王大学

专知会员服务

17+阅读 · 2022年5月11日

【MIT-Krismer Konstantin博士论文】基于功能基因组学的深度学习原理方法与模型，Principled Methods and Models for Deep Learning Based Functional Genomics

【MIT-Krismer Konstantin博士论文】基于功能基因组学的深度学习原理方法与模型，Principled Methods and Models for Deep Learning Based Functional Genomics

专知会员服务

10+阅读 · 2022年4月6日

基因组数据隐私保护理论与方法综述

专知会员服务

16+阅读 · 2021年8月6日

最新《数据科学：全面综述论文》42页pdf，Data Science: A Comprehensive Overview

最新《数据科学：全面综述论文》42页pdf，Data Science: A Comprehensive Overview

专知会员服务

319+阅读 · 2020年7月9日

【论文强烈推荐】基于卷积神经网络的基因组序列基序的表示学习，Representation learning of genomic sequence motifs with convolutional neural networks

【论文强烈推荐】基于卷积神经网络的基因组序列基序的表示学习，Representation learning of genomic sequence motifs with convolutional neural networks

专知会员服务

12+阅读 · 2019年12月21日

【图机器学习论文】基于深度学习的网络生物学（Deep Learning for Network Biology）

【图机器学习论文】基于深度学习的网络生物学（Deep Learning for Network Biology）

专知会员服务

11+阅读 · 2019年12月16日

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

专知

14+阅读 · 2023年4月6日

【2022新书】生命科学的数据分析，511页pdf

【2022新书】生命科学的数据分析，511页pdf

专知

14+阅读 · 2022年11月15日

AAAI21最佳论文Informer：效果远超Transformer的长序列预测神器！

AAAI21最佳论文Informer：效果远超Transformer的长序列预测神器！

AINLP

10+阅读 · 2021年2月6日

KAUST高欣组研发基于深度学习的研究RNA和RBP相互作用的全新方法｜Nat. Commun.

KAUST高欣组研发基于深度学习的研究RNA和RBP相互作用的全新方法｜Nat. Commun.

科研圈

17+阅读 · 2019年10月30日

Jeff Dean等发文《Nature Medicine》，综述深度学习在医疗领域的应用

Jeff Dean等发文《Nature Medicine》，综述深度学习在医疗领域的应用

机器之心

13+阅读 · 2019年1月13日

代谢组学数据分析及多元统计分析与应用培训（11.17-18）

代谢组学数据分析及多元统计分析与应用培训（11.17-18）

外泌体之家

11+阅读 · 2018年10月22日

自然语言处理（NLP）数据集整理

自然语言处理（NLP）数据集整理

论智

20+阅读 · 2018年4月8日

【论文推荐】最新六篇序列推荐相关论文—卷积序列嵌入学习、用户记忆网络、上下文GRU、迁移学习

【论文推荐】最新六篇序列推荐相关论文—卷积序列嵌入学习、用户记忆网络、上下文GRU、迁移学习

专知

10+阅读 · 2018年4月8日

【前沿】自动从CT医疗影像中生成诊断报告，卡内基梅隆大学CMU邢波教授团队最新基于深度学习的医疗影像研究成果

【前沿】自动从CT医疗影像中生成诊断报告，卡内基梅隆大学CMU邢波教授团队最新基于深度学习的医疗影像研究成果

专知

18+阅读 · 2017年11月24日

TextInfoExp:自然语言处理相关实验（基于sougou数据集）

TextInfoExp:自然语言处理相关实验（基于sougou数据集）

全球人工智能

12+阅读 · 2017年11月12日

基于深度学习与超CpG分割的人类全基因组差异甲基化研究

国家自然科学基金

0+阅读 · 2015年12月31日

可扩展的蛋白质组学大数据存储与分析模型研究

国家自然科学基金

1+阅读 · 2015年12月31日

高通量测序的可计算建模与应用基础算法

国家自然科学基金

1+阅读 · 2015年12月31日

基于表面等离子激元理论和方法的DNA计算生物芯片杂交信号研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于下一代测序技术的重复基因结构及拷贝数目变异与癌症关联性研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

蒙古高原反刍家畜基因序列比对分析云计算平台研究及变异关联数据库的构建

国家自然科学基金

0+阅读 · 2014年12月31日

面向基因组相关性研究的迁移学习理论与方法

国家自然科学基金

0+阅读 · 2014年12月31日

面向进化基因组学的高通量测序数据流形建模

国家自然科学基金

1+阅读 · 2014年12月31日

与肿瘤相关的DNA甲基化和组蛋白修饰数据的分析与研究

国家自然科学基金

1+阅读 · 2014年12月31日

DNA-MGC+: A versatile codec for reliable and resource-efficient data storage on synthetic DNA

Arxiv

0+阅读 · 3月15日

SNPgen: Phenotype-Supervised Genotype Representation and Synthetic Data Generation via Latent Diffusion

Arxiv

0+阅读 · 3月11日

Mitigating the Memory Bottleneck with Machine Learning-Driven and Data-Aware Microarchitectural Techniques

Arxiv

0+阅读 · 3月8日

Adaptive Sampling for Storage of Progressive Images on DNA

Arxiv

0+阅读 · 3月5日

ReSearch: A Multi-Stage Machine Learning Framework for Earth Science Data Discovery

Arxiv

0+阅读 · 3月2日

Characterizing Production GPU Workloads using System-wide Telemetry Data

Arxiv

0+阅读 · 2月24日

Benchmarking AI Performance on End-to-End Data Science Projects

Arxiv

0+阅读 · 2月15日

Towards Spatial Transcriptomics-driven Pathology Foundation Models

Arxiv

0+阅读 · 2月15日

SciDataCopilot: An Agentic Data Preparation Framework for AGI-driven Scientific Discovery

Arxiv

0+阅读 · 2月9日

STProtein: predicting spatial protein expression from multi-omics data

Arxiv

0+阅读 · 2月5日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

3+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

4+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

5+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

4+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

4+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

4+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

8+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

21+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

【博士论文】通过新算法与技术实现快速、准确、高效的实时基因组分析

【博士论文】通过新算法与技术实现快速、准确、高效的实时基因组分析

专知会员服务

11+阅读 · 2025年3月13日

深度学习在人类基因组学中的应用：下一代测序数据的综述

深度学习在人类基因组学中的应用：下一代测序数据的综述

专知会员服务

17+阅读 · 2023年9月2日

【干货书】计算基因组学，463页pdf

【干货书】计算基因组学，463页pdf

专知会员服务

48+阅读 · 2022年12月30日

【2022新书】深度学习基因组学:生命科学和生物技术中基因组学应用的数据驱动方法

【2022新书】深度学习基因组学:生命科学和生物技术中基因组学应用的数据驱动方法

专知会员服务

74+阅读 · 2022年11月22日

《蛋白质组学数据的深度学习》207页博士论文，英国女王大学

《蛋白质组学数据的深度学习》207页博士论文，英国女王大学

专知会员服务

17+阅读 · 2022年5月11日

【MIT-Krismer Konstantin博士论文】基于功能基因组学的深度学习原理方法与模型，Principled Methods and Models for Deep Learning Based Functional Genomics

【MIT-Krismer Konstantin博士论文】基于功能基因组学的深度学习原理方法与模型，Principled Methods and Models for Deep Learning Based Functional Genomics

专知会员服务

10+阅读 · 2022年4月6日

基因组数据隐私保护理论与方法综述

专知会员服务

16+阅读 · 2021年8月6日

最新《数据科学：全面综述论文》42页pdf，Data Science: A Comprehensive Overview

最新《数据科学：全面综述论文》42页pdf，Data Science: A Comprehensive Overview

专知会员服务

319+阅读 · 2020年7月9日

【论文强烈推荐】基于卷积神经网络的基因组序列基序的表示学习，Representation learning of genomic sequence motifs with convolutional neural networks

【论文强烈推荐】基于卷积神经网络的基因组序列基序的表示学习，Representation learning of genomic sequence motifs with convolutional neural networks

专知会员服务

12+阅读 · 2019年12月21日

【图机器学习论文】基于深度学习的网络生物学（Deep Learning for Network Biology）

【图机器学习论文】基于深度学习的网络生物学（Deep Learning for Network Biology）

专知会员服务

11+阅读 · 2019年12月16日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

专知

14+阅读 · 2023年4月6日

【2022新书】生命科学的数据分析，511页pdf

【2022新书】生命科学的数据分析，511页pdf

专知

14+阅读 · 2022年11月15日

AAAI21最佳论文Informer：效果远超Transformer的长序列预测神器！

AAAI21最佳论文Informer：效果远超Transformer的长序列预测神器！

AINLP

10+阅读 · 2021年2月6日

KAUST高欣组研发基于深度学习的研究RNA和RBP相互作用的全新方法｜Nat. Commun.

KAUST高欣组研发基于深度学习的研究RNA和RBP相互作用的全新方法｜Nat. Commun.

科研圈

17+阅读 · 2019年10月30日

Jeff Dean等发文《Nature Medicine》，综述深度学习在医疗领域的应用

Jeff Dean等发文《Nature Medicine》，综述深度学习在医疗领域的应用

机器之心

13+阅读 · 2019年1月13日

代谢组学数据分析及多元统计分析与应用培训（11.17-18）

代谢组学数据分析及多元统计分析与应用培训（11.17-18）

外泌体之家

11+阅读 · 2018年10月22日

自然语言处理（NLP）数据集整理

自然语言处理（NLP）数据集整理

论智

20+阅读 · 2018年4月8日

【论文推荐】最新六篇序列推荐相关论文—卷积序列嵌入学习、用户记忆网络、上下文GRU、迁移学习

【论文推荐】最新六篇序列推荐相关论文—卷积序列嵌入学习、用户记忆网络、上下文GRU、迁移学习

专知

10+阅读 · 2018年4月8日

【前沿】自动从CT医疗影像中生成诊断报告，卡内基梅隆大学CMU邢波教授团队最新基于深度学习的医疗影像研究成果

【前沿】自动从CT医疗影像中生成诊断报告，卡内基梅隆大学CMU邢波教授团队最新基于深度学习的医疗影像研究成果

专知

18+阅读 · 2017年11月24日

TextInfoExp:自然语言处理相关实验（基于sougou数据集）

TextInfoExp:自然语言处理相关实验（基于sougou数据集）

全球人工智能

12+阅读 · 2017年11月12日

相关论文

DNA-MGC+: A versatile codec for reliable and resource-efficient data storage on synthetic DNA

Arxiv

0+阅读 · 3月15日

SNPgen: Phenotype-Supervised Genotype Representation and Synthetic Data Generation via Latent Diffusion

Arxiv

0+阅读 · 3月11日

Mitigating the Memory Bottleneck with Machine Learning-Driven and Data-Aware Microarchitectural Techniques

Arxiv

0+阅读 · 3月8日

Adaptive Sampling for Storage of Progressive Images on DNA

Arxiv

0+阅读 · 3月5日

ReSearch: A Multi-Stage Machine Learning Framework for Earth Science Data Discovery

Arxiv

0+阅读 · 3月2日

Characterizing Production GPU Workloads using System-wide Telemetry Data

Arxiv

0+阅读 · 2月24日

Benchmarking AI Performance on End-to-End Data Science Projects

Arxiv

0+阅读 · 2月15日

Towards Spatial Transcriptomics-driven Pathology Foundation Models

Arxiv

0+阅读 · 2月15日

SciDataCopilot: An Agentic Data Preparation Framework for AGI-driven Scientific Discovery

Arxiv

0+阅读 · 2月9日

STProtein: predicting spatial protein expression from multi-omics data

Arxiv

0+阅读 · 2月5日

相关基金

基于深度学习与超CpG分割的人类全基因组差异甲基化研究

国家自然科学基金

0+阅读 · 2015年12月31日

可扩展的蛋白质组学大数据存储与分析模型研究

国家自然科学基金

1+阅读 · 2015年12月31日

高通量测序的可计算建模与应用基础算法

国家自然科学基金

1+阅读 · 2015年12月31日

基于表面等离子激元理论和方法的DNA计算生物芯片杂交信号研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于下一代测序技术的重复基因结构及拷贝数目变异与癌症关联性研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于云计算平台的下一代测序数据错误修正算法研究与实现

国家自然科学基金

2+阅读 · 2015年12月31日

蒙古高原反刍家畜基因序列比对分析云计算平台研究及变异关联数据库的构建

国家自然科学基金

0+阅读 · 2014年12月31日

面向基因组相关性研究的迁移学习理论与方法

国家自然科学基金

0+阅读 · 2014年12月31日

面向进化基因组学的高通量测序数据流形建模

国家自然科学基金

1+阅读 · 2014年12月31日

与肿瘤相关的DNA甲基化和组蛋白修饰数据的分析与研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员