These are the lecture notes for the course CM0622 - Algorithms for Massive Data, Ca' Foscari University of Venice. The goal of this course is to introduce algorithmic techniques for dealing with massive data: data so large that it does not fit in the computer's memory. There are two main solutions to deal with massive data: (lossless) compressed data structures and (lossy) data sketches. These notes cover both topics: compressed suffix arrays, probabilistic filters, sketching under various metrics, Locality Sensitive Hashing, nearest neighbour search, algorithms on streams.


翻译:本文档为威尼斯卡福斯卡里大学CM0622课程《海量数据算法》的讲义。本课程旨在介绍处理海量数据的算法技术:即数据规模过大,无法完全载入计算机内存的情形。处理海量数据主要有两种解决方案:(无损)压缩数据结构与(有损)数据草图。本讲义涵盖以下主题:压缩后缀数组、概率过滤器、多种度量下的草图技术、局部敏感哈希、最近邻搜索以及流数据算法。

0
下载
关闭预览

相关内容

【干货书】高性能大数据计算,275页pdf
专知会员服务
81+阅读 · 2023年1月3日
【干货书】算法,Algorithms,314页pdf
专知会员服务
84+阅读 · 2022年8月20日
【Manning新书】大规模数据结构和算法,306页pdf
专知会员服务
142+阅读 · 2022年5月30日
最新《高级算法》Advanced Algorithms,176页pdf
专知会员服务
92+阅读 · 2020年10月22日
【电子书】大数据挖掘,Mining of Massive Datasets,附513页PDF
专知会员服务
105+阅读 · 2020年3月22日
【Manning新书】高级算法与数据结构,769页pdf
《AI 算法手册》目录 | 机器学习知识点系统性梳理!
数说工作室
23+阅读 · 2019年5月28日
286页PDF教你如何搞明白深度学习的算法、理论与计算系统!(可下载)
机器学习算法与Python学习
13+阅读 · 2018年8月6日
国家自然科学基金
16+阅读 · 2017年12月31日
国家自然科学基金
9+阅读 · 2017年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
25+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Arxiv
17+阅读 · 2023年12月4日
Arxiv
95+阅读 · 2022年8月2日
VIP会员
最新内容
BES:让语言模型通过双向进化搜索自我改进
专知会员服务
3+阅读 · 5月30日
以色列-美国-伊朗战争中的无人机:关键要点
专知会员服务
4+阅读 · 5月30日
《Palantir任务保障性软件安全标准(MA-S2)》
专知会员服务
10+阅读 · 5月30日
基于声学的无人机检测技术综述
专知会员服务
7+阅读 · 5月30日
《当代混合战争分析框架:俄乌战争经验教训》
战略前沿人工智能的再思考(中文)
专知会员服务
8+阅读 · 5月29日
《量化地基防空系统间接效应的博弈论方法》
专知会员服务
6+阅读 · 5月29日
相关VIP内容
【干货书】高性能大数据计算,275页pdf
专知会员服务
81+阅读 · 2023年1月3日
【干货书】算法,Algorithms,314页pdf
专知会员服务
84+阅读 · 2022年8月20日
【Manning新书】大规模数据结构和算法,306页pdf
专知会员服务
142+阅读 · 2022年5月30日
最新《高级算法》Advanced Algorithms,176页pdf
专知会员服务
92+阅读 · 2020年10月22日
【电子书】大数据挖掘,Mining of Massive Datasets,附513页PDF
专知会员服务
105+阅读 · 2020年3月22日
相关基金
国家自然科学基金
16+阅读 · 2017年12月31日
国家自然科学基金
9+阅读 · 2017年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
25+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员