搜索引擎已经成为各种web和移动应用程序的基本组件。从海量数据集中检索相关文档对于搜索引擎系统来说是一项挑战,尤其是在遇到冗长或尾部查询时。在本文中,我们探索了一个向量空间搜索框架的文档检索。具体地说,我们训练了一个深度语义匹配模型,使每个查询和文档都可以编码为低维嵌入。我们的模型是基于BERT架构进行训练的。我们为在线服务部署了一个快速的k-近邻索引服务。离线和在线指标都表明,我们的方法大大提高了检索性能和搜索质量,特别是尾部查询。

https://www.zhuanzhi.ai/paper/98c122f66125ade0ad73761f23bab2f4

成为VIP会员查看完整内容
22

相关内容

【ECCV2020-华为】车道线架构搜索框架
专知会员服务
23+阅读 · 2020年9月23日
【ICML2020】统一预训练伪掩码语言模型
专知会员服务
27+阅读 · 2020年7月23日
【ICML2020-浙江大学】对抗性互信息的文本生成
专知会员服务
44+阅读 · 2020年7月4日
【SIGMOD2020-腾讯】Web规模本体可扩展构建
专知会员服务
32+阅读 · 2020年4月12日
Query 理解和语义召回在知乎搜索中的应用
DataFunTalk
25+阅读 · 2020年1月2日
最新论文解读 | 基于预训练自然语言生成的文本摘要方法
微软研究院AI头条
57+阅读 · 2019年3月19日
赛尔原创 | 基于文本蕴含识别的答案验证技术研究
哈工大SCIR
9+阅读 · 2018年11月19日
干货 | 谷歌 AI:语义文本相似度研究进展
AI科技评论
24+阅读 · 2018年6月12日
【智能商务】海量商品查找利器—苏宁搜索系统
产业智能官
5+阅读 · 2017年12月1日
业界 | 谷歌发布自然语言框架语义解析器SLING
机器之心
3+阅读 · 2017年11月16日
Efficiently Embedding Dynamic Knowledge Graphs
Arxiv
14+阅读 · 2019年10月15日
Arxiv
4+阅读 · 2019年2月18日
Arxiv
5+阅读 · 2018年5月1日
VIP会员
最新内容
最新“指挥控制”领域出版物合集(简介)
专知会员服务
1+阅读 · 今天15:19
面向军事作战需求开发的人工智能(RAIMOND)
专知会员服务
3+阅读 · 今天15:13
软件定义多域战术网络:基础与未来方向(综述)
水下战战术决策中的气象与海洋预报(50页报告)
远程空中优势:新一代超视距导弹的兴起
专知会员服务
1+阅读 · 今天14:45
大语言模型溯因推理的统一分类学与综述
专知会员服务
0+阅读 · 今天12:07
微信扫码咨询专知VIP会员