廊坊集团网站建设,沈阳自主建站模板,意识形态建设专题网站,音乐网站开发需求文档模板Datawhale干货 来源#xff1a;WhalePaper#xff0c;负责人#xff1a;芙蕖 WhalePaper简介 由Datawhale团队成员发起#xff0c;对目前学术论文中比较成熟的 Topic 和开源方案进行分享#xff0c;通过一起阅读、分享论文学习的方式帮助大家更好地“高效全面自律”学习WhalePaper负责人芙蕖 WhalePaper简介 由Datawhale团队成员发起对目前学术论文中比较成熟的 Topic 和开源方案进行分享通过一起阅读、分享论文学习的方式帮助大家更好地“高效全面自律”学习让大家都有所收获和提升方向包括自然语言处理NLP、计算机视觉CV、推荐Res等相关方向的论文解读和分享后续将融入更多的方向。 开源地址https://datawhalechina.github.io/whale-paper WhalePaper | Github 本期活动 分享时间2023年7月29日本六日 20:00 分享方向向量检索 分享工具#腾讯会议815-856-759 paper议程分享45分钟提问环节不限时。 分享大纲 向量检索算法介绍与最新进展向量数据库的算法与系统设计 嘉宾论文概况 嘉宾简介陈琪微软亚洲研究院系统研究组的首席研究员。她于2010年和2016年在北京大学获得计算机科学学士学位和博士学位在那里与导师肖臻教授一起从事分布式系统、云计算和并行计算的研究。2013年至2014年她作为访问学生在纽约大学的系统组中在李金扬教授的指导下从事分布式数组框架的研究。她在顶级会议和期刊上发表了20多篇论文其中一些论文获得了重要奖项如OSDI最佳论文奖和NeurIPS杰出论文奖。她目前的研究兴趣包括分布式系统、云计算和深度学习算法和框架。 专题题目Vector Search and Vector Database 专题简介近年来深度学习的最新进展使得各种类型的数据都能被映射为高维向量。目前最先进的向量搜索库主要关注如何在内存中进行快速高召回率的搜索。然而在极大规模的向量搜索场景中存在一些挑战。例如数百亿个向量与有限的内存结合在一起会导致容量问题。同时扩展性也是一个问题增加服务机器的数量会增加查询延迟和计算成本。此外高维向量索引不具备单调性而单调性是传统索引的一个关键属性。缺乏单调性使得现有的向量系统不得不依赖于保持单调性的临时索引用于目标向量的TopK最近邻以便实现近似相似性搜索和关系运算的复杂查询。这导致了性能的下降因为很难预测最优的K值。 在本次演讲中我们介绍了SPANN一个分布式基于磁盘的ANNS系统已经集成到Bing中可以实现数百亿规模的向量搜索并以毫秒级的响应时间。此外我们还介绍了VBASE一个向量数据库系统它能有效处理基于一种称为放松单调性的共同属性的复杂查询。这种方法将两个看似不兼容的系统统一起来提供了比现有最先进的向量系统高出三个数量级的性能。 参与方式 扫码加入WhalePaper群 若群满请在公众号后台回复“paper” WhalePaper负责人联系方式 芙蕖微信号MePhyllis 华挥微信号BuShouY