Havenask开源搜索引擎

阿里巴巴自研开源搜索引擎 — Havenask

Havenask是是阿里巴巴内部广泛使用的大规模分布式检索系统，支持了包括淘宝、天猫、菜鸟、高德、饿了么、全球化在内整个阿里巴巴集团的搜索业务，为用户提供高性能、低成本、易用的搜索服务。同时具有灵活的定制和开发能力，支持算法快速迭代，帮助客户和开发者量身定做适合自身业务的智能搜索服务，助力业务增长。

【Github地址】 https://github.com/alibaba/havenask

极致的工程性能

支持千亿级数据实时检索，百万QPS查询，百万TPS写入，毫秒级查询延迟与秒级数据更新。

C++的底层构建

对性能、内存、稳定性有更高保障。

SQL查询支持

支持SQL语法便捷查询，查询体验更友好。

丰富的插件机制

支持各类业务插件，拓展性强。

支持图化开发

实现算法分钟级快速迭代，定制能力丰富，在新一代智能检索场景下的支持效果优秀。

支持向量检索

可通过与插件配合实现多模态搜索，满足更多场景的搜索服务搭建需求。

极致的工程性能

C++的底层构建

SQL查询支持

丰富的插件机制

支持图化开发

支持向量检索

我们的优势

Havenask 是阿里巴巴自主研发的大规模分布式搜索引擎，其核心能力广泛应用于阿里巴巴和蚂蚁集团内众多业务，如淘宝搜索和推荐、蚂蚁人脸支付、优酷视频搜索、阿里妈妈广告检索等。

内置功能完备、性能优异的向量检索能力

个位数毫秒级查询性能，同时有更高的稳定性保障

支持单应用实例千亿+级别数据，大数据检索场景有较大优势

百万+TPS高时效性写入保障，单元化容灾

演进历程

Havenask在阿里集团内部有着10多年的发展历史，通过性能和稳定性的成绩在集团内遍地开花，丰富的定制化能力，支撑了集团内所有核心的搜索业务场景，累积了很多针对搜索场景的功能及性能优化经验。 1、1999年~2008年起源于雅虎搜索技术（YST、Vespa）的单机版搜索引擎，支持淘宝、B2B等子公司搜索业务。 2、2009年~2011年完成自研搜索引擎HA3（Havenask）研发，开启自研大规模分布式高性能搜索引擎时代。 3、2013年Havenask支持阿里巴巴集团几乎所有搜索业务，统一代码分支，以产品化方式规模化支持集团大量搜索业务。 4、2018年深度学习技术广泛应用，Havenask继续演进，除了提供传统的倒排索引能力外，还提供KV、KKV、向量索引，支持深度模型和在线预测，提供插件定制、自研CAVA语言支持业务扩展等能力，成为阿里搜推广场景的核心AI智能引擎。