infinity: 一个 AI Native 的数据库

目录

github 链接

关于 infinity

Infinity is a cutting-edge AI-native database that provides a wide range of search capabilities for rich data types such as vectors, full-text, and structured data. It provides robust support for various LLM applications, including search, recommenders, question-answering, conversational AI, copilot, content generation, and many more RAG (Retrieval-augmented Generation) applications.

最厉害的一个 feature:

  • Achieves 0.1 milliseconds query latency on million-scale vector datasets.
  • Up to 10K QPS on million-scale vector datasets.

以下是使用 chargpt4 翻译项目中faq 文档的结果:

什么是检索增强生成?

检索增强生成(Retrieval Augmented Generation,简称RAG)是一种用于提高基础模型,特别是大型语言模型(LLMs)响应的准确性和可靠性的技术。它通过用外部知识源补充现有的LLMs来实现。

使用RAG的好处包括提高响应质量和相关性、获取最新和最可靠的事实,以及验证模型的响应。它减少了持续培训和更新LLM的需求,从而降低了成本。RAG依赖于使用向量,这是数据的数学表示,来丰富提示与相关外部信息。

RAG使得从各种来源检索外部数据成为可能,包括文档仓库、数据库和API。然后将这些数据转换成兼容格式以便进行相关性搜索。检索到的信息被添加到原始用户提示中,使LLM能够基于更相关或最新的知识提供响应。

如何定义融合搜索?它与混合搜索有何不同?

混合搜索结合了文本和语义(向量)查询,以找到更准确和相关的结果。这种技术结合了多种搜索算法,如关键字搜索、自然语言搜索和语义搜索,以提高搜索结果的准确性。

混合搜索结合了多种搜索策略,而融合搜索则更进一步,接管了之前由上层应用管理的决策过程。它合并了获得的结果,并自行返回结果。

什么是AI原生数据库?它只是向量数据库的换言之词吗?

AI原生数据库专门设计用于解决检索增强生成(RAG)的挑战,RAG目前是提高基础模型生成响应的准确性和相关性的行业标准。

除了基本的向量搜索之外,AI向量数据库还提供了更全面的文本搜索、多向量检索、混合数据类型查询、精细数据分析和融合搜索等高级功能。

重点:

使用 C++20 标准,对于想找 基于 Modern cpp 项目学习的小伙伴可以参与下。


参考链接

打赏作者