infinity: 一个 AI Native 的数据库

关于 infinity

Infinity is a cutting-edge AI-native database that provides a wide range of search capabilities for rich data types such as vectors, full-text, and structured data. It provides robust support for various LLM applications, including search, recommenders, question-answering, conversational AI, copilot, content generation, and many more RAG (Retrieval-augmented Generation) applications.

最厉害的一个 feature：

Achieves 0.1 milliseconds query latency on million-scale vector datasets.
Up to 10K QPS on million-scale vector datasets.

以下是使用 chargpt4 翻译项目中faq 文档的结果：

什么是检索增强生成？

检索增强生成（Retrieval Augmented Generation，简称RAG）是一种用于提高基础模型，特别是大型语言模型（LLMs）响应的准确性和可靠性的技术。它通过用外部知识源补充现有的LLMs来实现。

使用RAG的好处包括提高响应质量和相关性、获取最新和最可靠的事实，以及验证模型的响应。它减少了持续培训和更新LLM的需求，从而降低了成本。RAG依赖于使用向量，这是数据的数学表示，来丰富提示与相关外部信息。

RAG使得从各种来源检索外部数据成为可能，包括文档仓库、数据库和API。然后将这些数据转换成兼容格式以便进行相关性搜索。检索到的信息被添加到原始用户提示中，使LLM能够基于更相关或最新的知识提供响应。

如何定义融合搜索？它与混合搜索有何不同？

混合搜索结合了文本和语义（向量）查询，以找到更准确和相关的结果。这种技术结合了多种搜索算法，如关键字搜索、自然语言搜索和语义搜索，以提高搜索结果的准确性。

混合搜索结合了多种搜索策略，而融合搜索则更进一步，接管了之前由上层应用管理的决策过程。它合并了获得的结果，并自行返回结果。

什么是AI原生数据库？它只是向量数据库的换言之词吗？

AI原生数据库专门设计用于解决检索增强生成（RAG）的挑战，RAG目前是提高基础模型生成响应的准确性和相关性的行业标准。

除了基本的向量搜索之外，AI向量数据库还提供了更全面的文本搜索、多向量检索、混合数据类型查询、精细数据分析和融合搜索等高级功能。

重点：

使用 C++20 标准，对于想找基于 Modern cpp 项目学习的小伙伴可以参与下。

参考链接

打赏作者