用于大规模管理矢量数据库的通用 UI 和工具套件。
快的!您能准确告诉我您的 Pinecone 或 Chroma 矢量数据库中嵌入了哪些信息吗?我打赌你不能。虽然这些团队专注于构建底层架构,但我们让您可以更轻松地管理矢量数据,而无需遇到麻烦和 API 调用。
我们称之为VectorAdmin,我们希望成为矢量数据库管理的最佳通用 GUI。
VectorAdmin 的目标是成为一个全栈应用程序,让您完全控制通过 API 或使用 LangChain 等工具嵌入的原本笨重的矢量数据,这些数据并不表明您希望将其保存到数据库中。
VectorAdmin 是一款功能齐全的多用户产品,您可以通过 Docker 在本地运行,也可以远程托管并同时管理多个矢量数据库。
VectorAdmin 不仅仅是一个工具。 VectorAdmin 是一套工具,可以轻松地与矢量化文本交互和理解矢量化文本,而不会影响您期望从传统数据库管理系统获得的控件。
VectorAdmin 的一些很酷的功能
- 多用户实例支持和监督
- 以原子方式查看、更新和删除嵌入的单个文本块。
- 复制整个文档甚至整个命名空间和嵌入,无需付费重新嵌入。
- 将新文档直接上传并嵌入到矢量数据库中。
- 将整个现有矢量数据库迁移到另一种类型或实例。仍在进行中
- 一次管理多个并发矢量数据库。
- 权限数据和数据访问
- 100% 云部署就绪。
- 作为命名空间或集合运行的自动回归测试会使用新文档进行更新,以确保响应质量。仍在进行中
- 完整的 API、Javascript 和 Python 独立客户端和 LangChain 集成。仍在进行中
- 用于管理非常大的文档的极其有效的成本节约措施。您永远不需要支付多次嵌入大量文档或成绩单的费用。
这个 monorepo 包含三个主要部分:
document-processor
:Flask 应用程序可轻松消化、解析和嵌入文档。frontend
:一个 viteJS + React 前端,您可以运行它来轻松创建和管理所有内容。backend
:一个 NodeJS + Express 服务器来处理所有交互并进行所有 VectorDB 管理。workers
:InngestJS 实例,用于处理长时间运行的进程后台任务以实现快速性能。docker
:建议使用单个命令作为 docker 实例运行整个架构。
yarn
在node
你的机器上python
3.9+ 用于在document-processor/
.- 如果计划更新嵌入或上传新文档,则可以访问 OpenAI API 密钥。
- Pinecone.io免费帐户或正在运行的ChromaDB实例。
以下说明不适用于 Windows。
yarn dev:setup
从项目根目录。cd document-processor && python3.9 -m virtual-env v-env && source v-env/bin/activate && pip install -r requirements.txt
在与项目根目录不同的终端窗口中:
yarn prisma:setup
创建数据库迁移和客户端,然后运行yarn dev:server
yarn dev:frontend
yarn dev:workers
cd document-processor && flask run --host '0.0.0.0' --port 8888
首次启动和访问主页时,您将被自动重定向以创建主管理员帐户、组织和数据库连接。
- 创建问题
- 创建 PR,分支名称格式为
<issue number>-<short name>
- 是啊,让我们合并吧
Mintplex Labs Inc 的 VectorAdmin 包含收集匿名使用信息的遥测功能。
我们使用这些信息来帮助我们了解 VectorAdmin 的使用方式,帮助我们确定新功能和错误修复工作的优先顺序,并帮助我们提高 VectorAdmin 的性能和稳定性。
将DISABLE_TELEMETRY
服务器或 docker .env 设置设置为“true”以选择退出遥测。
DISABLE_TELEMETRY="true"
我们只会跟踪有助于我们做出产品和路线图决策的使用详细信息,特别是:
- 服务器已启动或启动。
- 您的安装版本。
- 执行时的作业类型。
您可以通过查找所有被Telemetry.sendTelemetry
调用的位置来验证这些声明。此外,这些事件会写入输出日志,因此您还可以查看发送的特定数据(如果启用)。不会收集 IP 或其他识别信息。遥测提供者是PostHog - 一个开源遥测收集服务。