zvec 浅尝
阿里新开源了 zvec,开个小仓库浅浅试一下。 这篇就是折腾记录,不作为任何指南、是为了给未来如果做 LLM桌面应用时,多一个 vector DB 的选择。 GitHub - alibaba/zvec GitHub - Coco422/zvec-try 怎么测的 目标很简单:先把“建库 -> 入库 -> 向量查询 -> 命中评估”这条链路跑通。 我在 zvec-try 里做了这几件事: 用 datasets/*.json 配 4 组中英混合语料 每条 query 写 expected_doc_ids,按 top-k 命中做 PASS/FAIL embedding 走第三方 API(SiliconFlow / 阿里云/自部署) 每个语料单独创建一个本地 zvec collection,方便重复跑 配环境 我还是用 uv。 1 2 uv sync cp .env.example .env .env 里填这几个值就能跑: 1 2 3 AI_BASE_URL=https://api.siliconflow.cn AI_API_KEY=sk-xxx EMBEDDING_MODEL_NAME=Qwen/Qwen3-Embedding-0.6B 代码里对 endpoint 处理了一下: 如果你已经写到 /v1,会自动补成 /v1/embeddings 如果你直接写域名,也会自动拼接 embeddings 路径 数据格式 每个语料是一个 JSON,结构大概这样: ...