OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

FastEmbed-rs 🦀

Rust 向量嵌入生成与本地重排序库

特性

支持同步使用，无需依赖 Tokio。
使用 @pykeio/ort 进行高性能 ONNX 推理。
使用 @huggingface/tokenizers 实现快速编码。

需要其他语言版本？

Python: fastembed
Go: fastembed-go
JavaScript: fastembed-js

支持的模型

文本嵌入

BAAI/bge-small-en-v1.5 - 默认模型
BAAI/bge-base-en-v1.5
BAAI/bge-large-en-v1.5
BAAI/bge-small-zh-v1.5
BAAI/bge-large-zh-v1.5
BAAI/bge-m3
sentence-transformers/all-MiniLM-L6-v2
sentence-transformers/all-MiniLM-L12-v2
sentence-transformers/all-mpnet-base-v2
sentence-transformers/paraphrase-MiniLM-L12-v2
sentence-transformers/paraphrase-multilingual-mpnet-base-v2
nomic-ai/nomic-embed-text-v1
nomic-ai/nomic-embed-text-v1.5 - 与 nomic-embed-vision-v1.5 配对用于图像到文本搜索
intfloat/multilingual-e5-small
intfloat/multilingual-e5-base
intfloat/multilingual-e5-large
mixedbread-ai/mxbai-embed-large-v1
Alibaba-NLP/gte-base-en-v1.5
Alibaba-NLP/gte-large-en-v1.5
lightonai/ModernBERT-embed-large
Qdrant/clip-ViT-B-32-text - 与 clip-ViT-B-32-vision 配对用于图像到文本搜索
jinaai/jina-embeddings-v2-base-code
jinaai/jina-embeddings-v2-base-en
google/embeddinggemma-300m
nomic-ai/nomic-embed-text-v2-moe - 需要启用 nomic-v2-moe 特性（candle 后端）
Qwen/Qwen3-Embedding-0.6B - 需要启用 qwen3 特性（candle 后端）
Qwen/Qwen3-Embedding-4B - 需要启用 qwen3 特性（candle 后端）
Qwen/Qwen3-Embedding-8B - 需要启用 qwen3 特性（candle 后端）
Qwen/Qwen3-VL-Embedding-2B - 需要启用 qwen3 特性（candle 后端，通过 Qwen3VLEmbedding 支持多模态）
snowflake/snowflake-arctic-embed-xs
snowflake/snowflake-arctic-embed-s
snowflake/snowflake-arctic-embed-m
snowflake/snowflake-arctic-embed-m-long
snowflake/snowflake-arctic-embed-l

以上多个模型也提供量化版本（在模型枚举变体后追加 Q，例如 EmbeddingModel::BGESmallENV15Q）。

稀疏文本嵌入

prithivida/Splade_PP_en_v1 - 默认模型
BAAI/bge-m3

图像嵌入

重排序

✊ 支持

如需支持本库，请向我们的主要上游依赖 ort（ONNX 运行时的 Rust 封装）进行捐赠。

安装

在项目目录中运行：

cargo add fastembed

或在 Cargo.toml 中添加以下行：

[dependencies]
fastembed = "5"

使用示例

文本嵌入

use fastembed::{TextEmbedding, InitOptions, EmbeddingModel};

// 使用默认选项
let mut model = TextEmbedding::try_new(Default::default())?;

// 使用自定义选项
let mut model = TextEmbedding::try_new(
    InitOptions::new(EmbeddingModel::AllMiniLML6V2).with_show_download_progress(true),
)?;

let documents = vec![
    "passage: Hello, World!",
    "query: Hello, World!",
    "passage: This is an example passage.",
    // 可以省略前缀，但建议保留
    "fastembed-rs is licensed under Apache 2.0"
];

 // 使用默认批次大小 256 生成嵌入向量
 let embeddings = model.embed(documents, None)?;

 println!("Embeddings length: {}", embeddings.len()); // -> Embeddings length: 4
 println!("Embedding dimension: {}", embeddings[0].len()); // -> Embedding dimension: 384

Qwen3 嵌入

Qwen3 嵌入模型需启用 qwen3 特性标志（candle 后端）。

[dependencies]
fastembed = { version = "5", features = ["qwen3"] }

use candle_core::{DType, Device};
use fastembed::Qwen3TextEmbedding;

let device = Device::Cpu;
let model = Qwen3TextEmbedding::from_hf(
    "Qwen/Qwen3-Embedding-0.6B",
    &device,
    DType::F32,
    512,
)?;

// 使用 Qwen3-VL 嵌入检查点进行纯文本嵌入也受支持：
// let model = Qwen3TextEmbedding::from_hf("Qwen/Qwen3-VL-Embedding-2B", &device, DType::F32, 512)?;

let embeddings = model.embed(&["query: ...", "passage: ..."])?;
println!("Embeddings length: {}", embeddings.len());

使用 Qwen/Qwen3-VL-Embedding-2B 进行多模态文本/图像嵌入：

use candle_core::{DType, Device};
use fastembed::Qwen3VLEmbedding;

let device = Device::Cpu;
let model = Qwen3VLEmbedding::from_hf(
    "Qwen/Qwen3-VL-Embedding-2B",
    &device,
    DType::F32,
    2048,
)?;

let image_embeddings = model.embed_images(&["tests/assets/image_0.png", "tests/assets/image_1.png"])?;
let text_embeddings = model.embed_texts(&["query: blue cat", "query: red cat"])?;

println!("Image embeddings: {}", image_embeddings.len());
println!("Text embeddings: {}", text_embeddings.len());

Nomic Embed Text v2 MoE

nomic-embed-text-v2-moe 模型需启用 nomic-v2-moe 特性标志（candle 后端）。这是首个支持 100+ 语言的通用 MoE 嵌入模型。

[dependencies]
fastembed = { version = "5", features = ["nomic-v2-moe"] }

use candle_core::{DType, Device};
use fastembed::NomicV2MoeTextEmbedding;

let device = Device::Cpu;
let model = NomicV2MoeTextEmbedding::from_hf(
    "nomic-ai/nomic-embed-text-v2-moe",
    &device,
    DType::F32,
    512,
)?;

let embeddings = model.embed(&["search_query: ...", "search_document: ..."])?;
println!("Embeddings length: {}", embeddings.len());

稀疏文本嵌入

use fastembed::{SparseEmbedding, SparseInitOptions, SparseModel, SparseTextEmbedding};

// 使用默认选项
let mut model = SparseTextEmbedding::try_new(Default::default())?;

// 使用自定义选项
let mut model = SparseTextEmbedding::try_new(
    SparseInitOptions::new(SparseModel::SPLADEPPV1).with_show_download_progress(true),
)?;

let documents = vec![
    "passage: Hello, World!",
    "query: Hello, World!",
    "passage: This is an example passage.",
    "fastembed-rs is licensed under Apache 2.0"
];

// 使用默认批次大小 256 生成嵌入向量
let embeddings: Vec<SparseEmbedding> = model.embed(documents, None)?;

图像嵌入

use fastembed::{ImageEmbedding, ImageInitOptions, ImageEmbeddingModel};

// 使用默认选项
let mut model = ImageEmbedding::try_new(Default::default())?;

// 使用自定义选项
let mut model = ImageEmbedding::try_new(
    ImageInitOptions::new(ImageEmbeddingModel::ClipVitB32).with_show_download_progress(true),
)?;

let images = vec!["assets/image_0.png", "assets/image_1.png"];

// 使用默认批次大小 256 生成嵌入向量
let embeddings = model.embed(images, None)?;

println!("Embeddings length: {}", embeddings.len()); // -> Embeddings length: 2
println!("Embedding dimension: {}", embeddings[0].len()); // -> Embedding dimension: 512

候选重排序

use fastembed::{TextRerank, RerankInitOptions, RerankerModel};

// 使用默认选项
let mut model = TextRerank::try_new(Default::default())?;

// 使用自定义选项
let mut model = TextRerank::try_new(
    RerankInitOptions::new(RerankerModel::BGERerankerBase).with_show_download_progress(true),
)?;

let documents = vec![
    "hi",
    "The giant panda (Ailuropoda melanoleuca), sometimes called a panda bear, is a bear species endemic to China.",
    "panda is animal",
    "i dont know",
    "kind of mammal",
];

// 使用默认批次大小 256 进行重排序，并返回文档内容
let results = model.rerank("what is panda?", documents, true, None)?;
println!("Rerank result: {:?}", results);

此外，也可以通过相应结构体的 try_new_from_user_defined(...) 方法使用本地模型文件进行推理。

许可证

Apache 2.0

项目地址：https://github.com/Anush008/fastembed-rs

28 次点击 ∙ 0 人收藏

登录后收藏

0 条回复

FastEmbed-rs — 高性能嵌入模型推理的 Rust 实现

FastEmbed-rs 🦀

Rust 向量嵌入生成与本地重排序库

特性

需要其他语言版本？

支持的模型

文本嵌入

稀疏文本嵌入

图像嵌入

重排序

✊ 支持

安装

使用示例

文本嵌入

Qwen3 嵌入

Nomic Embed Text v2 MoE

稀疏文本嵌入

图像嵌入

候选重排序

许可证