Une base de données vectorielle (vector database, vector store) est un moteur de stockage spécialisé dans la recherche par similarité de vecteurs (embeddings). Là où Postgres ou MongoDB cherchent par valeur exacte, une base vectorielle répond à “trouve-moi les 5 documents les plus proches sémantiquement de cette requête”. C’est le moteur de recherche d’un RAG.
En pratique
Vous indexez 50 000 documents internes : chaque document est découpé en passages de 500 à 1 000 tokens, chaque passage est converti en embedding, puis stocké avec son texte dans la base. À la requête, l’embedding de la question est calculé, la base retourne en quelques millisecondes les K plus proches voisins. Ces passages sont injectés dans le prompt du LLM.
Exemples 2026
| Base | Type | Cas d’usage typique PME |
|---|---|---|
| pgvector | Extension Postgres | Vous avez déjà Postgres → ajouter CREATE EXTENSION vector et c’est plié |
| Qdrant | Open source, Rust | Self-hosted, hautes performances, scale > 1M docs |
| Pinecone | SaaS managé | Pas d’ops, cher en volume, démarrage rapide |
| Weaviate | Hybrid (vector + keyword) | Recherche hybride out-of-the-box |
| Milvus | Open source, scale | > 10M vecteurs, équipe data plate |
Critères de choix PME
- Volume : < 500 000 vecteurs → pgvector suffit largement, et c’est gratuit.
- Souveraineté : besoin France → Qdrant en self-hosted ou Mistral Cloud, éviter Pinecone.
- Stack existant : déjà sur Postgres → pgvector. Sur Elasticsearch → Elastic Vector. Sur cloud Azure → Azure AI Search.
- Recherche hybride : besoin mots-clés + vecteurs → Weaviate ou Qdrant ou Postgres + pg_trgm.
Pour 80 % des PME, pgvector est le bon premier choix. Migrer vers Qdrant ou Pinecone se fait plus tard si le volume explose.
Pour aller plus loin
- Vector databases 2026 comparatif — analyse détaillée 4 bases.
- Embedding — définition — la brique stockée.
- RAG — définition — l’usage principal.
- Audit IA Kezify — choisir la bonne base pour votre cas.
Vous voulez intégrer une base vectorielle dans votre entreprise ? Audit IA Kezify.