Glossaire IA · Lettre B

Base de données vectorielle — définition et choix pour PME

Qu'est-ce qu'une base de données vectorielle ? Définition, rôle dans le RAG, exemples (Pinecone, Qdrant, pgvector) et critères de choix pour une PME française.

Une base de données vectorielle (vector database, vector store) est un moteur de stockage spécialisé dans la recherche par similarité de vecteurs (embeddings). Là où Postgres ou MongoDB cherchent par valeur exacte, une base vectorielle répond à “trouve-moi les 5 documents les plus proches sémantiquement de cette requête”. C’est le moteur de recherche d’un RAG.

En pratique

Vous indexez 50 000 documents internes : chaque document est découpé en passages de 500 à 1 000 tokens, chaque passage est converti en embedding, puis stocké avec son texte dans la base. À la requête, l’embedding de la question est calculé, la base retourne en quelques millisecondes les K plus proches voisins. Ces passages sont injectés dans le prompt du LLM.

Exemples 2026

BaseTypeCas d’usage typique PME
pgvectorExtension PostgresVous avez déjà Postgres → ajouter CREATE EXTENSION vector et c’est plié
QdrantOpen source, RustSelf-hosted, hautes performances, scale > 1M docs
PineconeSaaS managéPas d’ops, cher en volume, démarrage rapide
WeaviateHybrid (vector + keyword)Recherche hybride out-of-the-box
MilvusOpen source, scale> 10M vecteurs, équipe data plate

Critères de choix PME

  1. Volume : < 500 000 vecteurs → pgvector suffit largement, et c’est gratuit.
  2. Souveraineté : besoin France → Qdrant en self-hosted ou Mistral Cloud, éviter Pinecone.
  3. Stack existant : déjà sur Postgres → pgvector. Sur Elasticsearch → Elastic Vector. Sur cloud Azure → Azure AI Search.
  4. Recherche hybride : besoin mots-clés + vecteurs → Weaviate ou Qdrant ou Postgres + pg_trgm.

Pour 80 % des PME, pgvector est le bon premier choix. Migrer vers Qdrant ou Pinecone se fait plus tard si le volume explose.

Pour aller plus loin

Vous voulez intégrer une base vectorielle dans votre entreprise ? Audit IA Kezify.

← Retour au glossaire
#vector database#définition#Pinecone#Qdrant