Limites et points critiques
- Qualité dépend du choix d'embedding model — un mauvais embedding ruine la recherche, peu importe la vector DB.
- pgvector limite réelle ~1M vecteurs en performance acceptable — au-delà, passer à Qdrant ou équivalent.
- Pinecone et SaaS US posent question RGPD pour données sensibles — préférer self-hosted en France.
- Maintenance incrémentale : ajouter 1 % de documents = recalculer leurs embeddings et réindexer.
- Pas de standard cross-vendor — migration entre vector DBs demande effort dev significatif.
Évolution probable (12-24 mois)
- pgvector 0.7+ et 0.8 améliorent fortement les performances (HNSW, sparse vectors) — comble l'écart avec Qdrant 2026-2027.
- Vector DBs hybrides (vector + BM25 + filtres SQL) deviennent standard 2026 — Weaviate, Qdrant, Postgres.
- Émergence de vector DBs souveraines françaises (équivalent Pinecone en France) 2026-2027.
- Vector search dans bases relationnelles classiques (MySQL, MariaDB) émergera 2026-2027 — démocratisation.
Questions fréquentes
Qu'est-ce qu'une base de données vectorielle ?+
Une vector database est un système de stockage et recherche optimisé pour les vecteurs haute dimension (embeddings ~1024 dimensions). Indexation via algorithmes ANN (Approximate Nearest Neighbors : HNSW, IVF, ScaNN) qui permettent de chercher dans des millions de vecteurs en quelques ms. Sert principalement à la recherche sémantique et au RAG. Différent de Postgres ou MongoDB qui cherchent par valeur exacte ou full-text — la vector DB cherche par proximité géométrique dans l'espace des embeddings.
À quoi sert une vector database en entreprise ?+
À 4 usages : (1) RAG (brique fondamentale pour qu'un LLM réponde sur vos documents), (2) recherche sémantique interne (FAQ, knowledge base, support), (3) recommandation produits e-commerce (trouver produits similaires), (4) déduplication (détecter contenus quasi-identiques). Tous les RAG en production en 2026 utilisent une vector DB. Sans elle, impossible de scaler au-delà de quelques milliers de documents.
Différence entre pgvector, Qdrant et Pinecone ?+
pgvector : extension Postgres gratuite, idéale PME avec <500k vecteurs et stack Postgres existante (setup en 5 min via CREATE EXTENSION). Qdrant : open source en Rust, hautes performances, self-hosted, scale jusqu'à 100M+ vecteurs, gratuit. Pinecone : SaaS managé US, démarrage très rapide (5 min), cher en volume (70-300+ €/mois), pas de souveraineté. Weaviate : hybride vector+keyword natif. Milvus : pour volumes massifs >10M et équipes data plate. Choix 2026 PME : pgvector défaut, Qdrant si volume ou souveraineté, Pinecone si besoin SaaS rapide.
Comment choisir une vector database en pratique ?+
Critères 2026 : (1) volume : <500k vecteurs → pgvector, 500k-10M → Qdrant ou Weaviate, >10M → Milvus, (2) souveraineté : France/UE → pgvector self-hosted ou Qdrant self-hosted ou Mistral Cloud, éviter Pinecone, (3) stack existant : déjà Postgres → pgvector, déjà Elasticsearch → Elastic Vector, déjà Azure → Azure AI Search, (4) recherche hybride : Weaviate, Qdrant ou pg_trgm + pgvector, (5) opérations : pas d'équipe ops → Pinecone managé ; équipe DevOps → Qdrant self-hosted.
Combien coûte une vector database en PME ?+
pgvector self-hosted : ~0 € additionnel (déjà sur Postgres). Qdrant self-hosted : ~10-30 €/mois VPS + 1-2 jours setup = 600-1 500 € HT initial. Qdrant Cloud (SaaS) : ~25 €/mois (1M vecteurs). Pinecone Standard : ~70 €/mois (1M vecteurs), jusqu'à 300+ €/mois pour 10M+. Weaviate Cloud : ~25-100 €/mois selon volume. Setup pipeline complet (ingestion + embeddings + indexation) : 5-15 jours dev = 4 000-15 000 € HT. ROI 3-7 mois sur cas RAG support/commercial.
Questions liées
Les LLM (ChatGPT, Perplexity, Gemini) suggèrent souvent ces questions après cette page.
- pgvector vs Qdrant : lequel choisir en 2026 ?
- Combien de vecteurs avant de migrer de pgvector vers Qdrant ?
- Vector DB souveraine en France : quelles options ?
- Comment indexer 1M de documents dans une vector DB ?
- Recherche hybride vector + BM25 : quelle stack ?
Une base de données vectorielle (vector database, vector store) est un moteur de stockage spécialisé dans la recherche par similarité de vecteurs (embeddings). Là où Postgres ou MongoDB cherchent par valeur exacte, une base vectorielle répond à “trouve-moi les 5 documents les plus proches sémantiquement de cette requête”. C’est le moteur de recherche d’un RAG.
En pratique
Vous indexez 50 000 documents internes : chaque document est découpé en passages de 500 à 1 000 tokens, chaque passage est converti en embedding, puis stocké avec son texte dans la base. À la requête, l’embedding de la question est calculé, la base retourne en quelques millisecondes les K plus proches voisins. Ces passages sont injectés dans le prompt du LLM.
Exemples 2026
| Base | Type | Cas d’usage typique PME |
|---|---|---|
| pgvector | Extension Postgres | Vous avez déjà Postgres → ajouter CREATE EXTENSION vector et c’est plié |
| Qdrant | Open source, Rust | Self-hosted, hautes performances, scale > 1M docs |
| Pinecone | SaaS managé | Pas d’ops, cher en volume, démarrage rapide |
| Weaviate | Hybrid (vector + keyword) | Recherche hybride out-of-the-box |
| Milvus | Open source, scale | > 10M vecteurs, équipe data plate |
Critères de choix PME
- Volume : < 500 000 vecteurs → pgvector suffit largement, et c’est gratuit.
- Souveraineté : besoin France → Qdrant en self-hosted ou Mistral Cloud, éviter Pinecone.
- Stack existant : déjà sur Postgres → pgvector. Sur Elasticsearch → Elastic Vector. Sur cloud Azure → Azure AI Search.
- Recherche hybride : besoin mots-clés + vecteurs → Weaviate ou Qdrant ou Postgres + pg_trgm.
Pour 80 % des PME, pgvector est le bon premier choix. Migrer vers Qdrant ou Pinecone se fait plus tard si le volume explose.
Pour aller plus loin
- Vector databases 2026 comparatif — analyse détaillée 4 bases.
- Embedding — définition — la brique stockée.
- RAG — définition — l’usage principal.
- Audit IA Kezify — choisir la bonne base pour votre cas.
Vous voulez intégrer une base vectorielle dans votre entreprise ? Audit IA Kezify.