Vector databases en 2026 — Pinecone vs Weaviate vs Qdrant vs PGVector

Le marché des vector databases s’est consolidé en 2026 autour de 4 acteurs sérieux. Le choix pour votre projet RAG ou agents IA n’est pas trivial : performance, coût, hébergement EU, conformité, et compétences internes pèsent tous. Voici le comparatif honnête.

Les 4 acteurs dans le match

Pinecone — pure SaaS, leader historique. Pinecone Inc., $138M Series B. Hébergement US, EU et AP. Plan free dérisoire, vraie utilisation à partir de $70/mois.
Weaviate — open-source + cloud, par Weaviate B.V. (Pays-Bas). Hébergement EU possible, multi-tenancy mature, GraphQL natif.
Qdrant — open-source Rust, par Qdrant GmbH (Berlin). Hébergement EU, on-prem facile, performance Rust excellente.
PGVector — extension Postgres open-source. Pas une vraie “vector DB” mais Postgres + extension qui suffit pour 80 % des cas PME. Maintenu par la communauté Postgres.

Performance pure (benchmarks 2026)

D’après notre benchmark interne 2026 (1 M vecteurs 1536 dim, top-k = 10, hardware équivalent) :

Critère	Pinecone	Weaviate	Qdrant	PGVector
Latence p50 query (ms)	25	28	18	45
Latence p99 query (ms)	60	75	40	180
Throughput max (qps single node)	800	700	1200	250
Indexation 1M vecteurs (minutes)	8	12	6	25
Filtres metadata performants	8/10	8/10	9/10	6/10
Recherche hybride (vector + BM25)	7/10	9/10	8/10	7/10 (avec ts_rank)
Mise à jour incrémentale	7/10	8/10	9/10	8/10

Verdict performance : Qdrant gagne sur la perf brute grâce à Rust. PGVector reste correct mais ~2-3× plus lent. Weaviate et Pinecone sont au coude à coude.

À noter : pour 80 % des projets PME (< 500k vecteurs, < 50 qps), même PGVector sur un Postgres standard tient parfaitement. La perf devient critique à grande échelle (> 5M vecteurs et > 200 qps).

Prix et économie (1M vecteurs, 50 qps moyen, 2026)

Solution	Coût mensuel	Frais admin internes
Pinecone Cloud (s1.x1)	~$280-450/mois	Faible (SaaS pur)
Weaviate Cloud (Standard)	~$140-280/mois	Moyen
Qdrant Cloud (1× 4GB)	~$95-180/mois	Moyen
Qdrant self-hosted (VPS Scaleway 4 vCPU 16 GB)	~$50/mois	Élevé (admin Linux + monitoring)
Weaviate self-hosted (VPS Scaleway 4 vCPU 16 GB)	~$50/mois	Élevé
PGVector sur Postgres existant	$0 (réutilise infra)	Faible si déjà Postgres
PGVector sur Supabase / Neon	~$25-100/mois	Faible

Insight clé : si vous avez déjà un Postgres en prod (95 % des PME tech), PGVector est gratuit et suffit. Pas besoin d’ajouter une vector DB dédiée pour < 1M vecteurs.

Sécurité, hébergement et conformité

Pinecone

US-based (Delaware), hébergement EU disponible (eu-west-1) en plan Pro
DPA standard, SOC 2 Type II, ISO 27001
Pas de self-hosted (pure SaaS)
OK pour PME hors secteur réglementé. Délicat en banque/santé/secteur souverain.

Weaviate

Pays-Bas (basé à Amsterdam), DPA EU natif
Open source GPL/BSL, self-hosted simple
SOC 2, ISO en cours
Solide pour conformité EU, particulièrement si self-hosted

Qdrant

Allemagne (Berlin), DPA EU natif
Open source Apache 2.0, self-hosted très simple (Docker / Kubernetes)
SOC 2, ISO en cours
Probablement le meilleur compromis souverain/perf en 2026

PGVector

Hérite de la conformité de votre Postgres (qui est probablement déjà conforme)
Postgres = standard rigoureusement éprouvé en banque, santé, secteur public
La plus simple à passer en conformité car Postgres est déjà partout

Quel acteur pour quel cas

Cas 1 : PME tech avec Postgres déjà en prod, < 1M vecteurs

PGVector. Zéro infra ajoutée, zéro coût, zéro nouveau vendor. Suffit pour 80 % des projets PME en 2026. Limite : à partir de 5M vecteurs ou 200 qps soutenus, basculer vers une vraie vector DB.

Cas 2 : projet > 5M vecteurs, latence critique, équipe Rust friendly

Qdrant self-hosted. Performance brute imbattable, hébergement EU, coût bas en self-hosted. C’est le choix sérieux 2026 pour la production exigeante.

Cas 3 : projet avec multi-tenancy (SaaS qui sert plusieurs clients chacun avec sa base)

Weaviate. Multi-tenancy natif et mature. Perf correcte, hébergement EU possible.

Cas 4 : équipe non-tech, besoin SaaS clé en main, budget OK

Pinecone. SaaS le plus mûr, doc excellente, intégrations everywhere. Vous payez la prime SaaS mais zéro infra. OK si projet hors secteur réglementé.

Cas 5 : secteur réglementé (santé HDS, banque ACPR, défense)

PGVector (sur Postgres déjà certifié) ou Qdrant self-hosted. Pas Pinecone (US par défaut).

Le combo qui marche en 2026

Pour des projets PME en France :

Démarrage POC + petit prod : PGVector sur le Postgres existant. Zéro friction.
Si la base grossit : migrer vers Qdrant self-hosted ou hosted.
Si conformité forte (santé, banque) : PGVector en interne, ou Qdrant self-hosted sur Scaleway.
Si SaaS multi-tenant : Weaviate ou Qdrant Cloud avec multi-collection.

Voir comparatif LangChain vs LlamaIndex vs Haystack pour le framework RAG associé.

Anti-patterns et pièges

Anti-pattern 1 : choisir Pinecone par défaut sans benchmark

Pinecone a un excellent marketing et une excellente doc, ce qui pousse beaucoup de projets à choisir par défaut. Pour un projet PME < 1M vecteurs, c’est souvent 3-5× le coût d’une alternative pour le même résultat fonctionnel.

Anti-pattern 2 : sous-estimer PGVector

Beaucoup d’équipes considèrent PGVector “pas sérieux” car ce n’est pas une vraie vector DB. Faux : Postgres scale très bien jusqu’à 5-10M vecteurs avec un index HNSW correct + bon hardware. Pour la majorité des projets PME, c’est largement suffisant et infiniment plus simple à opérer.

Anti-pattern 3 : oublier la dimension embedding et le coût associé

Embedding text-embedding-3-large (3072 dim) = 2× le coût stockage et requête vs text-embedding-3-small (1536 dim). Sur 10M vecteurs, l’écart est concret. Tester si la perf RAG souffre vraiment avec le modèle plus petit avant de payer le grand.

Anti-pattern 4 : mauvais index ou paramètres HNSW

Un PGVector sans index HNSW (ou avec paramètres inadaptés) est 10-100× plus lent. Un Qdrant avec HNSW mal calibré aussi. Investissez 1-2 jours avant la prod sur le tuning d’index, c’est l’investissement à plus haut ROI.

Anti-pattern 5 : pas de mesure de qualité retrieval

La vraie métrique d’une vector DB en RAG : Recall@k et MRR. Pas la latence. Si votre Recall@10 est 60 %, peu importe que vous soyez à 18 ms ou 25 ms, votre RAG est cassé. Mesurer en continu sur un dataset de référence (50-200 questions avec ground truth).

Ce qu’on recommande chez Kezify

Pour une PME 10-200 salariés qui démarre un projet RAG en 2026 :

Phase 1 (POC + premier prod) : PGVector sur le Postgres existant (ou Supabase / Neon si pas de Postgres). 0 friction, focus sur la qualité retrieval, pas l’infra.
Phase 2 (scale) : Qdrant Cloud ou Qdrant self-hosted Scaleway dès que > 2-5M vecteurs ou > 100 qps soutenus.
Si conformité critique : PGVector intra ou Qdrant self-hosted sur infra certifiée HDS / SecNumCloud.
Pinecone : seulement si vous avez un vrai besoin spécifique (multi-region global, intégration avec Pinecone Inference, équipe data science qui ne veut RIEN gérer).

L’erreur la plus fréquente : choisir Pinecone par marketing puis migrer 6-12 mois plus tard quand la facture explose. Démarrer avec PGVector et migrer ensuite si nécessaire est presque toujours la bonne stratégie en PME.

Pour votre projet

Si vous démarrez un projet RAG ou recherche sémantique en 2026 et vous voulez qualifier la bonne vector DB pour votre cas, 30 minutes au téléphone suffisent. On a déployé les 4 solutions chez nos clients PME, on connaît les pièges en prod.

Voir aussi : comparatif LangChain vs LlamaIndex vs Haystack, RAG vs fine-tuning vs prompt, RAG vs fine-tuning entreprise 2026.