La recherche sémantique consiste à chercher des documents par signification plutôt que par mots-clés. La requête et les documents sont convertis en vecteurs (embeddings), et on retourne les documents dont le vecteur est le plus proche de celui de la requête.
En pratique
Différence concrète avec la recherche classique (BM25, Elasticsearch standard) :
| Requête | Recherche mots-clés | Recherche sémantique |
|---|---|---|
| ”comment licencier un salarié” | trouve uniquement les pages contenant “licencier” | trouve aussi “rompre un contrat”, “fin de période d’essai”, “rupture conventionnelle" |
| "voiture pas chère” | échoue si la fiche dit “véhicule économique” | trouve les deux |
Stack 2026 typique en PME : embeddings via voyage-3 ou Mistral Embed, stockage dans pgvector, Qdrant ou Weaviate.
Pourquoi c’est important pour votre projet IA
- Les utilisateurs ne tapent jamais les mots-clés exacts qu’ils n’ont pas écrits.
- Brique fondamentale d’un RAG : sans recherche sémantique correcte, le LLM hallucine.
- Multilingue natif : une requête en français trouve un document en anglais (les embeddings 2026 sont cross-lingues).
Liens utiles
- Embedding — définition
- Vector database — définition
- Hybrid search — définition
- RAG — définition
- Audit IA Kezify — concevoir votre moteur de recherche sémantique.
← Retour au glossaire
#recherche sémantique#embedding#vector search#RAG