Retour au glossaire
IA & LLM

Base vectorielle

Base de données spécialisée dans le stockage et la recherche de vecteurs (embeddings) à grande échelle — composant clé d'un système RAG en production.

Une base vectorielle stocke des embeddings — des vecteurs de 768 à 3072 dimensions — et permet de retrouver très rapidement les plus proches d'un vecteur de requête (recherche par similarité). C'est la couche de stockage du RAG : on indexe ses documents une fois, on cherche en quelques millisecondes parmi des millions de chunks. Sans elle, on tomberait sur des recherches en O(n) inacceptables au-delà de quelques milliers de documents.

Les principaux acteurs en 2026 : Pinecone (managé, simple, plus cher), Weaviate (open-source, riche en features), Qdrant (open-source, rapide, Rust), pgvector (extension PostgreSQL, pertinent quand on a déjà du Postgres et des volumes < 10M chunks), Milvus (à grande échelle). Pour la majorité des projets PME/ETI, pgvector suffit largement et évite d'introduire un nouveau service à opérer. Pinecone devient pertinent au-delà de 50M de vecteurs ou quand on a besoin d'une recherche distribuée.

Les paramètres qui comptent en production : algorithme d'index (HNSW est le standard), métrique de distance (cosinus pour le texte), filtres métadata (filtrer par client, date, langue avant la recherche vectorielle), recherche hybride (vectoriel + BM25), et reranking en post-traitement. Une base vectorielle mal configurée renvoie du bruit — et un chatbot ou un agent IA qui s'en nourrit hallucinera. Le tuning de la stack RAG, c'est 70 % du travail d'un projet sérieux.

Quelle base vectorielle pour quel volume

  • < 1M chunks : pgvector dans votre Postgres existant — simple, robuste, pas de service additionnel.
  • 1M à 50M chunks : Qdrant ou Weaviate auto-hébergés — bon compromis perf/coût/contrôle.
  • > 50M chunks ou multi-tenant lourd : Pinecone managé ou Milvus distribué.
  • Toujours activer les filtres métadata avant la recherche vectorielle — gain de perf x10 facile.
Audit gratuit · 48h

Pas sûr d’où ça coince ?
On audite votre site. Gratuitement.

5 axes passés au crible — SEO, GEO, performance, conversion, tracking. Rapport PDF chiffré + restitution 30 min offerte. Sans engagement, sans carte bleue.

Réserver un audit gratuit

Rapport sous 48h · Restitution 30 min offerte

  • SEO Google
  • GEO · ChatGPT, Perplexity
  • Performance & Core Web Vitals
  • Conversion & UX
  • Tracking & analytics
Devis sous 48h

Pas envie d’appeler ?
Décrivez votre projet
en 5 min.

Un projet sur ce sujet ? Décrivez-le en 5 min, on vous renvoie une architecture, un chiffrage et un planning.

  • 1Vous décrivez votre besoin
  • 2On chiffre & argumente
  • 3Devis dans votre boîte
Décrire mon projet

Aucun engagement · Réponse sous 48h