Retour au glossaire
IA & LLM

Embeddings

Représentations vectorielles du sens d'un texte — chaque document devient un point dans un espace de 1500 dimensions où les contenus proches sémantiquement sont proches géométriquement.

Les embeddings sont des vecteurs numériques (typiquement 768 à 3072 dimensions) qui encodent le sens sémantique d'un texte, d'une image ou d'un audio. Deux textes qui parlent du même sujet auront des embeddings proches, mesurables par similarité cosinus. C'est la brique de base de la recherche sémantique moderne et du RAG : on transforme un corpus de documents en vecteurs, on stocke dans une base vectorielle, et à la requête on cherche les vecteurs les plus proches.

Concrètement, on appelle un modèle d'embedding (text-embedding-3 d'OpenAI, Voyage AI, Cohere, ou des modèles open-source comme bge-m3) qui prend du texte en entrée et renvoie un vecteur. Le modèle a été entraîné pour que la géométrie de cet espace reflète le sens : « contrat de travail » et « CDI » seront proches, même sans aucun mot en commun. Cela rend obsolète la recherche par mots-clés stricte pour beaucoup de cas — et active des usages comme la déduplication sémantique, la recommandation, le clustering automatique de tickets support.

Au-delà du RAG, les embeddings servent à : la classification (zero-shot ou few-shot via vecteurs de référence), la détection d'anomalies (un vecteur loin de tous les autres), le matching CV/offres en recrutement, la recommandation produit en e-commerce, l'analyse de feedback client à grande échelle. Coût indicatif : 0,02 à 0,15 € pour 1M de tokens encodés — négligeable comparé au LLM qui consomme derrière. Un projet bien conçu intègre les embeddings dès la phase de POC.

Choisir son modèle d'embeddings

  • OpenAI text-embedding-3-large : robuste, multilingue, bon par défaut.
  • Voyage AI / Cohere : meilleurs scores sur benchmarks récents, particulièrement en français.
  • bge-m3, jina-embeddings : open-source, auto-hébergeables — pertinent pour le RGPD.
  • Toujours tester sur vos données : un embedding générique peut sous-performer en domaine spécialisé.
Audit gratuit · 48h

Pas sûr d’où ça coince ?
On audite votre site. Gratuitement.

5 axes passés au crible — SEO, GEO, performance, conversion, tracking. Rapport PDF chiffré + restitution 30 min offerte. Sans engagement, sans carte bleue.

Réserver un audit gratuit

Rapport sous 48h · Restitution 30 min offerte

  • SEO Google
  • GEO · ChatGPT, Perplexity
  • Performance & Core Web Vitals
  • Conversion & UX
  • Tracking & analytics
Devis sous 48h

Pas envie d’appeler ?
Décrivez votre projet
en 5 min.

Un projet sur ce sujet ? Décrivez-le en 5 min, on vous renvoie une architecture, un chiffrage et un planning.

  • 1Vous décrivez votre besoin
  • 2On chiffre & argumente
  • 3Devis dans votre boîte
Décrire mon projet

Aucun engagement · Réponse sous 48h