IA & LLM

Embeddings

Représentations vectorielles du sens d'un texte — chaque document devient un point dans un espace de 1500 dimensions où les contenus proches sémantiquement sont proches géométriquement.

Les embeddings sont des vecteurs numériques (typiquement 768 à 3072 dimensions) qui encodent le sens sémantique d'un texte, d'une image ou d'un audio. Deux textes qui parlent du même sujet auront des embeddings proches, mesurables par similarité cosinus. C'est la brique de base de la recherche sémantique moderne et du RAG : on transforme un corpus de documents en vecteurs, on stocke dans une base vectorielle, et à la requête on cherche les vecteurs les plus proches.

Concrètement, on appelle un modèle d'embedding (text-embedding-3 d'OpenAI, Voyage AI, Cohere, ou des modèles open-source comme bge-m3) qui prend du texte en entrée et renvoie un vecteur. Le modèle a été entraîné pour que la géométrie de cet espace reflète le sens : « contrat de travail » et « CDI » seront proches, même sans aucun mot en commun. Cela rend obsolète la recherche par mots-clés stricte pour beaucoup de cas — et active des usages comme la déduplication sémantique, la recommandation, le clustering automatique de tickets support.

Au-delà du RAG, les embeddings servent à : la classification (zero-shot ou few-shot via vecteurs de référence), la détection d'anomalies (un vecteur loin de tous les autres), le matching CV/offres en recrutement, la recommandation produit en e-commerce, l'analyse de feedback client à grande échelle. Coût indicatif : 0,02 à 0,15 € pour 1M de tokens encodés — négligeable comparé au LLM qui consomme derrière. Un projet bien conçu intègre les embeddings dès la phase de POC.

Choisir son modèle d'embeddings

OpenAI text-embedding-3-large : robuste, multilingue, bon par défaut.
Voyage AI / Cohere : meilleurs scores sur benchmarks récents, particulièrement en français.
bge-m3, jina-embeddings : open-source, auto-hébergeables — pertinent pour le RGPD.
Toujours tester sur vos données : un embedding générique peut sous-performer en domaine spécialisé.

Aller plus loin sur ce sujet

Logiciel IA sur-mesure Chatbot IA Audit IA gratuit

Termes liés

Pas sûr d’où ça coince ?
On audite votre site. Gratuitement.

5 axes passés au crible — SEO, GEO, performance, conversion, tracking. Rapport PDF chiffré + restitution 30 min offerte. Sans engagement, sans carte bleue.

Réserver un audit gratuit

Rapport sous 48h · Restitution 30 min offerte

SEO Google
GEO · ChatGPT, Perplexity
Performance & Core Web Vitals
Conversion & UX
Tracking & analytics

Devis sous 48h

Pas envie d’appeler ?
Décrivez votre projet
en 5 min.

Un projet sur ce sujet ? Décrivez-le en 5 min, on vous renvoie une architecture, un chiffrage et un planning.

1Vous décrivez votre besoin
2On chiffre & argumente
3Devis dans votre boîte

Décrire mon projet

Aucun engagement · Réponse sous 48h

Embeddings

Choisir son modèle d'embeddings

À lire dans la foulée

Pas sûr d’où ça coince ? On audite votre site. Gratuitement.

Pas envie d’appeler ? Décrivez votre projet en 5 min.

Pas sûr d’où ça coince ?
On audite votre site. Gratuitement.

Pas envie d’appeler ?
Décrivez votre projet
en 5 min.