Tout modèle d'IA repose sur des données. La qualité, la quantité et la diversité des données d'entraînement déterminent les performances du modèle.
Un réseau de neurones est inspiré du cerveau humain : des couches de neurones artificiels connectés entre eux. Chaque neurone reçoit des entrées, applique une transformation mathématique, et produit une sortie.
Le deep learning utilise des réseaux avec de nombreuses couches. L'architecture Transformer, introduite en 2017, est la base de tous les LLMs actuels.
Les LLMs découpent le texte en tokens — des fragments de mots. Les embeddings sont des représentations mathématiques (vecteurs) dans un espace multidimensionnel. Les mots sémantiquement proches sont proches dans cet espace.
Imaginez les embeddings comme une carte géographique des concepts. « Roi » et « Reine » seraient proches. La direction de « Roi » à « Reine » serait similaire à celle de « Homme » à « Femme ».
L'entraînement : le modèle ajuste ses milliards de paramètres. Coûteux en calcul et énergie. L'inférence : utilisation du modèle pour générer des réponses, token par token.