L’apprentissage machine, ou machine learning, est un type d’algorithme qui a pour but de comprendre certaines propriétés d’un ensemble de données à partir de méthodes statistiques. Il va apprendre àles situer ou les catégoriser les unes par rapport aux autres. De la connaissance de cette relation, il va pouvoir situer de nouvelles données qu’il reçoit ou prédire de nouvelles données en conservant le même type de relation.
En pratique, ce genre d’algorithmes va par exemple pouvoir établir le profil des personnes sur les réseaux sociaux. Il va observer les personnes qui ont des contacts fréquents pour établir les groupes sociaux, puis établir ce qui statistiquement met en relation ces gens : un hobby, l’âge, le lieu géographique, le niveau d’études, etc. À partir de cela, il est possible d’une part d’établir rapidement le profil d’une nouvelle personne, et d’autre part de proposer des mises en relation entre personnes qui sont les plus susceptibles d’être acceptées.
En ce qui concerne les grands modèles de langage, l’apprentissage se fait à partir de textes existants et consiste à établir les liens entre les mots, la grammaire, le style, les sujets abordés, etc. Fort de cette connaissance, il peut analyser des textes et produire un texte probable en fonction d’un contexte précis, un prompt par exemple.
Histoire de l’apprentissage machine
Le premier algorithme d’apprentissage machine est le réseau de neurones artificiels, inventé en 1943. Le but est de reproduire le fonctionnement des cellules nerveuses et,in fine, le cerveau humain. Toutefois, la première application connue d’un logiciel d’apprentissage machine est un programme de jeu de dames datant de 1955. Il n’utilisait pas un réseau de neurones, mais des statistiques beaucoup plus simples issues des parties.
Ce n’est toutefois qu’en 1959 que le créateur de ce programme introduit l’expression machine learning, ou apprentissage machine en français.