Mais c’est quoi le deep learning ?
Dans cet épisode, nous allons parler d’apprentissage en nous concentrant sur le deep learning.
Ce n’est pas parce qu’on apprend qu’on devient intelligent, n’allons pas trop vite en besogne. La connaissance est cumulative mais pas l’intelligence et encore moins la sagesse.
Pour autant, ce qui caractérise l’intelligence artificielle c’est qu’elle apprend, notamment grâce à l’apprentissage profond. Le deep learning.
Learning, le commun des mortels se doute bien de ce que c’est. Mais deep… on voit moins bien.
L’apprentissage profond, ça va loin ça ! Or, comme l’intelligence artificielle envahit notre quotidien, l’actualité et vraisemblablement notre avenir, autant le savoir. Alors, le deep learning, c’est quoi l’histoire ?
Au fond, il n’y a pas une intelligence artificielle mais un domaine vaste de technologies, principes, modèles que l’on regroupe sous cette bannière.
En substance, l’intelligence artificielle utilise des algorithmes. Les algorithmes sont des modèles mais ce ne sont pas des modèles statiques. Ce sont des modèles qui apprennent.
Cela ne les rend pas intelligents pour autant car, au fond, ils ne remettront pas en cause les règles intrinsèques qui les régissent. Mais ils apprennent et peuvent s’adapter automatiquement.
C’est ce qu’on appelle le machine learning. L’apprentissage automatique. Le deep learning est en quelque sorte une catégorie de machine learning qui s’appuie sur une méthode spécifique.
Mais avant d’en parler, on peut évoquer les principales méthodes d’apprentissage du machine learning. En gros, il y en a 3.
D’abord l’apprentissage supervisé. Le modèle apprend à partir de données d’entraînement étiquetées. Cela signifie que les données d’entrée sont associées à des sorties ou des étiquettes connues à l’avance.
Je te montre des photos d’une mangue et je te dis c’est une mangue. Puis une autre photo de mangue, c’est une mangue. Puis une photo de papaye, ce n’est pas une mangue. Et on vérifie si tu sais reconnaître la mangue de la papaye.
Ensuite il y a l’apprentissage non supervisé. Lui, il ne repose pas sur des données étiquetées et connues à l’avance. On ne sait pas trop ce qui les caractérise.
Là, le but du jeu ce n’est pas d’apprendre au modèle à prédire au mieux ce qu’on attend qu’il prédise mais à identifier par lui-même des caractéristiques intéressantes des données qu’on lui donne.
Enfin, il y a l’apprentissage par renforcement. Le modèle décide de quelque chose ou fournit quelque chose en fonction de son degré de maturité, là maintenant. Puis, on lui fournit un feedback, un j’aime ou je n’aime pas de l’utilisateur par exemple, et avec le temps, il apprend.
Le deep learning dans tout cela c’est une technologie d’apprentissage qui repose sur le principe des réseaux de neurones. On l’utilise essentiellement là où les données ne sont pas structurées à l’avance.
Autrement dit, on ne sait pas à l’avance qu’elle est le facteur prédictif dans les données pour apprécier la valeur de ce qui sort du modèle. En gros, c’est le modèle lui-même qui va être entraîné pour les chercher.
Il a donc besoin pour y arriver d’un très grand volume de données et d’une grosse puissance de calcul.
Prenons un exemple simple. Je souhaite que mon algorithme fasse le tri entre des ballons de foot et des ballons de rugby. Je lui dis que le facteur prédictif c’est ovale ou pas ovale.
Dans l’éducation nationale on dirait : l’ovalité du référentiel bondissant comme marqueur de l’ovalie. Bref, pas besoin de beaucoup d’images pour entraîner ton algorithme. Ovale ou pas ovale.
Remarque c’est une question de point de vue… Sous un certain angle ovale et rond c’est kif kif bourricot.
Mais si tu veux que ton algorithme reconnaisse le ballon de rugby parmi des objets différents il faudra qu’il distingue de lui-même l’ovalité comme étant l’un des facteurs prédictifs.
Or, comme les pastèques sont ovales, il lui faudra peut-être bien plus de données pour s’entraîner à reconnaître le ballon de rugby entre les boules de pétanque, les melons, les pastèques et les obus de la première guerre mondiale.
C’est là la grande utilité des réseaux de neurones donc du deep learning. Pourquoi profond ? Pour une raison simple. Une couche d’entrée et une couche de sortie mais entre les deux une multitude de couches intermédiaires, dites cachées.
Plus tu en as, plus c’est profond. Mais comme c’est caché, tu ne sais pas trop ce qui se passe là-dedans mais c’est un autre sujet.
En résumé, le deep learning est un sous-domaine du machine learning qui utilise des réseaux de neurones pour s’entrainer sur un grand volume de données non structurées pour identifier de lui-même leurs caractéristiques prédictives.
J’ai bon chef ?
Oui tu as bon mais on ne va pas en faire toute une histoire.