Un exemple d’algorithme d’apprentissage en RH

Dans cet épisode nous allons donner un exemple simplifié d’algorithme d’apprentissage dans le domaine RH.

Petite devinette. Qu’est-ce que le domaine RH et l’IA ont en commun à ton avis ?

L’intelligence ?

Si c’était le cas, ça se saurait depuis longtemps, non ? Je parle de l’IA bien sûr… Non, la réponse, c’est l’apprentissage.

Voilà donc deux domaines dans lesquels l’apprentissage est clé en effet ! En IA on parle de machine learning, de deep learning, c’est plus classe, mais au fond, il s’agit bien d’apprentissage. Le truc apprend donc il progresse.

Pas comme toi… Il y a plusieurs formes d’apprentissage, l’apprentissage supervisé, non supervisé, l’apprentissage par renforcement etc. Ce qui est intéressant, c’est qu’au cœur de tout cela, il y a des algorithmes.

Un gros mot, on en parle mais quand on est profane est-ce qu’on sait comment ça marche ?

Pour cela, et pour simplifier, on va prendre un exemple d’algorithme d’apprentissage en RH ? Alors, c’est quoi l’histoire ?

En matière de rémunération, on utilise souvent une méthode d’évaluation de postes, la méthode Hay, par exemple. Les professionnels RH savent de quoi on parle. Normalement.

Et les autres feraient bien de s’y intéresser pour comprendre à quelle sauce ils sont mangés, mais c’est un autre sujet. On le fait court pour illustrer notre exemple. D’un côté, une évaluation de poste, de l’autre, les salaires des personnes qui les occupent.

Pour les matheux parmi vous, enfin ce n’est pas des mathématiques bien compliquées, on explique. Les salaires des personnes sur l’axe des ordonnées, Y. Vous voyez celui qui est vertical et qui tient debout tout seul.

Et les évaluations de postes, sur l’axe des abscisses, les X, à l’horizontale. Quoi de plus normal. Allez, on vous raconte le film.

En l’espèce, un film où on est tenté d’établir une corrélation entre X et Y donc entre l’importance du poste, évaluée à l’aide de l’évaluation de poste, X, et le salaire réel des gens, Y.

On retourne à l’école, rappelez-vous la droite des moindres carrés, bref, une régression simple. Y=aX+b avec un coefficient de corrélation qui vous indique, pour faire court, l’intensité de la relation.

Quand on parle de X tout est dans la relation, c’est normal. Cette relation, on l’apprécie avec R2, qui n’a rien à voir avec son copain D2, mais qui, comme son nom l’indique, est un coefficient de corrélation. Au fond, cette équation Y=aX+b est la meilleure représentation que l’on ait de ce que l’on cherche à observer, c’est-à-dire les données dont on dispose.

En l’occurrence, la relation entre l’importance du poste et le salaire de la personne. Dis-moi ton évaluation de poste et je te dirai ton salaire, pour faire simple. Cette équation, c’est un modèle. Un modèle de représentation.

Mais, comme tout modèle, il ne décrit pas la réalité. Il tente de s’en approcher. Donc s’il n’était pas con, il essayerait de s’améliorer. Donc on va lui demander d’apprendre. Là, en l’occurrence, on va faire de l’apprentissage supervisé.

J’ai donc un algorithme simple, représenté par une équation de type Y=aX+b ou salaire = a fois évaluation de poste + b. Avec un coefficient de corrélation de R2. Maintenant, je vais nourrir mon algorithme d’une donnée supplémentaire.

Tu me donnes ton évaluation de poste. 350 points Hay. Super. Le modèle prédit, grâce à l’équation, un salaire de 33000 euros bruts annuels. Je dis n’importe quoi, c’est pour illustrer. Bon, en vrai tu gagnes 34000.

On va donc dire au programme qui met en œuvre ton algorithme qu’il y a une nouvelle donnée X = 350 et Y = 34000. Il va donc recalculer Y=aX+b. Les valeurs de a, de b, et de R2 seront alors sensiblement différentes.

Le modèle aura donc appris. Y=aX+b c’est un algorithme, qui a été nourri d’un premier jeu de données, dont l’apprentissage est mis en œuvre grâce à un programme informatique, écrit en python par exemple, qui lui permet d’affiner l’équation Y=aX+b à mesure qu’on le nourrit de données réelles nouvelles.

Voilà un algorithme d’apprentissage supervisé, simple, qui repose sur une équation de type régression simple. On pourrait, par exemple aller plus loin, en introduisant plusieurs variables potentiellement explicatives des salaires.

C’est ce qu’on fait dans un diagnostic de rémunération implicite. Il suffirait de faire un petit programme qui met en œuvre l’apprentissage de l’équation Y=ax1+bx2+cx3+k une constante et on ferait de l’IA.

On pourrait aussi imaginer une autre forme d’algorithme pour poursuivre notre exemple. Imagine que je te donne une série de questions, plutôt simples, à laquelle un profane qui ne connaît pas la méthode Hay, peut répondre.

Un arbre de décision par exemple, où d’embranchement en embranchement on arrive in fine à une approximation d’évaluation de postes suffisamment solide pour essayer ta fameuse équation.

On a alors mixé deux algorithmes, un algorithme fondé sur un arbre de décision pour approcher l’évaluation de poste, puis un algorithme d’apprentissage supervisé fondé sur une équation de type régression simple. Ce n’est pas bien compliqué, tu vois.

Dans les années 90, quand on était chez Hay, on avait fabriqué cela avec deux copains consultants, Christophe et Laurent, tous les deux statisticiens à l’origine. Et à la fin, c’était Salair 3617…

L’époque des dinosaures avec le Minitel… Mais, comme quoi, il n’y a rien de nouveau sous le soleil.

En résumé, un algorithme est une succession d’étapes conceptuelles qui traite des informations en entrée pour délivrer un résultat en sortie. Un exemple très simple c’est celui d’une prévision établie à partir d’une équation simple de type Y=aX+b.

J’ai bon chef ?

Oui tu as bon mais on ne va pas en faire toute une histoire.