Posted

De l’art d’utiliser des ordinateurs pour comprendre le langage humain et pourquoi cela est si important dans le processus de recrutement.

A la recherche du meilleur candidat

Supposons que vous soyez à la recherche d’un Managing Director en région parisienne. Dans votre quête du candidat parfait, vous avez fait preuve d’ingéniosité en incluant dans vos recherches le terme « Managing Director » mais aussi celui de « MD ».

Vous risquez de tomber sur les trois CV ci-dessous où le mot « MD » apparaît plusieurs fois :
– Julie, Managing Director (MD) dans une banque à Paris
– Stéphane, Media Director (MD) dans un journal à Bordeaux
– Aurélie, Medical Doctor (MD) dans une clinique à Nantes

Reste à savoir comment un outil de recherche et de matching basé sur l’Intelligence Artificielle (IA) tel que DaXtra Parser va-t-il parvenir à trouver et localiser Julie, plutôt que Stéphane ou Aurélie. La réponse se trouve dans cette discipline de l’lA connue sous le nom de Natural Language Processing (NLP) ou traitement naturel du langage.

Humain et ordinateurs

Les humains communiquent en utilisant un langage composé de mots répartis de façon bien précise dans une phrase. Dès la petite enfance, nos cerveaux ont été formés à la parole puis à l’écriture. Là où nous autres, humains, accordons à une phrase un sens bien précis, les ordinateurs n’y verront que du désordre. Et pour cause : ces derniers ont été programmés ou « entraînés » sur des ensembles de règles comme Java, Python, C ++, etc.

En tant qu’êtres humains, nous sommes capables de tirer des conclusions basées sur la sémantique et / ou de nombreux éléments pertinents pour un sujet défini à travers le contexte d’une conversation ou le texte que nous lisons. Le cerveau humain traite quantité d’informations afin de comprendre ce qui est dit (ex : avec qui nous communiquons, la situation à laquelle la conversation est liée et le sujet traité). Notre cerveau traite des milliers de permutations de métadonnées pour donner un sens à la communication orale. Ce qui n’empêche pas les humains de commettre parfois des erreurs de compréhension et d’interprétation.

De leur côté, les ordinateurs considèrent l’écriture humaine comme des occurrences non structurées de mots et pour un cerveau binaire comme le leur, il faut bien reconnaître que c’est un concept très abstrait. Ainsi, pour pouvoir comprendre un texte écrit par un humain, un ordinateur doit recevoir des données non structurées aussi contextualisées que possible afin de les traiter de manière significative et créer de la valeur ajoutée. Le NLP est une tentative de rapprocher les ordinateurs de ce niveau de compréhension humain.

Le Natural Language Processing en pleine expansion

Dans un article de présentation sur le sujet Pauline Olivier, Junior Data Engineer, rappelle que « le Natural Language Processing (NLP) – ou Traitement Automatique du Langage Naturel (TALN) en français – étudie la compréhension, la manipulation et la génération du langage naturel par les machines (…) Actuellement, avec les technologies informatiques toujours plus perfectionnées et abordables, la quantité de données open source toujours plus importante et l’utilisation du Deep Learning, le NLP est en pleine expansion ».

Sur le plan humain, ce type de compréhension et de traduction informatique est extrêmement important lorsqu’il s’agit de faire du parsing de CV contenant naturellement toutes les nuances du langage humain – autrement dit le contexte – qui rendent un sujet spécifique. Un outil de parseur de CV (extraction sémantique) comme DaXtra Parser peut, via une analyse sémantique, interpréter le texte humain ou des données non structurées, (comme des mots) dans le CV, décomposer cette structure, dégager une vision globale du contexte du CV, et puis transformer le tout en données structurées comme XML ou JSON, qu’un ordinateur peut ainsi traiter.

En comprenant ces données via des modèles contextuels, le parseur de CV est alors en mesure de trier et de classer les candidats selon leur adéquation avec le poste, en fonction de nombreux critères. Mais là où le Natural Language Processing se distingue, c’est dans sa capacité à dégager des marqueurs comme la façon dont les compétences sont décrites dans le contexte du poste à pourvoir, ou bien l’évaluation d’un job ou d’une compétence par rapport au background professionnel.

Rapidité et précision

En termes de facilité et d’efficacité, nous sommes bien loin de la méthode ancestrale – dont certains d’entre nous se souviennent encore – qui consistait à trier les CV papier pour trouver le meilleur candidat. Et pourtant, certains n’utilisent toujours pas l’automatisation NLP pour faire du parsing de CV.

Bien qu’il ne s’agisse là que la partie émergée de l’iceberg de ce que l’IA peut offrir dans la recherche et le matching, c’est un énorme pas en avant. Cela dit, certains parseurs de CV sont meilleurs que d’autres en termes de précision. Le meilleur choix est un parseur multilingue qui se rapproche le plus possible du niveau de précision humain.

En conclusion, nous pouvons dire que la technologie de recherche et de matching PNL est devenue un outil indispensable pour les structures de toutes tailles – des cabinets de recrutement aux départements de recrutement internes en passant par les agences d’intérim – dont le succès dépend de la rapidité et de la précision dans la recherche des meilleurs candidats.