Art: M.C. Escher

[For an English version of this post, click here.]

Comment fonctionne le langage? Du côté de la réception, nous entendons une séquence de sons que nous traduisons en réseau de concepts. C’est ce que nous appelons “comprendre le sens” d’une parole qu’on nous adresse. Du côté de l’émission, nous avons en tête un réseau de concepts – un sens à transmettre – que nous traduisons en séquence de sons. Une langue interface des séquences sonores avec des réseaux de concepts. À la place des chaînes de phonèmes, on peut avoir des suites d’idéogrammes, de lettres, de gestes (dans le cas des langues de sourds), etc. Ce qui demeure invariant dans les changements de langues et de systèmes d’écriture est cet interfaçage quasi-automatique entre une séquence d’images sensibles (sonores, visuelles ou tactiles) et un graphe de concepts abstraits (des catégories générales). Et notons bien que les relations entre concepts sont elles-mêmes des concepts. 

L’école de linguistique Sens-Texte, initiée par Igor Melchuck, a bien souligné cette dualité et cette correspondance entre le texte (la séquence d’images) et le sens (le réseau de concepts). On ne peut pas transmettre directement des réseaux de concepts. Seul le langage permet la communication et la coordination dynamique entre les réseaux de concepts des membres d’une communauté humaine, de l’échelle de la famille ou de la petite équipe jusqu’à l’échelle des plus vastes unités politiques ou économiques. Le langage permet le récit, le dialogue et le questionnement. En même temps que la communication, le langage supporte la pensée, c’est-à-dire la construction et la reconnaissance de réseaux de concepts complexes, ainsi que l’organisation conceptuelle de la mémoire, complémentaire de son organisation émotive et sensorimotrice.

Cette fonction de traduction réciproque entre séquences d’images (les signifiants) et réseaux de catégories abstraites (les signifiés) nous suggère une hypothèse sur le type de structure mathématique dont nous avons besoin pour modéliser le langage : une catégorie qui organise la correspondance entre une algèbre et une structure de graphes. L’algèbre règle des opérations de lecture et d’écriture sur des textes tandis que la structure de graphe ordonne des opérations sur des nœuds et des liens orientés. À chaque texte correspond un réseau de concepts et vice versa. Les opérations dans le monde des textes reflètent des opérations dans le monde des graphes conceptuels. 

Nous avons besoin d’un langage régulier pour coder les chaînes de signifiants et nous pouvons transformer les séquences de symboles d’un langage régulier en arbres syntagmatiques (ou syntaxiques, la syntaxe étant l’ordre du syntagme) et réciproquement. Or, si son arbre syntagmatique – sa structure grammaticale interne – est indispensable à la compréhension du sens d’une phrase, il n’est pas suffisant. Car chaque expression linguistique se trouve au croisement d’un axe syntagmatique et d’un axe paradigmatique. L’arbre syntagmatique représente le réseau sémantique interne d’une phrase, l’axe paradigmatique représente son réseau sémantique externe et en particulier ses relations avec les phrases ayant même structure, mais dont elle se distingue. Pour comprendre la phrase «Je choisis le menu végétarien», il faut bien sûr reconnaître que le verbe est “choisir”, le sujet “je” et l’objet “le menu végétarien” et savoir en outre que “végétarien” qualifie “menu”. Mais il faut aussi reconnaître le sens des mots et savoir, par exemple, que végétarien s’oppose à carné et à végétalien, ce qui implique de sortir de la phrase pour situer ses composantes dans les systèmes d’oppositions sémantiques de la langue. L’établissement de relations sémantiques entre concepts suppose donc que l’on ait non seulement reconnu les arbres syntagmatiques internes aux phrases qui les expriment, mais aussi l’appartenance de ces concepts ou de leurs composants à des matrices paradigmatiques externes à la phrase, mais propres à la langue ou à certains domaines pratiques.

Parce que les langues naturelles sont ambiguës et irrégulières, j’ai inventé une langue mathématique (IEML) traductible en langues naturelles qui code algébriquement non seulement les arbres syntagmatiques, mais aussi les matrices paradigmatiques qui donnent sens aux mots ou aux concepts plus complexes. Chaque phrase de cette langue (chaque concept) est située précisément au croisement d’un arbre syntagmatique et de matrices paradigmatiques. 

Sur la base de la grille syntagmatique-paradigmatique régulière d’IEML, il devient possible de générer et de reconnaître des relations sémantiques entre concepts de manière fonctionnelle : graphes de connaissance, ontologies, modèles de données… Toujours du côté de l’IA, un codage des étiquettes ou de la catégorisation des données dans cette langue algébrique qu’est IEML faciliterait certainement l’apprentissage machine.

Sur le plan technique, il s’agit d’un projet léger et décentralisé: un dictionnaire IEML-langues naturelles, un analyseur syntaxique (parseur) open-source supportant les fonctions calculables sur les expressions de la langue et une plate-forme d’édition collaborative et de partage des concepts et ontologies. Sur le plan intellectuel, la formalisation du sens demanderait sûrement un sérieux effort collectif de recherche et de formation.

Au-delà de l’IA et des aspects techniques, ma vision politique – au sens noble du terme – est la suivante : IEML devrait être utilisé pour favoriser l’interopérabilité sémantique des mémoires numériques ainsi qu’une synergie entre l’augmentation de la puissance cognitive personnelle et l’augmentation de la transparence et de la réflexivité de l’intelligence collective, de l’échelle du petit groupe à celle de l’humanité.