Archives for category: French

Intelligence collective, intelligence artificielle et partage du savoir

12 July 2023 //

Prof. Pierre Lévy, PhD, MSRC

“Ce texte propose quelques réflexions philosophiques sur la relation triangulaire entre l’intelligence collective, l’intelligence artificielle et la noble finalité de mettre la connaissance à la portée de tous.”

La valeur du savoir vérifié à l’heure de l’IA générative

Commençons par une citation de Denny Vrandečić, un des initiateurs de Wikidata, qui avait travaillé sur le graphe de connaissances de Google comme ontologiste et qui est aujourd’hui le chef de file du projet “Abstract Wikipedia”[1] visant à rendre les données des articles de Wikipédia indépendants des langues (c’est-à-dire traductibles dans toutes les langues). Denny a déclaré dans sa communication à la Knowledge Graph Conference de mai 2023[2] “In a world of infinite content, knowledge becomes valuable”. Ce monde où les contenus sont potentiellement infinis résulte évidemment de l’usage désormais massif de l’intelligence artificielle générative. Parmi tous les problèmes que posent cette nouvelle situation, citons-en deux, particulièrement prégnants du point de vue de l’accès à la connaissance. Premièrement, malgré les usages qui sont faits des modèles génératifs pour obtenir rapidement des réponses directes, il faut réaffirmer que, contrairement à l’IA symbolique classique du XXe siècle, l’IA statistique (dite aussi neuronale) d’aujourd’hui – limitée à ses seules capacités – n’offre aucune garantie de vérité. GPT4 comme les autres modèles du même genre ne sont pas des bases de connaissances. Les erreurs de fait et de raisonnement sont nombreuses et il suffit d’être spécialiste d’un domaine pour constater les faiblesses de ces IA, comme nous le faisons d’habitude lorsque nous lisons un article portant sur un de nos domaines de compétence quand il est rédigé par un journaliste pressé qui se contente de reformuler la doxa dans laquelle il baigne. Les réponses – probabilistes – de Chat GPT sont seulement vraisemblables. Deuxièmement, comme les modèles d’IA générative sont entraînés sur les données du Web et que celles-ci sont de plus en plus rédigées et illustrées par les modèles en question, on se trouve en présence d’un dangereux cercle vicieux, et cela d’autant plus que les travailleurs au rabais chargés d’aligner les modèles et de redresser leurs biais ou erreurs utilisent eux-mêmes des IA génératives pour accomplir leur tâche![3] Pour s’extraire de ces sables mouvants épistémologiques, il est donc nécessaire d’investir plus que jamais dans la construction de sources d’information fiables. En d’autres termes, l’explosion des usages de l’IA générative, loin de nous dispenser d’alimenter et d’utiliser Wikipédia, Wikidata et d’autres bases de connaissances vérifiées, rend l’effort d’y contribuer et le plaisir de les consulter encore plus nécessaires! Ceci dit, comme nous le verrons par la suite, l’IA neuronale a néanmoins vocation à jouer un rôle positif dans le partage du savoir.

Ce texte propose quelques réflexions philosophiques sur la relation triangulaire entre l’intelligence collective, l’intelligence artificielle et la noble finalité de mettre la connaissance à la portée de tous.

L’intelligence collective

Étroitement définis comme des moyens de résoudre des problèmes, les processus d’intelligence collective[4] se présentent sous de multiples formes, dont les plus étudiées sont les espèces statistique, délibérative et stigmergique[5].

Au début du XXe siècle, en Angleterre, le savant Francis Galton visitait une foire agricole. Un concours avait été organisé: on demandait aux huit cents participants, la plupart éleveurs, de deviner le poids d’un bœuf. Mais aucun d’eux n’avait trouvé le poids exact. Galton fit la moyenne de toutes les évaluations et trouva qu’elle était beaucoup plus proche du poids réel qu’aucune des estimations individuelles. La “sagesse” de la foule était supérieure à chacune des intelligences isolées[6]. Cette forme d’intelligence collective statistique – ou comptable – suppose que les individus ne communiquent pas entre eux et ne se coordonnent d’aucune manière. Elle fonctionne d’autant mieux que la distribution des choix ou des prédictions s’étend sur un large spectre, de sorte que les erreurs et les biais individuels se compensent. Ce type d’intelligence collective suppose – paradoxalement – l’ignorance mutuelle. Elle s’exprime dans les sondages ou dans les élections, lorsqu’il est interdit de communiquer les résultats partiels avant que tout le monde ait voté. Cette approche de l’intelligence collective statistique sans connexion entre ses membres a été notamment popularisée par James Surowiecki dans son livre « la Sagesse des Foules »[7]

Une seconde forme d’intelligence collective, délibérative, repose au contraire sur la communication directe entre les membres d’une communauté. Elle résulte de l’échange des arguments et des points de vue. Face à un problème commun, elle peut converger sur un consensus ou se partager entre quelques solutions dont on a – tous ensemble – pesé le pour et contre. Pourvu que l’écoute soit au rendez-vous, chacun amène son point de vue, sa compétence particulière, qui enrichit le débat général[8]. Ce type d’intelligence collective, apparemment idéale puisqu’elle est ouverte et réflexive, est d’autant plus difficile à mettre en œuvre que la collectivité est étendue. Il faut alors établir des formes de hiérarchie et de délégation, certes indispensables mais qui troublent la transparence de l’intelligence collective à elle-même.

Je voudrais maintenant introduire une forme d’intelligence collective moins connue mais qui n’en est pas moins à l’œuvre dans nombre de sociétés animales et qui a trouvé son plus haut degré d’achèvement dans l’humanité: la communication stigmergique. L’étymologie grecque explique assez bien le sens du mot « stigmergie » : des marques (stigma) sont laissées dans l’environnement par l’action ou le travail (ergon) de membres d’une collectivité, et ces marques guident en retour – et récursivement – leurs actions[9]. Le cas classique est celui des fourmis qui laissent une traîne de phéromones sur leur passage lorsqu’elles ramènent de la nourriture à la fourmilière. L’odeur des phéromones incite d’autres fourmis à remonter leurs traces pour découvrir le butin et ramener des vivres à la ville souterraine en laissant par terre à leur tour un message parfumé. Le langage confère à l’humanité un haut degré d’intelligence collective, supérieur à celui des autres mammifères et comparable à celui des abeilles ou des fourmis. Comme d’autres espèces eusociales, nous communiquons en grande partie de manière stigmergique, mais au lieu de marquer un territoire physique au moyen de phéromones ou d’autres types de signaux visuels, sonores ou olfactifs, nous laissons des traces symboliques. Au fur et à mesure de l’évolution culturelle, les signifiants s’accumulent dans des mémoires externes de plus en plus perfectionnées : pierres levées, totems, paysages sculptés, monuments, architectures, signes d’écriture, archives, bibliothèques, bases de données. On peut prétendre que toute forme d’écriture qui n’est pas précisément adressée est une forme de communication stigmergique : des traces sont déposées pour une lecture à venir et font office de mémoire externe d’une communauté.

Les différents processus d’intelligence collectives qui viennent d’être évoqués, statistique (sans communication), délibératifs (à communication directe) et stigmergique (à communication indirecte) ne sont évidemment pas exclusives l’une de l’autre et peuvent fort bien se succéder ou se combiner. Par exemple, les wikipédiens se coordonnent par l’intermédiaire de bases de données communes, délibèrent et votent.

A l’échelle de l’espèce, l’intelligence collective humaine se situe dans la continuité de l’intelligence collective animale, mais elle est plus perfectionnée à cause du langage, des techniques et des institutions politiques, économiques, légales et autres qui nous caractérisent. La principale différence entre les intelligences collectives animale et humaine tient à la culture. Dans une dimension diachronique, notre espèce est entraînée par une vitesse d’apprentissage supérieure à celle de l’évolution biologique. Nos savoir-faire s’accumulent et se transmettent d’une génération à l’autre grâce à nos mémoires externes, au moyen de systèmes de signes, de conventions sociales et d’outils. Aucun individu ne serait « intelligent » s’il n’héritait pas des connaissances créées par les ancêtres. Dans une dimension synchronique, nous participons à une intelligence collective coordonnée où résonnent et se relancent l’architecture conceptuelle de nos mémoires communes et l’organisation sociale de nos collectivités. La définition réciproque des identités et la reconnaissance des problèmes se décident à ce méta-niveau de la culture. Au-delà des procédures utiles (stigmergique, statistique et délibérative) pour résoudre des problèmes, il existe donc une intelligence collective plus holistique, qui circonscrit les capacités cognitives d’une société.

L’évolution culturelle a déjà franchi plusieurs seuils d’intelligence collective. En effet, les inventions de l’écriture, de l’imprimerie et des médias électroniques (enregistrement musical, téléphone, radio, télévision) ont déjà augmenté de manière irréversible nos capacités de mémoire et de communication sociale. Le surgissement d’une communication globale par l’intermédiaire de la mémoire numérique est probablement le plus grand changement social des vingt-cinq dernières années. Cette nouvelle forme de communication par lecture-écriture distribuée dans une mémoire numérique collective représente une mutation anthropologique de grande ampleur. Plongés dans le nouvel environnement numérique, nous interagissons par le moyen de la masse océanique de données qui nous rassemble. Les encyclopédistes de Wikipédia et les programmeurs de GitHub collaborent par l’intermédiaire d’une même base de données. A notre insu, chaque lien que nous créons, chaque étiquette ou hashtag apposée sur une information, chaque acte d’évaluation ou d’approbation, chaque « j’aime », chaque requête, chaque achat, chaque commentaire, chaque partage, toutes ces opérations modifient subtilement la mémoire commune, c’est-à-dire le magma inextricable des rapports entre les données. Notre comportement en ligne émet un flux continuel de messages et d’indices qui transforment la structure de la mémoire et contribuent à orienter l’attention et l’activité de nos contemporains. Nous déposons dans l’environnement virtuel des phéromones électroniques qui déterminent en boucle l’action des autres internautes et qui entraînent par-dessus le marché les neurones formels des intelligences artificielles (IA).

L’intelligence artificielle comme augmentation de l’intelligence collective

Abordons maintenant le thème de l’intelligence artificielle, mais sous l’angle – qui paraîtra peut-être insolite à quelques lecteurs – de l’intelligence collective. Les journalistes et le grand public ont tendance à classer dans “l’intelligence artificielle” les applications considérées comme avancées à l’époque où elles apparaissent. Mais quelques années plus tard ces mêmes applications, devenues banales et quotidiennes, seront le plus souvent réinterprétées comme appartenant à l’informatique ordinaire[10]. Par delà les titres apocalyptiques et les images de jeunes femmes au cerveau chromé censées illustrer “l’intelligence artificielle”, nous assistons depuis le milieu du XXe siècle à un processus de réification formelle et d’extériorisation des fonctions cognitives. L’augmentation de puissance et la baisse des coûts du matériel distribuent ces fonctions cognitives objectivées dans l’ensemble de la société. Des machines interconnectées enregistrent et retrouvent de l’information, effectuent des calculs arithmétiques ou algébriques, simulent des phénomènes complexes, raisonnent logiquement, respectent des syntaxes et des systèmes de règles, extraient des formes à partir de distributions statistiques enchevêtrées… L’informatique automatise et socialise nos capacités de communication, nos facultés de mémoire, de perception, d’apprentissage, d’analyse et de synthèse.

Du fait même de son nom, l’intelligence artificielle évoque naturellement l’idée d’une intelligence autonome de la machine, qui se pose en face de l’intelligence humaine, pour la simuler ou la dépasser. Mais si nous observons les usages réels des dispositifs d’intelligence artificielle, force est de constater que, la plupart du temps, ils augmentent, assistent ou accompagnent les opérations de l’intelligence humaine. Déjà, à l’époque des systèmes experts – lors des années 80 et 90 du XXe siècle – j’observais que les savoirs critiques de spécialistes au sein d’une organisation, une fois codifiés sous forme de règles animant des bases de connaissances, pouvaient être mis à la portée des membres qui en avaient le plus besoin, répondant précisément aux situations en cours et toujours disponibles. Plutôt que d’intelligences artificielles prétendument autonomes, il s’agissait de médias de diffusion des savoir-faire pratiques, qui avaient pour principal effet d’augmenter l’intelligence collective des communautés utilisatrices[11].

Dans la phase actuelle du développement de l’IA, le rôle de l’expert est joué par les foules qui produisent les données et le rôle de l’ingénieur cogniticien qui codifie le savoir est joué par les réseaux neuronaux. Au lieu de demander à des linguistes comment traduire ou à des auteurs reconnus comment produire un texte, les modèles statistiques interrogent à leur insu les multitudes de rédacteurs anonymisés du web et ils en extraient automatiquement des patterns de patterns qu’aucun programmeur humain n’aurait pu tirer au clair. Conditionnés par leur entraînement, les algorithmes peuvent alors reconnaître et reproduire des données correspondant aux formes apprises. Mais parce qu’ils ont abstrait des structures plutôt que de tout enregistrer, les voici capables de conceptualiser correctement des formes (d’image, de textes, de musique, de code…) qu’ils n’ont jamais rencontrées et de produire une infinité d’arrangements symboliques nouveaux. C’est pourquoi l’on parle d’intelligence artificielle générative. L’IA neuronale synthétise et mobilise la mémoire commune. Bien loin d’être autonome, elle prolonge et amplifie l’intelligence collective. Des millions d’utilisateurs contribuent au perfectionnement des modèles en leur posant des questions et en commentant les réponses qu’ils en reçoivent. On peut prendre l’exemple de Midjourney, dont les utilisateurs s’échangent leurs consignes (prompts) et améliorent constamment leurs compétences en IA. Les serveurs Discord de Midjourney sont aujourd’hui les plus populeux de la planète, avec plus d’un million d’utilisateurs. Une nouvelle intelligence collective stigmergique émerge de la fusion des médias sociaux, de l’IA et des communautés de créateurs.

L’IA contemporaine fonctionne ainsi comme le conduit d’une boucle de rétroaction entre la mémoire numérique commune et les productions individuelles qui l’exploitent et s’accumulent à leur tour dans les centres de données. Derrière la machine il faut entrevoir l’intelligence collective qu’elle réifie et mobilise.

Le partage du savoir : vers une intelligence collective neurosymbolique

L’intelligence collective aujourd’hui supportée par l’intelligence artificielle n’est encore que partielle. En effet, l’utilisation des données de l’Internet pour entraîner les modèles mobilise les intelligences collectives stigmergique (la boucle de rétroaction entre les comportements individuels et la mémoire commune) et statistique (l’apprentissage neuronal). Au début des années 2020, la connexion et le renforcement mutuel de ces deux formes d’intelligence collective par les nouveaux dispositifs d’intelligence artificielle a provoqué un choc intellectuel – et des émotions fortes – chez ceux qui en ont aperçu la puissance. Mais une intelligence collective délibérative et réflexive manque encore à l’appel. A l’échelle où nous nous situons, cette intelligence collective délibérative doit porter sur l’organisation des données, c’est-à-dire sur la structure conceptuelle de la mémoire, inévitablement couplée aux pratiques des communautés. Comment faire en sorte que les réseaux de concepts qui informent la mémoire numérique puissent faire l’objet d’une conversation ouverte, transparente, attentive aux conséquences de ses choix? Le Web sémantique et son empilement de standards (XML, RDF, OWL, SPARQL) a certes établi une interopérabilité de formats, mais non pas l’interopérabilité proprement sémantique – celle des architectures de concepts – dont nous avons besoin. Les géants du web ont leurs graphes de connaissances, mais ces derniers sont malheureusement privés et secrets. Wikidata propose un exemple de graphe de connaissance ouvert, mais il est encore bien difficile à explorer et utiliser quotidiennement par le grand public. Il se présente de plus comme une ontologie, celle de l’encyclopédie Wikipédia, alors qu’il faudrait mettre en harmonie et en dialogue la multitude des ontologies qui émergent de pratiques aussi diverses que l’on voudra.

C’est pour résoudre ce problème de l’émergence d’une intelligence collective délibérative (ou réflexive) à support numérique que j’ai inventé IEML (Information Economy MetaLanguage) : une langue artificielle pourvue d’une structure algébrique régulière, dont la sémantique est calculable, qui permet de tout dire et qui peut traduire n’importe quel réseau de concept[12]. IEML est un langage à source ouverte, qui se place dans la perspective d’une augmentation des communs de la connaissance, et dont le développement doit faire l’objet d’une gouvernance décentralisée. Aussi hétérogènes ou divers qu’ils soient, IEML projette les ontologies, graphes de connaissances, collections d’étiquettes et modèles de données sur le même système de coordonnées sémantique : un univers virtuellement infini de différences conceptuelles donnant prise aux algorithmes. IEML peut servir de langage pivot entre les langues naturelles, entre les humains et les machines, entre les modèles d’IA. Il va sans dire que la plupart de ses bénéficiaires n’auront pas à l’apprendre puisque les interfaces des applications, y compris l’éditeur lui-même, seront en langues naturelles ou sous forme iconique. La face « code » d’IEML n’est destinée qu’aux ordinateurs. On peut dès lors envisager qu’une multitude de bases de connaissances aux architectures conceptuelles singulières puissent échanger des modules ontologiques et des informations grâce à l’interopérabilité sémantique assurée par ce langage de métadonnées commun.

Considérons maintenant l’idéal des lumières de mettre la connaissance à la portée de tous. Cette finalité dépasse l’objet « encyclopédie » – qui n’est finalement qu’un moyen particulier adapté aux possibilités techniques et culturelles d’une époque – pour ouvrir de vastes horizons et retentir jusque dans un avenir encore inimaginable.

Ce concept se décompose en deux exercices complémentaires: (a) celui de permettre à toutes les connaissances de s’exprimer, de s’accumuler et de communiquer ; (b) celui de faciliter l’exploration et l’appropriation des connaissances selon la gamme étendue des situations pratiques, des parcours d’apprentissage et des styles cognitifs. On voit l’affinité de cet idéal avec celui d’une intelligence collective – diamétralement opposée au “group think” – qui vise à maximiser simultanément la liberté créatrice et l’efficacité collaborative.

On pardonnera au philosophe que je suis l’évocation d’une utopie concrète, sans doute techniquement réalisable, mais qui – à court terme – vise d’abord à faire penser. Imaginons donc un dispositif destiné au partage des connaissances et qui tire le maximum des possibilités techniques contemporaines. Au cœur de ce dispositif évolue un écosystème ouvert de bases de connaissances catégorisées en IEML, qui émergent d’une multitude de communautés de recherche et de pratique. Entre ce noyau de bases de connaissances interopérables et les utilisateurs humains vivants s’interpose une interface neuronale (un écosystème de modèles) « no code » qui donne accès au contrôle, à l’alimentation, à l’exploration et à l’analyse des données. Tout se passe de manière intuitive et directe, selon les modalités sensori-motrices sélectionnées. C’est aussi par l’intermédiaire de ce giga-perceptron – un métavers immersif, social et génératif – que les collectifs échangent et discutent les modèles de données et réseaux sémantiques qui organisent leurs mémoires. En bonne gestion des connaissances, le nouveau dispositif de partage des savoirs favorise l’enregistrement des créations, accompagne les parcours d’apprentissage et présente les informations utiles aux acteurs engagés dans leurs pratiques.

Pour ce qui est commun, chaque base de connaissance – personnelle ou collective – affiche son univers de discours, ses données et ses statistiques, aussi transparente aux algorithmes qu’elle l’est aux regards humains. Mais pour ce qui est privé, notre dispositif de partage des connaissances assure la souveraineté pratique et légale des individus et des groupes sur les données qu’ils produisent et qu’ils ne divulguent qu’aux acteurs choisis.

L’augmentation décisive de la dimension délibérative de l’intelligence collective grâce à l’utilisation d’un langage de métadonnées commun a des effets multiplicateurs sur les intelligences collectives statistique et stigmergique déjà à l’œuvre aujourd’hui. Une nouvelle infrastructure neurosymbolique plonge l’intelligence collective du futur dans l’univers explorable émanant de ses propres activités cognitives. Il faut cependant bien distinguer l’intelligence collective qui anime les personnes et les collectivités humaines vivantes des extensions mécaniques et des représentations médiatiques qui l’augmentent. Ne faisons pas une idole de l’intelligence artificielle.

Citant Ibn Roshd (l’Averroes des latins), Dante écrit au chapitre I, 3 de sa Monarchie : “Le terme extrême proposé à la puissance de l’humanité est la puissance, ou vertu, intellective. Et parce que cette puissance ne peut, d’un seul coup, se réduire toute entière en acte par le moyen d’un seul homme ou d’une communauté particulière, il est nécessaire qu’il règne dans le genre humain une multitude par le moyen de laquelle soit mise en acte cette puissance toute entière.” Que cette multitude devienne transparente à elle-même dans le nouveau médium algorithmique et nous serons passés de la fourmilière à la cité.

[1] https://meta.wikimedia.org/wiki/Abstract_Wikipedia consulté le 8 juillet 2023

[2] https://www.knowledgegraph.tech/ consulté le 8 juillet 2023

[3] https://www.theregister.com/2023/06/16/crowd_workers_bots_ai_training consulté le 8 juillet 2023

[4] Lévy, Pierre. L’Intelligence collective. Pour une anthropologie du cyberespace. Paris: La Découverte, 1994.

[5] Voir par exemple : Baltzersen, Rolf. Cultural-Historical Perspectives on Collective Intelligence: Patterns in Problem Solving and Innovation. Cambridge, Mass: Cambridge University Press, 2022.

[6] Galton, Francis 1907, Vox populi, Nature, 75, 450-451.

[7] Surowiecki, James. The Wisdom of Crowds. Doubleday, 2004

[8] Voir par exemple : Zara, Olivier. Le chef parle toujours en dernier: Manifeste de l’intelligence collective, Axiopole, 2021, et Mulgan, Geoff. Big Mind. How Collective Intelligence Can Change Our World. Princeton: Princeton University Press, 2017.

[9] Heylighen, Francis. “Stigmergy as a Universal Coordination Mechanism I: Definition and Components.” Cognitive Systems Research 38 (2016): 4–13. https://doi.org/10.1016/j.cogsys.2015.12.002

Heylighen, Francis. “Stigmergy as a Universal Coordination Mechanism II: Varieties and Evolution.” Cognitive Systems Research, 2016, 50–59. https://doi.org/10.1016/j.cogsys.2015.12.007

[10] Lévy, Pierre. “Pour un changement de paradigme en Intelligence artificielle”, Giornale di Filosofia (Roma) numéro spécial sur Technology and Constructive Critical Thought, 15 décembre 2021

[11] Lévy, Pierre. “Les systèmes à base de connaissance comme médias de transmission de l’expertise”, Intellectica numéro spécial “Expertise et sciences cognitives”, ed. Violaine Prince. 1991. p. 187 – 219.

[12] Lévy, Pierre. La Sphère Sémantique. Computation, Cognition, Économie de l’information. Paris-London: Hermès-Lavoisier, 2011.

Pierre Lévy, “Calculer la sémantique avec le langage IEML”, Humanités numériques [Online], 8 | 2023, Online since 01 December 2023, connection on 26 November 2024. URL: http://journals.openedition.org/revuehn/3836; DOI: https://doi.org/10.4000/revuehn.3836

Tags artificial intelligence, categorization, Collective intelligence, IEML

Categories French, Semantic Sphere

LA SPHÈRE PUBLIQUE NUMÉRIQUE

12 May 2023 //

Comment penser la nouvelle sphère publique numérique? Je commencerai par évoquer le contexte anthropologique et démographique du basculement de la sphère publique dans l’environnement numérique. Dans un second temps, j’analyserai les nouvelles formes de mémoire et de communication supportées par le nouveau médium. J’évoquerai ensuite les figures de la domination et de l’aliénation propres à ce milieu de communication. Je terminerai, comme il se doit, par quelques perspectives d’émancipation.

1 Le contexte

Une nouvelle époque de la culture

Un des facteurs principaux de l’évolution des écosystèmes d’idées réside dans le dispositif matériel de production et de reproduction des symboles, mais aussi dans les systèmes « logiciels » d’écriture et de codage de l’information. Au cours de l’histoire, les symboles (avec les idées qu’ils portaient) ont été successivement pérennisés par l’écriture, allégés par l’alphabet et le papier, multipliés par l’imprimerie et les médias électriques.

A chaque étape, de nouvelles formes politiques sont apparues : villes, palais-temples et premiers états avec l’écriture, empires et cités avec l’alphabet ou le papier, états nations avec l’imprimerie et les médias électroniques.

Les symboles sont aujourd’hui numérisés et calculés, c’est-à-dire qu’une foule de robots logiciels – les algorithmes – les enregistrent, les comptent, les traduisent et en extraient des patterns. Les objets symboliques (textes, images fixes ou animées, voix, musiques, programmes, etc.) sont non seulement enregistrés, reproduits et transmis automatiquement, ils sont aussi générés et transformés de manière industrielle. En somme, l’évolution culturelle nous a menés au point où les écosystèmes d’idées se manifestent sous l’avatar de données animées par des algorithmes dans un espace virtuel ubiquitaire. Et c’est dans cet espace que se nouent, se maintiennent et se dénouent les liens sociaux, là que se jouent désormais les drames de la Polis…

Le basculement démographique

L’hypothèse d’une mutation anthropologique rapide et de grande ampleur se fonde sur des données quantitatives qui ne prêtent pas à controverse.

Accès aux ordinateurs

Concernant l’accès aux ordinateurs, on peut considérer que 0,1 pour cent de la population mondiale avait un accès direct à un ordinateur en 1975 (avant la révolution de l’ordinateur personnel). Cette proportion se montait à 20% dans les pays riches en 1990 (avant la révolution du Web). En 2022, pour les pays européens, la proportion oscillait entre 65% (Grèce) et 95% (Luxembourg). A noter que ces derniers chiffres ne prennent pas en compte les téléphones portables.

Accès à l’Internet

La proportion de la population mondiale qui avait accès à l’Internet était d’environ 1% en 1990 (donc avant le Web), de 4% en 1999, de 24% en 2009, de de 51% en 2018 et de 65% en 2023. Selon l’Organisation internationale des télécommunications, environ 5 milliards de personnes sont des internautes. Toujours pour 2023, mais seulement en Europe, la proportion de la population branchée à l’Internet se monte à 93% (ce sont les données de l’Union Européenne).

Prise de connaissance des nouvelles

Pour compléter ces statistiques avec des données concernant plus directement la politique, 40% des européens et 50% des américains et canadiens prennent connaissance des nouvelles par les médias sociaux (je dis bien les médias sociaux et pas l’Internet en général). On dépasse partout les 50% pour les moins de quarante ans. Pour les données spécifiques concernant la lecture des journaux par opposition à la lecture de textes en ligne, les moins de trente ans lisent les nouvelles en ligne à 80% (données du Pew Research Center).

2 Mémoire et communication numérique

La nouvelle sphère publique

En somme, moins d’un siècle après l’invention des premiers ordinateurs, plus de soixante cinq pour cent de la population mondiale est branchée à l’internet et la mémoire du monde est numérisée. Qu’une information se trouve en un point du réseau et la voici partout. Du texte statique sur papier, nous sommes passé à l’hypertexte ubiquitaire, puis à l’Architexte surréaliste qui rassemble tous les symboles. Une mémoire virtuelle s’est mise à croître, secrétée par des milliards de vivants et de morts, fourmillant de langues, de musiques et d’images, grosse de rêves et de fantasmes, mêlant la science et le mensonge. La nouvelle sphère publique est multimédia, interactive, mondiale, fractale, stigmergique et – désormais – médiée par l’intelligence artificielle.

La nouvelle sphère publique est mondiale. Aussi bien le web que les grands médias sociaux comme Facebook, Twitter, LinkedIn, Telegram, Reddit, etc. sont internationaux et multilingues. La traduction automatique a atteint un point ou l’on peut maintenant comprendre, avec quelques erreurs, ce qu’un internaute écrit dans une autre langue. J’ajoute que, parallèlement à la traduction, la synthèse automatique de longs textes progresse, ce qui ajoute à la porosité des diverses bulles cognitives et sémantiques.

La sphère publique numérique est fractale, c’est-à-dire qu’elle se subdivise en sous-groupes, eux-mêmes subdivisés en sous-groupes, et ainsi de suite récursivement, avec toutes les réunions et intersections imaginables. Ces subdivisions recoupent des distinctions de plateformes, de langues, de zones géographiques, de centres d’intérêts, d’orientations politiques, etc. On peut donner comme exemples les groupes Facebook ou LinkedIn, les serveurs Discord, les canaux YouTube ou Telegram, les communautés de Reddit, etc.

L’intelligence collective stigmergique

Si l’échange de messages point à point a toujours lieu, la majeure part de la communication sociale s’effectue désormais de manière stigmergique. La notion de stigmergie est une des clés de la compréhension du fonctionnement de la sphère publique numérique. On distingue traditionnellement trois schémas de communication : un-un, un-plusieurs et plusieurs-plusieurs. Le schéma un-un correspond au dialogue, au courrier postal classique ou au téléphone traditionnel. Le schéma un-plusieurs décrit le dispositif où un éditeur/émetteur central envoie ses messages à une masse de récepteurs dits « passifs ». Ce dernier schéma correspond à la presse, au disque, à la radio et à la télévision. Internet représente une rupture parce qu’il permet à l’ensemble des participants d’émettre pour un grand nombre de récepteurs selon un schéma en réseau décentralisé « plusieurs vers plusieurs ». Cette dernière description est néanmoins trompeuse. En effet, si tout le monde émet pour tout le monde (ce qui est le cas), tout le monde ne peut pas écouter tout le monde. Ce qui se passe en réalité est que les internautes contribuent à alimenter une mémoire commune et prennent connaissance en retour du contenu de cette mémoire par l’intermédiaire de procédures de recherche et de sélection automatisées. Ce sont les fameux algorithmes de Google, (Page Rank), de Facebook, de Twitter, d’Amazon (recommandations), etc.

L’étymologie grecque explique assez bien le sens du mot « stigmergie » : des marques (stigma) sont laissées dans l’environnement par l’action ou le travail (ergon) de membres d’une collectivité, et ces marques guident en retour – et récursivement – leurs actions. Le cas classique est celui des fourmis qui laissent une traîne de phéromones sur leur passage lorsqu’elles ramènent de la nourriture à la fourmilière. L’odeur des phéromones incite d’autres fourmis à remonter leurs traces pour découvrir le butin et ramener des vivres à la ville souterraine en laissant par terre à leur tour un message parfumé.

On peut prétendre que toute forme d’écriture qui n’est pas précisément adressée est une forme de communication stigmergique : des traces sont déposées pour une lecture à venir et font office de mémoire externe d’une communauté. Si le phénomène est fort ancien, il a pris depuis le début du siècle une nouvelle ampleur. Plongés dans la nouvelle sphère publique numérique, nous communiquons par l’intermédiaire de la masse océanique de données qui nous rassemble. Les encyclopédistes de Wikipédia et les programmeurs de GitHub collaborent par l’intermédiaire d’une même base de données. A notre insu, chaque lien que nous créons, chaque étiquette ou hashtag apposée sur une information, chaque acte d’évaluation ou d’approbation, chaque « j’aime », chaque requête, chaque achat, chaque commentaire, chaque partage, toutes ces opérations modifient subtilement la mémoire commune, c’est-à-dire le magma inextricable des rapports entre les données. Notre comportement en ligne émet un flux continuel de messages et d’indices qui transforment la structure de la mémoire et contribuent à orienter l’attention et l’activité de nos contemporains. Nous déposons dans l’environnement virtuel des phéromones électroniques qui déterminent en boucle l’action des autres internautes et qui entraînent par-dessus le marché les neurones formels des intelligences artificielles (IA).

Le rôle de l’Intelligence artificielle dans la nouvelle sphère publique

La mémoire numérique est détachée de son lieu d’émission et de réception, mise en commun, en attente de lecture, suspendue dans les “nuages” de l’Internet, logicielle. Cette masse de donnée est maintenant compressée par des modèles neuronaux. Et les patterns cachés dans les myriades de couches et de connexions des cerveaux électroniques font retomber en pluie des objets symboliques inédits. Nous ne semons des données que pour récolter du sens.

L’IA nous offre un nouvel accès à la mémoire numérique mondiale. C’est aussi une manière de mobiliser cette mémoire pour automatiser des opérations symboliques de plus en plus complexes, impliquant l’interaction d’univers sémantiques et de systèmes de comptabilité hétérogènes.

3 Le côté obscur

L’état-plateforme et la nouvelle bureaucratie dans les nuages

Si les analyses qui précèdent ont quelque validité, le pouvoir politique se joue pour une bonne part dans la sphère publique numérique. Or son contrôle ultime se trouve « dans les nuages », aux mains des bureaucraties célestes qui calculent les interactions sociales et la mémoire. Les nuages, c’est-à-dire les réseaux de centres de données possédées par l’oligopole des GAFAM, BATX et compagnie. C’est pourquoi les prétendants à l’hégémonie politique mondiale, essentiellement les américains et les chinois, s’allient avec les seigneurs des données – ou les soumettent – parce que les oligarques numériques détiennent le contrôle matériel de la mémoire mondiale et de la sphère publique. Eux seuls ont d’ailleurs la capacité de mémoire et la puissance de calcul nécessaires à l’entraînement des modèles d’IA généraux dits « fondationnels ». Ce que j’appelle un État-Plateforme résulte de l’imbrication d’une super-puissance politique avec une fraction de l’oligarchie numérique.

La bureaucratie des nuages est plus efficace que celle des états-nations, héritée de l’ère de l’imprimerie. Déjà, plusieurs fonctions gouvernementales ou régaliennes sont assurées par les grandes plateformes ou par des réseaux numériques « décentralisés ». La liste qui suit n’est pas close :

Vérification de l’identité des personnes, reconnaissance faciale
Cartographie et cadastre
Création monétaire
Régulation du marché
Éducation et recherche
Fusion de la défense et de la cyberdéfense
Contrôle de la sphère publique, censure, propagande, “nudge” (coup de pouce statitique)
Surveillance
Biosurveillance

Les médias sociaux : addictions et manipulations

Notre allégeance aux seigneurs des données vient de la puissance de leurs centres de calcul, de leur efficacité logicielle et de la simplicité de leurs interfaces. Elle trouve aussi sa source dans notre dépendance à une architecture sociotechnique toxique, qui utilise la stimulation dopaminergique et les renforcements narcissiques addictifs de la communication numérique pour nous faire produire toujours plus de données. On sait combien, de ce point de vue, la santé mentale des populations adolescentes est à risque. En plus de la biopolitique évoquée par Michel Foucault, il faut donc maintenant considérer une psychopolitique à base de neuromarketing, de données personnelles et de gamification du contrôle.

Il faut s’y faire : la Polis a basculé dans la grande base de données mondiale de l’Internet. Dès lors, les luttes de pouvoir – toutes les luttes de pouvoir, qu’elles soient économiques, politiques ou culturelles – sont reconduites et compliquées dans le nouvel espace numérique. Sur le terrain glissant des médias sociaux, les camps qui s’affrontent disposent leurs armées de trolls coordonnées en temps réel, équipées de bots dernier cri, renseignées par l’analyse automatique des données et augmentées par l’apprentissage machine. Dans la guerre civile mondiale qui fait rage, politique intérieure et extérieure inextricablement mêlées, les nouveaux mercenaires sont les influenceurs.

Mais toutes ces nouveautés n’invalident pas les règles classiques de la propagande, toujours d’actualité : répétition continuelle, simplicité des mots d’ordre, images mémorables, provocation affective et résonnance identitaire. Personne n’oublie non plus les conseils avisés de Machiavel pour amener l’ennemi à s’auto-détruire : « La guerre secrète consiste à se mettre dans la confidence d’une ville divisée, à se porter pour médiateur entre les deux partis jusqu’à ce qu’ils en viennent aux armes : et quand l’épée est enfin tirée à donner des secours prudemment dosés au parti le plus faible, autant dans le but de faire durer la guerre et de les laisser se consumer les uns par les autres, que pour se garder, par un secours trop massif, de révéler son dessein de les opprimer et de les maîtriser tous deux également. Si l’on suit soigneusement cette marche, on arrive presque toujours à son but. »[1]

La tête baissée sur nos smartphones, nous faisons tourner en boucle les stéréotypes qui renforcent nos identités éclatées et nos mémoires courtes sous le regard narquois des experts de l’intoxication, communicants stipendiés, spécialistes du marketing et agents d’influence géopolitiques…

IA et domination culturelle

Poursuivons cette revue des côtés obscurs de la nouvelle sphère publique par les enjeux de domination culturelle liés à l’Intelligence artificielle. On parle beaucoup des « biais » de tel ou tel modèle d’intelligence artificielle, comme s’il pouvait exister une IA non-biaisée ou neutre. Cette question est d’autant plus importante que, comme je l’ai suggéré plus haut, l’IA devient notre nouvelle interface avec les objets symboliques : stylo universel, lunettes panoramiques, haut-parleur général, programmeur sans code, assistant personnel. Les grands modèles de langue généralistes produits par les plateformes dominantes s’apparentent désormais à une infrastructure publique, une nouvelle couche du méta-médium numérique. Ces modèles généralistes peuvent être spécialisés à peu de frais avec des jeux de données issues d’un domaine particulier et de méthodes d’ajustement. On peut aussi les munir de bases de connaissances dont les faits ont été vérifiés.

Les résultats fournis par une IA découlent donc de plusieurs facteurs qui contribuent tous à son orientation ou si l’on préfère, à ses « biais ». a) Les algorithmes proprement dits sélectionnent les types de calcul statistique et les structures de réseaux neuronaux. b) Les données d’entraînement favorisent les langues, les cultures, les options philosophiques, les partis-pris politiques et les préjugés de toutes sortes de ceux qui les ont produites. c) Afin d’aligner les réponses de l’IA sur les finalités supposées des utilisateurs, on corrige (ou on accentue!) « à la main » les penchants des données par ce que l’on appelle le RLHF (Reinforcement Learning from Human Feed-back – en français : apprentissage par renforcement à partir d’un retour d’information humain). d) Finalement, comme pour n’importe quel outil, l’utilisateur détermine les résultats au moyen de consignes en langue naturelle (les fameux prompts). Il faut noter que des communautés d’utilisateurs s’échangent et améliorent collaborativement de telles consignes. La puissance de ces systèmes n’a d’égal que leur complexité, leur hétérogénéité et leur opacité. Le contrôle règlementaire de l’IA, sans doute nécessaire, semble difficile.

4 Perspectives d’émancipation

Littéracie numérique et pensée critique

Malgré tout ce qui vient d’être dit, la sphère publique du XXIe siècle est plus ouverte que celle du XXe siècle : les citoyens des pays démocratiques y jouissent d’une grande liberté d’expression et peuvent choisir leurs sources d’information parmi un vaste éventail de spécialisations thématiques, de langues et d’orientations politiques. Cette liberté d’expression et d’information, la nouvelle puissance distribuée de création et d’analyse de données, sans oublier les possibilités de coordination sociale offertes par le nouveau médium, tout cela ne représente que des potentialités émancipatrices. Seule une véritable éducation à la pensée critique dans le nouvel environnement de communication permettra d’actualiser ce potentiel de citoyenneté renouvelée. Pour fixer les idées, une étude de la BBC a récemment montré que 50% des jeunes gens de 12 à 16 ans croient aux nouvelles partagées sur les médias sociaux sans les vérifier. Et nous savons d’expérience que les enfants ne sont pas les seuls sujets crédules. Idéalement, la nouvelle éducation à la pensée critique devrait enseigner aux futurs citoyens à s’organiser comme de petites agences de renseignement autonomes qui rangent leurs centres d’intérêts par ordre de priorité, sélectionnent soigneusement des sources diversifiées, analysent les données à partir d’hypothèses explicites et maintiennent une classification pertinente de leur mémoire numérique personnelle. Il faut apprendre à discerner les sources de données en termes de catégories organisatrices, de récits dominants et d’agendas. On inculquera le réflexe journalistique élémentaire de croiser les sources ainsi identifiées. Enfin, les élèves devraient être entraînés à l’intelligence collective stigmergique et à l’apprentissage collaboratif.

Pour une gouvernance de la sphère publique numérique

Je me contenterai ici d’indiquer quelques grandes orientations d’une nécessaire gouvernance de la nouvelle sphère publique plutôt que de déterminer précisément les moyens d’y parvenir. Si le pilotage par gros temps peut nécessiter de nombreux détours, le cap est clair : il s’agit de perfectionner, autant que possible, la dimension réflexive d’une intelligence collective déjà en acte.

A l’appui de cette finalité, la transparence des processus en ligne semble une condition sine qua non. Je vise en particulier, mais pas seulement, une description claire, brève et en langue naturelle des algorithmes et des données d’entraînement des IA.
A l’exemple de Wikimédia, efforçons-nous de maximiser les « communs » de la connaissance.
Ouvrons les jeux de données et les algorithmes selon la voie tracée par le mouvement du logiciel libre.
Assurons la souveraineté pratique et légale des individus et des groupes sur les données qu’ils produisent.
Enfin, décentralisons la gouvernance des interactions en ligne en favorisant les procédures consensuelles. Le mouvement social qui porte la blockchain indique ici un chemin possible.

Afin d’apporter ma pierre au projet d’une intelligence collective réflexive j’ai inventé une langue (IEML, Information Economy MetaLanguage) ayant la même capacité d’expression et de traduction que les langues naturelles mais qui a aussi la régularité d’une algèbre, permettant ainsi un calcul de la sémantique. Cette langue pourrait servir de système de coordonnées sémantique à la nouvelle sphère publique. Elle contribuerait ainsi à transformer la mémoire numérique en miroir de nos intelligences collectives. Dès lors, une boucle de rétroaction plus fluide entre les écosystèmes d’idées et les communautés qui les entretiennent nous rapprocherait de l’idéal d’une intelligence collective réflexive au service du développement humain et d’une démocratie renouvelée. Il ne s’agit pas d’entretenir quelque illusion sur la possibilité d’une transparence totale, mais plutôt d’ouvrir la voie à l’exploration critique d’un univers de sens infini.

[1] Discours sur la première décade de Tite-Live. La Pléiade, Gallimard, Paris, p. 588

Tags artificial intelligence, Collective intelligence, démocratie, pensée critique

Categories French, Sphère sémantique

LE VIRTUEL ET LES TROIS CERVEAUX

25 April 2023 //

A mi-chemin entre l’impossible et le nécessaire, le possible est un concept logique. Par contraste, le virtuel est un mode d’être qui relève de la physique, de la biologie, de la psychologie et de la technologie. On peut le rapprocher de la notion dynamique de potentiel, quoiqu’il ne s’y réduise pas. La notion de virtuel ne se comprend que dans son opposition dialectique à l’actuel, chacun des deux concepts visant les pôles complémentaires d’un même cycle générateur. La virtualité émane des situations actuelles qu’elle conditionne en retour. A ce titre, et bien qu’il soit intangible, le virtuel existe en droit comme en fait.

Considérons l’exemple paradigmatique du gland qui contient le chêne sur un mode virtuel. La virtualité de l’arbre n’est pas une simple possibilité logique. Elle résulte d’un programme et d’un ensemble de mécanismes qui activent le développement de la plante ligneuse. L’arbre pousse à partir de la graine. Il est néanmoins impossible de prédire exactement la forme du chêne en ne considérant que le gland. Cette forme est partiellement indéterminée parce que les instructions contenues par la graine négocieront la croissance de l’arbre avec nombre de facteurs environnementaux tels que le sol, l’humidité, la lumière, la température, les symbiotes, les parasites et ainsi de suite. Bien que programmée, l’actualisation de l’arbre relève d’une adaptation créative. Si les circonstances sont favorables, l’arbre arrivé à maturation se virtualisera en une multitude de nouvelles graines qui chercheront aventure dans le monde. Vérifions ici l’une des principales propriétés du virtuel : il n’a pas d’adresse spatio-temporelle. On peut certes toucher la graine, mais pas l’arbre virtuel qu’elle promet. Nous voyons sur cet exemple végétal que la dialectique biologique du germen et du soma consonne avec celle du virtuel et de l’actuel.

LE CERVEAU ANIMAL

Passons maintenant à un exemple choisi dans le domaine de l’animalité. Lorsqu’on les compare aux plantes, la grande affaire des animaux est la locomotion, avec la boucle sensori-motrice qu’elle suppose. Le système nerveux, et le cerveau où il se concentre, s’est développé en parallèle dans les différents phylums biologiques comme une interface entre la sensation et le mouvement. Chaque élan entraîne une modification de la position de l’animal, ce qui détermine de nouvelles perceptions, qui appellent une réaction ou un repos provisoire. Au cours de l’évolution, la boucle sensori-motrice réflexe s’est complexifiée en simulation de l’environnement, évaluation de la situation et calcul décisionnel. Le virtuel devient ici un concept pratique. L’acte résout les tensions qui organisent une situation vitale et, ce faisant, il redonne naissance à un nuage de virtualités.

Intéressons-nous maintenant au rôle que joue le cerveau de l’animal dans cette dialectique pratique. Cet organe calcule l’action à accomplir et envoie ses ordres aux muscles par les nerfs efférents. Le mouvement de l’animal s’inscrit dans l’univers physique et possède certainement une adresse spatio-temporelle. Il est donc actuel. Quant à la perception, elle est calculée à partir des impulsions nerveuses venant des organes sensoriels le long des nerfs afférents. Si l’on met de côté le rêve, l’illusion et l’hallucination, la perception se rapporte au monde physique actuel. Mais peut-on dire qu’elle possède une adresse spatio-temporelle ? Selon nos connaissances scientifiques du XXIe siècle, le monde physique est peuplé de champs électromagnétiques, de vibrations atmosphériques et de molécules. Mais où se trouvent exactement la couleur bleue, les trilles du rossignol et l’odeur de la forêt en automne ? Certes, le système nerveux calcule les fameux qualia. Mais ces perceptions sont-elles dans le cerveau ? Une observation attentive de cet organe ne révèlera jamais que des concentrations de neurotransmetteurs et des dynamiques d’états d’excitations des neurones : ni coloris, ni sonorités, ni parfums. Cette remarque ne porte pas que sur les qualités sensibles, elle concerne aussi le plaisir et la douleur, les émotions, les intentions et tout ce qui constitue la vie intérieure de l’animal. L’expérience phénoménale ou, si l’on préfère, la conscience est virtuelle. Sans coordonnées spatiales, elle ne se situe pas dans le monde matériel. Tissée de mémoire et d’attente, d’habitudes et de surprises, l’expérience phénoménale ne s’inscrit pas non plus dans le temps linéaire, objectif et neutre chronométré par les sciences exactes. Elle serait plutôt temporalisante. Tendu vers un futur désiré, épais d’adhérer encore à son passé, loin de se réduire à un point sans dimension, le présent vécu entraîne le monde dans son orbite.

On pourrait objecter que l’expérience phénoménale n’est pas exactement un potentiel qui s’actualise en réalités tangibles. Sans doute. Mais observer quelque chose ici et maintenant arrive forcément dans une conscience, donc à partir du virtuel. Sans organisme animal, pas d’expérience phénoménale mais, symétriquement, l’extériorité actuelle ne se découvre que visée par une intériorité subjective, fut-ce celle d’une cigale. Actuel et virtuel sont chacun la condition de possibilité de l’autre le long d’une boucle étrange de génération ontologique.

Avec le cerveau, le concept – ou la catégorie générale – apparaît dans la nature. En effet, les animaux catégorisent leurs perceptions : voici un congénère, un rival, un partenaire sexuel, une proie, un prédateur, etc. Immanquablement, les séquences d’interactions pertinentes suivent la conceptualisation des situations et des émotions qui les teintent. Pensons aux concepts comme à des schémas d’interaction probabilistes plutôt que comme à des classes logiques nettement découpées. Ils correspondent à des circuits neuronaux plus ou moins plastiques qui mettent en relation des aires perceptives, affectives et motrices. La catégorie “prédateur”, la peur et la réaction de fuite qu’elle entraîne se trouvent codées dans un circuit neuronal du cerveau de la gazelle. Elle a donc un point d’appui dans l’actualité de l’organisme. Mais le concept de prédateur est virtuel dans la mesure même de sa généralité : il s’applique à quantité de rencontres datées et situées sans être lui-même attaché à un moment ou à un lieu précis. Il s’agit d’un schéma abstrait qui donne sens au vécu subjectif de l’animal et conduit son comportement ici et maintenant. En somme, l’expérience phénoménale – elle-même virtuelle par rapport à l’organisme actuel qui la supporte et qu’elle éclaire – se dédouble. Nous avons, d’une part, une expérience actuelle, singulière, au présent de la conscience et, d’autre part, un schéma d’interaction ou concept général, virtuel, sans qui l’expérience actuelle serait dépourvue de signification et d’orientation.

Passons maintenant de la cognition à la communication. Un animal reconnait une situation. Sa conceptualisation déclenche une libération d’hormones, une vocalisation, une posture : un signe est émis. Le concept qui organisait l’expérience actuelle de l’intérieur opaque du cerveau était déjà virtuel comparé à la situation concrète. Le voici maintenant traduit en image sensible et projeté dans le monde, à la merci d’un coup de vent, en attente du décodage d’un congénère pour s’actualiser de nouveau dans une expérience subjective. Le signal est un concept virtualisé. Les odeurs qui saturent l’atmosphère, les empreintes qui tapissent le sol, les paysages sonores des marais ou des forêts entrelacent des réseaux de signes. En un sens, la communication stigmergique est déjà une forme d’écriture. L’étymologie grecque du mot explique assez bien son sens : des marques (stigma) sont laissées dans l’environnement par l’action ou le travail (ergon) de membres d’une collectivité, et ces marques guident en retour – et récursivement – leurs actions. Le cas classique est celui des fourmis qui laissent une traîne de phéromones sur leur passage lorsqu’elles ramènent de la nourriture à la fourmilière. L’odeur des phéromones incite d’autres fourmis à remonter leurs traces pour découvrir le butin et ramener des vivres à la ville souterraine en laissant par terre à leur tour un message parfumé. On saisit l’analogie avec l’écriture : des traces sont déposées pour une lecture à venir et font office de mémoire externe d’une communauté.

Mise en commun par la communication stigmergique, cette mémoire externe est souvent brève, qu’elle soit étroitement localisée, comme le nuage de phéromones qui émane d’un attroupement d’éléphants, ou portant loin, comme le barrissement qui ponctue de sa note cuivrée la symphonie de la savane. Mais elle peut aussi être durable ou réactivée en boucle : l’urine du loup et le hurlement du singe roux marquent leur territoire. Quoiqu’il en soit, les animaux émettent et reconnaissent leurs signes en situation. Un message vise un effet pratique et se rapporte directement au contexte en cours. Performatif, son décodage déclenche quasi automatiquement l’activation d’un comportement. Métonymique, le signe fait lui-même partie du schéma d’interaction qu’il code. Indiciels, les flux de signes entretiennent une contiguïté locale ou causale avec les acteurs qui les échangent et les situations auxquels ils se rapportent.

LE CERVEAU HUMAIN

La sémiotique animale suppose des référents actuels. Voilà qui change avec l’entrée en scène d’Homo Sapiens, puisque nous racontons ce qui nous est arrivé la veille, prenons rendez-vous pour la semaine prochaine, inventons des histoires. Les référents des signes humains n’appartiennent pas nécessairement à la situation présente et nous entretenons une communication avec le monde invisible (ancêtres, esprits, dieux, valeurs…). L’animal symbolique peuple son existence d’objets et d’événements de nature intangible, ou qui ne sont plus là depuis longtemps, ou qui n’arriveront jamais.

Une langue possède généralement des milliers d’unités de sens élémentaires distinctes, ce qui est supérieur de plusieurs ordres de grandeur au répertoire de signaux des espèces animales. Surtout, les symboles s’organisent selon une grammaire récursive (les expressions peuvent s’emboîter les unes dans les autres comme des poupées russes), ce qui permet de construire et de reconnaître une quantité indéfinie de phrases et de textes pourvues de significations distinctes. Le verbe qui évoque l’action et les rôles grammaticaux qui décrivent les actants et les circonstances modélisent une “scène” complexe. Les primates parlants représentent les schémas qui organisent leur expérience avec un luxe de détail hyperréaliste. Les concepts immédiats et massifs des animaux font place aux généalogies, aux classifications fines, aux genres, aux espèces et à leurs différences, aux tissus de notions compliquées dont chaque nœud est un réseau à lui tout seul. Nos récits s’enchâssent et se répondent. Philosophes, nous dialoguons et mettons nos concepts en question. La conscience humaine ne se contente pas de s’organiser par des concepts, elle s’y réfléchit, et cette réflexion ajoute un nouveau tour à la virtualité de notre expérience.

Le symbole linguistique est coupé en deux puisqu’il possède (a) une partie actuelle ou signifiante : une image sonore, visuelle, tactile ou autre, comme le son “arbre”, et (b) une partie virtuelle ou signifiée : un concept général, comme celui de “plante ligneuse possédant des racines, un tronc et des branches”. Le signifiant lui-même se dédouble en forme abstraite (le phonème, le caractère, le geste) sans adresse, intemporelle, et une image concrète, située, datée : ce timbre de voix, cette lettre, une main qui s’agite. Quant au signifié, il possède à son tour une part virtuelle et une part actuelle. Le dictionnaire et la grammaire d’une langue définissent la partie virtuelle, générale, encore flottante, du sens d’une parole qu’on nous adresse. Notre connaissance de la langue nous permet de décoder cette séquence de phonèmes pour la traduire en réseaux de concepts, en récit suscitant des images, des émotions et des souvenirs. Un rhizome de sens illumine un instant l’opacité de notre expérience. Le sens s’est actualisé ainsi pour nous, mais il s’actualiserait différemment dans des circonstances dissemblables pour quelqu’un d’autre, pourvu d’une mémoire singulière.

Notre cerveau a toutes les propriétés de celui des vertébrés supérieurs, avec les capacités cognitives et communicatives que cela implique, mais il possède en plus une capacité de lecture et de production de symboles qui nous fait entrer dans un nouvel univers. En effet, l’évolution biologique qui mène à l’humain a profondément transformé le cerveau du primate initial pour l’ajuster à une spécialisation symbolique unique dans le règne animal : hypertrophie du cortex préfrontal, amplification du cervelet, apparition des aires de Broca et de Wernicke, division du travail plus poussée entre les hémisphères et réorganisation générale des circuits neuronaux. Le cerveau humain fonctionne alors comme un dispositif de codage-décodage entre le monde des idées et celui des corps plongés dans la biosphère. Interface ontologique, il conduit la symbiose et la coévolution des populations de bipèdes parlants et de leurs cultures. Nos sociétés se coordonnent par l’intermédiaire d’un monde virtuel des significations que nos esprits habitent en commun tandis que nos organismes interagissent actuellement dans le monde physique.

Le langage confère à l’humanité un haut degré d’intelligence collective, supérieur à celui des autres mammifères et comparable à celui des abeilles ou des fourmis. Comme d’autres espèces eusociales, nous communiquons en grande partie de manière stigmergique, mais au lieu de marquer un territoire physique au moyen de phéromones ou d’autres types de signaux visuels, sonores ou olfactifs, nous laissons des traces symboliques. Au fur et à mesure de l’évolution culturelle, les signifiants s’accumulent dans des mémoires externes de plus en plus perfectionnées : pierres levées, totems, paysages sculptés, monuments, architectures, signes d’écriture, archives, bibliothèques, bases de données.

LE CERVEAU ÉLECTRONIQUE

Sur le temps long d’une évolution culturelle qui s’accélère, les symboles se détachent de leurs lieux d’origine et survivent de mieux en mieux au moment de leur naissance. Les voici qui s’allègent, se multiplient, se diffusent, se traduisent et se transforment. Mais plus les symboles se font “soft“, logiciels, virtuels, plus ils s’approchent d’une forme omniprésente et malléable échappant à l’inertie de la matière, plus leur inscription nécessite de supports “hard”, d’instruments et d’installations lourdement actuelles. La manipulation symbolique relève d’une longue histoire technique où la virtualisation des codes et l’actualisation des médias s’entraînent mutuellement : tablettes d’argile, rouleaux de papyrus ou de soie, réseaux de routes et de ports des empires antiques, poste à cheval, fabrication du papier, machines à imprimer, bâtiments des écoles et des bibliothèques, transports mécanisés, poteaux télégraphiques au bord des voies ferrées, antennes et satellites, jusqu’aux centres de données qui consomment l’électricité d’une centrale et aux magazines, radios, tourne-disques, télévisions, ordinateurs et téléphones crachés par des usines qui finissent par s’entasser pêle-mêle dans des décharges.

Le virtuel et l’actuel alternent, se compénètrent et compliquent leur enchevêtrement. Chaque circuit de leur tourbillon auto-poïétique dépose une nouvelle couche de complexité qu’entraîne la révolution suivante. Il en est de ces deux modes d’être comme des rapports du Yin et du Yang dans la philosophie chinoise traditionnelle. Un des principaux classiques confucéens, le Yi-King (ou I-Ching) représente la dynamique des transformations cosmiques, politiques et personnelles au moyen de soixante-quatre hexagrammes : six lignes empilées dont certaines sont continues (Yang) et d’autres brisées (Yin). Ce vieux livre oraculaire présente un des premiers alignements entre structure signifiante et situation signifiée : les deux plans des hexagrammes et des configurations pratiques obéissent au même groupe de transformations. Faut-il faire remonter là le codage binaire et la manipulation réglée des signifiés au moyen des signifiants qui caractérise l’informatique ? Ou bien faut-il identifier les débuts du calcul automatique à la formalisation du raisonnement logique par Aristote ? Et que dire des mathématiciens indiens qui ont inventé la numération par position avec neuf chiffres et le zéro, rendant ainsi les calculs arithmétiques simples et uniformes ? Ou du développement de l’algèbre par les mathématiciens arabophones, andalous ou persans, comme Al Khawarizmi, qui a donné son nom à l’algorithme ? Dans tous ces cas, la manipulation réglée, quasi-mécanique, d’éléments visibles et tangibles – donc actuels – entraîne un mouvement d’objets virtuels : tropismes politiques, propositions logiques ou nombres insubstantiels.

Pendant les années cinquante du XXe siècle, on qualifiait les ordinateurs de “cerveaux électroniques”. Des machines à calculer mécaniques avaient été construites dès le XVIIe siècle par Pascal et Leibniz. Charles Babbage et Ada Lovelace ont construit des prototypes de machines à calculer complexes dans la Grande-Bretagne victorienne. Les caisses enregistreuses présentes dans de nombreuses boutiques effectuaient les opérations arithmétiques au début du XXe siècle. Mais pour atteindre des calculatrices électroniques programmables – beaucoup plus rapides et adaptables que les machines précédentes – il a fallu que plusieurs progrès théoriques et techniques soient accomplis au préalable. Du côté théorique, Turing avait dès 1937 décrit un automate abstrait capable d’effectuer n’importe quel calcul défini par un programme. Du côté technique, dès le début du XXe siècle, les diodes, ou tubes à vide, ont permis le contrôle fin des flux d’électrons. Utilisés par les premiers ordinateurs, ces composants volumineux et grands consommateurs d’énergie seront ensuite remplacés par les transistors, puis par les circuits imprimés dans la course à la vitesse et à la miniaturisation qui marque l’industrie électronique. Un pas décisif fut franchi par Claude Shannon en 1938, lorsqu’il démontra la corrélation entre le calcul logique et l’arrangement des circuits électriques, à la confluence du virtuel et de l’actuel. Un interrupteur ouvert ou fermé correspond à “vrai” ou “faux”, un montage des interrupteurs en série correspond à l’opérateur logique “et”, un montage en parallèle à l’opérateur “ou exclusif”. Or les connecteurs non, et, ou suffisent à exprimer l’algèbre de Boole, à savoir la formalisation de la logique ordinaire. L’arithmétique en base deux (0, 1) se prête également fort bien au calcul électronique. Traversant les portes logiques, courant dans le labyrinthe de circuits que forment et reforment les programmes, rapide comme l’éclair, l’électron devient signifiant. Automatiser la manipulation du sens virtuel en mécanisant celle du signe actuel, telle est la puissance du codage informatique.

Moins d’un siècle après l’invention des premiers ordinateurs, la mémoire du monde est numérisée et plus de soixante pour cent de la population mondiale est branchée à l’internet. Qu’une information se trouve en un point du réseau et la voici partout. Du texte statique sur papier, nous sommes passé à l’hypertexte ubiquitaire, puis à l’architexte surréaliste qui rassemble tous les symboles. Une mémoire virtuelle s’est mise à croître, secrétée par des milliards de vivants et de morts, fourmillant de langues, de musiques et d’images, grosse de rêves et de fantasmes, mêlant la science et le mensonge. Si l’échange de messages point à point a toujours lieu, la majeure part de la communication sociale s’effectue désormais de manière stigmergique. Plongés dans l’espace numérique, nous communiquons par l’intermédiaire de la masse océanique de données qui nous rassemble. Chaque lien que nous créons, chaque étiquette ou hashtag apposée sur une information, chaque acte d’évaluation ou d’approbation, chaque « j’aime », chaque requête, chaque achat, chaque commentaire, chaque partage, toutes ces opérations modifient subtilement la mémoire commune, c’est-à-dire le magma inextricable des rapports entre les données. Notre comportement en ligne émet un flux continuel de messages et d’indices qui transforment la structure de la mémoire et contribuent à orienter l’attention et l’activité de nos contemporains. Nous déposons dans l’environnement virtuel des phéromones électroniques qui déterminent en boucle l’action des autres internautes et qui entraînent par-dessus le marché les neurones formels des intelligences artificielles (IA).

Le cerveau biologique abstrait le détail des expériences actuelles en schémas d’interactions, ou concepts, codés par des patterns de circuits neuronaux. De la même manière, les modèles neuronaux de l’IA condensent les données innombrables de la mémoire numérique. Ils virtualisent les données actuelles en patterns et en patterns de patterns. Conditionnés par leur entraînement, les algorithmes peuvent alors reconnaître et reproduire des données correspondant aux formes apprises. Mais parce qu’ils ont abstrait des structures plutôt que de tout enregistrer, les voici capables de conceptualiser correctement des formes (d’image, de textes, de musique, de code…) qu’ils n’ont jamais rencontrées et de produire une infinité d’arrangements symboliques nouveaux. C’est pourquoi l’on parle d’intelligence artificielle générative. La mémoire numérique est virtuelle parce qu’elle est détachée de son lieu d’émission et de réception, mise en commun, en attente de lecture, suspendue dans les “nuages” de l’Internet, logicielle. Mais cette mémoire apparaît désormais comme une masse de données actuelles que virtualisent des modèles neuronaux. Et les patterns cachés dans les myriades de couches et de connexions des cerveaux électroniques font retomber en pluie des actualisations inédites. Nous ne semons des données que pour récolter du sens.

Le calcul électronique qui simule le fonctionnement des neurones donne-t-il naissance à une conscience autonome ? Non, parce que les machines manipulent seulement la partie matérielle des symboles et que les images, les textes, les mélodies n’ont de signification que pour nous lorsqu’elles sont émises aux interfaces. Non, parce que l’expérience phénoménale est la contrepartie d’un organisme animal. Les humains sensibles et intelligents n’ont une âme que parce qu’ils habitent un corps vivant. De l’autre côté du miroir, les signifiants tourbillonnent à l’aveugle, les galets s’entrechoquent sur le grand abaque, une furie électronique insensée se déchaîne dans les centres de données. De ce côté du miroir, les écrans nous présentent le visage d’un autre qui parle, mais c’est une projection anthropomorphe. Une bibliothèque ne se souvient pas plus qu’un algorithme ne pense : les deux virtualisent des fonctions cognitives par externalisation, transformation, mise en commun et ré-internalisation. Les nouveaux cerveaux électroniques synthétisent et mettent à l’œuvre – virtualisent et réactualisent – l’énorme mémoire numérique par l’intermédiaire de laquelle nous nous souvenons, communiquons et pensons ensemble. Derrière “la machine” il faut entrevoir l’intelligence collective qu’elle réifie et mobilise.

La crainte du virtuel qui agitait les esprits lors de la première édition de “Qu’est-ce que le Virtuel?” en 1995 (alors qu’à peine un pour cent de la population mondiale était connectée à l’Internet et que le World Wide Web venait d’éclore), s’est transformée aujourd’hui en grande peur de l’intelligence artificielle. Ni fin de la civilisation, ni fin de l’humanité, il s’agit encore d’une nouvelle étape de l’évolution culturelle, de la poursuite d’une hominisation, d’une virtualisation que nous devons penser avec justesse si nous voulons l’orienter.

Tags cerveau, concepts, philosophie, virtuel

Categories French

Comment construire un concept en IEML? L’exemple de la démocratie.

20 February 2023 //

INTRODUCTION

IEML est une langue (mathématique) dont la finalité principale est de formaliser la description des concepts et de leurs connexions. On s’en servira pour produire des modèles de données, des systèmes de métadonnées sémantiques, des ontologies, des graphes de connaissances et autres réseaux sémantiques. Je dis que cette langue est “mathématique” parce que les nœuds conceptuels (les entités) et les relations – représentés par des phrases IEML – peuvent être générés de manière fonctionnelle et parce que cette langue non ambiguë instaure une bijection entre séquences de caractères (ou chaines phonétiques) et réseaux de concepts. Le grand avantage d’IEML est de rendre les différentes ontologies ou modèles de données sémantiquement compatibles puisque tous les concepts sont construits au moyen du même dictionnaire compact en utilisant la même grammaire régulière.

IEML ne vise pas principalement les sciences exactes, qui disposent déjà d’une formalisation mathématique adéquate et d’une conceptualisation univoque, mais plutôt les sciences humaines, dont la formalisation et la calculabilité laissent à désirer. À noter que l’ingénierie (notamment la documentation de systèmes complexes) et la médecine sont néanmoins des cas d’usages favorables.

COMMENT CONSTRUIRE UN CONCEPT EN IEML?

Pour construire un concept en IEML, il faut utiliser sa grammaire, résumée dans la figure ci-dessous.

Structure et composants de la phrase IEML, illustrés par un exemple

Pour plus de détails sur la grammaire d’IEML, voir https://pierrelevyblog.com/2022/05/19/ieml-pour-les-humanites-numeriques/ et pour un compte rendu encore plus fourni, aller à https://intlekt.io/2022/10/02/semantic-computing-with-ieml-3/. Le rôle 0 peut être occupé par un nom dans les phrases nominales.

Après avoir pris connaissance de la grammaire, il faut se donner une définition du concept à construire. Voici ci-dessous une définition possible de la démocratie qui utilise la structure de la phrase en IEML.

@node
fr: démocratie
en: democracy
(
0 verbe: exercer le pouvoir
1 sujet: tous les citoyens
2 objet: unité politique / cité
4 cause/instrument: suffrage universel
7 intention/contexte: régime politique
8 manière: séparation des pouvoirs et protection des minorités
).

Beaucoup d’autres définitions IEML de la démocratie sont possibles, plus simples, plus complexes ou différentes, mais elles seront toutes explicites et on pourra les comparer.

Pour la définition que nous avons proposée, les concepts nécessaires existent déjà dans le dictionnaire IEML pour les rôles 0, 1, 2 et 7, mais pas pour les rôles 4 et 8. Il faut donc créer les concepts de suffrage universel, de séparation des pouvoirs et de protection des minorités. Ici encore, les définitions ci-dessous auraient pu être différentes. Chaque @node créé peut être réutilisé comme un #concept!

@node
fr: suffrage universel = “tous les citoyens choisissent les dirigeants”
en: universal suffrage
(
0 ~indicatif #choisir,
1 ~tous #citoyen,
2 ~pluriel #dirigeant
).

@node
fr: séparation des pouvoirs
en: separation of powers
(
0 ~voix passive #séparer,
1 &et [#pouvoir législatif #pouvoir judiciaire #pouvoir économique]
).

Pour construire le concept de protection des minorités, je dois d’abord construire le concept de minorité.

@node
fr:minorités
en: minorities
(
0 ~pluriel #communauté,
8 &et [#petit #faible]
).

@node
fr: protection des minorités
en:protection of minorities
(
0 ~indicatif #protéger un groupe,
2 #minorités
).

Voici finalement un concept possible de démocratie formellement défini en IEML.

@node
fr: démocratie
en: democracy
(
0 #exercer le pouvoir,
1 ~tous #citoyen,
2 #unité politique,
4 *instrument #suffrage universel,
7 *se référant à #organisation politique,
8 *avec &et [ #séparation des pouvoirs #protection des minorités]
).

REMARQUES FINALES

À noter que, pour une utilisation concrète dans une ontologie, on ne construit jamais les concepts isolément (un par un) en IEML mais toujours dans des paradigmes ou champs sémantiques. Dans une ontologie des sciences politiques, un paradigme des régimes politiques conserverait les rôles 0-verbe, 2-objet et 7-contexte/intention, mais ferait varier les rôles 1-sujet, 4-cause/instrument et 8-manière. On construirait ainsi une matrice en 3 dimensions qui pourrait être représentée par plusieurs tables 2 D.

Pour des exemples de paradigmes construits en IEML dans le domaine de la santé mentale, voir: https://intlekt.io/2023/02/07/ieml-in-global-medical-communication/

Par ailleurs, le sens (ou sémantique) d’un concept ne se réduit pas à sa définition. Il faut aussi prendre en compte le contexte d’utilisation, c’est-à-dire le réseau de relations auquel renvoie le concept dans une ontologie ou graphe de connaissances.

Pour naviguer dans le dictionnaire IEML et les débuts d’ontologies, aller à https://ieml.intlekt.io/login , choisir « read without account » puis « published projects ». Explorer le menu contextuel pour chaque mot, en particulier la visualisation de la table paradigmatique à laquelle le mot appartient.

Tags IEML

Categories French, Sphère sémantique

Sémantique, intelligence artificielle et intelligence collective

23 July 2022 //

[For an English version of this post, click here.]

Le langage permet une coordination dynamique entre les réseaux de concepts entretenus par les membres d’une communauté, de l’échelle d’une famille ou d’une équipe, jusqu’aux plus grandes unités politiques ou économiques. Il permet également de raconter des histoires, de dialoguer, de poser des questions et de raisonner. Le langage soutient non seulement la communication mais aussi la pensée ainsi que l’organisation conceptuelle de la mémoire, complémentaire de son organisation émotionnelle et sensorimotrice.

Mais comment le langage fonctionne-t-il ? Du côté de la réception, nous entendons une séquence de sons que nous traduisons en un réseau de concepts, conférant ainsi son sens à une proposition. Du côté de l’émetteur, à partir d’un réseau de concepts que nous avons à l’esprit – un sens à transmettre – nous générons une séquence de sons. Le langage fonctionne comme une interface entre des séquences de sons et des réseaux de concepts. Et gardons en tête que les relations entre les concepts sont eux-mêmes des concepts.

Les chaînes de phonèmes (des sons), peuvent être remplacées par des séquences d’idéogrammes, de lettres, ou de gestes comme dans le cas de la langue des signes. L’interfaçage quasi-automatique entre une séquence d’images sensibles (sonores, visuelles, tactiles), et un graphe de concepts abstraits (catégories générales) reste constant parmi toutes les langues et systèmes d’écriture.

Cette traduction réciproque entre une séquence d’images (le signifiant) et des réseaux de concepts (le signifié) suggère qu’une categorie mathématique pourrait modéliser le langage en organisant une correspondance entre une algèbre et une structure de graphe. L’algèbre réglerait les opérations de lecture et d’écriture sur les textes, tandis que la structure de graphe organiserait les opérations sur les nœuds et les liens orientés. A chaque texte correspondrait un réseau de concepts. Les opérations sur les textes reflèteraient dynamiquement les opérations sur les graphes conceptuels.

Nous avons besoin d’un langage régulier pour coder des chaînes de signifiants et nous pouvons transformer les séquences de symboles en arbres syntagmatiques (la syntaxe étant l’ordre du syntagme) et vice versa. Cependant, si son arbre syntagmatique – sa structure grammaticale interne – est indispensable à la compréhension du sens d’une phrase, il n’est pas suffisant. Parce que chaque expression linguistique repose à l’intersection d’un axe syntagmatique et d’un axe paradigmatique. L’arbre syntagmatique représente le réseau sémantique interne d’une phrase, l’axe paradigmatique représente son réseau sémantique externe et en particulier ses relations avec des phrases ayant la même structure, mais dont elle se distingue par quelques mots. Pour comprendre la phrase ” Je choisis le menu végétarien “, il faut bien sûr reconnaître que le verbe est “choisir”, le sujet “je” et l’objet “le menu végétarien” et savoir en outre que “végétarien” qualifie “menu”. Mais il faut aussi reconnaître le sens des mots et savoir, par exemple, que végétarien s’oppose à carné et à végétalien, ce qui implique de sortir de la phrase pour situer ses composantes dans les systèmes d’oppositions sémantiques de la langue. L’établissement de relations sémantiques entre concepts suppose que l’on reconnaisse les arbres syntagmatiques internes aux phrases, mais aussi les matrices paradigmatiques externes à la phrase qui organisent les concepts, que ces matrices soient propres à une langue ou à certains domaines pratiques.

Parce que les langues naturelles sont ambiguës et irrégulières, j’ai conçu une langue mathématique (IEML) traduisible en langues naturelles, une langue calculable qui peut coder algébriquement non seulement les arbres syntagmatiques, mais aussi les matrices paradigmatiques où les mots et les concepts prennent leur sens. Chaque phrase du métalangage IEML est située précisément à l’intersection d’un arbre syntagmatique et de matrices paradigmatiques.

Sur la base de la grille syntagmatique-paradigmatique régulière d’IEML, il devient possible de générer et de reconnaître des relations sémantiques entre concepts de manière fonctionnelle : graphes de connaissance, ontologies, modèles de données… Toujours du côté de l’IA, un codage des étiquettes ou de la catégorisation des données dans cette langue algébrique qu’est IEML faciliterait l’apprentissage machine. Au-delà de l’IA, ma vision pour IEML est de favoriser l’interopérabilité sémantique des mémoires numériques et de développer une synergie entre l’autonomisation cognitive personnelle et la réflexivité de l’intelligence collective.

Sur le plan technique, il s’agit d’un projet léger et décentralisé: un dictionnaire IEML-langues naturelles, un analyseur syntaxique (parseur) open-source supportant les fonctions calculables sur les expressions de la langue et une plate-forme d’édition collaborative et de partage des concepts et ontologies. Le développement, la maintenance et l’utilisation d’un protocole sémantique basé sur l’IEML nécessitera un effort de recherche et de formation à long terme.

Tags artificial intelligence, Collective intelligence, IEML, Semantic computing, Semantic Sphere

Categories French, Sphère sémantique

IEML pour les humanités numériques

19 May 2022 //

Le tournant numérique en sciences humaines

Ce billet rend compte de ma communication au colloque Humanistica à Montréal, le 20 mai 2022.

Les chercheurs en sciences humaines et sciences sociales constituent des bases de données pour l’analyse, la fouille et le partage. L’indexation des documents en ligne est cruciale pour les auteurs, les éditeurs et les lecteurs. Aujourd’hui, il existe une multiplicité de systèmes de métadonnées sémantiques et ontologies selon les langues, disciplines, traditions et théories. Ces systèmes sont souvent hérités de l’ère de l’imprimerie.
Dans ce contexte, le métalangage IEML propose un outil de modélisation et d’indexation programmable, capable d’assurer l’interopérabilité sémantique sans uniformiser les points de vue.

En IEML il y a coïncidence entre les concepts et leur représentation linguistique. Exprimés en IEML plutôt qu’en langue naturelle, les concepts deviennent auto-explicatifs et univoques (sans ambiguïtés lexicale ou syntagmatique). Les concepts d’ontologies différentes sont composés à partir des mots d’un même dictionnaire IEML selon une grammaire régulière. Il devient donc possible d’échanger collaborativement des modèles et sous-modèles entre chercheurs parlant des langues différentes et venant de disciplines distinctes. En somme, IEML résout le problème de l’interopérabilité sémantique.

Une plateforme pour la conception et le maintien collaboratif de graphes sémantiques est en vue. (ontologies, systèmes d’indexation, étiquettes pour le machine learning, etc.).

Un nouvel outil sémantique

IEML n’est pas un format – de données ou de métadonnées – mais une langue qui possède:

• un dictionnaire compact de 3000 mots (accessibles en anglais et français)

• une grammaire entièrement régulière

• le tout intégré à un éditeur-parser

IEML a les mêmes qualités et forces sémantiques qu’une langue naturelle. Ainsi, IEML peut traduire toutes les langues naturelles et peut servir de pivot entre langues naturelles. Sa sémantique est calculable parce que c’est une fonction de sa syntaxe (qui est régulière).

Destinés à la construction de graphes sémantiques, ses phrases peuvent prendre deux formes: nœuds ou liens. IEML possède des instructions permettant de programmer des graphes sémantiques tels que : hypertextes, ontologies et modèles de données.

Les mots

En utilisant la grammaire et les mots du dictionnaire, l’éditeur IEML permet de générer récursivement autant de concepts que l’on veut. Chaque mot en IEML est construit de manière régulière à partir de
6 primitives (lettres majuscules).

Les six primitives, tout comme les autres lettres d’IEML sont des mots et dénotent des concepts lorsqu’elles sont utilisées seules. Lorsqu’elles sont utilisées dans un autre mot, elles représentent des places dans des systèmes de symétrie: symétrie 1 pour E, symétrie 2 pour U/A, symétrie 3 pour S/B/T. Pour plus de détails sur les primitives d’IEML, voir: https://intlekt.io/semantic-primitives/

L’opération générative pour les mots a trois rôles: substance ☓ attribut ☓ mode.
En combinant cette opération générative (☓) avec une opération de jonction (+), on peut former des paradigmes de mots. Ci-dessous les 25 lettres minuscules sont réunies dans une table paradigmatique qui multiplie U+A+S+B+T en substance par U+A+S+B+T en attribut, avec un mode toujours vide.

Dans l’image ci-dessus, les couleurs signalent quatre systèmes de symétries (4, 6, 6, 9) dont les lettres occupent des positions déterminées. Pour en savoir plus sur les 25 lettres minuscules, voir: https://intlekt.io/25-basic-categories/

En IEML, les paradigmes de mots, comme d’ailleurs les paradigmes de phrases, sont des systèmes de symétries sémantiques représentés par des systèmes de symétries syntaxiques. Par exemple, le paradigme ci-dessous organise les relations spatiales. Les deux premières rangées organisent les relations spatiales selon les axes vertical (première rangée) et horizontal (deuxième rangée). Les trois rangées inférieures organisent les entrées et sorties, la latéralisation et les chemins.

Paradigme des relations spatiales. Cliquez sur l’image pour l’agrandir 😉

Retenons que le dictionnaire d’IEML est avant tout une boîte à outils pour construire de nouvelles catégories au moyen de phrases.

Les phrases

Les neuf rôles de la phrase – en vert dans l’exemple ci-dessous – ainsi que les * auxiliaires, les ~ flexions et les & jonctions permettent l’expression de récits et d’explications causales. Les # mots en français sont des alias de mots ou de concepts-phrases en IEML.

La création de relations sémantiques

En IEML, les relations sémantiques ne se créent pas une par une “à la main” mais se programment. L’instruction de création de relations sémantiques ci-dessous se décompose en deux parties. La partie qui commence par @link énonce la phrase de lien avec les deux variables $A et $B: “Le mot A signifie le contraire du mot B”. Les numéros 0, 1 et 8 sont des raccourcis pour les rôles de phrase: racine, initiateur et manière. La partie qui commence par @function énonce le domaine (en l’occurrence le paradigme de relations spatiales ci-dessus) qui est concerné par la création de relations et il énonce les conditions nécessaires en termes d’adresses syntaxiques et de contenu. La fonction de création de relations n’utilise que deux “équations” connectées par des “ET” et des “OU”:
adresse syntaxique A == adresse syntaxique B
adresse syntaxique A == contenu c

Exemple d’instruction déclarative de création de relations sémantiques

Remarquons que l’instruction déclarative ci-dessus crée 30 relations sémantiques d’un coup!

Indexation, noms propres, référence et auto-référence.

IEML traite explicitement les noms propres et les références qui ne sont pas des catégories générales. L’exemple ci-dessous donne trois exemples : un nom, un nombre et un lien hypertexte. Pour en savoir plus sur le traitement des noms propres en IEML voir:
https://pierrelevyblog.com/2021/07/13/les-noms-propres-en-ieml/

IEML peut aussi faire référence à ses propres expressions: liens, définitions, commentaires, etc. L’exemple ci-dessous est pris au paradigme des relations spatiales et à la relation “le mot A signifie le contraire du mot B” examiné plus haut.

Plusieurs ontologies sont actuellement en cours de développement. N’hésitez pas à me contacter si vous êtes intéressés par IEML!

IEML Lower-Case Letters and their Dialectics

Tags IEML

Categories French, Sphère sémantique

Un séminaire-atelier sur IEML à L’Université de Montréal

12 January 2022 //

Pierre Lévy a tenu un séminaire sur IEML pendant trois après-midi (13h-17h) les 24, 25 et 26 octobre 2022 à l’Université de Montréal, dans la salle C-8132, Pavillon Lionel-Groulx, 3150 Jean-Brillant.

Pour en savoir plus sur IEML, voir ce texte en anglais facile et qui se lit en 15 min.

Première séance 24 Oct. 13h-17h

Vidéo
Présentation générale de la langue et du projet IEML
La nouvelle grammaire et le nouvel éditeur
Le Power point

Seconde séance 25 Oct. 13h-17h

Vidéo
Présentation d’exemples d’ontologies en IEML (psychiatrie et autres)
Comment concevoir une ontologie ou un modèle de données en IEML?
Le Power point.

Troisième séance 26 Oct 13h-17h

Vidéo
Présentation de la librairie IEML open-source (un gros parseur) en C++ par Louis Van Beurden
Comment transformer IEML en projet collectif-collaboratif open-source?
Le Power point
La présentation de Louis van Beurden, qui a programmé le back-end de l’éditeur IEML, y compris le parseur.

La problématique est définie dans le texte qui suit.

La recherche en sciences humaines et sociales utilise de manière croissante les bases de données, l’analyse automatique, voire l’intelligence artificielle. D’autre part, les résultats de la recherche sont de plus en plus disponibles en ligne sur les blogs des chercheurs, certains réseaux sociaux, les sites web des revues, mais aussi dans des moteurs de recherches spécialisés comme ISIDORE. Tout ceci pose de façon cruciale le problème d’une catégorisation interopérable des données et des documents en sciences humaines et sciences sociales. La question ne se posait pas (ou moins gravement) lorsque chaque bibliothèque, voire chaque pays, avait son système de classement cohérent. Mais dans le nouvel espace numérique, la multiplicité des langues et des systèmes de classifications incompatibles fragmente la mémoire.

Un premier niveau de réponse à ce problème est fourni par des *formats standards* pour les métadonnées sémantiques, notamment RDF (Resource Description Framework) proposé par le WWW Consortium. Signalons également d’autres formats standards comme JSON LD et Graph QL. Mais il ne s’agit dans tous ces cas que d’une interopérabilité technique, au niveau de la forme des fichiers. Pour résoudre le problème de l’interopérabilité sémantique (traitant de la cohérence des architectures de concepts) on a élaboré des *modèles standards*. Par exemple schema.org pour les sites web, CIDOC-CRM pour le domaine culturel, etc. Il existe de tels modèles pour de nombreux domaines, de la finance à la médecine, mais – notons-le – aucun d’eux n’unifie l’ensemble des sciences humaines. Non seulement plusieurs modèles se font concurrence pour un domaine, mais les modèles eux-mêmes sont hypercomplexes et relativement rigides, au point que même les spécialistes n’en maîtrisent qu’une petite partie. De plus, ces modèles sont exprimés en langues naturelles – le plus souvent en anglais – avec les problèmes de traduction et d’ambiguïté que cela suppose.

Afin de résoudre le problème de l’interopérabilité sémantique dans la catégorisation des données en sciences humaines et sociales, nous proposons d’expérimenter une approche à la fois plus souple et plus générale que celle des modèles standards: une langue documentaire standard capable d’exprimer n’importe quel modèle ou ontologie et se traduisant dans toutes les langues naturelles. On trouvera ici une rapide description d’IEML en français.

IEML (Information Economy Metalanguage) développé par Pierre Lévy depuis plusieurs années est un langage artificiel (1) ayant le même pouvoir d’expression et de traduction que n’importe quelle langue naturelle, et (2) dont la grammaire et la sémantique sont régulières et calculables. IEML est le seul langage à posséder ces deux propriétés. IEML peut servir de système de métadonnées, assurant l’interopérabilité sémantique des bases de données, quel que soit le domaine. Grâce à sa nature régulière, IEML est également destiné à soutenir la prochaine génération d’intelligence artificielle “neuro-sémantique”. Voir sur ce blog un article d’une vingtaine de pages qui situe IEML dans le paysage général de l’intelligence artificielle. Un outil open-source, l’éditeur IEML (basé sur un parseur en C++) permet de modéliser finement des domaines complexes au moyen de graphes de connaissances ou ontologies. Les modèles sont générés à l’aide d’un langage de programmation déclaratif original et pourront être explorés de manière interactive sous forme d’hypertextes, de tables et de graphes. Les modèles pourront être exportés dans n’importe quel format standard.

L’objectif global du séminaire consiste à réunir des leaders établis et émergents dans les domaines de la recherche, de l’édition et de la fouille de données en humanités numériques pour faire le point sur les récents développements d’IEML. On présentera notamment une ontologie déjà construite et les enseignements méthodologiques issus des travaux en cours. Les trois jours d’échanges intensifs se tiendront sous la direction de Pierre Lévy (Professeur associé à l’Université de Montréal, membre de la Société Royale du Canada) et Marcello Vitali-Rosati (Chaire de recherche du Canada en écritures numériques et professeur titulaire en littérature française à l’Université de Montréal).”

Photo prise par Luc Courchesne lors de la séance du 25 octobre 2022

Tags humanities, IEML

Categories Annonce, French

Pour un changement de paradigme en intelligence artificielle

20 September 2021 //

English version: https://intlekt.io/2022/01/18/ieml-towards-a-paradigm-shift-in-artificial-intelligence/

Résumé

Le but de ce texte est de présenter une vue générale des limites de l’IA contemporaine et de proposer une voie pour les dépasser. L’IA a accompli des progrès considérables depuis l’époque des Claude Shannon, Alan Turing et John von Neumann. Néanmoins, de nombreux obstacles se dressent encore sur la route indiquée par ces pionniers. Aujourd’hui, l’IA symbolique se spécialise dans la modélisation conceptuelle et le raisonnement automatique tandis que l’IA neuronale excelle dans la catégorisation automatique. Mais les difficultés rencontrées aussi bien par les approches symboliques que neuronales sont nombreuses. Une combinaison des deux branches de l’IA, bien que souhaitable, laisse encore non résolus les problèmes du cloisonnement des modèles et les difficultés d’accumulation et d’échange des connaissances. Or l’intelligence humaine naturelle résout ces problèmes par l’usage du langage. C’est pourquoi je propose que l’IA adopte un modèle calculable et univoque du langage humain, le Métalangage de l’Économie de l’Information (IEML pour Information Economy MetaLanguage), un code sémantique de mon invention. IEML a la puissance d’expression d’une langue naturelle, il possède la syntaxe d’un langage régulier, et sa sémantique est univoque et calculable parce qu’elle est une fonction de sa syntaxe. Une architecture neuro-sémantique basée sur IEML allierait les forces de l’IA neuronale et de l’IA symbolique classique tout en permettant l’intégration des connaissances grâce à un calcul interopérable de la sémantique. De nouvelles avenues s’ouvrent à l’intelligence artificielle, qui entre en synergie avec la démocratisation du contrôle des données et l’augmentation de l’intelligence collective.

Après avoir été posté sur ce blog, le texte a été publié par le Giornale Di Filosofia numéro 2.
Lien vers –> le texte complet en PDF publié sur le site du Giornale di Filosofia. Ou bien lisez le texte ci-dessous 🙂.

vers-un-changement-de-paradigme-en-ia Télécharger

Tags artificial intelligence, IEML, intelligence artificielle, intelligence collective, Semantic computing

Categories French, paper

Les noms propres en IEML

13 July 2021 //

For the English version, go here.

Le but de cette entrée de blog est d’expliquer comment fonctionne la sémantique référentielle en IEML et en particulier comment IEML traite les noms propres. J’ai distingué la sémantique linguistique et la sémantique référentielle ici et là. Je rappelle néanmoins dans ce qui suit les idées principales qui fondent cette distinction.

Sémantique linguistique et sémantique référentielle

La sémantique linguistique est interne au langage, tandis que la sémantique référentielle fait le pont entre un énoncé et ce dont il parle.

Lorsque je dis que “les platanes sont des arbres”, je ne fais que préciser le sens conventionnel du mot “platane”. Mais si je dis que “cet arbre-là, dans la cour, est un platane”, alors je pointe vers un état de chose, et ma proposition est vraie ou fausse. Le second énoncé met évidemment en jeu la sémantique linguistique puisque je dois d’abord connaître le sens des mots et la grammaire du français pour la comprendre. Mais s’ajoute à la dimension linguistique une sémantique référentielle puisque l’énoncé se rapporte à un objet particulier dans une situation concrète.

Un dictionnaire classique définit le sens conventionnel des mots dans une langue, chaque mot étant expliqué en utilisant d’autres mots qui sont eux-mêmes expliqués par d’autres mots, et ainsi de suite de manière circulaire. Un dictionnaire relève donc principalement de la sémantique linguistique. En revanche, un dictionnaire encyclopédique contient des descriptions d’individus réels ou fictifs pourvus de noms propres tels que divinités, héros de roman, personnages et événements historiques, objets géographiques, monuments, œuvres de l’esprit, etc. Sa principale fonction est de répertorier et de décrire des objets externes au système d’une langue. Il enregistre donc une sémantique référentielle.

La sémantique linguistique met en relation un signifiant avec un signifié. Par exemple, le signifiant “arbre”, a pour signifié : “végétal ligneux, de taille variable, dont le tronc se garnit de branches à partir d’une certaine hauteur”. En revanche, la sémantique référentielle met en rapport un signifiant avec un référent. Par exemple, le signifiant “Napoléon 1er” désigne un personnage historique.

Individus et catégories

Les mots contenus dans un dictionnaire classique, et particulièrement les noms communs, désignent généralement des catégories alors que les entrées du dictionnaire encyclopédique se rapportent plutôt à des individus. Le nom commun “arbre” désigne n’importe quel arbre, la classe des arbres, alors que “l’Arbre de la Bodhi” de Bodh Gaya en Inde est un individu portant un nom propre.

Par “catégorie” j’entends une classe, un genre, un ensemble, une collection, etc. Et ce n’est pas le hasard qui réunit un ensemble d’êtres ou d’objets dans la même catégorie, mais bien au contraire des traits communs. Par contraste avec une catégorie, un “individu” est unique, discret, particulier, qu’il s’agisse d’une personne, d’une chose, d’un événement, d’un lieu, d’une date, etc. On peut élargir le concept d’individu en suivant Bertrand Russell, qui en propose la définition suivante: “une série de faits liés entre eux par des relations causales”. En ce sens l’Écosystème de la forêt amazonienne ou la Révolution française sont bien des individus.

Les deux notions d’individu et de catégorie font système : les individus appartiennent à des catégories et les éléments à des ensembles. L’individu est plutôt concret, comme Isabelle qui est devant moi, alors que la catégorie générale est abstraite, comme l’humanité, qu’il m’est impossible de toucher.

Ne confondons pas “catégorie générale” avec “tout” ni “individu” avec “partie”. Les touts ne sont pas des ensembles abstraits, mais bel et bien des individus, comme d’ailleurs les parties. Par exemple, un organisme animal est un individu total et ses membres sont des parties individuelles de ce tout. Cet éléphant est un exemplaire individuel de la classe des éléphants, mais sa trompe est une partie du corps de l’éléphant.

Noms propres et noms communs: une définition

Je vais maintenant définir la différence entre noms communs et noms propres. Mon but n’est pas ici de trancher définitivement un débat que de grands linguistes, logiciens et philosophes mènent depuis plusieurs siècles sur ce thème mais plutôt de fixer une convention utile pour le métalangage IEML (Information Economy MetaLanguage) en suivant le consensus aujourd’hui majoritaire en philosophie et en linguistique.

Un nom commun

(1) Il désigne une catégorie.

(2) Il a un signifié relativement constant dans le système de la langue, c’est-à-dire qu’il possède une place dans le réseau cyclique des signifiés d’un dictionnaire.

(3) Il peut en outre acquérir un référent de manière variable selon les actes d’énonciation, comme dans “cette bouteille”.

Un nom propre

(1) Il désigne un individu.

(2) C’est un signifiant qui n’a pas de signifié dans le système de la langue.

(3) Il possède un référent constant conféré par une tradition sociale qui remonte à un acte de nomination. Selon Saul Kripke, un nom propre est un “désignateur rigide” dont la principale fonction est de permettre de parler d’un objet indépendamment des propriétés qu’il possède et des interprétations qu’on lui donne.

Ces définitions peuvent prêter à malentendus et donnent lieu à quelques exceptions.

Est-il vrai qu’un nom propre n’a pas de signifié?

Commençons tout de suite par évoquer la révolte instinctive contre l’idée qu’un nom propre n’a pas de signifié. Car lorsque nous entendons le mot “Napoléon” nous imaginons tout de suite le bicorne, les abeilles d’or, le jeune général traversant le pont d’Arcole un drapeau à la main, le code civil, le désastre de la Bérésina, etc. Mais Napoléon n’est pas un nom commun de la langue française, c’est un personnage historique. Les images qu’évoquent ce signifiant ne sont pas des signifiés conventionnels mais des connotations qui peuvent varier fortement selon que l’on est français ou anglais, bonapartiste ou légitimiste, militariste ou pacifiste, sensible ou non à la cause abolitioniste (la loi du 20 mai 1802 rétablit l’esclavage), etc. Les connotations sont variables mais la référence à l’individu est constante et sans ambiguité. Les noms propres peuvent avoir des connotations, mais ils n’ont pas de signifié conventionnel dans le système de la langue.

Les noms communs désignent-ils toujours des catégories générales?

Autre point douteux : les noms communs désignent-ils toujours des catégories générales? Par exemple, la lune, satellite de la terre, est-elle un nom commun ou un nom propre? Et si c’est un nom commun, comment se fait-il que “La lune” désigne un individu? Mais remarquons que l’on parle des lunes de Jupiter, qui ont été découvertes par Galilée. Le mot “lune” est donc bien un nom commun. Lorsqu’il est utilisé avec un article défini sans autre précision il réfère à l’astre argenté au cycle quasi mensuel qui éclaire nos nuits, sinon il signifie la catégorie des satellites de planètes. Le même problème se pose pour d’autre objets cosmiques, comme le soleil, la terre, le ciel, etc. En règle générale, chaque fois qu’un nom peut être utilisé au pluriel sans absurdité, alors il s’agit d’un nom commun. La philosophie bouddhiste multiplie les “terres” : les dix bhumis (sanscrit pour “terres”) sont des étapes successives sur le chemin du Bodhisatva. Bien qu’il semble à première vue qu’il n’y ait qu’un seul ciel, le mot possède plusieurs pluriels en français : “cieux” au sens spirituel et “ciels” aux sens matériels. Ne parle-t-on pas des ciels de Turner ou de Monet? En revanche, Mars ou Saturne sont des satellites particuliers ou des divinités personnelles et je ne les ai jamais vus utilisés au pluriel. Ce sont donc des noms propres désignant des individus astronomiques ou mythologiques.

Dans certains usages, une catégorie générale peut être considérée comme un individu

Encore un cas troublant: on peut faire référence à une catégorie générale en la considérant comme un individu. Lorsque je dis “Le fruit que je tiens dans ma main est un melon” j’utilise bien le mot melon comme une catégorie générale dans laquelle je range le fruit individuel que je tiens dans ma main. Jusqu’ici tout va bien. Mais je peux toujours considérer une catégorie générale comme un individu, un élément de l’ensemble des catégories générales : c’est le point de vue réaliste ou platonicien. Par exemple lorsque je dis “le melon est un fruit”, “melon” est au singulier et il est accompagné d’un article défini. Il s’agit donc d’un individu: une “catégorie individuelle”. Mais il ne s’agit là que d’un usage possible d’un nom commun, qui ne range nullement le mot “melon” dans la catégorie des noms propres. Dès qu’une catégorie générale est placée dans un énoncé en position de référent (nous parlons de “cette catégorie-là”), l’usage en fait un individu. Il suffit de distinguer les niveaux logiques pour ne pas se prendre les pieds dans le tapis sémantique. Retenons que lorsqu’un mot possède un signifié dans le système de la langue, il s’agit d’un nom commun, bien que l’on puisse s’en servir pour désigner un individu.

Des noms propres peuvent être utilisés comme prototypes de catégories générales

Dans l’effort pour discriminer entre nom propre et nom commun, la plus grande difficulté vient de l’utilisation des noms propres comme prototypes de catégories générales. On parle par exemple de statuettes qui sont des Vénus préhistoriques ou d’un maître-nageur qui est un Apollon. On traite ironiquement d’Einstein une personne à l’esprit lent, etc. “Les Vénus” contredit la règle générale que nous avons énoncé plus haut, selon laquelle chaque fois qu’un nom peut être utilisé au pluriel sans absurdité, alors il s’agit d’un nom commun. Bien pire, les noms propres peuvent engendrer des adjectifs désignant des qualités abstraites. Par exemple, on souligne le contraste entre l’évolution lamarckienne et l’évolution darwinienne, on évoque les guerres napoléoniennes ou les idées platoniciennes. Certes, Vénus, Apollon, Platon, Napoléon, Darwin, etc. sont des individus, mais ces individus ont tellement marqué les imaginations qu’ils sont devenus les “membres centraux”, ou figures archétypiques, de catégories comprenant les individus qui leur ressemblent ou qui possèdent avec eux une contiguïté spatio-temporelle (la “période napoléonienne”). Dès lors, le nom propre est utilisé de manière figurative comme un nom commun, ou comme une qualité générique dans le cas d’un adjectif construit à partir d’un nom propre. Nous avons donc affaire dans ces cas à des exceptions à notre règle, dans lesquelles des noms propres sont utilisés (par métaphore, métonymie, contiguïté, etc.) pour désigner des catégories.

Nom propres et références en IEML

Chacun des trois mille mots élémentaires du dictionnaire d’IEML se définit au moyen de phrases utilisant d’autres mots élémentaires et chaque expression complexe en IEML (groupes de mots, phrases, textes) renvoie au noyau circulaire d’inter-définition du dictionnaire. Cette inter-définition circulaire des mots du dictionnaire est d’ailleurs le propre de toutes les langues. Selon leurs rôles grammaticaux dans un énoncé, les trois mille éléments du dictionnaire IEML peuvent être lus comme des noms, des adjectifs, des verbes ou des adverbes. Leurs signifiés sont des catégories générales. Les signifiants de ces catégories générales sont construits pour avoir le maximum de relations fonctionnelles avec leurs signifiés. Les signifiés du même champ sémantique appartiennent au même paradigme et possèdent des similitudes syntaxiques. La composition matérielle des signifiants et leurs places respectives dans les paradigmes donne des indications sur leur sens. Par exemple, les signifiants des couleurs ou des sentiments ont des traits syntaxiques en commun. Les couleurs qui contiennent du rouge ou les sentiments qui avoisinent la colère ont également des traits matériels communs. C’est ce qui fait d’IEML une idéographie. On ne trouve évidemment pas ce type de relation signifiant / signifié dans les langues naturelles, dans lesquelles les mots pour désigner les couleurs ou les sentiments, n’ont pas de traits phonétiques communs. Jointe à la régularité sans faille de sa grammaire, ce rapport fonctionnel entre signifiant et signifié fait d’IEML une langue à la sémantique (linguistique) calculable.

En revanche, les noms propres comme Napoléon ou le Fuji Yama n’ont pas de traduction en IEML et, de ce fait, leur sémantique linguistique n’est pas calculable en IEML. En IEML les noms propres sont considérés comme des signifiants n’ayant pas de signifié (du moins pas en IEML) et dont le sens est donc purement référentiel. Les références, tout comme les noms propres, sont notés entre crochets. Voici quelques exemples qui mettent en valeur le cas particulier de Napoléon. Dans les phrases IEML entre parenthèses qui suivent, les mots en italiques désignent les rôles grammaticaux de la ligne qu’ils initient, les mots en français contiennent des liens vers le mot IEML correspondant.

***

(racine le officier — stratège <Napoléon>).

L’expression signifie : “le général Napoléon”

***

(racine le chef <Napoléon> ,
manière de empire).

L’expression signifie : “l’empereur Napoléon”

***

(racine vide <Napoléon>).

Ici Napoléon n’est qualifié par aucune catégorie générale.

***

(racine pluriel guerre,
manière de officier — stratège <Napoléon>).

L’expression signifie “les guerres napoléonniennes”

***

L’expression “les guerres napoléoniennes” peut être réifiée ainsi:

@alias les-guerres-napoléonniennes
(racine pluriel guerre,
manière de officier — stratège <Napoléon>).

***

L’expression définie ci-dessus peut être réutilisée dans une phrase, par exemple:

(racine être blessé,
sujet singulier pronom troisième personne,
temps passé,
temps pendant les-guerres-napoléonniennes).

L’expression signifie: “Il a été blessé pendant les guerres napoléoniennes”

Dans cet exemple, on voit comment une phrase IEML (y compris une phrase contenant un nom propre) peut être réifiée et utilisée comme un mot dans une phrase au niveau de complexité linguistique supérieure. Ce type d’opération peut être répété récursivement, ce qui permet d’atteindre des degrés élevés de différentiation et de précision sémantique.

***

Les deux exemples qui précèdent montrent qu’il est possible d’utiliser des noms propres comme prototypes de catégories générales en IEML, comme on le fait dans les langues naturelles. Mais en règle générale on préfèrera exprimer directement les catégories évoquées par les noms propres dans certaines langues naturelles par des catégories en IEML. Par exemple, pour traduire “sadique” on ne reprendra pas le nom du Marquis de Sade, mais on dira simplement “quelqu’un qui aime faire souffrir les autres.”

***

Dans l’exemple ci-dessous, l’objet de la proposition principale est une proposition secondaire – on remarquera les parenthèses dans les parenthèses – et l’accent sémantique (le point d’exclamation) est mis sur la personne (qui que ce soit) qui aime faire souffrir les autres.

@alias sadique
(
racine aimer, désirer
sujet ! qui que ce soit
objet
(racine faire souffrir,
objet pluriel autre personne).
).

***

Les noms de personnes, les adresses, les dates, les positions GPS, les nombres, les unités de mesure, les devises, les objets géographiques, les URL, etc. sont tous considérés comme des noms propres ou des références individuelles et sont mis entre crochets. Les douze premiers nombres entiers naturels sont néanmoins considérés comme des noms communs (ils “existent” en IEML et sont connectés aux nombres ordinaux, aux symétries, aux figures géométriques régulières, etc.). Les grandes zones géographiques existent également en IEML, sont considérées comme des catégories générales et peuvent être assimilés à des “codes postaux” qui donnent lieu à des calculs sémantiques. Ces codes permettent notamment de déterminer les positions respectives (au Nord, à l’Est, etc.) des zones codées, ainsi que de situer et regrouper les pays, les villes et autres objets géographiques.

***

Par exemple, pour dire “l’Italie” en IEML, on écrit:

(racine Europe centre-sud <Italia>).

Expression dans laquelle “Europe centre sud” fait partie du paradigme des pays européens.

***

Pour dire “le nombre 292”, on écrit:

(racine nombre <292>).

***

Pour dire “le nom d’un client”, on écrit:

(racine nom < Dupont >,
manière du client).

Le lecteur contrastera l’approche d’IEML avec celle du Web sémantique, dans lequel les URI ne distinguent pas entre catégories générales et désignateurs rigides et ne peuvent pas faire l’objet de calculs sémantiques à partir de leur forme matérielle (une séquence de caractères). En fait, tous les URI sont des désignateurs rigides. Bien entendu, l’approche d’IEML et celle du web sémantique ne sont pas incompatibles puisque les expressions IEML valides ou USLs (Uniform Semantic Locators) ont une forme unique et peuvent se représenter comme des URIs.

L’auto-référence linguistique en IEML

On a vu plus haut que les USLs pouvaient contenir des noms propres, des nombres et autres expressions qui sont opaques au calcul sémantique IEML. Les USLs peuvent aussi faire référence à d’autres USLs, comme on peut le voir dans l’exemple ci-dessous.

***

@alias Bravo-Einstein!
(racine féliciter,
sujet singulier première personne,
objet singulier pronom deuxième personne <Einstein>).

***

(racine mode indicatif moquer,
sujet cette phrase <Bravo-Einstein!>,
objet singulier pronom deuxième personne).

***

BIBLIOGRAPHIE

Cormier Agathe. “Relecture pragmatique de Kripke pour une approche dialogique du nom propre”. 4e Congrès Mondial de Linguistique Française, Jul 2014, Berlin, Allemagne. p. 3059-3074

Frege Gottlob, “Sens et dénotation”. 1892. Trad. de C. Imbert. In Écrits logiques et philosophiques. Paris : Éditions du Seuil, 1971, 102-126.

Kripke Saul, Naming and Necessity, Oxford, Blackwell, 1980. Trad. fr. La logique des noms propres, Paris, Minuit, 1982, (trad. P. Jacob et F. Recanati).

Mill John Stuart, A System of Logic, 1843. Trad. fr. Mill, John Stuart, Système de logique déductive et inductive, trad. fr. L. Peisse Paris, Alcan, 1896.

Récanati François, “La sémantique des noms propres : remarques sur la notion de « désignateur rigide»”. In: Langue française, n°57, 1983. Grammaire et référence, sous la direction de Georges Kleiber et Martin Riegel. pp. 106-118.

DOI : https://doi.org/10.3406/lfr.1983.5159 www.persee.fr/doc/lfr_0023-8368_1983_num_57_1_5159

Rosch Eleanor., “Cognitive Representations of Semantic Categories”, Journal of Experimental Psychology: General, Vol.104, No.3, September 1975, pp. 192–233.

Rosch Eleanor, “Natural categories”, Cognitive Psychology 1973 4, pp. 328-350.

Russell Bertrand. Human Knowledge: Its Scope and Limits. London: George Allen & Unwin (1948). Trad fr. La connaissance humaine : sa portée et ses limites. Trad. N. Lavand. Paris : J. Vrin, 2002

Vandendorpe, Christian, “Quelques considérations sur le nom propre. Pour un éclairage du linguistique par le cognitif et réciproquement”. In Langage et société, numéro 66, déc. 1993, p. 63-75.

Wittgenstein, Ludwig, Philosophical Investigations, (specially paragraph 79), Trad Anscombe, Basil Blackwell, 1958.

Articles de Wikipedia:

https://en.wikipedia.org/wiki/Prototype_theory

https://en.wikipedia.org/wiki/Causal_theory_of_reference

https://en.wikipedia.org/wiki/Saul_Kripke

Tags IEML, noms propres, sémantique

Categories French, Sphère sémantique

Vers l’organisation data-centrique

1 July 2021 //

For the English version, go here.

Les banques classiques proposent désormais à leurs clients une application permettant d’effectuer des transactions sur un smartphone. Mais les données en provenance du smartphone sont le plus souvent décodées et rentrées dans le système central pendant la nuit, puis sont traitées et finalement recodées le lendemain pour être renvoyées à l’application du smartphone. Résultat: il faut deux jours pour que votre compte soit mis à jour après une transaction sur votre téléphone.

Par contraste, dans les systèmes bancaires qui datent du XXIe siècle, tous les traitements ont lieu dans le même centre de données accessible par Internet. De plus, l’application du portable et celles des services centraux communiquent de manière immédiate parce qu’elles utilisent le même format et la même catégorisation des données. Résultat : les comptes sont mis à jour instantanément après une transaction sur le smartphone. On dit que les systèmes d’information des nouvelles banques sont conçues dès l’origine de manière data-centrique. En fluidifiant la circulation de l’information, l’enjeu central de l’organisation data-centrique est d’améliorer l’expérience du client ou, selon une autre formulation, de créer plus de valeur pour le bénéficiaire d’un service.

La chaîne de valeur

La notion de valeur possède un champ sémantique étendu. Il peut s’agit de valeurs éthiques, comme la justice, le courage, la sagesse ou l’harmonie des relations humaines. Ces valeurs-là n’ont évidemment pas de contreparties monétaires. Quant aux biens et services qui s’échangent sur le marché, au-delà d’un ajustement provisoire et local de l’offre et de la demande, il est bien difficile d’assigner une essence à leur valeur. La valeur proprement économique peut correspondre à une nécessité (comme celle de manger), à un désir de distraction ou de beauté, à l’accélération d’un travail ennuyeux, à un espoir de gagner de l’argent (loterie ou instrument de spéculation), à une amélioration de la qualité de vie, à l’acquisition de compétences, à une compréhension élargie qui nous rendra capable de mieux décider, à un avantage compétitif, à une image plus flatteuse, etc. La valeur n’est donc pas une fonction simple du travail investi dans la production d’un bien ou d’un service. Elle dépend de l’appréciation subjective et des comparaisons de ceux qui en bénéficient, le tout prenant place dans un contexte économique et culturel changeant. Malgré le caractère évanescent de son essence, qui tient probablement à son rapport au désir, la valeur est au cœur de la théorie économique et de la pratique des entreprises. Toute organisation crée de la valeur pour ses clients (une entreprise privée), son public (un service municipal) ou ses patients (un hôpital) et cette création constitue la principale justification de son existence.

Il est souvent utile de distinguer entre deux personnes distinctes, le client, celui qui paye pour le bien ou le service, et l’utilisateur ou le consommateur, qui s’en sert. Par exemple, le service informatique d’une entreprise (le client) achète un logiciel, mais ce sont les employés (les consommateurs) qui s’en servent. Dans l’analyse qui suit, je me concentrerai sur les relations entre les producteurs et les consommateurs de la valeur. Chaque collaborateur crée de la valeur pour les collègues qui viennent après lui sur la chaîne, la bonne exécution de leur travail dépendant de la sienne. La chaîne de valeur ne s’arrête pas nécessairement aux frontières d’une seule organisation. Elle peut connecter des réseaux d’entreprises, qui peuvent elles-mêmes être implantées dans plusieurs pays, chaque type d’entreprise contribuant qui à la conception, qui à la production des pièces, qui à l’assemblage, qui au transport, qui à la vente. Les chaînes d’approvisionnement, dont on parle tant depuis la pandémie de COVID-19, sont un cas de chaîne de valeur qui concerne plus particulièrement les activités matérielles et les transports au sein d’une filière particulière. Le consommateur final bénéficie de la valeur créée à chaque étape de la production du bien ou du service.

L’augmentation de la productivité des organisations et des filières fonde la prospérité économique. Cette augmentation vient d’innovations permettant de créer plus de valeur à moindre coût. Or la performance globale d’une entreprise – ou d’une plus vaste chaîne de valeur – dépend de la performance de chaque activité ou métier, mais aussi de la liaison qui existe entre ces activités. Nous rejoignons ici le thème de l’organisation data-centrique, car les activités – et plus encore les liaisons entre les activités – nécessitent la réception, le traitement et l’échange d’informations.

De l’informatique centrée sur les applications à l’informatique centrée sur les données

Dans la seconde moitié du XXe siècle, lors de la première vague d’informatisation, chaque “métier” d’une entreprise avait développé des applications pour augmenter ses performances: le système de conception assisté par ordinateur, les automatismes de production, la gestion des stocks, la paye des employés, la comptabilité de l’entreprise, la base de données des clients, etc. Chaque application particulière était conçue selon les normes culturelles et le vocabulaire de son milieu d’utilisation. Les données d’entrées étaient formatées spécialement pour l’application qui les utilisait tandis que les données de sortie étaient mises en forme pour les besoins de leurs utilisateurs immédiats. On avait donc une informatisation “en silos” centrée sur les applications, chaque application commandant la structure de ses données d’entrée et de sortie.

la banque classique du début de ce texte est un bon exemple de cette informatique du XXe siècle, dont le principal défaut est la difficulté de communication entre les applications. En effet, le découpage conceptuel et le formatage des données de sortie d’une application ne correspondent pas forcément à ceux de l’entrée d’une autre application. Par exemple, si le logiciel de gestion de stock ne partage pas ses données avec celui de la base de données des clients, la réponse rapide à une commande est malaisée. Mais depuis le début du XXIe siècle les connexions à l’Internet se sont multipliées et banalisées. Sur le plan matériel, le traitement de l’information a lieu de manière croissante dans les grands centres de données d’Amazon ou de Microsoft qui louent à leurs clients de la mémoire aussi facilement que des places de stationnement et de la puissance de calcul à la demande comme s’il s’agissait d’électricité. Mémoire et puissance de calcul deviennent des marchandises disponibles sur le marché (“commodities“) que l’on a plus besoin de produire soi-même. C’est ce qu’on appelle la nuagique, ou cloud computing en anglais. Sur le plan logiciel, les API (application programming interfaces) sont des interfaces de codage / décodage des données permettent aux applications d’échanger leurs informations. Sous l’effet des mutations qui viennent d’être évoquées, l’informatique centrée sur les applications apparaît de plus en plus obsolète, bien qu’elle reste la situation de fait dans la majorité des organisations en 2021.

Par contraste avec celle du XXe siècle, l’informatique du XXIe siècle est centrée sur les données. Il faut se représenter un entrepôt commun dans lequel différentes applications viennent chercher leurs données d’entrée et déposer leurs données de sortie. Au lieu que des données spécialisées s’ordonnent autour d’applications particulières, ce sont de multiples applications, dont certaines sont éphémères, qui s’ordonnent autour d’une mémoire numérique commune et relativement stable. On dit alors que les applications deviennent interopérables. Le décollement de l’informatique data-centrique peut être datée de 2002, lorsque Jeff Bezos, le dirigeant d’Amazon, a demandé à tous ses développeurs de rendre accessible et de publier leurs données par l’intermédiaire d’une API.

Sur un plan économique, l’informatique data-centrique améliore la productivité des organisations puisqu’elle permet aux différentes activités de partager leurs données et de se coordonner plus facilement : la chaîne de valeur se fluidifie. Contrairement à ces administrations affichant des formulaires indéchiffrables en jargon bureaucratique et qui demandent dix fois aux usagers de redonner les mêmes informations sous des formes différentes parce que leurs applications ne communiquent pas, les grandes entreprises de nuagique comme les GAFAM et les BATX ont habitué les consommateurs à des temps de réaction immédiats et à des interfaces optimisées. Les entreprises les plus riches du monde sont data-centriques. Il en est de même de secteurs dynamiques de l’économie comme l’industrie du jeu vidéo ou de la distribution de films et de séries en ligne. Puisque les bénéfices de l’informatique data-centrique sont tellement évidents, pourquoi n’est-elle pas mise en oeuvre partout? Parce qu’il ne peut exister d’informatique data-centrique hors d’une organisation data-centrique et que le passage à ce nouveau type d’organisation réclame une mutation épistémologique et sociale considérable. Les grandes entreprises de nuagique datent du XXIe siècle ou de la toute fin du XXe siècle. Elles sont nées dans le paradigme numérique et ce sont elles qui ont inventé l’organisation data-centrique. Les industries plus anciennes, en revanche, peinent à suivre.

A une activité quelconque (production, vente, etc.) correspond une culture pratique, c’est-à-dire une certaine manière de découper les objets, de nommer leurs relations et d’enchaîner les opérations. L’informatisation d’une activité suppose non seulement la création d’une application mais aussi d’un système de métadonnées, et l’un comme l’autre sont conditionnés par une culture pratique datée et située. Pour fusionner les collections de données d’une organisation, il faut “réconcilier” les différents systèmes de métadonnées et, cela fait, s’engager à maintenir et faire évoluer le système de métadonnées commun pour accompagner les besoins. Tout cela demande de nombreux entretiens avec des experts des différentes sphères d’activité et des réunions d’harmonisation où les marchandages sur les définitions de concepts peuvent être rudes. La réconciliation des modèles de données n’est pas moins complexe que n’importe quelle négociation interculturelle alourdie par des enjeux de pouvoir. En effet, pour la plupart des acteurs concernés, il faut non seulement réviser ses habitudes cognitives et ses manières de faire, mais encore renoncer à une part de souveraineté locale. Il ne va plus être possible d’organiser sa mémoire pratique sans se coordonner avec les autres activités de la chaîne de valeur aussi bien sur un plan sémantique que sur un plan technique. Dès lors, la gouvernance des données, dont le principal responsable est le “Chief Information Officer” ou “Chief Data Officer“, devient une des principales fonctions de l’entreprise.

La gouvernance des données

La gouvernance des données doit faire face à deux problèmes entrelacés: sémantique et politique. Sur un plan politique, on remarquera que les systèmes de métadonnées – c’est-à-dire les catégories qui organisent les données – sont toujours liées aux caractéristiques sociales, culturelles et aux activités pratiques de leurs utilisateurs. Par exemple, dans telle grande entreprise de télécommunication, les données de consommation vont être organisées par “lignes” et non par “clients”. Or un client peut avoir plusieurs lignes et la même ligne peut être utilisée par plusieurs clients. Il est clair que les relations avec la clientèle serait plus aisée si les données étaient classées et analysées en fonction des personnes physiques ou morales qui utilisent les services de l’entreprise. Mais ce n’est pas le cas parce que l’entreprise de télécommunication est dominée par une culture d’ingénieurs pour qui les “vraies” données sont celles des lignes. Cette approche par le matériel plutôt que par l’humain permet aussi de rendre la tarification la plus “objective” possible et de la soustraire aux négociations. En somme, la manière dont une communauté organise sa mémoire reflète et réifie son identité. Réorganiser sa mémoire revient à changer d’identité. Le parallélisme entre métadonnées et contextes sociaux fait de la gouvernance des données un enjeu politique.

Quant à l’enjeu sémantique, il ne concerne plus la face subjective de l’identité – qu’elle soit personnelle ou collective – mais sa face logique. Si l’on veut que les applications soient interopérables d’un bout à l’autre de la chaîne de valeur, les objets, des relations et des processus doivent être nommées de façon unique. La difficulté vient ici de la multiplicité des métiers, chacun avec son propre jargon, et de la pluralité des langues, particulièrement dans les entreprises ou les filières internationales. Lorsqu’il s’agit de coordonner des activités, les synonymes (mots différents pour dire la même chose) et les homonymes (un mot signifiant plusieurs choses différentes) deviennent des obstacles à la collaboration. Les homonymes, en particulier, peuvent provoquer de graves erreurs de calcul. Par exemple, il est arrivé dans une compagnie aérienne que le mot “Asie” recouvre des aires géographiques différentes selon les branches et que cette incohérence sémantique provoque des erreurs de décision stratégique. Quand toutes les opérations sont automatisées et dirigées par les données, un terme ambigu peut donner de fausses indications aux dirigeants, voire interrompre une chaîne d’approvisonnement.

Le “dictionnaire de données” ou référentiel est le principal outil de la gouvernance des données. C’est là que sont énumérés tous les types de données et la manière unique de les catégoriser. Si, comme c’est souvent le cas, le référentiel n’a pas été unifié, il faut alors faire appel à des “tables d’alignement” entre systèmes. Au-delà des problèmes de cohérence, la gouvernance des données doit aussi s’occuper de la qualité des données. A cette fin on utilise un “catalogue de contrôle des données”, qui énumère les méthodes pour tester la qualité des données en fonction de leur nature. Par exemple, comment détecter les erreurs sur les noms de clients lorsque l’entreprise opère dans soixante-dix pays? Il y a des pays où on ne découpe pas en nom et prénom, d’autres pays ou des nombres sont acceptables dans un nom (en Ukraine), d’autres où un nom peut y avoir quatre ou cinq consonnes de suite, etc.

Le passage à l’organisation data-centrique implique un changement de culture et une évolution du management. Soudain, les mots et les concepts deviennent importants, et cela non seulement dans la communication et le marketing, mais aussi dans la production, qui n’est pas moins informatisée que les autres fonctions de l’entreprise. De plus, le changement culturel réclame plus d’ouverture et de communication entre départements, agences, services et métiers. Pas de bonne gestion sans gestion des données et pas de gestion des données sans bonne gestion des métadonnées. On croyait l’intérêt pour la sémantique réservée aux départements de cultural studies entichés de french theory dans les universités américaines, et voici qu’elle conditionne la productivité des entreprises!

Distinguer les mots et les concepts

Je note pour finir que les outils d’édition et de gestion de métadonnées les plus sophistiqués du marché (Pool Party, Ab Initio, Synaptica) n’ont aucun moyen de distinguer clairement entre les “mots” ou “termes” dans une langue naturelle particulière et les “concepts” ou “catégories”, qui sont des notions plus abstraites et trans-linguistiques. Le même concept peut être exprimé par différents mots dans différentes langues et le même mot peut correspondre à plusieurs concepts, y compris dans la même langue (le cardinal est-il un dignitaire ecclésiaste, un oiseau, ou un glaïeul?). Les mots sont ambigus et multiples, mais reconnaissables par des humains. Les concepts formels sous-jacents sont uniques et devraient être interprétables par les machines. En proposant un système de codage univoque des concepts et de leurs relations qui soit indépendant des langues naturelles, IEML permet de distinguer et d’articuler les mots et les concepts. Ce nouveau système de codage fait non seulement progresser la sémantique, mais recèle un pouvoir insoupçonné de fluidifier les chaînes de valeur et d’augmenter l’intelligence collective.

P.S. Je remercie John Horodyski, Paul-Louis Moreau, Samuel Parfouru et Michel Volle d’avoir bien voulu répondre à mes questions, contribuant ainsi à informer ce billet. Erreurs, inexactitudes et opinions hétérodoxes ne doivent néanmoins être attribuées qu’à l’auteur, Pierre Lévy.

Tags Collective intelligence, data, IEML, metadata, semantics

Categories French

La valeur du savoir vérifié à l’heure de l’IA générative

L’intelligence collective

L’intelligence artificielle comme augmentation de l’intelligence collective

­­­­Le partage du savoir : vers une intelligence collective neurosymbolique

1 Le contexte

Une nouvelle époque de la culture

Le basculement démographique

2 Mémoire et communication numérique

La nouvelle sphère publique

L’intelligence collective stigmergique

Le rôle de l’Intelligence artificielle dans la nouvelle sphère publique

3 Le côté obscur

L’état-plateforme et la nouvelle bureaucratie dans les nuages

Les médias sociaux : addictions et manipulations

IA et domination culturelle

4 Perspectives d’émancipation

Littéracie numérique et pensée critique

Pour une gouvernance de la sphère publique numérique

INTRODUCTION

COMMENT CONSTRUIRE UN CONCEPT EN IEML?

REMARQUES FINALES

Le tournant numérique en sciences humaines

Un nouvel outil sémantique

Les mots

Les phrases

La création de relations sémantiques

Indexation, noms propres, référence et auto-référence.

Résumé

Le partage du savoir : vers une intelligence collective neurosymbolique