What is IEML?

  • IEML (Information Economy MetaLanguage) is an open (GPL3) and free artificial metalanguage that is simultaneously a programming language, a pivot between natural languages and a semantic coordinate system. When data are categorized in IEML, the metalanguage compute their semantic relationships and distances.
  • From a “social” point of view, on line communities categorizing data in IEML generate explorable ecosystems of ideas that represent their collective intelligence.
  • Github.

What problems does IEML solve?

  • Decompartmentalization of tags, folksonomies, taxonomies, ontologies and languages (french and english for now).
  • Semantic search, automatic computing and visualization of semantic relations and distances between data.
  • Giving back to the users the information that they produce, enabling reflexive collective intelligence.

Who is IEML for?

Content curators

  • knowledge management
  • marketing
  • curation of open data from museums and libraries, crowdsourced curation
  • education, collaborative learning, connectionists MOOCs
  • watch, intelligence

Self-organizing on line communities

  • smart cities
  • collaborative teams
  • communities of practice…

Researchers

  • artificial intelligence
  • data analytics
  • humanities and social sciences, digital humanities

What motivates people to adopt IEML?

  • IEML users participate in the leading edge of digital innovation, big data analytics and collective intelligence.
  • IEML can enhance other AI techniques like machine learning, deep learning, natural language processing and rule-based inference.

IEML tools

IEML v.0

IEML v.0 includes…

  • A dictionary of  concepts whose edition is restricted to specialists but navigation and use is open to all.
  • A library of tags – called USLs (Uniform Semantic Locators) – whose edition, navigation and use is open to all.
  • An API allowing access to the dictionary, the library and their functionalities (semantic computing).

Intellect v.0

Intellect v.0 is a Twitter client (using the IEML API) that allows the categorization of data in IEML and their semantic computing.

Subsequent versions will address other social media.

When will it ship?

November 2016

Who made it?

The IEML project is designed and led by Pierre Lévy.

It has been financed by the Canada Research Chair in Collective Intelligence at the University of Ottawa (2002-2016).

At an early stage (2004-2011) Steve Newcomb and Michel Biezunski have contributed to the design and implementation (parser, dictionary). Christian Desjardins implemented a second version of the dictionary. Andrew Roczniak helped for the first mathematical formalization, implemented a second version of the parser and a third version of the dictionary (2004-2016).

The version 0 (2016) has been implemented by Louis van Beurden, Hadrien Titeux (chief engineers), Candide Kemmler (project management, interface), Zakaria Soliman and Alice Ribaucourt.

dice-1-600x903

Dice sculpture by Tony Cragg

ON A TROUVÉ des programmeurs pour produire une démo de la sphère sémantique IEML durant l’été-automne 2016! Ce n’est plus la peine de contacter Pierre Lévy (en tous cas, plus pour ça).

IEML

IEML est une langue artificielle dont les expressions calculent automatiquement leurs relations sémantiques. C’est à la fois une langue et un langage de programmation. Si l’on se sert d’IEML pour catégoriser des données, on obtient une mémoire “auto-analytique” où les données calculent et visualisent leurs relations et distances sémantiques. Le but à long terme est d’offrir des outils de connaissance de soi à une intelligence collective réflexive. IEML se traduit évidemment en langues naturelles (pour le moment: français et anglais) et peut servir de langage pivot entre les langues.

L’application web à programmer – un outil de curation de données – vise à offrir une démonstration logicielle de la recherche sur IEML menée par le prof. Pierre Lévy à la CRC en intelligence collective de l’Université d’Ottawa de 2002 à 2016.

Une application ouverte, gratuite, au bénéfice du bien commun

– Les modules logiciels seront publiés sur Github sous la license GPL version 3 (et suivantes)
– Une API donnera accès au noyau de la sphère sémantique: dictionnaire, bibliothèque d’expressions et moteur de calcul sémantique
– L’application sera disponible à l’adresse ieml.org

Détail de l’application en quatre couches

1) L’éditeur de dictionnaire  – parseur, calcul des tables paradigmatiques, calcul des relations entre termes – a été programmé par Andrew Roczniak.
2) L’éditeur de la bibliothèque d’expressions IEML – parseur, visualisation et édition du contenu de la bibliothèque – a été programmée par Louis van Beurden et Hadrien Titeux, avec l’aide de Florent Thomas-Morel.
3) Le moteur sémantique – calcul des relations entre expressions, des distances, search, ranking sémantique, visualisation d’une expression dans un ensemble, visualisation d’un ensemble d’expressions – sera programmé par Louis van Beurden, Hadrien Titeux et Alice Ribaucourt.
4) L’application démo mono-utilisateur pour la curation de données : fonctions de catégorisation de données et de navigation dans la mémoire, y compris la bibliothèque et le dictionnaire, moyennant les outils du moteur sémantique. On a trouvé des programmeurs pour cette quatrième couche: Candide Kemmler et Zack Soliman

Travail attendu du(de la) programmeur(programmeuse) web recherché(e)

1- Collaboration étroite avec l’équipe : Louis van Beurden, Hadrien Titeux, Alice Ribeaucourt
2- Conception, en collaboration avec Pierre Lévy, de l’application-démo “curation de données”, intégration du dictionnaire, bibliothèque et moteur sémantique dans la couche application-démo sous une interface et une expérience utilisateur uniforme.
3- Programmation (Javascript, Angular 2, HTML) de la couche “démo-curation de données”

Types de personnes visés par la démo

– chercheurs en intelligence artificielle / traitement automatique des langues naturelles
– chercheurs en sciences humaines et sociales (digital humanities)
– curateurs des données publiques des musées et bibliothèques (curation crowdsourcée)
– éducateurs, environnements d’apprentissage collaboratifs / connexionnistes (MOOCs, etc.)

Quand et où

Quatre mois à temps plein du 1er juin au 30 septembre. Possibilités d’extension.

Université d’Ottawa, région Montréal et/ou Ottawa

Contact
@plevy

Quelques documents pertinents

Les fondements philosophiques et scientifiques ont été présentés dans
La Sphère sémantique, 1

Le “devis technique” fondamental est contenu dans
La Sphère sémantique, 2

Les implications culturelles et sociales sont décrits dans
L’intelligence algorithmique (à paraître)

Voir aussi: The Basics of IEML

 

Après avoir posé dans un post précédent les principes d’une cartographie de l’intelligence collective, je m’intéresse maintenant au développement humain qui est le corrélat, la condition et l’effet de l’intelligence collective. Dans un premier temps, je vais élever au carré la triade sémiotique signe/être/chose (étoile/visage/cube) pour obtenir les neuf «devenirs», qui pointent vers les principales directions du développement humain.

F-PARA-devenirs-1.jpgCarte des devenirs

Les neuf chemins qui mènent de l’un des trois pôles sémiotiques vers lui-même ou vers les deux autres sont appelés en IEML des devenirs (voir dans le dictionnaire IEML la carte sémantique M:M:.) Un devenir ne peut être réduit ni à son point de départ ni à son point d’arrivée, ni à la somme des deux mais bel et bien à l’entre-deux ou à la métamorphose de l’un dans l’autre. Ainsi la mémoire signifie ultimement «devenir chose du signe». On remarquera également que chacun des neufs devenirs peut se tourner aussi bien vers l’actuel que vers le virtuel. Par exemple, la pensée peut prendre comme objet aussi bien le réel sensible que ses propres spéculations. A l’autre bout du spectre, l’espace peut référer aussi bien au contenant de la matérialité physique qu’aux idéalités de la géométrie. Au cours de notre exploration, nous allons découvrir que chacun des neufs devenirs indique une direction d’exploration possible de la philosophie. Les neuf devenirs sont à la fois conceptuellement distincts et réellement interdépendants puisque chacun d’eux a besoin du soutien des autres pour se déployer.

Pensée

Dans la pensée – s. en IEML – aussi bien la substance (point de départ) que l’attribut (point d’arrivée) sont des signes. La pensée relève en quelque sorte du signe au carré. Elle marque la transformation d’un signe en un autre signe, comme dans la déduction, l’induction, l’interprétation, l’imagination et ainsi de suite.

Le concept de pensée ou d’intellection est central pour la tradition idéaliste occidentale qui part de Platon et passe notamment par Aristote, les néo-plationciens, les théologiens du moyen-Age, Kant, Hegel et jusqu’à Husserl. L’intellection se trouve également au coeur de la philosophie islamique, aussi bien chez Avicenne (Ibn Sina) et ses contituateurs dans la philosophie iranienne jusqu’au XVIIe siècle que chez l’andalou Averroes (Ibn Roshd). Elle l’est encore pour la plupart des grandes philosophies de l’Inde méditante. L’existence humaine, et plus encore l’existence philosophique, est nécessairement plongée dans la pensée discursive réfléchissante. Où cette pensée prend-elle son origine ? Quelles sont ses structures ? Comment mener la pensée humaine à sa perfection ? Autant de questions que l’interrogation philosophique ne peut éluder.

Langage

Le langage – b. en IEML – s’entend ici comme un code (au sens le plus large du terme) de communication qui fonctionne effectivement dans l’univers humain. Le langage est un «devenir-être du signe», une transformation du signe en intelligence, une illumination du sujet par le signe.

Certaines philosophies adoptent comme point de départ les problèmes du langage et de la communication. Wittgenstein, par exemple, a fait largement tourner sa philosophie autour du problème des limites du langage. Mais il faut noter qu’il s’intéresse également à des questions de logique et au problème de la vérité. Dans un style différent, un philosophe comme Peirce n’a cessé d’approfondir la question de la signification et du fonctionnement des signes. Austin a creusé le thème des actes de langage, etc. On comprend que ce devenir désigne le moment sémiotique (ou linguistique) de la philosophie. L’Homme est un être parlant dont l’existence ne peut se réaliser que par et dans le langage.

Mémoire

Dans la mémoire – t. en IEML – le signe en substance se réifie dans son attribut chose. Ce devenir évoque le geste élémentaire de l’inscription ou de l’enregistrement. Le devenir chose du signe est ici considéré comme la condition de possibilité de la mémoire. Il commande la notion même de temps.

Le passage du temps et son inscription – la mémoire – fut un des thèmes de prédilection de Bergson (auteur notamment de Matière et Mémoire). Bergson mettait l’épaisseur de la vie et le jaillissement évolutif de la création du côté de la mémoire par opposition avec le déterminisme physicien du XIXe siècle (la « matière ») et le mécanisme logico-mathématique, assignés à l’espace. On trouve également une analyse fine du passage du temps et de son inscription dans les philosophies de l’impermanence et du karma, comme le bouddhisme. L’évolutionnisme, de manière générale, qu’il soit cosmique, biologique ou culturel, se fonde sur une dialectique du passage du temps et de la rétention d’une mémoire codée. Notons enfin que nombre de grandes traditions religieuses se fondent sur des écritures sacrées relevant du même archétype de l’inscription. En un sens, parce que nous sommes inévitablement soumis à la séquentialité temporelle, notre existence est mémoire : mémoire à court terme de la perception, mémoire à long terme du souvenir et de l’apprentissage, mémoire individuelle où revivent et confluent les mémoires collectives.

Société

Dans la société – k. en IEML –, une communauté d’êtres s’organise au moyen de signes. Nous nous engageons dans des promesses et des contrats. Nous obéïssons à la loi. Les membres d’un clan ont le même animal totémique. Nous nous battons sous le même drapeau. Nous échangeons des biens économiques en nous mettant d’accord sur leur valeur. Nous écoutons ensemble de la musique et nous partageons la même langue. Dans tous ces cas, comme dans bien d’autres, une communauté d’humains converge et crée une unité sociale en s’attachant à une même réalité signifiante conventionnelle : autant de manières de « faire société ».

On sait que la sociologie est un rejeton de la philosophie. Avant même que la discipline sociologique ne se sépare du tronc commun, le moment social de la philosophie a été illustré par de grands noms : Jean-Jacques Rousseau et sa théorie du contrat, Auguste Comte qui faisait culminer la connaissance dans la science des sociétés, Karl Marx qui faisait de la lutte des classes le moteur de l’histoire et ramenait l’économie, la politique et la culture en général aux « rapports sociaux réels ». Durkheim, Mauss, Weber et leurs successeurs sociologues et anthropologues se sont interrogé sur les mécanismes par lesquels nous « faisons société ». L’homme est un animal politique qui ne peut pas ne pas vivre en société. Comment vivifier la philia, lien d’amitié entre les membres de la même communauté ? Quelles sont les vraies ou les bonnes sociétés ? Spirituelles, cosmopolites, impériales, civiques, nationales…? Quels sont les meilleurs régimes politiques ? Autant d’interrogations toujours ouvertes.

Affect

Dans l’affect – m. en IEML – un être s’oriente vers d’autres êtres, ou détermine son intériorité la plus intime. L’affect est ici entendu comme le tropisme de la subjectivité. Désir, amour, haine, indifférence, compassion, équanimité sont des qualités émotionnelles qui circulent entre les êtres.

Après les poètes, les dévots et les comédiens, Freud, la psychanalyse et une bonne part de la psychologie clinique insistent sur l’importance de l’affect et des fonctions émotionnelles pour comprendre l’existence humaine. On a beaucoup souligné récemment l’importance de « l’intelligence émotionnelle ». Mais la chose n’est pas nouvelle. Cela fait bien longtemps que les philosophes s’interrogent sur l’amour (voir le Banquet de Platon) et les passions (Descartes lui-même a écrit un Traité des passions), même s’il n’en font pas toujours le thème central de leur philosophie. L’existence se débat nécessairement dans les problèmes affectifs parce qu’aucune vie humaine ne peut échapper aux émotions, à l’attraction et à la répulsion, à la joie et à la tristesse. Mais les émotions sont-elles des expressions légitimes de notre nature spontanée ou des «poisons de l’esprit» (selon la forte expression bouddhiste) auxquels il ne faut pas laisser le gouvernement de notre existence ? Ou les deux ? De nombreuses écoles philosophiques aussi bien Orient qu’en Occident, ont vanté l’ataraxie, le calme mental ou, tout au moins, la modération des passions. Mais comment maîtriser les passions, et comment les maîtriser sans les connaître ?

Monde

Dans le monde – n. en IEML – les êtres humains (être en substance) s’expriment dans leur environnement physique (chose en attribut). Ils habitent cet environnement, ils le travaillent au moyen d’outils, ils en nomment les parties et les objets, leur attribuent des valeurs. C’est ainsi que se construit un monde culturellement ordonné, un cosmos.

Nietzsche (qui accordait un rôle central à la création des valeurs), tout comme la pensée anthropologique, fondent principalement leur approche sur le concept de « monde », ou de cosmos organisé par la culture humaine. La notion indienne tout-englobante de dharma se réfère ultimement à un ordre cosmique transcendant qui veut se manifester jusque dans les plus petits détails de l’existence. L’interrogation philosophique sur la justice rejoint cette idée que les actes humains sont en résonance ou en dissonance avec un ordre universel. Mais quelle est la « voie » (le Dao de la philosophie chinoise) de cet ordre ? Son universalité est-elle naturelle ou conventionnelle ? A quels principes obeit-elle ?

Vérité

La vérité – d. en IEML – décrit un « devenir signe de la chose ». Une référence (un état de chose) se manifeste par un message déclaratif (un signe). Un énoncé n’est vrai que s’il contient une description correcte d’un état de choses. L’authenticité se dit d’un signe qui garantit une chose.

La tradition logicienne et la philosophie analytique s’intéressent principalement au concept de vérité (au sens de l’exactitude des faits et des raisonnements) ainsi qu’aux problèmes liés à la référence. L’épistémologie et les sciences cognitives qui se situent dans cette mouvance mettent au fondement de leur démarche la construction d’une connaissance vraie. Mais, au-delà de ces spécialisations, la question de la vérité est un point de passage obligé de l’interrogation philosophique. Même les plus sceptiques ne peuvent renoncer à la vérité sans renoncer à leur propre scepticisme. Si l’on veut mettre l’accent sur sa stabilité et sa cohérence, on la fera découler des lois de la logique et de procédures rigoureuses de vérification empirique. Mais si l’on veut mettre l’accent sur sa fragilité et sa multiplicité, on la fera sécréter par des paradigmes (au sens de Khun), des épistémès, des constructions sociales de sens, toutes variables selon les temps et les lieux.

Vie

Dans la vie – f. en IEML – une chose substantielle (la matérialité du corps) prend l’attribut de l’être, avec sa qualité d’intériorité subjective. La vie évoque ainsi l’incarnation physique d’une créature sensible. Quand un être vivant mange et boit, il transforme des entités objectivées en matériaux et combustibles pour les processus organiques qui supportent sa subjectivité : devenir être de la chose.

Les empiristes fondent la connaissance sur les sens. Les phénoménologues analysent notamment la manière dont les choses nous apparaissent dans la perception. Le biologisme ramène le fonctionnement de l’esprit à celui des neurones ou des hormones. Autant de traditions et de points de vue qui, malgré leurs différences, convergent sur l’organisme humain, ses fonctions et sa sensibilité. Beaucoup de grands philosophes furent des biologistes (Aristote, Darwin) ou des médecins (Hippocrate, Avicenne, Maïmonide…). Médecine chinoise et philosophie chinoise sont profondément interreliées. Il est indéniable que l’existence humaine émane d’un corps vivant et que tous les événements de cette existence s’inscrivent d’une manière ou d’une autre dans ce corps.

Espace

Dans l’espace – l. en IEML –, qu’il soit concret ou abstrait, une chose se relie aux autres choses, se manifeste dans l’univers des choses. L’espace est un système de transformation des choses. Il se construit de relations topologiques et de proximités géométriques, de territoires, d’enveloppes, de limites et de chemins, de fermetures et de passages. L’espace manifeste en quelque sorte l’essence superlative de la chose, comme la pensée manifestait celle du signe et l’affect celle de l’être.

Sur un plan philosophique, les géomètres, topologues, atomistes, matérialistes et physiciens fondent leurs conceptions sur l’espace. Comme je le soulignais plus haut, le géométrisme idéaliste ou l’atomisme matérialiste se rejoignent sur l’importance fondatrice de l’espace. Les atomes sont dans le vide, c’est-à-dire dans l’espace. L’existence humaine se projette nécessairement dans la multitude spatiale qu’elle construit et qu’elle habite : géographies physiques ou imaginaires, paysages urbains ou ruraux, architectures de béton ou de concepts, distances géométriques ou connexions topologiques, replis et réseaux à l’infini.

On peut ainsi caractériser les philosophies en fonction du ou des devenirs qu’elles prennent pour point de départ de leur démarche ou qui constituent leur thème de prédilection. Les devenirs IEML représentent des « points de passage obligé » de l’existence. Dès son alphabet, le métalangage ouvre la sphère sémantique à l’expression de n’importe quelle philosophie, exactement comme une langue naturelle. Mais c’est aussi une langue philosophique, conçue pour éviter les zones cognitives aveugles, les réflexes de pensée limitants dus à l’usage exclusif d’une seule langue naturelle, à la pratique d’une seule discipline devenue seconde nature ou à des points de vue philosophiques trop exclusifs. Elle a justement été construite pour favoriser la libre exploration de toutes les directions sémantiques. C’est pourquoi, en IEML, chaque philosophie apparaît comme une combinaison de points de vue partiels sur une sphère sémantique intégrale qui peut les accommoder toutes et les entrelace dans sa circularité radicale.

F-PARA-IC.jpg

Carte sémantique de l’intelligence collective

La carte ci-dessus schématise les grandes structures de l’intelligence collective humaine telles que nous les appréhendons au début du XXIe siècle. Le signe y est signalé par une étoile, l’être par un visage et la chose par un cube. L’intelligence collective se présente comme une boucle d’interdépendance entre le développement humain actuel et le développement humain virtuel (sur les catégories sémantiques virtuel, actuel, signe, être et chose, voir ce post). Le développement actuel comprend trois facettes qui sont elles-mêmes interdépendantes : celle des messages , des personnes et des équipements. Ces trois facettes actuelles concernent des facteurs ou des processus qui sont plongés dans l’espace et le temps. Le développement virtuel comprend lui aussi trois facettes interdépendantes : la connaissance, l’éthique et la puissance. Par contraste avec les facettes actuelles, les facettes virtuelles désignent des états d’esprit, des règles ou des potentialités. Le développement virtuel dépend du développement actuel comme de sa base matérielle tandis que le développement actuel dépend du développement virtuel comme de son instance de coordination, de pilotage et de traction. L’intelligence collective peut également s’analyser comme une dialectique d’interdépendance entre trois types de réseaux représentés par les colonnes de la carte : les réseaux de signes (connaissances et messages), d’êtres (éthiques et personnes) et de choses (puissances, équipements).

Chacune des six catégories principales s’analyse à son tour comme une dynamique de transformation entre trois sous-catégories de niveau inférieur selon la symétrie signe/être/chose. Dans la transformation symétrique interne à chacune des six catégories principales de l’intelligence collective, la chose représente la dimension la plus « dure » ou la plus objective ; l’être est chargé d’émotion et se déploie dans les rapports humains ; enfin le signe indique une dimension cognitive qui oriente le contenu de la catégorie. On comprend ici que des symétries sémantiques virtuel/actuel et signe/être/chose peuvent se décliner récursivement à l’intérieur de n’importe quelle catégorie et que la modélisation par les systèmes de relations sémantiques peut être raffinée à loisir.

En inspectant la carte sémantique de l’intelligence collective, il faut supposer qu’une variation des données empiriques dans une catégorie se répercutera d’une manière ou d’une autre dans la variation empirique des catégories symétriques et que les données catégorisées par les différentes facettes tendent à s’équilibrer en fonction de leurs relations d’interdépendance. Par exemple, il est impossible de garder de manière durable une force dans une des six catégories principales et des faiblesses dans les autres. Nous allons maintenant explorer une par une les six catégories principales de l’intelligence collective. Il faut imaginer ce système de relations sémantiques comme un tableau de bord qui documente en temps réel l’évolution de l’intelligence collective d’une communauté (son contenu, ses forces, ses faiblesses, ses connexions internes) sur un mode visuel et interactif, à partir d’un flux de données spécialement sélectionné à cet effet. On imaginera également que l’individu ou le groupe qui interagit avec le tableau de bord peut visualiser sa propre contribution à l’intelligence collective et ce qu’il en reçoit.

Connaissances

Une foule de styles de savoirs – académiques ou non-académiques – alimentent le « capital épistémique » d’une communauté. Les réseaux de connaissances n’excluent a priori aucun genre de savoir ni aucun type de relation entre les savoirs. Cette catégorie rassemble donc la variété ouverte des types de connaissance portés par une communauté à partir de l’intuition fondamentale qu’ils se multiplient les uns par les autres et qu’ils peuvent tous contribuer à leur manière au développement humain dans son ensemble. Les connaissances contiennent notamment, comme une sous-fonction cognitive spécialement consacrée à la réflexivité de l’intelligence collective, une représentation synthétique de l’intelligence collective elle-même. Une image holistique du développement humain est donc contenue dans la catégorie de la connaissance, qui n’est pourtant qu’une partie du développement humain pris comme un tout.

La distinction entre arts et sciences peut se décliner, par exemple, en savoirs du vrai et savoirs du beau, jugements logiques et jugements de goût. On peut encore opposer, d’une part, les savoirs explicites, calculables, basés sur l’observation, l’expérimentation contrôlée, la démonstration et l’explication et, d’autre part, les savoirs implicites, incalculables, fondés sur l’expérience personnelle, la transmission traditionnelle et l’autorité de la coutume. Quant à la sagesse, le terme traduit les termes grecs Sophia, plus théorique, et Phronésis, plus pratique, mais aussi la Sapientia latine, la Hochma hébraïque, la Hekmah arabe, le Yoga indien, les Voies de l’Asie du Sud-Est, etc. Les sagesses concernent les savoir-être, les arts de la maîtrise de soi, de la prudence, du jugement droit et de l’action en résonance avec les rythmes fondamentaux.

Ethiques

La multitude des éthiques comprend les valeurs, normes et priorités (quelles qu’elles soient) qui orientent la gouvernance, ainsi que les systèmes de droits et d’obligations qui régulent les comportements, les décisions et évaluations en tous genres ayant cours dans la communauté considérée. De même que la catégorie « connaissance » n’impliquait aucune prise de parti dans les controverses concernant le vrai, le beau, le sage, la validité ou le bon goût des représentations, la catégorie éthique ne prend pas parti non plus sur le bien et le mal, le juste et l’injuste, le préférable ou le négligeable. L’accent est mis sur l’explicitation des choix qui construisent le réseau de vouloirs ou « capital éthique » d’une communauté et sur la contribution de ces choix à l’augmentation et à la diversification des autres catégories de l’intelligence collective. A long terme, les orientations concernant le bien et le mal devraient idéalement se fonder sur la connaissance des effets des choix éthiques sur le développement humain durable. Cette connaissance des effets, toujours perfectible, repose essentiellement sur un travail de modélisation et d’observation empirique de la dynamique interne de l’intelligence collective et du développement humain.

Puissances

Eclairés par des réseaux de savoirs (connaissance) et orientés par des réseaux de vouloirs (éthique), la puissance d’une intelligence collective mobilise les compétences, savoir-faire pratiques et métiers, qui peuvent s’associer en réseaux collaboratifs et se complémenter. Outre les compétences, la puissance d’une intelligence collective repose sur sa force économique, résumée ici par le terme de « ressources » (liquidité, crédit, épargne…). Cette dimension financière correspond non seulement à un pouvoir d’achat à des fins de consommation mais également à une capacité d’investissement et d’emploi des compétences. Enfin, la puissance s’alimente de la résolution d’une communauté, c’est-à-dire de l’engagement, du courage, du moral ou de la confiance en soi de ses membres.

Sans ressources, le savoir-faire seul ne confère pas de pouvoir d’action effective et, sans la mise en branle de réseaux de compétences, les moyens financiers restent impuissants ou stériles. Et si la communauté en question n’est pas résolue dans son action, sa puissance se dissipe. La catégorie de la puissance dessine donc un ensemble de réseaux de pouvoirs ou les disponibilités de ressources, des engagements fermes et des savoir-faire pratiques s’échangent, se fécondent et se multiplient. Comme les catégories épistémiques et éthiques, la catégorie pratique de la puissance a pour vocation naturelle de croître et de se diversifier pour elle-même. Mais elle doit parallèlement contribuer à la croissance et à la diversification des autres catégories, selon une stratégie d’intelligence collective bien comprise, fondée sur l’analyse des équilibres durables à maintenir.

Messages

Le « capital de messages » peut être envisagé de trois points de vue complémentaires : celui du contenu des messages, celui de la communication interpersonnelle proprement dite et celui des médias (les environnements et supports de communication). La catégorie rassemble l’ensemble des messages échangés dans et par la communauté envisagée, auxquels il faut ajouter les messages disponibles en ligne qui sont pertinents pour cette communauté, même si aucun de ses membres n’en est le destinataire ou le destinateur explicite. Les messages et leurs contenus sont pratiquement indissociables des communications qu’ils alimentent et des médias qui servent à les produire, les enregistrer, les fouiller, les retrouver, les transmettre, les recevoir et les transformer. Du point de vue de la mémoire de l’intelligence collective, les messages sont conçus comme des documents à conserver et à exploiter afin de permettre à la communauté de se représenter à elle-même son histoire, ou l’évolution de son identité. En ce sens, le capital de messages comprend non seulement les flux de messages à court terme (les médias et systèmes de messagerie) mais également la communication à long terme et la transmission intergénérationnelle (donc l’éducation) : les écoles, les bibliothèques, les musées et les supports d’apprentissage de toutes sortes dont les trésors sont de plus en plus numérisés et disponibles en ligne. Sans communication ni mémoire culturelle, sans support sémiotique en général, ni les réseaux de savoir, ni les réseaux de vouloirs, ni les réseaux de pouvoirs ne pourraient subsister, sans parler des réseaux sociaux… Les messages n’ont de sens qu’en fonction de leur relation inter-créative avec les cinq autres pôles.

Personnes

La catégorie des personnes représente le « capital social » d’une communauté, c’est-à-dire le réseau des connexions interpersonnelles qui fondent cette communauté. On peut ici distinguer trois aspects interdépendants : la variété des rôles sociaux joués par les personnes, la qualité des liens (que le terme général de confiance résume assez bien) et finalement la quantité, l’intensité et le dessin des connexions (les réseaux proprement dit). Les gens qui interagissent au sein de réseaux interpersonnels le font généralement au titre d’un ou plusieurs rôles sociaux : rôles de genre, rôles familiaux, professionnels ou politiques, participation à la société civile, participation à des rituels de tous ordres, etc. Plusieurs approches du développement humain mettent le capital social en position de déterminant essentiel. Plutôt que de désigner un déterminant essentiel, la démarche proposée ici préconise un instrument d’observation et de pilotage des interdépendances. Car si le capital social peut être bel et bien considéré, en un sens, comme la racine (ou le fruit ultime) du développement humain, il dépend lui-même d’une foule de facteurs qu’il conditionne en retour : équipements, santé, éducation et connaissances, compétences, moyens financiers, gouvernance, mémoire culturelle… On voit que chaque catégorie décrit la même communauté humaine, mais selon des points de vue conceptuellement distincts qui se réfléchissent les uns dans les autres selon des modèles fonctionnels à tester et à préciser empiriquement.

Equipements

La « capital biophysique » décrit par les équipements désigne d’abord les organismes humains dans leur actualité biomédicale (santé) ainsi que l’environnement biophysique ou écosystémique complexe dont ils dépendent nécessairement pour leur nourriture, leur boisson, leur respiration, leur hygiène et leur bien-être en général. Le circuit corporel comprend également l’ensemble des équipements matériels et techniques produits et entretenus par l’industrie humaine : vêtements, bâtiments, réseaux de transports, véhicules, outils, machines, produits de l’industrie chimique et biochimique, etc. Il s’agit en somme du système d’interaction causal qui réunit les corps matériels et qui constitue le support physico-biologique du développement humain. Il est sans doute inutile de souligner ici la part prise aujourd’hui par la santé dans les dépenses publiques et le souci général d’un développement durable respectueux des équilibres écologiques dont dépend le bien-être des populations. Par ailleurs il est évident que les infrastructures matérielles, ainsi que la qualité et la quantité de l’outillage disponible, déterminent dans une large mesure les opportunités ouvertes aux communautés humaines. En retour, il est clair que les « équipements » dépendent eux-mêmes des apports en provenance des cinq autres catégories principales de ce modèle.

 

F-Arbre-methode.jpg

FIGURE 1

La figure 1 présente les six catégories primitives de la sémantique et schématise leurs relations d’interdépendance. On peut comparer ce diagramme à celui d’une main. Alors que l’organe du corps humain possède cinq doigts et une opposition entre le pouce et les autres doigts, la main sémantique comporte six doigts – les catégories – et quatre systèmes d’opposition emboîtés – les relations –. La pince du virtuel et de l’actuel commande la relation d’interdépendance pragmatique. La pince ternaire entre le signe, l’être et la chose prend en charge l’interdépendance sémiotique. L’opposition de la pince pragmatique et de la pince sémiotique actionne la tenaille de la relation formelle. La méta-pince rationnelle, enfin, oppose le vide et la forme.

Le vide, le virtuel, l’actuel, le signe, l’être et la chose ne sont pas de mon invention, je me suis contenté de recueillir puis de mettre en forme un très ancien héritage. La plupart des catégories sémantiques remontent au moins à Aristote et elles ont été raffinées par une longue tradition de philosophes, de logiciens, de sémioticiens, de grammairiens et de linguistes. On trouvera une importante bibliographie à ce sujet dans La Sphère sémantique (2011). Je me contenterai ici de signaler quelques-unes de mes sources.

La relation pragmatique entre virtuel et actuel

On catégorise comme actuel ce qui possède un caractère concret ou sensible et qui se localise facilement dans l’espace et le temps. Par contraste, le virtuel catégorise ce qui possède un caractère intelligible, abstrait et auquel il est difficile d’attribuer une adresse spatio-temporelle bien déterminée.

Le couple virtuel/actuel décrit une dialectique pragmatique, que l’on peut retrouver notamment dans la dynamique entre potentialités (virtuelles) et réalisations (actuelles), problèmes (virtuels) et solutions (actuelles), stratégies (relation aux finalités virtuelles) et tactiques (relations aux moyens actuels), etc.

La dialectique du virtuel et de l’actuel fait écho au Ciel et à la Terre des premières nations, au yang et au yin de la pensée chinoise, à l’âme et au corps, à la transcendance et à l’immanence, à l’intelligible et au sensible (Platon), à la puissance et à l’acte (Aristote), à la pensée et à l’étendue (Descartes), au transcendantal et à l’empirique (Kant)… J’ai par ailleurs consacré un livre entier à cette question.

Virtuel et actuel sont des notions relatives, qui se définissent l’une par l’autre. Dans l’analyse d’un cycle pragmatique complexe, la catégorisation des phases virtuelle et actuelle relève de l’interprétation en contexte. Par ailleurs, virtualité et actualité peuvent définir les deux pôles d’un continuum. Ainsi, un caillou rêvé est plus virtuel qu’un caillou perçu, mais plus actuel qu’un rêve de caillou dans un roman.

La relation sémiotique entre signe, être et chose

Le signe catégorise ce qui est de l’ordre du code, du message et de la connaissance. L’être indique les personnes, leurs rapports et leurs intentions, ce qui est de l’ordre de l’esprit, la capacité de concevoir ou d’interpréter. Enfin, la chose catégorise ce dont on parle, les objets (abstraits ou concrets), les corps, les outils, le pouvoir.

Le ternarité signe/être/chose exprime une dialectique sémiotique, que l’on retrouve notamment dans la distribution des rôles de communication : on pourra par exemple distinguer entre les messages (signes), les personnes (êtres) et les éléments de contexte qui sont en jeu (choses). En logique, la proposition (signe), le jugement (être) et l’état de chose (chose) sont inséparables puisqu’un jugement logique détermine si un état de chose correspond, oui ou non, à une proposition.

La dialectique sémiotique du signe, de l’être et de la chose renvoie…

  • à la distinction aristotélicienne du symbole, de l’état d’esprit et de la chose ;
  • à la triade « vox, conceptus, res » de la philosophie médiévale ;
  • au fondement du signe, à l’interprétant et à l’objet de C. S. Peirce ;
  • au noème, à l’intention et à l’objet de Husserl (ou bien, à un niveau d’analyse plus fin décomposant le noème de cette dernière triade, la noèse – signe –, le noème au sens restreint – être – et la hylè sensible – chose – ;
  • au logos, à l’ethos et au pathos de la rhétorique ;
  • aux actes locutoire, illocutoire et perlocutoire de la pragmatique (tels que définis par Austin), et ainsi de suite.

De même que dans le cas de la dialectique virtuel/actuel, la dialectique signe/être/chose est hautement relative. Il s’agit surtout de déterminer le rôle joué par ce que l’on veut catégoriser selon les points de vue, les circonstances et les contextes. Par exemple, une personne pourra être catégorisée signe, être ou chose selon la fonction qu’elle joue dans une situation : messager (signe), interlocuteur (être) ou sujet de la conversation (chose).

La relation formelle entre pragmatique et sémiotique

Les dialectiques pragmatique et sémiotique sont elles-mêmes en relation dynamique d’interdépendance. L’interdépendance de la figure et du fond – de la représentation sémiotique et de l’interaction pragmatique – fait émerger une forme. A l’intérieur de cette dialectique, la sémiotique décrit les opérations de construction ou de production d’entités tandis que la pragmatique rend compte de l’exploration et de la reconnaissance de processus. C’est ainsi que les mouvements ou les verbes seront catégorisés comme pragmatiques et que les entités ou les noms seront catégorisés comme sémiotiques.

Sur un plan épistémologique, cette dialectique permet d’articuler deux faces complémentaires de la connaissance : le « savoir produire » de l’intérieur (sémiotique) et le « savoir reconnaître » à l’extérieur (pragmatique). Par exemple, maîtriser le langage suppose d’être capable de produire des phrases, ce qui se termine par une activation motrice, mais aussi de les reconnaître, ce qui commence par une activation sensorielle. Les deux aspects sont à la fois distincts et complémentaires. Pour prendre un autre exemple, nous savons marcher ou manger ; nous savons aussi reconnaître la marche ou la manducation chez les autres, donc ailleurs que dans notre propre activité ; finalement, nous savons qu’il s’agit de la même chose, même si savoir faire et savoir reconnaître mettent en oeuvre des sensations et des mouvements différents.

La relation rationnelle entre vide et forme

La dialectique rationnelle, enfin, met en relation la forme qui comprend les cinq catégories pleines (virtuel, actuel, signe, être, chose) et le vide. Le vide rend compte du zéro, du silence, du blanc, de l’indétermination sémantique et de l’espace ouvert où se déploie l’expérience humaine. A ce titre, il s’oppose aux catégories pleines qu’il exclut en tant que néant… mais qu’il contient en tant qu’espace. Le contraste entre le pattern et le bruit dans le signal. relève justement de cette dialectique rationnelle entre le vide (le bruit) et le plein (le pattern).

Une théorie sémantique de la cognition doit rendre compte de la distinction fondamentale entre fait et fiction, c’est-à-dire entre les idées dont les objets seront réputés inventés ou simulés (vide) et celles dont les objets seront supposés réels (plein) : il y va de la survie de l’être intelligent. C’est pourquoi, en fonction des circonstances, la dialectique rationnelle distinguera entre le vrai et le faux, le connu et l’inconnu, la réalité et l’imitation, les idées claires ou confuses…

Diapositive1.jpg
FIGURE 1

J’ai montré dans un post précédent, l’importance contemporaine de la curation collaborative de données.  Les compétences dans ce domaine sont au coeur de la nouvelle litéracie algorithmique. La figure 1 présente ces compétences de manière systématique et, ce faisant, elle met en ordre les savoir-faire intellectuels et pratiques tout comme les « savoir-être » éthiques qui supportent l’augmentation de l’intelligence collective en ligne. L’étoile évoque le signe, le visage l’être et le cube la chose (sur ces concepts voir ce post). La table est organisée en trois rangées et trois colonnes interdépendantes. La première rangée explicite les fondements de l’intelligence algorithmique au niveau personnel, la seconde rappelle l’indispensable travail critique sur les sources de données et la troisième détaille les compétences nécessaires à l’émergence d’une intelligence collective augmentée par les algorithmes. L’intelligence personnelle et l’intelligence collective travaillent ensemble et ni l’une ni l’autre ne peuvent se passer d’intelligence critique ! Les colonnes évoquent trois dimensions complémentaires de la cognition : la conscience réflexive, la production de signification et la mémoire. Aucune d’elles ne doit être tenue pour acquise et toutes peuvent faire l’objet d’entraînement et de perfectionnement. Dans chaque case, l’item du haut pointe vers un exercice de virtualisation tandis que celui du bas indique une mise en oeuvre actuelle de la compétence, plus concrète et située. Je vais maintenant commenter le tableau de la figure 1 rangée par rangée.

L’intelligence personnelle

La notion d’intelligence personnelle doit ici s’entendre au sens d’une compétence cognitive individuelle. Mais elle tire également vers la signification du mot « intelligence » en anglais. Dans ce dernier sens, elle désigne la capacité d’un individu à mettre en place son propre système de renseignement.

La gestion de l’attention ne concerne pas seulement l’exercice de la concentration et l’art complémentaire d’éviter les distractions. Elle inclut aussi le choix réfléchi de priorités d’apprentissage et le discernement de sources d’information pertinentes. Le curateur lui-même doit décider de ce qui est pertinent et de ce qui ne l’est pas selon ses propres critères et en fonction des priorités qu’il s’est donné. Quant à la notion de source, est-il besoin de souligner ici que seuls les individus, les groupes et les institutions peuvent être ainsi qualifiés. Seuls donc ils méritent la confiance ou la méfiance. Quant aux médias sociaux, ce ne sont en aucun cas des sources (contrairement à ce que croient certains journalistes) mais plutôt des plateformes de communication. Prétendre, par exemple, que « Twitter n’est pas une source fiable », n’a pas plus de sens que l’idée selon laquelle « le téléphone n’est pas une source fiable ».

L’interpretation des données relève également de la responsabilité des curateurs. Avec tous les algorithmes statistiques et tous les outils d’analyse automatique de données (« big data analytics ») du monde, nous aurons encore besoin d’hypothèses causales, de théories et de systèmes de catégorisation pour soutenir ces théories. Les corrélations statistiques peuvent suggérer des hypothèses causales mais elles ne les remplacent pas. Car nous voulons non seulement prédire le comportement de phénomènes complexes, mais aussi les comprendre et agir sur la base de cette compréhension. Or l’action efficace suppose une saisie des causes réelles et non seulement la perception de corrélations. Sans les intuitions et les théories dérivées de notre connaissance personnelle d’un domaine, les outils d’analyse automatique de données ne seront pas utilisés à bon escient. Poser de bonnes questions aux données n’est pas une entreprise triviale !

Finalement, les données collectionnées doivent être gérées au plan matériel. Il nous faut donc choisir les bons outils d’entreposage dans les « nuages » et savoir manipuler ces outils. Mais la mémoire doit être aussi entretenue au niveau conceptuel. C’est pourquoi le bon curateur est capable de créer, d’adopter et surtout de maintenir un système de catégorisation qui lui permettra de retrouver l’information désirée et d’extraire de ses collections la connaissance qui lui sera utile.

L’intelligence critique

L’intelligence critique porte essentiellement sur la qualité des sources. Elle exige d’abord un travail de critique « externe ». Nous savons qu’il n’existe pas d’autorité transcendante dans le nouvel espace de communication. Si nous ne voulons pas être trompé, abusé, ou aveuglé par des oeillères informationnelles, il nous faut donc autant que possible diversifier nos sources. Notre fenêtre d’attention doit être maintenue bien ouverte, c’est pourquoi nous nous abonnerons à des sources adoptant divers points de vue, récits organisateurs et théories. Cette diversité nous permettra de croiser les données, d’observer les sujets sur lesquelles elles se contredisent et ceux sur lesquelles elles se confirment mutuellement.

L’évaluation des sources demande également un effort de décryptage des identités : c’est la critique « interne ». Pour comprendre la nature d’une source, nous devons reconnaître son système de classification, ses catégories maîtresses et son récit organisateur. En un sens, une source n’est autre que le récit autour duquel elle organise ses données : sa manière de produire du sens.

Finalement l’intelligence critique possède une dimension « pragmatique ». Cette critique est la plus dévastatrice parce qu’elle compare le récit de la source avec ce qu’elle fait réellement. Je vise ici ce qu’elle fait en diffusant ses messages, c’est-à-dire l’effet concret de ses actes de communication sur les conversations en cours et l’état d’esprit des participants. Je vise également les contributions intellectuelles et esthétiques de la source, ses interactions économiques, politiques, militaires ou autres telles qu’elles sont rapportées par d’autres sources. Grâce à cette bonne mémoire nous pouvons noter les contradictions de la source selon les moments et les publics, les décalages entre son récit officiel et les effets pratiques de ses actions. Enfin, plus une source se montre transparente au sujet de ses propres sources d’informations, de ses références, de son agenda et de son financement et plus elle est fiable. Inversement, l’opacité éveille les soupçons.

L’intelligence collective

Je rappelle que l’intelligence collective dont il est question ici n’est pas une « solution miracle » mais un savoir-faire à cultiver qui présuppose et renforce en retour les intelligences personnelles et critiques.

Commençons par définir la stigmergie : il s’agit d’un mode de communication dans lequel les agents se coordonnent et s’informent mutuellement en modifiant un environnement ou une mémoire commune. Dans le médium algorithmique, la communication tend à s’établir entre des pairs qui créent, catégorisent, critiquent, organisent, lisent, promeuvent et analysent des données au moyen d’outils algorithmiques. Il s’agit bien d’une communication stigmergique parce que, même si les personnes dialoguent et se parlent directement, le principal canal de communication reste une mémoire commune que les participants exploitent et transforment ensemble. Il est utile de distinguer entre les mémoires locale et globale. Dans la mémoire « locale » de réseaux ou de communautés particulières, nous devons prêter attention à des contextes et à des histoires singulières. Il est également recommandé de tenir compte des contributions des autres participants, de ne pas aborder des sujets non-pertinents pour le groupe, d’éviter les provocations, les explosions d’agressivité, les provocations, etc.

Quant à la mémoire « globale », il faut se souvenir que chaque action dans le médium algorithmique réorganise – même de façon infinitésimale – la mémoire commune : lire, taguer, acheter, poster, créer un hyperlien, souscrire, s’abonner, « aimer », etc. Nous créons notre environnement symbolique de manière collaborative. Le bon agent humain de l’intelligence collective gardera donc à la conscience que ses actions en ligne contribuent à l’information des autres agents.

La liberté dont il est question dans la figure 1 se présente comme une dialectique entre pouvoir et responsabilité. Le pouvoir recouvre notre capacité à créer, évaluer, organiser, lire et analyser les données, notre aptitude à faire évoluer la mémoire commune à partir de la multitude distribuée de nos actions. La responsabilité se fonde sur une conscience réfléchie de notre pouvoir collectif, conscience qui informe en retour l’orientation de notre attention et le sens que nous donnons à l’exercice de nos pouvoirs.

Diapositive4.jpg

FIGURE 2

L’apprentissage collaboratif

Finalement, l’apprentissage collaboratif est un des processus cognitifs majeurs de l’intelligence collective et le principal bénéfice social des habiletés en curation de données. Afin de bien saisir ce processus, nous devons distinguer entre savoirs tacites et savoirs explicites. Les savoirs tacites recouvrent ce que les membres d’une communauté ont appris dans des contextes particuliers, les savoir-faire internalisés dans les réflexes personnels à partir de l’expérience. Les savoirs explicites, en revanche, sont des récits, des images, des données, des logiciels ou d’autres ressources documentaires, qui sont aussi clairs et décontextualisés que possible, afin de pouvoir être partagés largement.

L’apprentissage collaboratif enchaîne deux mouvements. Le premier consiste à traduire le savoir tacite en savoir explicite pour alimenter une mémoire commune. Dans un second mouvement, complémentaire du premier, les participants exploitent le savoir explicite et les ressources d’apprentissage disponibles dans la mémoire commune afin d’adapter ces connaissances à leur contexte particulier et de les intégrer dans leurs réflexes quotidiens. Les curateurs sont potentiellement des étudiants ou des apprenants lorsqu’ils internalisent un savoir explicite et ils peuvent se considérer comme des enseignants lorsqu’ils mettent des savoirs explicites à la disposition des autres. Ce sont donc des pairs (voir la figure 2) qui travaillent dans un champ de pratique commun. Ils transforment autant que possible leur savoir tacite en savoir explicite et travaillent en retour à traduire la partie des connaissances explicites qu’ils veulent acquérir en savoir pratique personnel. J’écris “autant que possible” parce que l’explicitation totale du savoir tacite est hors de portée, comme l’a bien montré Michael Polanyi.

Dans le médium algorithmique, le savoir explicite prend la forme de données catégorisées et évaluées. Le cycle de transformation des savoirs tacites en savoirs explicites et vice versa prend place dans les médias sociaux, où il est facilité par une conversation créative civilisée : les compétences intellectuelles et sociales (ou morales) fonctionnent ensemble !

La curation de données

Comme Monsieur Jourdain faisait de la prose sans le savoir, tout le monde fait aujourd’hui de la curation de données – on dit aussi de la curation de contenu – sans le savoir. Sur les grandes plateformes de médias sociaux comme Facebook, Twitter, Pinterest ou Instagram, mais aussi dans une multitude d’applications en ligne plus spécialisées comme Evernote, Scoop.it ou Diigo, les utilisateurs font référence à des données (textes, images, vidéos, musique…) qu’ils accompagnent de commentaires, de hashtags classificateurs et de diverses formes d’évaluations et d’émoticons. Ces posts s’accumulent dans des collections personnelles ou communautaires, apparaissent sur les fils d’autres utilisateurs et sont réexpédiées ad libitum avec d’éventuels changements de commentaires, de hashtags et d’appréciations émotionnelles. Les posts deviennent eux-mêmes des données qui peuvent à leur tour faire l’objet de références, de commentaires, de marquage affectif, de recherche et d’analyse. Les médias sociaux nous proposent des outils perfectionnés de gestion de base de données, avec des algorithmes de fouille, d’apprentissage machine, de reconnaissance de forme et de filtrage collaboratif qui nous aident à naviguer parmi la masse du contenu et les foules d’utilisateurs. Mais l’alimentation de la base tout comme la catégorisation et l’évaluation des données sont à notre charge.

labyrinthe-livres.jpg

Le mot curation, employé d’abord en anglais pour désigner l’activité d’un commissaire d’exposition dans l’univers des galeries d’art et des musées, a été récemment généralisé à toutes les activités de collection d’information. L’étymologie latine du mot évoque le soin médical (la cure) et plus généralement le souci. S’il est vrai que nous entrons dans une société datacentrique, le souci des données, l’activité qui consiste à collectionner et organiser des données pour soi et pour les autres devient cruciale. Et puisque la société datacentrique repose sur une effervescente économie de la connaissance, au sens le plus vaste et le plus « écologique » de la notion d’économie (voir à ce sujet La Sphère sémantique 1, Chp. 6.) l’enjeu ultime de la curation de données n’est autre que la production et le partage des connaissances.

Je vais maintenant évoquer un certain nombre de sphères d’activité dans lesquelles la maîtrise de la curation collaborative de données commence à s’imposer comme une compétence essentielle : la conservation des héritages, la recherche en sciences humaines, l’apprentissage collaboratif, la production et la diffusion des nouvelles, le renseignement à sources ouvertes et la gestion des connaissances.

url.jpg

La conservation des héritages

Les responsables des archives, bibliothèques, médiathèques et musées collectionnent depuis des siècles des artefacts porteurs d’information et les organisent de telle sorte que leur public puisse les retrouver et les consulter. C’est dans ce milieu professionnel qu’est d’abord apparue la distinction entre données et métadonnées. Du côté des données, les documents physiques sont posés sur des étagères. Du côté des métadonnées, un fichier permet de rechercher les documents par auteurs, titres, sujets, disciplines, dates, etc. Le bibliothécaire fabrique une fiche, voire plusieurs fiches, pour chaque document qui entre dans la bibliothèque et le lecteur fouille dans les fiches pour explorer le contenu de la bibliothèque et savoir où se trouvent placés les livres qu’il veut lire. Sans l’appareillage des métadonnées et les principes d’organisation qui les sous-tendent il serait impossible d’exploiter les informations contenues dans une bibliothèque. Depuis la fin du XXe siècle, le monde des archives, des bibliothèques et des musées connaît une grande transformation. La numérisation fait converger toutes les informations dans le médium algorithmique et cette unification met cruellement en évidence la disparité et l’incompatibilité des systèmes de classification en usage. De plus, les principaux systèmes de métadonnées ont été conçus et utilisés à l’époque de l’imprimerie, ils n’exploitent donc pas les nouvelles possibilités de calcul automatique. Finalement, les flots d’information ont tellement crû qu’ils échappent à toute possibilité de catalogage classique par un petit nombre de professionnels. Depuis quelques années, les musées et bibliothèques numérisent et mettent en ligne leurs collections en faisant appel au crowdsourcing, c’est-à-dire à l’intelligence collective des internautes, pour catégoriser les données. Cette curation collaborative de données brouille la distinction entre curateurs et utilisateurs tout en manifestant la diversité des points de vue et des intérêts du public. Par ailleurs, une multitude de sites puisant leurs données dans le Web ouvert, et souvent indépendants des institutions classiques de préservation des héritages culturels, permettent aux amateurs d’art ou aux bibliophiles de partager leurs goûts et leurs trouvailles, de se regrouper par sensibilité et par centres d’intérêts.

La recherche en sciences humaines

La numérisation des archives et des héritages culturels, l’accessibilité des données et statistiques compilées par les gouvernements et les institutions internationales, les communications et transactions des internautes recueillies par les grandes plateformes du Web, toutes ces nouvelles sources offrent aux sciences humaines une matière première dont l’abondance défie l’imagination. Par ailleurs les blogs de chercheurs, les plateformes collaboratives spécialisées dans la collection d’articles (comme Academia.edu, Researchgate, Mendeley, CiteULike…) et les bases de données partagées transforment profondément les pratiques de recherche. Enfin, une frange croissante des professionnels des sciences humaines s’initie à la programmation et à l’usage avancé des algorithmes, produisant et partageant le plus souvent des outils open source. L’édition scientifique traditionnelle est en crise puisque la communication entre chercheurs n’a plus besoin de journaux imprimés. Chaque plateforme en ligne propose ses propres méthodes d’appréciation des publications, basées sur un traitement automatisé des interactions sociales, ce qui remet en question les modes classiques de filtrage et d’évaluation des articles. Certes, le problème posé par l’incompatibilité des plateformes et des systèmes de catégorisation reste à résoudre. Il subsiste donc quelques obstacles à franchir, mais tout est en place pour que la curation collaborative de données s’impose comme l’activité centrale de la recherche en sciences humaines… et de son évaluation.

L’apprentissage collaboratif

La curation collaborative de données émerge également comme une pratique essentielle dans le domaine de l’éducation. A l’époque du médium algorithmique, les connaissances évoluent vite, presque toutes les ressources d’apprentissage sont disponibles gratuitement en ligne et les étudiants sont déjà plongés dans le bain des médias sociaux. Le vieux modèle des communautés d’apprentissage s’organisant autour d’une bibliothèque ou d’un entrepôt physique de documents est donc obsolète. L’apprentissage doit être de plus en plus pensé comme partiellement délocalisé, collaboratif et continu. L’ensemble de la société acquiert une dimension d’apprentissage. Cela n’implique pas que les institutions d’enseignement classiques, école et université, ne soient plus pertinentes, bien au contraire. C’est précisément parce que l’apprentissage va puiser dans un stock de ressources pratiquement infini qu’aucune autorité transcendante ne peut plus organiser et hiérarchiser a priori que l’école a l’obligation d’entraîner les jeunes gens à l’apprentissage collaboratif et critique par le biais des médias sociaux. La fameuse littéracie numérique ne repose pas principalement sur l’acquisition de compétences techniques en informatique (qui changent rapidement), mais plutôt sur un savoir-faire socio-cognitif orienté vers la curation collaborative de données : filtrer les contenus pertinents pour tel ou tel groupe, les catégoriser, les évaluer, consulter les données, rédiger de courtes synthèses… Ainsi les enseignants utilisent des plateformes de social bookmarking (partage de signets) comme Diigo pour animer leurs cours, les MOOCs connectivistes font appel aux étudiants pour alimenter leurs ressources d’apprentissage, on trouvera une multitude de hashtags reliés à l’éducation et à l’apprentissage sur Twitter et les groupes Facebook abritent de plus en plus de classes…

Les nouvelles

La production et la dissémination des nouvelles participe du même type de mutation que celles qui viennent d’être évoquées. Du côté de la production, les journalistes s’initient à l’exploitation statistique des bases de données ouvertes pour en retirer les synthèses et les visualisations qui vont alimenter leurs articles. Ils suivent leurs collègues ainsi qu’une foules de sources sur Twitter afin de rester à jour sur les thèmes dont ils s’occupent. Par ailleurs, ce ne sont plus seulement les agences de presse et les journalistes professionnels qui produisent les nouvelles mais également les acteurs culturels, économiques, politiques et militaires par l’intermédiaire de leurs sites et de leurs agents dans les médias sociaux. N’oublions pas non plus les citoyens ordinaires qui prennent des photos et des vidéos grâce à leurs téléphones intelligents, qui diffusent ce qu’ils voient et ce qu’ils pensent sur toutes les plateformes et qui réagissent en temps réel aux nouvelles diffusées par les médias classiques. Du côté de la réception, la consommation des nouvelles se fait de plus en plus en ligne par le biais de Facebook, de Twitter, de Google news et d’autres plateformes sociales. Puisque chacun peut accéder directement aux sources (les messages émis par les acteurs eux-mêmes), les médias classiques ont perdu le monopole de l’information. Sur les sujets qui m’intéressent, je suis les experts de mon choix, j’écoute tous les sons de cloche et je me fais ma propre idée sans être obligé de m’en remettre à des synthèses journalistiques simplificatrices et forcément tributaires d’un agenda ou d’un maître-récit (« narrative ») politique ou national. En somme, aussi bien les professionnels de l’information que le nouveau public critique en ligne pratiquent assidûment la curation collaborative de données

L’intelligence open-source

Le domaine du renseignement économique (« business intelligence »), politique ou militaire échappe progressivement à l’ancienne logique de l’espionnage. Désormais, l’abondance des sources d’information en ligne rend de moins en moins judicieux l’entretien d’un personnel spécialement chargé de recueillir des informations sur place. En revanche, les compétences linguistiques, culturelles et scientifiques, l’érudition en sciences humaines, la capacité à extraire les renseignements pertinents du flot des données, le monitoring des médias sociaux et le savoir-faire collaboratif deviennent indispensables. A part les noms et adresses des agents doubles et le détail des plans d’attaque, tout est désormais disponible sur internet. A qui sait chercher en ligne et lire entre les mots, les images des satellites, les sites médiatiques, académiques, diplomatiques et militaires, sans oublier les rapports des « think tanks » en pdf, permettent de comprendre les situations et de prendre des décisions éclairées. Certes, les agents d’influence, trolls, utilisateurs masqués et robots logiciels tentent de brouiller les cartes, mais ils révèlent à la longue les stratégies des marionnettistes qui les manipulent. Dans le domaine en pleine expansion de l’open source intelligence les agences de renseignement – comme la nuée de leurs fournisseurs d’information, d’analyse et de synthèse – coopèrent dans la production, l’échange et l’évaluation des données. Ici encore, la curation collaborative de contenu est à l’ordre du jour.

La gestion des connaissances

Une équipe de travail, une entreprise quelconque – qu’elle soit publique, privée ou associative – se trouve dans la nécessité de « gérer ses connaissances » pour atteindre ses buts. Le terme de gestion des connaissances a commencé à être utilisé vers le milieu des années 1990, au moment même où naissait le Web et alors que l’idée d’une économie basée sur les savoirs et l’innovation commençait à s’affirmer. L’un des principaux fondateurs de cette nouvelle discipline, Ikujiro Nonaka (né en 1935), s’est attaché à décrire le cycle de création des connaissances dans les entreprises en insistant sur la phase d’explicitation des savoir-faire pratiques. A la suite de Nonaka, de nombreux chercheurs et praticiens ont tenté de déterminer les meilleures méthodes pour expliciter les savoirs tacites – nés de l’expérience – afin de les conserver et de les diffuser dans les organisations. Les premiers outils de gestion des connaissances étaient assez rigides et centralisés, à l’image de l’informatique de l’époque. On met en place aujourd’hui (2016) de véritables médias sociaux d’entreprise, dans lesquels les collaborateurs peuvent repérer mutuellement leurs compétences, créer des groupes de travail et des communautés de pratique, accumuler des ressources et partager des données. Indépendamment des outils techniques utilisés, la gestion des connaissances est une dimension transversale de toute entreprise. Cette épistémologie appliquée inclut la conservation des savoirs et savoir-faire, le développement des compétences et des ressources humaines, l’art de créer et de diffuser les connaissances. De fait, en observant les pratiques contemporaines dans les médias sociaux d’entreprise qui supportent la gestion des connaissances, on découvre que l’une des principales activités se trouve être justement la curation collaborative de données.

Il existe donc une pratique commune à de nombreux secteurs de la culture mondiale contemporaine, pratique dont les cloisonnements sociaux et la disparité des jargons professionnels dissimulent l’unité et la transversalité. Je fais l’hypothèse que la curation collaborative de données est le support techno-social de l’intelligence collective à l’époque du médium algorithmique : écrire et lire… sur des flots de données.

Pour en savoir plus sur les compétences en curation collaborative de données, lisez-donc le post qui suit!

Follow

Get every new post delivered to your Inbox.

Join 27,508 other followers