Archives for category: Uncategorized

data-science-education-at-monash-monash-university

L’accès du grand public à la puissance de diffusion du Web ainsi que les flots de données numériques qui coulent désormais de toutes les activités humaines nous confrontent au problème suivant : comment transformer les torrents de données en fleuves de connaissances ? Certains observateurs enthousiastes du traitement statistique des « big data », comme Chris Anderson, (l’ancien rédacteur en chef de Wired), se sont empressés de déclarer que les théories scientifiques – en général! – étaient désormais obsolètes [Voir : de Chris Anderson « The End of Theory: The Data Deluge Makes the Scientific Method Obsolete », Wired, 23 juin 2008.] Nous n’aurions plus besoin que de mégadonnées et d’algorithmes statistiques opérant dans les centres de calcul : les théories – et donc les hypothèses qu’elles proposent et la réflexion dont elles sont issues – appartiendraient à une étape révolue de la méthode scientifique. Il paraît que les nombres parlent d’eux-mêmes. Mais c’est évidemment oublier qu’il faut, préalablement à tout calcul, déterminer les données pertinentes, savoir exactement ce que l’on compte, et nommer – c’est-à-dire catégoriser – les patterns émergents. De plus, aucune corrélation statistique ne livre directement des relations causales. Celles-ci relèvent nécessairement d’hypothèses qui expliquent les corrélations mises en évidence par les calculs statistiques. Sous couvert de pensée révolutionnaire, Chris Anderson et ses émules ressuscitent la vieille épistémologie positiviste et empiriste en vogue au XIXe siècle selon laquelle seuls les raisonnements inductifs (c’est-à-dire uniquement basés sur les données) sont scientifiques. Cette position revient à refouler ou à passer sous silence les théories – et donc les hypothèses risquées fondées sur une pensée personnelle – qui sont nécessairement à l’oeuvre dans n’importe quel processus d’analyse de données et qui se manifestent par des décisions de sélection, d’identification et de catégorisation. On ne peut initier un traitement statistique et interpréter ses résultats sans aucune théorie. Le seul choix que nous ayons est de laisser les théories à l’état tacite ou de les expliciter. Expliciter une théorie permet de la relativiser, de la comparer avec d’autres théories, de la partager, de la généraliser, de la critiquer et de l’améliorer [Parmi la très abondante littérature sur le sujet, voir notamment les ouvrages de deux grands épistémologues du XXe siècle, Karl Popper et Michael Polanyi]. Cela constitue même une des principales composantes de ce qu’il est convenu d’appeler « la pensée critique », que l’éducation secondaire et universitaire est censée développer chez les étudiants.

Outre l’observation empirique, la connaissance scientifique a toujours eu à voir avec le souci de la catégorisation et de la description correcte des données phénoménales, description qui obéit nécessairement à des théories plus ou moins formalisées. En décrivant des relations fonctionnelles entre des variables, la théorie offre une prise conceptuelle sur le monde phénoménal qui permet (au moins partiellement) de le prévoir et de le maîtriser. Les données d’aujourd’hui correspondent à ce que l’épistémologie des siècles passés appelait les phénomènes. Pour continuer de filer cette métaphore, les algorithmes d’analyse de flots de données correspondent aux instruments d’observation de la science classique. Ces algorithmes nous montrent des patterns, c’est-à-dire en fin de compte des images. Mais ce n’est pas parce que nous sommes capables d’exploiter la puissance du médium algorithmique pour « observer » les données qu’il faut s’arrêter en si bon chemin. Nous devons maintenant nous appuyer sur la puissance de calcul de l’Internet pour « théoriser » (catégoriser, modéliser, expliquer, partager, discuter) nos observations, sans oublier de remettre cette théorisation entre les mains d’une intelligence collective foisonnante.

Tout en soulignant la distinction entre corrélation et causalité dans leur livre de 2013 sur les big data, Viktor Mayer-Schonberger  et Kenneth Cukier annoncent que nous nous intéresserons de plus en plus aux corrélations et de moins en moins à la causalité, ce qui les range dans le camp des empiristes. Leur livre fournit néanmoins un excellent argument contre le positivisme statistique. Ils racontent dans leur ouvrage la très belle histoire de Matthew Maury, un officier de marine américain qui, vers le milieu du XIXe siècle, agrégea les données des livres de navigation figurant dans les archives officielles pour établir des cartes fiables des vents et des courants [In Big Data: A Revolution… (déjà cité) p. 73-77]. Certes, ces cartes ont été construites à partir d’une accumulation de données empiriques. Mais je fais respectueusement remarquer à Cukier et Mayer-Schonberger qu’une telle accumulation n’aurait jamais pu être utile, ou même simplement faisable, sans le système de coordonnées géographique des méridiens et des parallèles… qui est tout sauf empirique et basé sur des données. De la même manière, ce n’est qu’en adoptant un système de coordonnées sémantique que nous pourrons organiser et partager les flots de données de manière utile.

Aujourd’hui, la plupart des algorithmes qui gèrent l’acheminement des recommandations et la fouille des données sont opaques, puisqu’ils sont protégés par le secret commercial des grandes compagnies du Web. Quant aux algorithmes d’analyse ils sont, pour la plupart, non seulement opaques mais aussi hors d’atteinte de la majorité des internautes pour des raisons à la fois techniques et économiques. Or il est impossible de produire de la connaissance fiable au moyen de méthodes secrètes. Bien plus, si l’on veut résoudre le problème de l’extraction d’information utile à partir du flot diluvien des big data, on ne pourra pas éternellement se limiter à des algorithmes statistiques travaillant sur le type d’organisation de la mémoire numérique dont nous disposons en 2017. Il faudra tôt ou tard, et le plus tôt sera le mieux, implémenter une organisation de la mémoire conçue dès l’origine pour les traitements sémantiques. On ne pourra apprivoiser culturellement la croissance exponentielle des données – et donc transformer ces données en connaissance réfléchie – que par une mutation qualitative du calcul.

Retenons que la « science des données » (data science en anglais) devient une composante essentielle de la compréhension des phénomènes économiques et sociaux. Plus aucune organisation ne peut s’en passer. Au risque de marcher à l’aveugle, les stratégies économiques, politiques et sociales doivent s’appuyer sur l’art d’analyser les mégadonnées. Mais cet art ne comprend pas seulement les statistiques et la programmation. Il inclut aussi ce que les américains appellent la « connaissance du domaine » et qui n’est autre qu’une modélisation ou une théorie causale de la réalité analysée, théorie forcément d’origine humaine, enracinée dans une expérience pratique et orientée par des fins. Ce sont toujours les humains et leurs récits producteurs de sens qui mobilisent les algorithmes.

Références documentaires

Voir ma collection d’articles sur les “Big Data” dans Scoop.it Les tags peuvent être utilisés pour naviguer dans la collection.

datacentrique.jpgAutour de la Terre, les satellites artificiels transmettent nos communications et transportent une foule d’instruments d’observation et de capteurs : renseignement militaire, documentation du climat, monitoring des écosystèmes, surveillance des récoltes… Plus proche de la surface voici la zone des satellites de basse altitude qui connectent nos téléphones intelligents. Un peu plus bas, les avions sur pilote automatique communiquent avec les stations radar, les bases au sol, tandis que leurs événements internes s’enregistrent dans des boîtes noires. Passée la barrière des nuages se découvrent les réseaux lumineux des métropoles intelligentes. Les cargos, les navettes, les métros, les trains rapides, les flottes de véhicules autonomes se transmettent des signaux, restent en contact avec les satellites et les balises routières, s’échangent leurs passagers et leurs marchandises dûment identifiés. Surveillant le moindre coin de rue, truffant le sous-sol, flottant au milieu des océans, guettant sur les côtes et les sommets, embarqués sur les drones aériens ou sous-marins, les antennes, les capteurs, les caméras inondent de données les centres de calcul. Écouteurs, gants et chaussures sont connectés. Nous voici pourvus de bracelets qui enregistrent notre pouls, la composition chimique de notre sang et de notre peau, envoient les données pour analyse dans les nuages, reçoivent les notifications et conseils de santé en temps réel… Grâce aux identités infalsifiables de l’informatique portable nous passons partout sans fouille ni mot de passe. Les lunettes branchées prennent photos et vidéos, surimposent des couches virtuelles à la vision optique ordinaire et projettent sur demande des cartographies de données. Nos jeux de domination s’alignent sur les capacité d’exploitation de la mémoire et les vitesses d’analyse. Les nouveaux partis politiques rassemblent leurs membres autour de thèses épistémologiques. Entremêlés dans l’économie mondiale et le nouvel espace public transnational, nos essaims d’intelligence collective collaborent et se combattent sur les territoires hyper-connectés des grandes métropoles. Réfléchissant la pensée humaine sur le miroir sémantique du cloud, l’évolution des écosystèmes d’idées déploie son inépuisable spectacle immersif et multi-joueur. La prospérité, la sécurité, l’influence, tout se ramène à une forme ou une autre d’optimisation cognitive… sauf peut-être dans les zones analogiques reculées, presque désertes, qui s’étendent loin des grands centres.

Communication does not entail the use of words as reflected by a majority of the people, but a method employed by the sender to convey a particular message to the audience. Irrespective of the meth…

Source : What I have learnt from the course ” Advanced Theories of Communication”

Dans les cours que je donne à l’Université d’Ottawa, je demande à mes étudiants de participer à un groupe Facebook fermé, de s’enregistrer sur Twitter, d’ouvrir un blog s’il n’en n’ont pas déjà un et d’utiliser une plateforme de curation collaborative de données comme Scoop.itDiigo ou Pocket.

L’usage de plateformes de curation de contenu me sert à enseigner aux étudiants comment choisir des catégories ou « tags » pour classer les informations utiles dans une mémoire à long terme, afin de les retrouver facilement par la suite. Cette compétence leur sera fort utile dans le reste de leur carrière.

Les blogs sont utilisés comme supports de « devoir final » pour les cours gradués (c’est-à-dire avant le master), et comme carnets de recherche pour les étudiants en maîtrise ou en doctorat : notes sur les lectures, formulation d’hypothèses, accumulation de données, première version d’articles scientifiques ou de chapitres des mémoires ou thèses, etc. Le carnet de recherche public facilite la relation avec le superviseur et permet de réorienter à temps les directions de recherche hasardeuses, d’entrer en contact avec les équipes travaillant sur les mêmes sujets, etc.

Le groupe Facebook est utilisé pour partager le Syllabus ou « plan de cours », l’agenda de la classe, les lectures obligatoires, les discussions internes au groupe – par exemple celles qui concernent l’évaluation – ainsi que les adresses électroniques des étudiants (Twitter, blog, plateforme de curation sociale, etc.). Toutes ces informations sont en ligne et accessibles d’un seul clic, y compris les lectures obligatoires. Les étudiants peuvent participer à l’écriture de mini-wikis à l’intérieur du groupe Facebook sur des sujets de leur choix, ils sont invités à suggérer des lectures intéressantes reliées au sujet du cours en ajoutant des liens commentés. J’utilise Facebook parce que la quasi totalité des étudiants y sont déjà abonnés et que la fonctionnalité de groupe de cette plateforme est bien rodée. Mais j’aurais pu utiliser n’importe quel autre support de gestion de groupe collaboratif, comme Slack ou les groupes de Linkedin.

Sur Twitter, la conversation propre à chaque chaque classe est identifiée par un hashtag. Au début, j’utilisais le médium à l’oiseau bleu de manière ponctuelle. Par exemple, à la fin de chaque classe je demandais aux étudiants de noter l’idée la plus intéressante qu’ils avaient retenu du cours et je faisais défiler leurs tweets en temps réel sur l’écran de la classe. Puis, au bout de quelques semaines, je les invitais à relire leurs traces collectives sur Twitter pour rassembler et résumer ce qu’ils avaient appris et poser des questions – toujours sur Twitter – si quelque chose n’était pas clair, questions auxquelles je répondais par le même canal.

Au bout de quelques années d’utilisation de Twitter en classe, je me suis enhardi et je demande maintenant aux étudiants de prendre directement leurs notes sur ce medium social pendant le cours de manière à obtenir un cahier de notes collectif. Pouvoir regarder comment les autres prennent des notes (que ce soit sur le cours ou sur des textes à lire) permet aux étudiants de comparer leurs compréhensions et de préciser ainsi certaines notions. Ils découvrent ce que les autres ont relevé et qui qui n’est pas forcément ce qui les a stimulé eux-mêmes… Quand je sens que l’attention se relâche un peu, je leur demande de s’arrêter, de réfléchir à ce qu’ils viennent d’entendre et de noter leurs idées ou leurs questions, même si leurs remarques ne sont pas directement reliées au sujet du cours. Twitter leur permet de dialoguer librement entre eux sur les sujets étudiés sans déranger le fonctionnement de la classe. Je consacre toujours la fin du cours à une période de questions et de réponses qui s’appuie sur un visionnement collectif du fil Twitter. Cette méthode est particulièrement pertinente dans les groupes trop grands (parfois plus de deux cents personnes) pour permettre à tous les étudiants de s’exprimer oralement. Je peux répondre tranquillement aux questions après la classe en sachant que mes explications restent inscrites dans le fil du groupe. La conversation pédagogique se poursuit entre les cours.

En utilisant Facebook et Twitter en classe, les étudiants n’apprennent pas seulement la matière du cours mais aussi une façon « cultivée » de se servir des médias sociaux. Documenter ses petits-déjeuners ou la dernière fête bien arrosée, disséminer des vidéos de chats et des memes comiques, échanger des insultes entre ennemis politiques, s’extasier sur des vedettes du show-business ou faire de la publicité pour telle ou telle entreprise sont certainement des usages légitimes des médias sociaux. Mais on peut également entretenir des dialogues constructifs dans l’étude d’un sujet commun. On peut du même coup tisser des réseaux personnels d’apprentissage, c’est-à-dire collectionner des sources (individus, organisations) pertinentes pour se maintenir au courant dans les domaines d’expertise que l’on veut approfondir. (Dans le cas de Twitter, les réseaux personnels d’apprentissage prennent la forme de « listes » de personnes que l’on suit sur un sujet donné. Une liste bien construite permet de filtrer les tweets par sujets…) L’usage des médias sociaux en classe me permet de faire prendre conscience à mes étudiants qu’ils s’expriment dans une mémoire publique et qu’ils sont responsables des traces qu’ils y laissent, des idées qu’ils y diffusent, des émotions qu’ils y propagent. En somme, si petit soit-il, un Tweet ou un post sur Facebook sont déjà des « publications » : le télégramme social exprime publiquement un point de vue, cite d’autres usagers et renvoie à des données au moyen d’hyperliens. La responsabilité de son auteur s’étend évidemment aux gens qui le suivent et le lisent directement ; mais elle comprend aussi les employeurs ou partenaires potentiels qui font des recherches sur sa personne ; elle se prolonge enfin à toutes les recommendations et décisions – politiques, économiques ou autres – qui suivent des traitements automatiques effectuées sur les messages en ligne ! L’usage pédagogique de Facebook et Twitter semble paradoxal à de nombreux étudiants qui conçoivent les médias sociaux comme un espace « réservé aux adolescents », libre des contraintes imposées par les parents et l’école. Mais si cette conception des médias sociaux était encore valable au début des années 2000 elle ne l’est plus aujourd’hui puisque les médias sociaux sont devenus le moyen de communication dominant.

Quelles que soient les institutions dans lesquelles ils travaillent, j’estime que les enseignants devraient construire avec leurs étudiants des communautés ouvertes de pratique, de dialogue et de réflexion utilisant les plateformes gratuites qui sont déjà utilisées par les élèves et le grand public. Les plateformes fermées élèvent des murs virtuels qui bloquent les contacts transversaux pertinents avec des experts et d’autres communautés d’apprentissage. En revanche, l’usage de plateformes ouvertes inscrit résolument l’Université – et plus généralement l’école – dans le nouvel espace public. J’avoue ne pas croire aux « technologies éducatives » et donner ma préférence aux usages pédagogiques des techniques de communication grand public qui sont déjà utilisées par les étudiants. L’important n’est ni la plateforme, ni le logiciel ni la collection de ressources, mais les compétences cognitives trans-plateformes et trans-contenus dont les pratiques éducatives doivent stimuler l’acquisition. Ce n’est pas Twitter qui doit polariser l’attention des étudiants, mais l’apprentissage de la clarté, de la brièveté et de la synthèse dans un dialogue où se construit la connaissance réflexive. De même, telle ou telle plateforme de curation de contenu n’est qu’un outil grâce auquel l’étudiant va s’initier à la catégorisation intelligente des données pour leur mutualisation dans une mémoire commune.

L’usage éducatif des média sociaux publics peut aller jusqu’à inclure les examens et les devoirs. J’ai expérimenté un « examen Twitter » où les étudiants devaient évaluer vingt de mes tweets en temps réel. Le code de communication était le suivant : pas de réaction s’ils pensaient que mon Tweet était faux, un coeur s’il contenait une part de vérité, un retweet s’ils étaient en gros d’accord et un retweet plus un coeur s’ils étaient complètement d’accord. Cela revenait à leur demander d’évaluer mes tweets sur une échelle de pertinence de 1 à 4. Après avoir relu avec eux mes tweets et les réponses qu’ils leur avaient donné, je leur demandais quel était, selon eux, la plus catastrophique des erreurs d’appréciation. Evidemment, les étudiants différaient dans leur estimation de la pire réponse. Je retenais toutes celles qu’ils avaient mentionnées et je retirais un point à tous ceux qui avaient donné l’une des mauvaises réponses identifiées par le groupe. Ainsi mon évaluation appliquait aux étudiants les règles qu’ils avaient eux-mêmes déterminées.

J’utilise maintenant une autre méthode d’évaluation, qui suppose la prise de note et le dialogue continu sur Twitter. Deux fois par semestre, les étudiants doivent relire la mémoire collaborative de la classe et sélectionner les éléments (notes de cours, questions, réponses, diagrammes, photos…) qui leur paraissent les plus intéressants ou les plus pertinents afin de construire un récit commenté de leur propre apprentissage. Il peuvent pour ce faire utiliser les Moments de Twitter ou encore Storify. Au moyen de citations plus ou moins commentées, chaque étudiant produit alors son histoire d’apprentissage – son interprétation originale du cours – selon ses intérêts et sa subjectivité propre. Toutes les histoires d’apprentissage sont publiées sur Twitter avec le hashtag du cours, ce qui permet d’observer non seulement l’accumulation de la mémoire collective mais également la multitude des réflexions personnelles sur cette mémoire, avec leurs complémentarités et leurs divergences.

Dans les deux cas – qu’il s’agisse de l’estimation de la pertinence de mes tweets ou du résumé personnel du cours que je demande aux élèves – l’exercice évalué demande aux participants de faire un retour réflexif sur leur apprentissage collectif. A la fin du semestre, les étudiants ont non seulement acquis une connaissance du sujet enseigné mais ils ont aussi amélioré leurs compétences en apprentissage collaboratif dans un environnement trans-plateforme et ils ont peu ou prou expérimenté un processus d’intelligence collective réflexive dans la nouvelle sphère publique. Dans leur immense majorité, les étudiants apprécient un dispositif d’apprentissage dans lequel ils sont plus actifs, s’ennuient moins et apprennent mieux. Ce type d’expérimentation et de perfectionnement pédagogique est aujourd’hui exploré un peu partout dans le monde.

En réfléchissant sur ma pratique d’enseignant depuis une dizaine d’années, je réalise qu’elle repose sur un modèle de l’apprentissage collaboratif à trois phases : 1) une pratique commune, 2) un dialogue sur cette pratique, 3) une réflexion collective émergeant du dialogue et qui vient enrichir la pratique en retour. Dans mon cas, la pratique commune est fort simple puisqu’il s’agit de la prise de notes. Comme cette pratique est enregistrée et partagée en temps réel, elle implique immédiatement une activité collaborative et pose les bases du dialogue et de la réflexion ultérieure. Le dialogue, ou plutôt le multilogue, a lieu sur un mode transversal entre tous les membres de la communauté d’apprentissage et non seulement entre le professeur et les étudiants. Aussi bien les élèves que l’enseignant peuvent poser des questions et y répondre. Qui a besoin de conseils ou d’encouragements ? Comment reformuler telle telle ou telle notion ? Tel exemple est-il pertinent ? De nouvelles ressources ou références peuvent-elles faciliter la compréhension des élèves ? Une simple image trouvée sur Internet par un étudiant fait parfois la différence. Enfin, la réflexion s’appuie sur une relecture de la mémoire enregistrée de la classe. A la fin du semestre, les étudiants sont suffisamment familiers avec le sujet du cours pour créer un ou plusieurs documents multimédia où sont mis en oeuvre les compétences, connaissances et réflexions personnelles qui ont émergé du dialogue et de l’expérience gagnées par la fréquentation de la classe. Dès aujourd’hui, les étudiants en informatique publient leurs travaux et leurs discussions sur Github. afin d’obtenir la reconnaissance de leurs pairs et d’afficher leurs compétences auprès des employeurs potentiels. Pourquoi les étudiants en sciences humaines ne suivraient-ils pas leurs traces ?

Supposons maintenant qu’au lieu de représenter les connaissances acquises au moyen d’un diplôme ou d’un crédit (la cote d’un cours et la note obtenue), on les représente par un enregistrement de l’ensemble des transactions pédagogiques publiques auxquelles a participé un étudiant : pratiques, dialogues, oeuvres témoignant des compétences et de la réflexion développées… Ce qui serait enregistré et authentifié ne serait plus un bref document statique et relativement opaque – comme aujourd’hui – mais une fenêtre sur l’apprentissage collaboratif vivant où le professeur et les étudiants se rendent mutuellement témoignage. La garantie des apprentissages individuels ne serait plus séparée du processus d’intelligence collective d’où les savoirs ont émergé et où ils ont pris sens. Indépendamment des mutations institutionnelles et culturelles qu’elle implique, une telle évolution de la reconnaissance des savoirs serait aujourd’hui techniquement possible. Les blockchains sont des registres informatisés qui contiennent l’historique de tous les échanges et transactions effectués entre ses utilisateurs depuis leur création. Ces bases de données sont sécurisées par un procédé cryptographique et partagées par leurs différents utilisateurs sans intermédiaire. D’abord utilisée en finance et en comptabilité, la technologie de la blockchain se répand aujourd’hui dans d’autres secteurs d’application. L’éducation et – plus généralement – l’authentification des expériences professionnelles et des compétences pourrait être une de ses futures applications vedette. Ainsi, à la fin d’un semestre, la mémoire de l’apprentissage collaboratif d’une classe, avec la participation de chaque étudiant, serait enregistrée et authentifiée par une blockchain. Cette nouvelle reconnaissance des savoirs amènerait un gain de transparence pour les contribuables qui financent l’éducation et pour les employeurs ou les collaborateurs potentiels des étudiants. Elle fournirait en outre aux institutions d’enseignement des flots de données fort précieuses pour étudier les évolutions cognitives et la qualité des apprentissages de leurs publics. De telles données seraient beaucoup plus précises et complètes que celles qui sont recueillies aujourd’hui au moyen d’évaluations après-coup et de sondages forcément partiels. Contrairement aux données récoltées au moyen des grilles fermées que l’on emploie souvent dans les enquêtes, elles ne préjugeraient pas des questions qui pourraient leur être posées. Les chercheurs pourraient interroger ces données au moyen d’algorithmes aussi variés que leurs hypothèses.

DONNÉES

Je me tiens à la disposition de toute équipe de recherche en sciences de l’éducation ou pédagogie pour aider à analyser les données produites par mes deux cours #UOAC (en anglais) et #UOIM (en français). Ces données consistent en Tweets, Moments et Blogposts. Tous les moments et Blogposts ont été publiés sur Twitter avec les hashtags correspondants.

Un article dans Quartier Libre (Journal des étudiants de l’Université de Montréal):

Moments (choix personnel de tweets) issus de mes cours de l’automne 2016

Mon cours de cent étudiants de deuxième année à l’hiver 2017: #uotm17

Choix de Storifys ou Moments de mes étudiants de 2016 (travail en cours, plus à venir):

A unique experience

How free are we?” C’est beau comme un poème soufi !

Choix de blogposts de mes étudiants témoignant de l’efficacité de la méthode “Twitter en Classe” (travail en cours, plus à venir)

Le meilleur cours de toute ma vie

prendre des notes en Tweetant“!

Voyage au monde des médias

Le système est simple, mais efficace.

Twitter et la mémoire collective

Les tweets nous permettaient de nous remémorer les sujets discutés en classe presque dans leur intégralité.

Un cours qui a changé ma perception de l’apprentissage

Innover pour enseigner

“Le cours de CMN 1560 a été un de mes cours préférés lors du trimestre d’automne 2016. Mon professeur M. Pierre Lévy a véritablement changé la façon d’apprendre la matière du cours. La grande majorité des étudiants ont bien apprécié le cours. Vers la fin du trimestre, j’ai vu beaucoup de tweets exprimant comment agréables que les étudiants ont trouvés le cours. Nous utilisons les médias sociaux, spécifiquement Twitter pour faire une prise de notes collectives. Effectivement, je pourrais toujours, comme n’importe qui, accéder à la matière qui m’a été enseignée durant mon cours grâce au #uoim sur Twitter. Ici je peux retrouver tout les notes, les questions, et les remarques ou commentaires que les étudiants ont tweetés en relation avec le contenu du cours. Cet élément interactif du cours a intéressé plusieurs étudiants et rendait la matière plus fascinante. Personnellement, j’ai bien aimé assister aux séances en classe, je ne les trouvais pas du tout ennuyantes 

This course, Advanced theories of communication, was like none other that I had ever taken.

The potential of Twitter for education

Collective intelligence in the classroom

I have learned to use the media that are at my fingertips

Communication happened

Becoming an autonomous thinker

what more professors should do nowadays to make their courses more interactive and stimulating

6 Things I Learned From Pierre Levy

“When we started the class and the professor told us to only take notes via twitter, I was very skeptical. I did not want to have an open mind towards his new method of teaching despite the fact that I am considered to be part of the millennials generation and you know we are known for our excessive use of technology”

From the blogpost of Cindi Cai ” Moreover, this advanced theory of communication not only taught me how to be a good speaker, but also in the class, I learnt how to be a good listener. For example, in the class, the professor encouraged students to participate in the class Q&A section by twittering through the internet, which allows every single student to have a chance to ask questions, and at the same time also encourage students to listen to other students’ ideas toward the subject. We, as students in the class just need to focus on the speech that the professor have given to the students, and catch the content in which we have questions, doubts, and raise our questions by twittering in order to get answers from the professor, while the professor also need to listen to students opinion by checking out the course tag.  For doing so, students have equal chances to listen and get their answers from the professor, and also students get an opportunity to listen to or inspired from other students’ learning stories( storify, blog post ).This teaching method is very interesting to me, because as a university student, what I want from the university is not just a piece of degree certificate, but also an opportunity to develop the ability to think extensively, solve problems, and challenge myself. To be honest, before I took this class, I was so tired of university, because I found that every single class I took at the University of Ottawa was really boring, and most students included me was more like machine, though we kept going to every class, and studied hard, we just wanted a better grade, and after exams or assignments, we just simply forgot what we have learnt in the class. This situation made me feel nervous and I started to doubt my university life and wonder if university could really help me in my future development?

Luckily, the CMN 3109 class strongly changed my mind toward university, because in the class, under the unique teaching method of the professor, I realized that if I just focus on grades, there’s a strong possibility that I won’t be as prepared for the world outside of university. But if I focus on learning as much as I can, and engage with all the opportunities presented by the class, I will be in a much better position to thrive after I graduate. It is just like how those communication techniques inspired me to how to be a better yoga instructor, this course has truly encouraged me to build my knowledge of the whole communication process, and rebuild my confidence to prepare for my future yoga teacher career positively….”

F-PARA-IC.jpg

Carte sémantique de l’intelligence collective

La carte ci-dessus schématise les grandes structures de l’intelligence collective humaine telles que nous les appréhendons au début du XXIe siècle. Le signe y est signalé par une étoile, l’être par un visage et la chose par un cube. L’intelligence collective se présente comme une boucle d’interdépendance entre le développement humain actuel et le développement humain virtuel (sur les catégories sémantiques virtuel, actuel, signe, être et chose, voir ce post). Le développement actuel comprend trois facettes qui sont elles-mêmes interdépendantes : celle des messages , des personnes et des équipements. Ces trois facettes actuelles concernent des facteurs ou des processus qui sont plongés dans l’espace et le temps. Le développement virtuel comprend lui aussi trois facettes interdépendantes : la connaissance, l’éthique et la puissance. Par contraste avec les facettes actuelles, les facettes virtuelles désignent des états d’esprit, des règles ou des potentialités. Le développement virtuel dépend du développement actuel comme de sa base matérielle tandis que le développement actuel dépend du développement virtuel comme de son instance de coordination, de pilotage et de traction. L’intelligence collective peut également s’analyser comme une dialectique d’interdépendance entre trois types de réseaux représentés par les colonnes de la carte : les réseaux de signes (connaissances et messages), d’êtres (éthiques et personnes) et de choses (puissances, équipements).

Chacune des six catégories principales s’analyse à son tour comme une dynamique de transformation entre trois sous-catégories de niveau inférieur selon la symétrie signe/être/chose. Dans la transformation symétrique interne à chacune des six catégories principales de l’intelligence collective, la chose représente la dimension la plus « dure » ou la plus objective ; l’être est chargé d’émotion et se déploie dans les rapports humains ; enfin le signe indique une dimension cognitive qui oriente le contenu de la catégorie. On comprend ici que des symétries sémantiques virtuel/actuel et signe/être/chose peuvent se décliner récursivement à l’intérieur de n’importe quelle catégorie et que la modélisation par les systèmes de relations sémantiques peut être raffinée à loisir.

En inspectant la carte sémantique de l’intelligence collective, il faut supposer qu’une variation des données empiriques dans une catégorie se répercutera d’une manière ou d’une autre dans la variation empirique des catégories symétriques et que les données catégorisées par les différentes facettes tendent à s’équilibrer en fonction de leurs relations d’interdépendance. Par exemple, il est impossible de garder de manière durable une force dans une des six catégories principales et des faiblesses dans les autres. Nous allons maintenant explorer une par une les six catégories principales de l’intelligence collective. Il faut imaginer ce système de relations sémantiques comme un tableau de bord qui documente en temps réel l’évolution de l’intelligence collective d’une communauté (son contenu, ses forces, ses faiblesses, ses connexions internes) sur un mode visuel et interactif, à partir d’un flux de données spécialement sélectionné à cet effet. On imaginera également que l’individu ou le groupe qui interagit avec le tableau de bord peut visualiser sa propre contribution à l’intelligence collective et ce qu’il en reçoit.

Connaissances

Une foule de styles de savoirs – académiques ou non-académiques – alimentent le « capital épistémique » d’une communauté. Les réseaux de connaissances n’excluent a priori aucun genre de savoir ni aucun type de relation entre les savoirs. Cette catégorie rassemble donc la variété ouverte des types de connaissance portés par une communauté à partir de l’intuition fondamentale qu’ils se multiplient les uns par les autres et qu’ils peuvent tous contribuer à leur manière au développement humain dans son ensemble. Les connaissances contiennent notamment, comme une sous-fonction cognitive spécialement consacrée à la réflexivité de l’intelligence collective, une représentation synthétique de l’intelligence collective elle-même. Une image holistique du développement humain est donc contenue dans la catégorie de la connaissance, qui n’est pourtant qu’une partie du développement humain pris comme un tout.

La distinction entre arts et sciences peut se décliner, par exemple, en savoirs du vrai et savoirs du beau, jugements logiques et jugements de goût. On peut encore opposer, d’une part, les savoirs explicites, calculables, basés sur l’observation, l’expérimentation contrôlée, la démonstration et l’explication et, d’autre part, les savoirs implicites, incalculables, fondés sur l’expérience personnelle, la transmission traditionnelle et l’autorité de la coutume. Quant à la sagesse, le terme traduit les termes grecs Sophia, plus théorique, et Phronésis, plus pratique, mais aussi la Sapientia latine, la Hochma hébraïque, la Hekmah arabe, le Yoga indien, les Voies de l’Asie du Sud-Est, etc. Les sagesses concernent les savoir-être, les arts de la maîtrise de soi, de la prudence, du jugement droit et de l’action en résonance avec les rythmes fondamentaux.

Ethiques

La multitude des éthiques comprend les valeurs, normes et priorités (quelles qu’elles soient) qui orientent la gouvernance, ainsi que les systèmes de droits et d’obligations qui régulent les comportements, les décisions et évaluations en tous genres ayant cours dans la communauté considérée. De même que la catégorie « connaissance » n’impliquait aucune prise de parti dans les controverses concernant le vrai, le beau, le sage, la validité ou le bon goût des représentations, la catégorie éthique ne prend pas parti non plus sur le bien et le mal, le juste et l’injuste, le préférable ou le négligeable. L’accent est mis sur l’explicitation des choix qui construisent le réseau de vouloirs ou « capital éthique » d’une communauté et sur la contribution de ces choix à l’augmentation et à la diversification des autres catégories de l’intelligence collective. A long terme, les orientations concernant le bien et le mal devraient idéalement se fonder sur la connaissance des effets des choix éthiques sur le développement humain durable. Cette connaissance des effets, toujours perfectible, repose essentiellement sur un travail de modélisation et d’observation empirique de la dynamique interne de l’intelligence collective et du développement humain.

Puissances

Eclairés par des réseaux de savoirs (connaissance) et orientés par des réseaux de vouloirs (éthique), la puissance d’une intelligence collective mobilise les compétences, savoir-faire pratiques et métiers, qui peuvent s’associer en réseaux collaboratifs et se complémenter. Outre les compétences, la puissance d’une intelligence collective repose sur sa force économique, résumée ici par le terme de « ressources » (liquidité, crédit, épargne…). Cette dimension financière correspond non seulement à un pouvoir d’achat à des fins de consommation mais également à une capacité d’investissement et d’emploi des compétences. Enfin, la puissance s’alimente de la résolution d’une communauté, c’est-à-dire de l’engagement, du courage, du moral ou de la confiance en soi de ses membres.

Sans ressources, le savoir-faire seul ne confère pas de pouvoir d’action effective et, sans la mise en branle de réseaux de compétences, les moyens financiers restent impuissants ou stériles. Et si la communauté en question n’est pas résolue dans son action, sa puissance se dissipe. La catégorie de la puissance dessine donc un ensemble de réseaux de pouvoirs ou les disponibilités de ressources, des engagements fermes et des savoir-faire pratiques s’échangent, se fécondent et se multiplient. Comme les catégories épistémiques et éthiques, la catégorie pratique de la puissance a pour vocation naturelle de croître et de se diversifier pour elle-même. Mais elle doit parallèlement contribuer à la croissance et à la diversification des autres catégories, selon une stratégie d’intelligence collective bien comprise, fondée sur l’analyse des équilibres durables à maintenir.

Messages

Le « capital de messages » peut être envisagé de trois points de vue complémentaires : celui du contenu des messages, celui de la communication interpersonnelle proprement dite et celui des médias (les environnements et supports de communication). La catégorie rassemble l’ensemble des messages échangés dans et par la communauté envisagée, auxquels il faut ajouter les messages disponibles en ligne qui sont pertinents pour cette communauté, même si aucun de ses membres n’en est le destinataire ou le destinateur explicite. Les messages et leurs contenus sont pratiquement indissociables des communications qu’ils alimentent et des médias qui servent à les produire, les enregistrer, les fouiller, les retrouver, les transmettre, les recevoir et les transformer. Du point de vue de la mémoire de l’intelligence collective, les messages sont conçus comme des documents à conserver et à exploiter afin de permettre à la communauté de se représenter à elle-même son histoire, ou l’évolution de son identité. En ce sens, le capital de messages comprend non seulement les flux de messages à court terme (les médias et systèmes de messagerie) mais également la communication à long terme et la transmission intergénérationnelle (donc l’éducation) : les écoles, les bibliothèques, les musées et les supports d’apprentissage de toutes sortes dont les trésors sont de plus en plus numérisés et disponibles en ligne. Sans communication ni mémoire culturelle, sans support sémiotique en général, ni les réseaux de savoir, ni les réseaux de vouloirs, ni les réseaux de pouvoirs ne pourraient subsister, sans parler des réseaux sociaux… Les messages n’ont de sens qu’en fonction de leur relation inter-créative avec les cinq autres pôles.

Personnes

La catégorie des personnes représente le « capital social » d’une communauté, c’est-à-dire le réseau des connexions interpersonnelles qui fondent cette communauté. On peut ici distinguer trois aspects interdépendants : la variété des rôles sociaux joués par les personnes, la qualité des liens (que le terme général de confiance résume assez bien) et finalement la quantité, l’intensité et le dessin des connexions (les réseaux proprement dit). Les gens qui interagissent au sein de réseaux interpersonnels le font généralement au titre d’un ou plusieurs rôles sociaux : rôles de genre, rôles familiaux, professionnels ou politiques, participation à la société civile, participation à des rituels de tous ordres, etc. Plusieurs approches du développement humain mettent le capital social en position de déterminant essentiel. Plutôt que de désigner un déterminant essentiel, la démarche proposée ici préconise un instrument d’observation et de pilotage des interdépendances. Car si le capital social peut être bel et bien considéré, en un sens, comme la racine (ou le fruit ultime) du développement humain, il dépend lui-même d’une foule de facteurs qu’il conditionne en retour : équipements, santé, éducation et connaissances, compétences, moyens financiers, gouvernance, mémoire culturelle… On voit que chaque catégorie décrit la même communauté humaine, mais selon des points de vue conceptuellement distincts qui se réfléchissent les uns dans les autres selon des modèles fonctionnels à tester et à préciser empiriquement.

Equipements

Le « capital biophysique » décrit par les équipements désigne d’abord les organismes humains dans leur actualité biomédicale (santé) ainsi que l’environnement biophysique ou écosystémique complexe dont ils dépendent nécessairement pour leur nourriture, leur boisson, leur respiration, leur hygiène et leur bien-être en général. Le circuit corporel comprend également l’ensemble des équipements matériels et techniques produits et entretenus par l’industrie humaine : vêtements, bâtiments, réseaux de transports, véhicules, outils, machines, produits de l’industrie chimique et biochimique, etc. Il s’agit en somme du système d’interaction causal qui réunit les corps matériels et qui constitue le support physico-biologique du développement humain. Il est sans doute inutile de souligner ici la part prise aujourd’hui par la santé dans les dépenses publiques et le souci général d’un développement durable respectueux des équilibres écologiques dont dépend le bien-être des populations. Par ailleurs il est évident que les infrastructures matérielles, ainsi que la qualité et la quantité de l’outillage disponible, déterminent dans une large mesure les opportunités ouvertes aux communautés humaines. En retour, il est clair que les « équipements » dépendent eux-mêmes des apports en provenance des cinq autres catégories principales de ce modèle.

 

Diapositive1.jpg
FIGURE 1

J’ai montré dans un post précédent, l’importance contemporaine de la curation collaborative de données.  Les compétences dans ce domaine sont au coeur de la nouvelle litéracie algorithmique. La figure 1 présente ces compétences de manière systématique et, ce faisant, elle met en ordre les savoir-faire intellectuels et pratiques tout comme les « savoir-être » éthiques qui supportent l’augmentation de l’intelligence collective en ligne. L’étoile évoque le signe, le visage l’être et le cube la chose (sur ces concepts voir ce post). La table est organisée en trois rangées et trois colonnes interdépendantes. La première rangée explicite les fondements de l’intelligence algorithmique au niveau personnel, la seconde rappelle l’indispensable travail critique sur les sources de données et la troisième détaille les compétences nécessaires à l’émergence d’une intelligence collective augmentée par les algorithmes. L’intelligence personnelle et l’intelligence collective travaillent ensemble et ni l’une ni l’autre ne peuvent se passer d’intelligence critique ! Les colonnes évoquent trois dimensions complémentaires de la cognition : la conscience réflexive, la production de signification et la mémoire. Aucune d’elles ne doit être tenue pour acquise et toutes peuvent faire l’objet d’entraînement et de perfectionnement. Dans chaque case, l’item du haut pointe vers un exercice de virtualisation tandis que celui du bas indique une mise en oeuvre actuelle de la compétence, plus concrète et située. Je vais maintenant commenter le tableau de la figure 1 rangée par rangée.

L’intelligence personnelle

La notion d’intelligence personnelle doit ici s’entendre au sens d’une compétence cognitive individuelle. Mais elle tire également vers la signification du mot « intelligence » en anglais. Dans ce dernier sens, elle désigne la capacité d’un individu à mettre en place son propre système de renseignement.

La gestion de l’attention ne concerne pas seulement l’exercice de la concentration et l’art complémentaire d’éviter les distractions. Elle inclut aussi le choix réfléchi de priorités d’apprentissage et le discernement de sources d’information pertinentes. Le curateur lui-même doit décider de ce qui est pertinent et de ce qui ne l’est pas selon ses propres critères et en fonction des priorités qu’il s’est donné. Quant à la notion de source, est-il besoin de souligner ici que seuls les individus, les groupes et les institutions peuvent être ainsi qualifiés. Seuls donc ils méritent la confiance ou la méfiance. Quant aux médias sociaux, ce ne sont en aucun cas des sources (contrairement à ce que croient certains journalistes) mais plutôt des plateformes de communication. Prétendre, par exemple, que « Twitter n’est pas une source fiable », n’a pas plus de sens que l’idée selon laquelle « le téléphone n’est pas une source fiable ».

L’interpretation des données relève également de la responsabilité des curateurs. Avec tous les algorithmes statistiques et tous les outils d’analyse automatique de données (« big data analytics ») du monde, nous aurons encore besoin d’hypothèses causales, de théories et de systèmes de catégorisation pour soutenir ces théories. Les corrélations statistiques peuvent suggérer des hypothèses causales mais elles ne les remplacent pas. Car nous voulons non seulement prédire le comportement de phénomènes complexes, mais aussi les comprendre et agir sur la base de cette compréhension. Or l’action efficace suppose une saisie des causes réelles et non seulement la perception de corrélations. Sans les intuitions et les théories dérivées de notre connaissance personnelle d’un domaine, les outils d’analyse automatique de données ne seront pas utilisés à bon escient. Poser de bonnes questions aux données n’est pas une entreprise triviale !

Finalement, les données collectionnées doivent être gérées au plan matériel. Il nous faut donc choisir les bons outils d’entreposage dans les « nuages » et savoir manipuler ces outils. Mais la mémoire doit être aussi entretenue au niveau conceptuel. C’est pourquoi le bon curateur est capable de créer, d’adopter et surtout de maintenir un système de catégorisation qui lui permettra de retrouver l’information désirée et d’extraire de ses collections la connaissance qui lui sera utile.

L’intelligence critique

L’intelligence critique porte essentiellement sur la qualité des sources. Elle exige d’abord un travail de critique « externe ». Nous savons qu’il n’existe pas d’autorité transcendante dans le nouvel espace de communication. Si nous ne voulons pas être trompé, abusé, ou aveuglé par des oeillères informationnelles, il nous faut donc autant que possible diversifier nos sources. Notre fenêtre d’attention doit être maintenue bien ouverte, c’est pourquoi nous nous abonnerons à des sources adoptant divers points de vue, récits organisateurs et théories. Cette diversité nous permettra de croiser les données, d’observer les sujets sur lesquelles elles se contredisent et ceux sur lesquelles elles se confirment mutuellement.

L’évaluation des sources demande également un effort de décryptage des identités : c’est la critique « interne ». Pour comprendre la nature d’une source, nous devons reconnaître son système de classification, ses catégories maîtresses et son récit organisateur. En un sens, une source n’est autre que le récit autour duquel elle organise ses données : sa manière de produire du sens.

Finalement l’intelligence critique possède une dimension « pragmatique ». Cette critique est la plus dévastatrice parce qu’elle compare le récit de la source avec ce qu’elle fait réellement. Je vise ici ce qu’elle fait en diffusant ses messages, c’est-à-dire l’effet concret de ses actes de communication sur les conversations en cours et l’état d’esprit des participants. Je vise également les contributions intellectuelles et esthétiques de la source, ses interactions économiques, politiques, militaires ou autres telles qu’elles sont rapportées par d’autres sources. Grâce à cette bonne mémoire nous pouvons noter les contradictions de la source selon les moments et les publics, les décalages entre son récit officiel et les effets pratiques de ses actions. Enfin, plus une source se montre transparente au sujet de ses propres sources d’informations, de ses références, de son agenda et de son financement et plus elle est fiable. Inversement, l’opacité éveille les soupçons.

L’intelligence collective

Je rappelle que l’intelligence collective dont il est question ici n’est pas une « solution miracle » mais un savoir-faire à cultiver qui présuppose et renforce en retour les intelligences personnelles et critiques.

Commençons par définir la stigmergie : il s’agit d’un mode de communication dans lequel les agents se coordonnent et s’informent mutuellement en modifiant un environnement ou une mémoire commune. Dans le médium algorithmique, la communication tend à s’établir entre des pairs qui créent, catégorisent, critiquent, organisent, lisent, promeuvent et analysent des données au moyen d’outils algorithmiques. Il s’agit bien d’une communication stigmergique parce que, même si les personnes dialoguent et se parlent directement, le principal canal de communication reste une mémoire commune que les participants exploitent et transforment ensemble. Il est utile de distinguer entre les mémoires locale et globale. Dans la mémoire « locale » de réseaux ou de communautés particulières, nous devons prêter attention à des contextes et à des histoires singulières. Il est également recommandé de tenir compte des contributions des autres participants, de ne pas aborder des sujets non-pertinents pour le groupe, d’éviter les provocations, les explosions d’agressivité, les provocations, etc.

Quant à la mémoire « globale », il faut se souvenir que chaque action dans le médium algorithmique réorganise – même de façon infinitésimale – la mémoire commune : lire, taguer, acheter, poster, créer un hyperlien, souscrire, s’abonner, « aimer », etc. Nous créons notre environnement symbolique de manière collaborative. Le bon agent humain de l’intelligence collective gardera donc à la conscience que ses actions en ligne contribuent à l’information des autres agents.

La liberté dont il est question dans la figure 1 se présente comme une dialectique entre pouvoir et responsabilité. Le pouvoir recouvre notre capacité à créer, évaluer, organiser, lire et analyser les données, notre aptitude à faire évoluer la mémoire commune à partir de la multitude distribuée de nos actions. La responsabilité se fonde sur une conscience réfléchie de notre pouvoir collectif, conscience qui informe en retour l’orientation de notre attention et le sens que nous donnons à l’exercice de nos pouvoirs.

Diapositive4.jpg

FIGURE 2

L’apprentissage collaboratif

Finalement, l’apprentissage collaboratif est un des processus cognitifs majeurs de l’intelligence collective et le principal bénéfice social des habiletés en curation de données. Afin de bien saisir ce processus, nous devons distinguer entre savoirs tacites et savoirs explicites. Les savoirs tacites recouvrent ce que les membres d’une communauté ont appris dans des contextes particuliers, les savoir-faire internalisés dans les réflexes personnels à partir de l’expérience. Les savoirs explicites, en revanche, sont des récits, des images, des données, des logiciels ou d’autres ressources documentaires, qui sont aussi clairs et décontextualisés que possible, afin de pouvoir être partagés largement.

L’apprentissage collaboratif enchaîne deux mouvements. Le premier consiste à traduire le savoir tacite en savoir explicite pour alimenter une mémoire commune. Dans un second mouvement, complémentaire du premier, les participants exploitent le savoir explicite et les ressources d’apprentissage disponibles dans la mémoire commune afin d’adapter ces connaissances à leur contexte particulier et de les intégrer dans leurs réflexes quotidiens. Les curateurs sont potentiellement des étudiants ou des apprenants lorsqu’ils internalisent un savoir explicite et ils peuvent se considérer comme des enseignants lorsqu’ils mettent des savoirs explicites à la disposition des autres. Ce sont donc des pairs (voir la figure 2) qui travaillent dans un champ de pratique commun. Ils transforment autant que possible leur savoir tacite en savoir explicite et travaillent en retour à traduire la partie des connaissances explicites qu’ils veulent acquérir en savoir pratique personnel. J’écris “autant que possible” parce que l’explicitation totale du savoir tacite est hors de portée, comme l’a bien montré Michael Polanyi.

Dans le médium algorithmique, le savoir explicite prend la forme de données catégorisées et évaluées. Le cycle de transformation des savoirs tacites en savoirs explicites et vice versa prend place dans les médias sociaux, où il est facilité par une conversation créative civilisée : les compétences intellectuelles et sociales (ou morales) fonctionnent ensemble !

La curation de données

Comme Monsieur Jourdain faisait de la prose sans le savoir, tout le monde fait aujourd’hui de la curation de données – on dit aussi de la curation de contenu – sans le savoir. Sur les grandes plateformes de médias sociaux comme Facebook, Twitter, Pinterest ou Instagram, mais aussi dans une multitude d’applications en ligne plus spécialisées comme Evernote, Scoop.it ou Diigo, les utilisateurs font référence à des données (textes, images, vidéos, musique…) qu’ils accompagnent de commentaires, de hashtags classificateurs et de diverses formes d’évaluations et d’émoticons. Ces posts s’accumulent dans des collections personnelles ou communautaires, apparaissent sur les fils d’autres utilisateurs et sont réexpédiées ad libitum avec d’éventuels changements de commentaires, de hashtags et d’appréciations émotionnelles. Les posts deviennent eux-mêmes des données qui peuvent à leur tour faire l’objet de références, de commentaires, de marquage affectif, de recherche et d’analyse. Les médias sociaux nous proposent des outils perfectionnés de gestion de base de données, avec des algorithmes de fouille, d’apprentissage machine, de reconnaissance de forme et de filtrage collaboratif qui nous aident à naviguer parmi la masse du contenu et les foules d’utilisateurs. Mais l’alimentation de la base tout comme la catégorisation et l’évaluation des données sont à notre charge.

labyrinthe-livres.jpg

Le mot curation, employé d’abord en anglais pour désigner l’activité d’un commissaire d’exposition dans l’univers des galeries d’art et des musées, a été récemment généralisé à toutes les activités de collection d’information. L’étymologie latine du mot évoque le soin médical (la cure) et plus généralement le souci. S’il est vrai que nous entrons dans une société datacentrique, le souci des données, l’activité qui consiste à collectionner et organiser des données pour soi et pour les autres devient cruciale. Et puisque la société datacentrique repose sur une effervescente économie de la connaissance, au sens le plus vaste et le plus « écologique » de la notion d’économie (voir à ce sujet La Sphère sémantique 1, Chp. 6.) l’enjeu ultime de la curation de données n’est autre que la production et le partage des connaissances.

Je vais maintenant évoquer un certain nombre de sphères d’activité dans lesquelles la maîtrise de la curation collaborative de données commence à s’imposer comme une compétence essentielle : la conservation des héritages, la recherche en sciences humaines, l’apprentissage collaboratif, la production et la diffusion des nouvelles, le renseignement à sources ouvertes et la gestion des connaissances.

url.jpg

La conservation des héritages

Les responsables des archives, bibliothèques, médiathèques et musées collectionnent depuis des siècles des artefacts porteurs d’information et les organisent de telle sorte que leur public puisse les retrouver et les consulter. C’est dans ce milieu professionnel qu’est d’abord apparue la distinction entre données et métadonnées. Du côté des données, les documents physiques sont posés sur des étagères. Du côté des métadonnées, un fichier permet de rechercher les documents par auteurs, titres, sujets, disciplines, dates, etc. Le bibliothécaire fabrique une fiche, voire plusieurs fiches, pour chaque document qui entre dans la bibliothèque et le lecteur fouille dans les fiches pour explorer le contenu de la bibliothèque et savoir où se trouvent placés les livres qu’il veut lire. Sans l’appareillage des métadonnées et les principes d’organisation qui les sous-tendent il serait impossible d’exploiter les informations contenues dans une bibliothèque. Depuis la fin du XXe siècle, le monde des archives, des bibliothèques et des musées connaît une grande transformation. La numérisation fait converger toutes les informations dans le médium algorithmique et cette unification met cruellement en évidence la disparité et l’incompatibilité des systèmes de classification en usage. De plus, les principaux systèmes de métadonnées ont été conçus et utilisés à l’époque de l’imprimerie, ils n’exploitent donc pas les nouvelles possibilités de calcul automatique. Finalement, les flots d’information ont tellement crû qu’ils échappent à toute possibilité de catalogage classique par un petit nombre de professionnels. Depuis quelques années, les musées et bibliothèques numérisent et mettent en ligne leurs collections en faisant appel au crowdsourcing, c’est-à-dire à l’intelligence collective des internautes, pour catégoriser les données. Cette curation collaborative de données brouille la distinction entre curateurs et utilisateurs tout en manifestant la diversité des points de vue et des intérêts du public. Par ailleurs, une multitude de sites puisant leurs données dans le Web ouvert, et souvent indépendants des institutions classiques de préservation des héritages culturels, permettent aux amateurs d’art ou aux bibliophiles de partager leurs goûts et leurs trouvailles, de se regrouper par sensibilité et par centres d’intérêts.

La recherche en sciences humaines

La numérisation des archives et des héritages culturels, l’accessibilité des données et statistiques compilées par les gouvernements et les institutions internationales, les communications et transactions des internautes recueillies par les grandes plateformes du Web, toutes ces nouvelles sources offrent aux sciences humaines une matière première dont l’abondance défie l’imagination. Par ailleurs les blogs de chercheurs, les plateformes collaboratives spécialisées dans la collection d’articles (comme Academia.edu, Researchgate, Mendeley, CiteULike…) et les bases de données partagées transforment profondément les pratiques de recherche. Enfin, une frange croissante des professionnels des sciences humaines s’initie à la programmation et à l’usage avancé des algorithmes, produisant et partageant le plus souvent des outils open source. L’édition scientifique traditionnelle est en crise puisque la communication entre chercheurs n’a plus besoin de journaux imprimés. Chaque plateforme en ligne propose ses propres méthodes d’appréciation des publications, basées sur un traitement automatisé des interactions sociales, ce qui remet en question les modes classiques de filtrage et d’évaluation des articles. Certes, le problème posé par l’incompatibilité des plateformes et des systèmes de catégorisation reste à résoudre. Il subsiste donc quelques obstacles à franchir, mais tout est en place pour que la curation collaborative de données s’impose comme l’activité centrale de la recherche en sciences humaines… et de son évaluation.

L’apprentissage collaboratif

La curation collaborative de données émerge également comme une pratique essentielle dans le domaine de l’éducation. A l’époque du médium algorithmique, les connaissances évoluent vite, presque toutes les ressources d’apprentissage sont disponibles gratuitement en ligne et les étudiants sont déjà plongés dans le bain des médias sociaux. Le vieux modèle des communautés d’apprentissage s’organisant autour d’une bibliothèque ou d’un entrepôt physique de documents est donc obsolète. L’apprentissage doit être de plus en plus pensé comme partiellement délocalisé, collaboratif et continu. L’ensemble de la société acquiert une dimension d’apprentissage. Cela n’implique pas que les institutions d’enseignement classiques, école et université, ne soient plus pertinentes, bien au contraire. C’est précisément parce que l’apprentissage va puiser dans un stock de ressources pratiquement infini qu’aucune autorité transcendante ne peut plus organiser et hiérarchiser a priori que l’école a l’obligation d’entraîner les jeunes gens à l’apprentissage collaboratif et critique par le biais des médias sociaux. La fameuse littéracie numérique ne repose pas principalement sur l’acquisition de compétences techniques en informatique (qui changent rapidement), mais plutôt sur un savoir-faire socio-cognitif orienté vers la curation collaborative de données : filtrer les contenus pertinents pour tel ou tel groupe, les catégoriser, les évaluer, consulter les données, rédiger de courtes synthèses… Ainsi les enseignants utilisent des plateformes de social bookmarking (partage de signets) comme Diigo pour animer leurs cours, les MOOCs connectivistes font appel aux étudiants pour alimenter leurs ressources d’apprentissage, on trouvera une multitude de hashtags reliés à l’éducation et à l’apprentissage sur Twitter et les groupes Facebook abritent de plus en plus de classes…

Les nouvelles

La production et la dissémination des nouvelles participe du même type de mutation que celles qui viennent d’être évoquées. Du côté de la production, les journalistes s’initient à l’exploitation statistique des bases de données ouvertes pour en retirer les synthèses et les visualisations qui vont alimenter leurs articles. Ils suivent leurs collègues ainsi qu’une foules de sources sur Twitter afin de rester à jour sur les thèmes dont ils s’occupent. Par ailleurs, ce ne sont plus seulement les agences de presse et les journalistes professionnels qui produisent les nouvelles mais également les acteurs culturels, économiques, politiques et militaires par l’intermédiaire de leurs sites et de leurs agents dans les médias sociaux. N’oublions pas non plus les citoyens ordinaires qui prennent des photos et des vidéos grâce à leurs téléphones intelligents, qui diffusent ce qu’ils voient et ce qu’ils pensent sur toutes les plateformes et qui réagissent en temps réel aux nouvelles diffusées par les médias classiques. Du côté de la réception, la consommation des nouvelles se fait de plus en plus en ligne par le biais de Facebook, de Twitter, de Google news et d’autres plateformes sociales. Puisque chacun peut accéder directement aux sources (les messages émis par les acteurs eux-mêmes), les médias classiques ont perdu le monopole de l’information. Sur les sujets qui m’intéressent, je suis les experts de mon choix, j’écoute tous les sons de cloche et je me fais ma propre idée sans être obligé de m’en remettre à des synthèses journalistiques simplificatrices et forcément tributaires d’un agenda ou d’un maître-récit (« narrative ») politique ou national. En somme, aussi bien les professionnels de l’information que le nouveau public critique en ligne pratiquent assidûment la curation collaborative de données

L’intelligence open-source

Le domaine du renseignement économique (« business intelligence »), politique ou militaire échappe progressivement à l’ancienne logique de l’espionnage. Désormais, l’abondance des sources d’information en ligne rend de moins en moins judicieux l’entretien d’un personnel spécialement chargé de recueillir des informations sur place. En revanche, les compétences linguistiques, culturelles et scientifiques, l’érudition en sciences humaines, la capacité à extraire les renseignements pertinents du flot des données, le monitoring des médias sociaux et le savoir-faire collaboratif deviennent indispensables. A part les noms et adresses des agents doubles et le détail des plans d’attaque, tout est désormais disponible sur internet. A qui sait chercher en ligne et lire entre les mots, les images des satellites, les sites médiatiques, académiques, diplomatiques et militaires, sans oublier les rapports des « think tanks » en pdf, permettent de comprendre les situations et de prendre des décisions éclairées. Certes, les agents d’influence, trolls, utilisateurs masqués et robots logiciels tentent de brouiller les cartes, mais ils révèlent à la longue les stratégies des marionnettistes qui les manipulent. Dans le domaine en pleine expansion de l’open source intelligence les agences de renseignement – comme la nuée de leurs fournisseurs d’information, d’analyse et de synthèse – coopèrent dans la production, l’échange et l’évaluation des données. Ici encore, la curation collaborative de contenu est à l’ordre du jour.

La gestion des connaissances

Une équipe de travail, une entreprise quelconque – qu’elle soit publique, privée ou associative – se trouve dans la nécessité de « gérer ses connaissances » pour atteindre ses buts. Le terme de gestion des connaissances a commencé à être utilisé vers le milieu des années 1990, au moment même où naissait le Web et alors que l’idée d’une économie basée sur les savoirs et l’innovation commençait à s’affirmer. L’un des principaux fondateurs de cette nouvelle discipline, Ikujiro Nonaka (né en 1935), s’est attaché à décrire le cycle de création des connaissances dans les entreprises en insistant sur la phase d’explicitation des savoir-faire pratiques. A la suite de Nonaka, de nombreux chercheurs et praticiens ont tenté de déterminer les meilleures méthodes pour expliciter les savoirs tacites – nés de l’expérience – afin de les conserver et de les diffuser dans les organisations. Les premiers outils de gestion des connaissances étaient assez rigides et centralisés, à l’image de l’informatique de l’époque. On met en place aujourd’hui (2016) de véritables médias sociaux d’entreprise, dans lesquels les collaborateurs peuvent repérer mutuellement leurs compétences, créer des groupes de travail et des communautés de pratique, accumuler des ressources et partager des données. Indépendamment des outils techniques utilisés, la gestion des connaissances est une dimension transversale de toute entreprise. Cette épistémologie appliquée inclut la conservation des savoirs et savoir-faire, le développement des compétences et des ressources humaines, l’art de créer et de diffuser les connaissances. De fait, en observant les pratiques contemporaines dans les médias sociaux d’entreprise qui supportent la gestion des connaissances, on découvre que l’une des principales activités se trouve être justement la curation collaborative de données.

Il existe donc une pratique commune à de nombreux secteurs de la culture mondiale contemporaine, pratique dont les cloisonnements sociaux et la disparité des jargons professionnels dissimulent l’unité et la transversalité. Je fais l’hypothèse que la curation collaborative de données est le support techno-social de l’intelligence collective à l’époque du médium algorithmique : écrire et lire… sur des flots de données.

Pour en savoir plus sur les compétences en curation collaborative de données, lisez-donc le post qui suit!