Tous les articles par Émilien Ruiz

Histoire & Humanités numériques. Conclusions des #DHModerNum2016

Le 13 mai dernier, une passionnante journée d’études a eu lieu à la KBR – Bibliothèque Royale de Belgique. Organisée par ModerNum, le réseau des modernistes francophones de Belgique, et intitulée « Penser les temps modernes avec les  digital humanities », cette journée était structurée en deux « panels ». Le premier était consacré aux « Données » et nous a occupé pour la matinée, tandis que l’après-midi était consacré au panel « Communication ». Le tout se déroulait dans la « SkyRoom » de la bibliothèque.

Morceau de vue depuis la SkyRoom de la Bibliothèque Royale de Belgique
Morceau de vue depuis la SkyRoom de la Bibliothèque Royale de Belgique

Paul @medieviz Bertrand introduisait la matinée par une conférence intitulée « Vers une nouvelle critique historique. À propos du traitement numérique des sources anciennes », et Pierre @piotrr70 Mounier ouvrait quant à lui l’après-midi par une conférence intitulée « Traverser les silos : la science ouverte, horizon de l’accès ouvert en sciences humaines et sociales ». Après ces conférences d’ouvertures, chacune des demi-journées a été l’occasion de présentations très riches de projets numériques en histoire : Annick Delfosse nous a présenté EpistolART, Stéphane Demeter le SIG historique de Bruxelles et Wouter Brack le projet Cartésius pour le panel « Données » ; Côté « Communications », Caroline Heering nous a présenté le projet « Cultures du Spectacle Baroque », Nicolas @nsmodernhist Simon est revenu sur le blogging en histoire, tandis qu’Erik Buelinckx nous a présenté BALaT.

J’étais quant à moi chargé de prononcer les conclusions de la journée. L’exercice, gratifiant, n’est pas simple : il s’agissait de proposer quelques réflexions générales tout en partant des interventions de la journée… difficile de se préparer vraiment à l’avance. J’avais donc conçu une trame générale – dont l’idée précise ne m’est réellement venue que vers 2h du matin la veille de l’atelier… – à partir du programme et des brefs résumés des intervenants. C’est cette trame qu’il m’a ensuite fallu enrichir/amender/réduire au fil des exposés. En bref : je ne pense pas avoir déjà été autant attentif sur toute la durée d’une rencontre scientifique !

Vous l’avez donc compris, l’objet de ce billet est donc de partager ici ces réflexions de conclusions en repartant de mes notes.

Notes des 12 (noir) et 13 (rouge) mai 2016 (manuscrites, eh oui...)
Notes des 12 (noir) et 13 (rouge) mai 2016 (manuscrites, eh oui…)

Je les reprends ici sans trop les modifier, si ce n’est en réintroduisant quelques éléments qui ont sauté à l’oral, et en l’agrémentant de quelques liens et illustrations, et en précisant certains passages afin d’en améliorer éventuellement la compréhension pour celles et ceux qui n’auraient pas eu l’immense chance d’être parmi nous.

*

*          *

Je tiens d’abord à remercier les organisateurs de la journée de m’avoir invité à prononcer ces conclusions (et en particulier Nicolas Simon d’avoir apaisé mes inquiétudes et répondu à mes multiples questions concernant les attendus d’un tel exercice que je n’avais jamais pratiqué jusque-là). Honoré, je suis aussi et surtout ravi d’avoir à proposer quelques réflexions conclusives d’une journée organisée, certes par une société de modernistes, mais sous le signe d’un dialogue entre périodes, dialogue prenant de surcroît en considération des domaines (trop) souvent traités de façon séparée : la construction et le traitement des données d’une part, la communication et la diffusion des recherches de l’autre.

Si je suis totalement acquis à l’interdisciplinarité, c’est en effet dans l’optique tracée par Bernard Lepetit paru dans la Revue de synthèse en 1990  (et repris dans ses formidables – comme tout ce qu’a écrit Bernard Lepetit – Carnets de croquis) : celle d’une « pratique restreinte ». Ce que l’historien entendait par là c’est qu’une discipline n’est « pas seulement un mode de structuration de la réalité décrite » mais aussi « un métier, c’est-à-dire un ensemble de procédures éprouvées qui constituent une première garantie de discours cohérent ». Ainsi, si le dialogue, les échanges et les pratiques interdisciplinaires sont, à mon sens, indispensables (je me permets de vous renvoyer à ce texte, où je développe quelques réflexions sur ces enjeux), on ne saurait faire l’économie de réflexions sur l’impact disciplinaire des humanités numériques – comme en témoignent, au demeurant, les remarques introductives de Nicolas Simon et Paul Bertrand à ce propos.

Or, au sein même de la discipline historique, il existe un tel éclatement, non seulement en termes de périodes étudiées, mais aussi en termes d’approches, de sources (textuelles, visuelles, statistiques, etc.) et parfois de conception même du métier, que prendre le temps d’échanger « entre nous » me semble toujours salutaire. Et justement, les DH, en tant que : « transdiscipline, porteuse de méthodes, dispositifs et perspectives heuristiques liés au numérique dans le domaine des SHS » (si l’on suit la définition du manifeste de 2010) nous poussent à réfléchir aux pratiques qui gouvernent nos activités de recherche et d’enseignement.

Prendre au sérieux les humanités numériques ?

À condition de les prendre au sérieux, et de prendre au sérieux ce qu’elles sont en mesure d’apporter à la discipline historique et à l’ensemble de la communauté des enseignants chercheurs en histoire, qu’ils pratiquent ou non, consciemment ou non, les humanités numériques. Pour faire comprendre ce que j’entends par prendre au sérieux, je me permets de vous renvoyer à un entretien avec Claire Lemercier, réalisé avec Elisa Grandi pour Diacronie en 2012. Alors que nous l’interrogions sur le sens à accorder au terme « Digital history » (qui me semble aujourd’hui peut-être un peu moins à la mode), soulignant l’omniprésence de l’outil informatique dans ses pratiques, elle nous avait répondu sur le risque de dilution d’une telle notion :

« Si elle doit désigner dans leur ensemble les pratiques des historiens un peu geeks, ceux que leurs collègues appellent quand ils rencontrent un problème « informatique », elle ne me semble pas très intéressante. (…)

Il me semble qu’un aspect fondamental est la question de la structuration de l’information historique (…) Structurer de l’information en lignes et en colonnes sans perdre les acquis de la discipline historique, c’est-à-dire en gardant le lien avec les sources et un équilibre entre le langage de la source et les questions de l’historienne). »

Elle ajoutait, e qui me semble l’un des passages les plus importants :

« Ce sont des questions qui se posaient déjà à l’époque des fiches cartonnées! Mais si le label “digital history” peut les rendre plus explicites et plus centrales dans la discipline, tant mieux. »

Ainsi, à mon sens, l’un des apports majeurs des humanités numériques aux disciplines de sciences humaines et sociales en général, et à l’histoire en particulier, c’est de nous avoir poussés à un véritable effort de réflexivité quant à de nombreux aspects de nos pratiques. Si, comme l’a noté Paul Bertrand dans sa conférence introductive, elles ne transforment pas à elles seules les disciplines, et les font encore moins disparaitre, les humanités numériques constituent au minimum un aiguillon, réactivant des efforts réflexifs anciens qui gagneraient à être mieux connus par la communauté des historiennes et historiens.

Réflexivité, interopérabilité et évolutivité

Le premier domaine concerné correspond à celui qui nous a occupé toute la matinée : celui du traitement des sources et du rapport aux « données »

Comme l’a expliqué Paul Bertrand, un renouvellement de la critique des sources est rendu nécessaire par le développement des humanités numériques. Je partage d’ailleurs totalement l’idée selon laquelle, en ce sens, les HN s’inscrivent/participent/accélèrent un renouvellement amorcé plus tôt ou en parallèle. Elles seraient ainsi, selon PB, à la fois un révélateur et un moteur.

À ce titre, il est important de souligner le fait que les interrogations épistémologiques ouvertes par l’irruption des « données », des « méta-sources » etc. à la faveur du « tournant numérique » ont déjà fait l’objet de réflexions très poussées dans les années 1980-1990. En effet, on trouve un véritable écho aux préoccupations énoncées par Paul Bertrand concernant la nécessaire révision de la critique des sources dans les renouvellements engagés par les travaux de Jean-Claude Perrot et ses héritiers quant à l’usage des sources et méthodes quantitatives. L’approche « reconstructionniste » (je me permets, à ce propos, de vous renvoyer à ce billet et à cet article) offre ainsi une lecture des sources quantitatives très attentive aux conditions de production des statistiques, mais qui, dans le même mouvement, ne présuppose pas l’abandon de leur exploitation. En bref, pour devenir une source exploitable par l’historien, un matériau quantitatif doit d’abord être lui-même un objet de recherche.

En outre, les interventions de la matinée ont bien montré ce qui distingue les projets menés sous l’égide des « humanités numériques » des projets auparavant simplement qualifiés d’« informatiques » : c’est l’importance des réflexions préalables concernant l’interopérabilité et l’évolutivité. Comme Stéphanie Paul l’a très bien résumé dans son livetweet de la journée : « Lutter contre la silo-isation des projets, un thème récurrent à #DHModerNum2016 ».

Ils sont en effet nombreux les projets informatiques développés par/pour les historiens qui, finalement, ont abouti à des bases de données impossibles à réutiliser par qui que ce soit. Ce qui me semble être un apport de la réflexivité qui a accompagné le développement des humanités numériques, c’est l’importance que revêt désormais l’interopérabilité, pensée dès l’amont, et l’évolutivité, constitutive de nombreux projets. Ce que notait Stéphane Demeter concernant le SIG historique de Bruxelles peut, à mon sens, être étendu à l’ensemble des projets relevant des HN : ils tendent de plus en plus à être conçus de façon à être tout à la fois cumulatifs, contributifs et ouverts à tous (en tous cas ils devraient le faire…).

Décloisonnements et élargissement des échanges scientifiques

Mais bien entendu l’apport réflexif des HN à la discipline historique ne se limite pas à la question des données – sans quoi on pourrait presque en conclure ici que, pour l’histoire, les HN ne sont rien d’autre qu’une prolongation des renouvellements opérés par l’histoire quantitative dans les années 1980/1990 (ce qu’elles sont pour bonne part…).

Les HN, on l’a vu, réactivent, accélèrent ou rendent simplement plus visibles les enjeux collaboratifs de la recherche historique. Mais les HN ce sont bien sûr aussi de nouvelles formes de communication scientifique. Comme l’ont bien souligné des analyses qui ont maintenant plusieurs années (mais ne sont certainement pas assez lu en dehors des cercles convaincus de l’intérêt de l’outil), le blog constitue une sorte de réactivation de la conversation scientifique, de la disputatio (voir, notamment, les travaux de Marin Dacos & Pierre Mounier), voire une forme de « séminaire permanent » (selon l’expression d’André Gunthert). Dans son intervention, Nicolas Simon a aussi souligné ce que la pratique du blogging implique en termes de novations du point de vue de l’écriture, du ton, etc.

Où l'on reconnaît l'un des co-auteurs de l'excellent blogs ParenThèse à ses choix de citation pour ouvrir son intervention...
Où l’on reconnaît l’un des co-auteurs de l’excellent blog ParenThèses à ses choix de citations pour ouvrir son intervention…

Les HN ce sont aussi, et là je vous renvoie aux travaux de Serge Noiret, de nouvelles formes d’histoire publique, on parle ainsi de plus en plus de digital public history.

Pour ces conclusions, j’avais envisagé d’amorcer quelques réflexions autour des difficultés que l’on peut éprouver quant à la grande diversité des outils de médiation/diffusion offerts par le numérique : livre/article/blog/mediasociaux/etc. pour souligner la difficulté que nous avions, avec le développement du blogging notamment, à suivre les termes d’un débat scientifique. Or, Pierre Mounier l’a fait bien mieux que je ne saurais le faire dans sa conférence… Pour ne faire qu’un bref point sur la question : Nicolas Simon a noté le fait que, finalement, les blogs/carnets de recherche, appellent, pour l’essentiel, peu de commentaires. Or, dans l’optique du débat scientifique renouvelé offert par le numérique, cela nous mènerait à une impasse.

Comme il le faisait récemment remarquer dans un billet de ParenThèses [eh oui, ici c’est un passage qui n’est pas totalement tiré de mes notes du 13 mai…] le fait est, qu’avec le numérique, nous assistons à un éclatement considérable des lieux du débat scientifique. C’est un constat qu’avec Franziska Heimburger nous avions pu rapidement dresser avec La boîte à outils des historiens : certains collègues commentaient les billets, non pas dans l’espace commentaires du blog, mais dans celui qui était offert par Facebook au pied des partages de liens. Face à une telle situation, ma première réaction, jusqu’à récemment, était d’inviter les commentateurs à faire l’effort de revenir au billet et de le commenter directement. Puis, à force d’observer de telles pratiques, et mon incapacité à convaincre mes interlocuteurs que leurs remarques seraient plus utiles en commentaires que sur twitter ou facebook (l’un n’empêchant pas l’autre bien sûr !) s’est imposée une certitude : il nous faut repenser nos pratiques éditoriales et nos outils de façon à intégrer au mieux cette diversité des lieux d’échanges scientifiques. Je n’ai en revanche, à l’heure où j’écris ces ligne, aucune idée de solution vraiment satisfaisante à vous soumettre…

À une échelle, certes réduite, mais encourageante, on pourra ainsi consulter les Non-actes de la non-conférence des Humanités Numériques du ThatCamp Paris 2012 qui offrent, pour l’excellente conférence inaugurale de Paul Bertrand notamment, Les digital humanities sont-elles solubles dans le Steampunk ?, non seulement une transcription de son propos, mais aussi quelques tweets intégrés issus du live tweet de la session, ou encore un lien vers l’enregistrement audio de la conférence.

Au-delà de l’impérieuse nécessité de repenser à nos pratiques éditoriales, les humanités numériques nous confrontent, par ailleurs, à un enjeux transversal aux interventions de la journée, qui fait de plus en plus l’objet d’interrogations collectives : celles de la pérennisation. Se tenait ainsi il y a quelques jours un colloque relatif à la « pérennisation de l’éphémère » à l’UCL. La question n’est pas anodine – et en tant qu’utilisateur de twitter qui, pour ses comptes personnels, revendique l’éphémère et donc, l’effacement automatique régulier des publications, il me semble que c’est une question fondamentale.

À mon sens, cette question de la pérennisation fait parfaitement le lien entre les deux thématiques abordées au cours de la journée d’études – thématiques qui sont apparues intrinsèquement liées dans toutes les interventions : les questions relatives à la construction et au traitement des « données » ne sauraient être totalement distinguées des questions relatives à la « communication ».

C’est, je pense, ce qui fait ici encore la spécificité des « humanités numériques » : ces dimensions, jugées hermétiques par certains historiens dits « informatisants », apparaissent désormais totalement intégrées aux pratiques numériques des historiennes et historiens.

Conclure des conclusions…

Et c’est sur ce point que je souhaiterais conclure ces remarques conclusives… Ce que nous avons vu aujourd’hui, c’est l’importance du lien entre les deux aspects traités au cours de la journée. Mais ce lien peut prendre différentes formes. Dans nos pratiques les plus courantes, ce lien est réel mais ténu. Or, les pratiques qui commencent à se dégager de projets historiques se réclamant des humanités numériques tendent à aller plus loin. Je ne prendrai ici que deux exemples qui me semblent très parlants.

Le premier concerne les travaux de Frédéric @inactinique Clavert autour du centenaire de la Grande Guerre sur Twitter. Ce projet consiste en la capture de tous les tweets comprenant un certain nombre de hashtags reliés au centenaire. Je n’entre pas ici dans les détails les plus techniques car FC prend soin de mettre en ligne et en libre accès les avancées de son travail.

C’est un projet qui s’inscrit typiquement dans une version renouvelée de la digital public history : il s’agit de prendre en considération le rapport des citoyens à leur propre histoire. Mais ce n’est pas que cela : le projet de Frédéric Clavert correspond aussi à une étude historiographique : comment écrit-on l’histoire de la Grande Guerre dans les années 2010 ? En ce sens, le numérique rapproche ici les questions historiques des questions mémorielles, par la prise au sérieux de ce nouveau mode de communication scientifique qu’est twitter.

On a ainsi, dans ce projet, de nouveaux moyens de production numérique d’un discours historique et mémoriel (sur twitter) qui deviennent l’objet d’une investigation historienne reposant sur la mobilisation d’outils numériques pour la collecte (API de twitter), le traitement (Iramuteq) et la visualisation (Gephi) de données.

Le second projet que je souhaite évoquer est porté par Sébastien @HistorieNumeriQ Poublanc et Rémy @remy_besson Besson, actuellement respectivement à Toulouse et Montréal. Ce projet s’intitule Euchronie et vous pouvez en suivre l’avancée via un carnet de recherche L’atelier d’Euchronie. Avec ce projet, SP & RB ont pris acte de la multiplicité/diversité des modes de production de contenus historiques sur le web : blogs, mais aussi podcasts, vidéos, etc. tant pour proposer de la vulgarisation que des recherches, en cours ou achevées.

Le projet Euchronie vise à agréger – au moyen de PressForward, développé par le RRCHNM (Zotero, Omeka, etc.) et de WordPress – tous ces contenus sur la base d’un critère commun : l’auto-publication. Agrégateur, le projet n’est toutefois pas envisagé comme une simple revue de liens : les ressources feront l’objet d’une éditorialisation, de l’ajout de méta-données, etc.

En outre, sur le plus long terme, l’objectif des concepteurs du projet est d’ainsi constituer un corpus à étudier pour lui-même, pour comprendre les modalités de productions de contenus historiques sur le web. À la croisée de l’historiographie et de la digital public history, il s’agira de mieux comprendre le rapport de nos contemporains au passé.

*

(Pour vraiment conclure cette fois) J’achèverai mon propos en notant que le prochain défi – qui a déjà commencé à être relevé – pour celles et ceux qui s’inscrivent, explicitement ou non, dans le domaine des « humanités numériques », est de penser les interactions entre des activités de recherche et des activités de « communication » et de médiatisation de la recherche qui restent parfois encore trop cloisonnées. C’est aussi, il me semble, une opération qui devrait permettre de rallier les collègues qui restent sceptiques quant à l’intérêt des outils numériques pour l’histoire.

____________

Crédit image de une : « DH » by Quinn Dombrowski, en cc sur Flickr

Initiation à l’utilisation de LibreOffice Calc

Si la mobilisation des méthodes quantitatives en histoire vous conduira sans aucun doute à vous familiariser avec des outils plus avancés, la maîtrise (même minimale) d’un tableur reste fondamentale.

Les habitué.es du blog connaissaient déjà l’introduction à Excel 2010, voici (en attendant la mise à jour pour Excel 2016) une introduction à son alternative libre : Calc.

Conçue à l’occasion d’une introduction aux méthodes quantitatives en histoire pour les étudiant.es en L2 de Lille 3, cette petite brochure vous propose de vous familiariser avec les fonctions de base du tableur de la suite Libre Office (v.5) de la mise en forme d’un tableau à la création d’une pyramide des âges, en passant par l’usage de quelques formules.

Initiation_LO-Calc_Sommaire
Cliquez sur l’image pour télécharger le PDF

 


Crédit image de une : « I Love Spreadsheets » by Craig Chew-Moulding en cc sur Flickr

À propos d’une conférence de « très très haut niveau » sur les humanités numériques

Le 19 novembre 2014, Bruno Latour donna l’une des conférences « d’un très très haut niveau » [0’26’’] organisées à la BnF grâce au soutien de la Fondation del Duca – Institut de France. Intitulée « Ce que le numérique fait aux humanités », cette conférence a été enregistrée en vidéo et re-circule aujourd’hui sur les médias sociaux grâce à sa rediffusion sur les réseaux par France Culture Plus – excellent site que je vous recommande vivement par ailleurs.
En voici la présentation sur le site de FCPlus :

« L’impact du numérique sur le travail intellectuel a donné naissance à un domaine d’expérimentation multiple qu’on appelle les « humanités numériques ». Bruno Latour a participé de plusieurs manières à ces expérimentations notamment par la création du médialab de Sciences Po, mais aussi par un programme de recherche collaboratif, « Enquête sur les modes d’existence », qui allie un site web modesofexistence.org avec un livre papier. Il présente ici quelques pistes de réflexion sur les mutations que le numérique engendre pour les humanités et les sciences sociales. » Continuer la lecture de À propos d’une conférence de « très très haut niveau » sur les humanités numériques

Nouvelles approches quantitatives en histoire et sciences sociales

Je relaie l’appel à candidature pour cet atelier doctoral, organisé par  François Dumasy (EFR), Michael Gasperoni (EFR), Silvia Sebastiani (EHESS) et Claire Zalc (CNRS), il aura lieu en octobre à l’École française de Rome :

_____________________________

Atelier doctoral organisé à l’École française de Rome, les 6-9 octobre 2015 – Réception des candidatures jusqu’au 30 mai 2015

La Méditerranée : un laboratoire de l’histoire globale et des processus de globalisation – Session 2015 :

« Les nouvelles approches quantitatives en histoire et en sciences sociales« 

_____________________________

Présentation : « Longtemps présente dans l’historiographie française des Annales, l’histoire quantitative a été longtemps assimilée à une histoire sérielle et principalement économique. Critiquée et repensée par la micro-histoire, renouvelée par les transformations des outils, notamment informatiques, elle a connu une profonde évolution de ses objets et ses méthodes et s’offre aujourd’hui comme une approche fructueuse de la recherche en histoire, mais aussi, au-delà, en sciences sociales. En proposant un ensemble d’instruments épistémologiques et techniques concernant aussi bien l’histoire économique que l’histoire sociale, culturelle, politique ou encore démographique, elle n’a cessé de s’alimenter du dialogue fécond avec les sciences sociales en général, qu’il s’agisse de la sociologie, de l’anthropologie, de l’économie ou des sciences politiques.« 

Objectifs de l’atelier, déroulement, condition de candidature, etc. :

cliquez ici.

Se former aux logiciels de bases de données

Après un premier billet relatif aux logiciels de bibliographie, suite de la série de conseils pour se former aux outils numériques plébiscités lors de ma petite enquête : les bases de données.

Bases de données, kézako ?

Commençons par une définition générale, celle que l’on trouve à l’entrée base de données de Wikipedia par exemple :

« Une base de données (en anglais : database) est un outil permettant de stocker et de retrouver l’intégralité de données brutes ou d’informations en rapport avec un thème ou une activité ; celles-ci peuvent être de natures différentes et plus ou moins reliées entre elles. Dans la très grande majorité des cas, ces informations sont très structurées, et la base est localisée dans un même lieu et sur un même support. Ce dernier est généralement informatisé. » (source)

Indépendamment de toute question logicielle, constituer une base de données (bdd), c’est donc organiser, rationaliser la collecte, le stockage et la gestion de sa documentation. Quand vous utilisez Zotero par exemple, vous alimentez une base de données de références bibliographiques (en l’occurrence, ce qu’il y a derrière votre bibliothèque Zotero, c’est une bdd SQL), voire plus si vous l’utilisez pour organiser toute votre documentation.  Dans ce cas comme avec d’autres outils plus généralistes, la structuration des données a été pensée pour vous : vous entrez les informations que vous souhaitez stocker et organiser directement dans une interface munie de champs prédéfinis (dans zotero : le nom de l’auteur, le titre, une pièce jointe, une note…).

Vous l’aurez certainement compris, les bdd se trouvent derrière quasiment tous les outils que vous utilisez sur internet. Dès que vous remplissez un formulaire en ligne par exemple vous alimentez une bdd : elles « constituent donc le cœur de nos systèmes d’information » (source).

Un outil pour les historien-nes ?

Pourquoi utiliser une base de données spécifique pour le traitement de vos sources ? D’abord parce qu’en construisant votre bdd vous même, vous maîtriserez la structuration de vos informations, c’est à dire la façon dont elles seront organisées. Bien sûr, toutes les sources ne se prêtent pas forcément à une structuration de ce type. Dans la plupart des cas, l’intérêt que vous trouverez à transformer vos sources en données, c’est de pouvoir ensuite opérer des traitements d’ordre quantitatif. Ce qui ne veut pas dire que la pratique des bdd est une exclusive de l’histoire économique ou sociale, réputée plus quantitative. Voir par exemple le retour d’expérience en histoire politique que propose Pierre-Marie Delpu sur le carnet NHumérisme. En outre, il m’est arrivé de rencontrer des doctorants qui, sachant utiliser des logiciels de bdd, avaient décidé d’organiser toute la documentation de leur thèse comme d’autres, telle Franziska, l’auraient fait avec Zotero.

Voici ce que notent Jacques Cellier et Martine Cocaud dans le principal ouvrage de référence (dont je vous recommande vivement la lecture) :

« La démarche débute avec l’examen des documents qui vont permettre la recherche historique : nous les appellerons les sources. (…) Il est rare qu’un seul document suffise à une recherche, qui exige souvent de collecter tout un corpus, composé de documents de même type ou de types variés. La recherche de documents, suivie de leur dépouillement et de leur collecte, dévore une grande partie du temps de l’historien. L’objectif est d’obtenir des données qui seront soumises par la suite à sa sagacité et à son talent d’analyste. Elles résultent d’une curieuse cuisine qui prend les sources comme ingrédient et les laisse ensuite bien éloignées tant que par leur contenu que par leur forme du modèle d’origine. « Physiquement », les données devront se présenter sous forme de fichier, c’est à dire d’une collection d’informations portant un nom et pouvant être stockées sur la mémoire d’un système informatique (…).
Des représentations iconographiques peuvent être stockées sous forme d’images numérisées mais on peut aussi n’en conserver qu’une description établie selon des rubriques précises (nom du peintre, date, techniques, personnages, etc.) ; un discours peut aussi être analysé de la même manière : nom de l’orateur, thèmes évoqués, expressions utilisées, date, etc. Toutes les sources peuvent être décrites sous forme de séries d’informations composées de rubriques, mais ce découpage, qui facilite le traitement des données sérielles, ne se révèle pas intéressant dans tous les cas : les analyses textuelles, par exemple, relèvent d’autres méthodes. » (source, p. 13-14)

 Vous l’aurez compris, tout-e historien-ne n’aura pas besoin de construire une base de données… en revanche la démarche intellectuelle qui est à la base de sa construction est commune à tout chercheur mobilisant de la documentation. C’est, il me semble un point de départ fondamental lorsqu’il est question de formation.

Se former aux bdd (1) – La démarche avant les logiciels !

Je n’ai, en ce qui me concerne, pas eu à créer une base de données pour ma thèse. Peut-être que, si j’avais été initié aux principes qui président à leur construction un peu plus tôt, je me serais lancé, surtout par goût de la découverte des outils par moi même. Néanmoins, avec le recul, je suis persuadé que cela ne m’aurait pas forcément apporté grand chose pour ma thèse (en revanche, pour la gestion à plus long terme de l’ensemble de ma documentation, c’est autre chose!).

SumSchool2008J’ai néanmoins suivi une formation qui m’a permis de m’exercer à la démarche intellectuelle qui préside à la fabrication d’une bdd. Dans le cadre d’une école d’été en « méthodologie de la recherche en histoire sociale » organisée par Frédéric Vesentini en 2008 à l’UCL (d’autres ont eu lieu en 2010, 2013 et 2014), nous étions une bonne trentaine à avoir été initiés aux bdd ; à l’analyse des discours et aux statistiques textuelles ; ainsi qu’aux enjeux d’échantillonnage et de tests statistiques. Sur les 5 jours que comptait la formation, deux furent consacrés aux bdd et, c’est là que je voulais en venir… à aucun moment nous n’avons manipulé un logiciel !

En effet, l’initiation dispensée par Aurore François et Frédéric Vésentini était alors tournée vers le travail – à mon sens le plus complexe, mais aussi le plus intéressant et formateur  – la conception d’une bdd à partir d’une réflexion sur l’organisation de sa documentation : principes de théorie relationnelle, conception d’un schéma conceptuel, transformation du schéma conceptuel en structure de données…

Comme le soulignent Claire Lemercier et Claire Zalc, la saisie d’une source dans une bdd, ou dans un tableur (j’y reviendrai) doit être envisagée, comme « un moment de recherche » (p. 35). Cette opération suppose en effet une réflexion préalable et permanente sur le contenu de la source, son organisation originale, les informations que l’on souhaite en tirer, etc. Réflexion dont on se passe généralement lorsqu’il s’agit simplement de transcrire une source dans un traitement de texte, et a fortiori lorsque l’on se « contente » au départ de photographier les sources :

« Promouvoir la saisie de la source par le chercheur ne correspond pas au désir d’imposer un « rite de passage » pénible et ingrat, mais bien à la conviction que cette étape constitue un véritable moment de recherche. (…) Fastidieuse, [la saisie] permet aussi d’appréhender réellement les données et de commencer à réfléchir sur leur structure. (…) C’est souvent au cours de la saisie que l’on prend presque physiquement contact avec son sujet, mais aussi que naissent de nombreuses questions (…). La saisie, pour l’historien peut ainsi être comparée au terrain pour l’ethnographe ou le sociologue : elle engage physiquement, induit une connaissance intime de la source et suscité nombre de questionnements de recherche. » (source, p. 36)

Traiter données 1Bien entendu, cela ne veut pas dire que toute source, en toutes circonstances, se prêterait à une saisie systématique. Néanmoins, il me semble indispensable de toujours se poser la question…

Ce qui impose de connaître quelques règles de bonnes pratiques, telles les « dix commandements de la saisie » que proposent Claire Lemercier et Claire Zalc.

METHODESQUANTICOUVC’est la première étape d’une auto-formation selon moi : lire les chapitres « De la source aux données » :

– p. 34-47 dans Méthodes quantitatives pour l’historien

– et p. 16-57 dans Traiter des données historiques par Jacques Cellier et Martine Cocaud.

HainautJe vous recommande aussi la consultation du livre de Jean-Luc Hainaut : Bases de données. Concepts, utilisation et développement, l’auteur y prend en effet le temps de bien expliquer les enjeux méthodologiques et conceptuels qui président à la création et à l’utilisation d’une bdd. En outre, la conception de l’ouvrage est très intéressante : plusieurs parcours sont possibles parmi les chapitres selon que vous souhaitiez « simplement » bénéficier d’une introduction aux bdd, ou que vous cherchiez une formation complète. [Voir la page du livre sur le site de l’auteur – Lire la table des matières et l’introduction (PDF)]

 

Se former aux bdd (2) – Les enseignements présentiels

Nous avions vu qu’il existe de très nombreuses formations présentielles aux logiciels de bibliographies, ateliers de doctorants, formations des bibliothèques et des urfist, elles ne manquent pas. Pour les bdd, l’offre existe mais elle est sans conteste moins pléthorique.

Il faut bien sûr commencer par citer les formations du Pireh (Pôle Informatique de Recherche et d’Enseignement en Histoire) de l’université Paris 1 qui, depuis de nombreuses années, dispense de la Licence au Doctorat des enseignements pointus à divers outils, dont les bases de données (ici ou par exemple). Voir aussi, bien qu’il dépasse la seule question des bdd à proprement parler, le programme du séminaire organisé par Stéphane Lamassé et Léo Dumont : « Structuration et analyse de données pour historien (2014-2015)« 

J’ai cité celles de Frédéric Vésentini et Aurore François ont organisé à plusieurs reprises depuis 2008, les écoles d’été peuvent être une excellente occasion de se former correctement en un minimum de temps. Il faut les guetter dans vos établissement et vous abonner aux flux de Calenda (écoles d’été ; méthodes de traitement et de représentation ; approches de corpus, enquêtes, archives ; etc.)

Bien entendu, il y a aussi l’atelier de Claire Zalc et Claire Lemercier, qui dépasse ici encore la seule question des bdd, mais dont l’approche très concrète basée sur les travaux des participants ouvrent de nombreuses perspectives. Voir, pour information, le programme 2014-2015.

Si vous avez connaissances de formations spécifiques orientées histoires et sciences sociales, n’hésitez pas à les partager. Une solution alternative lorsqu’il n’existe pas de formation dans votre discipline, est d’aller voir du côté des formations plus pointues des informaticiens, ou d’autres disciplines. Cela implique néanmoins d’avoir été particulièrement sensibilisé aux enjeux propres à la recherche en sciences sociales (en lisant les références mentionnées plus haut notamment!)

Jetez par exemple un œil à l’offre très riche du CNAM sur les domaines « bases de données » et « bases de données relationnelles« .

S’auto-former : le tableur

Utiliser un tableur comme base de données ? J’entends d’ici les puristes pousser des cris d’orfraie… Il n’empêche que bien souvent, ce sera une solution largement suffisante. Comme toujours, j’insiste sur le fait qu’en matière d’informatique, il est indispensable de toujours tenter de mobiliser les outils correspondant au mieux à nos besoins, nous n’avons pas besoin d’une masse pour planter un clou… Comme le notent Claire Lemercier et Claire Zalc (vous voyez bien que la lecture de leur « repères » est indispensable…) :

« En pratique, le choix est souvent entre tableur et logiciel spécifique de base de données. (…) En fait, dans la plupart des cas, un tableur, plus souvent présent à la base sur l’ordinateur et d’un accès plus intuitif, suffit largement, d’autant que les données saisies sont plus facilement exportables par la suite, pour des traitements que l’on n’imagine que rarement à l’avance. Outre le gain de temps, la discipline imposée par le fait d’entrer les données directement dans un tableau, visualisé comme tel, peut d’ailleurs aider à poser certains choix de recherche » (source, encadré p. 37)

Pour apprendre les bases de l’utilisation d’un tableur, je vous rappelle en premier lieu mon tutoriel, « initiation à l’utilisation d’Excel 2010« . Le tutoriel a pris – esthétiquement – un petit coup de vieux (le premier qui dit qu’il était déjà moche à l’origine verra son adresse IP blacklistée!) mais les fonctionnalités restent valables et facilement transposables à LibreOffice Calc. L’essentiel ici est d’apprendre à utiliser les outils de tri, filtre, croisements de données. Voir par exemple :

Pour LibreOffice ou OpenOffice, vous trouverez des tutoriels facilement, voir, par exemple, ces « conseils pour réaliser une table de données » (PDF) ou encore ces exemples vidéos :


(il s’agit de la première vidéo d’une série de 12…)

Reste que le tableur trouvera vite ses limites pour certains usages, et là, les choses se compliquent un peu.

À la lecture de conseils divers et variés, il semble que la plupart des historiens rompus aux outils de ce type recommandent désormais le passage à MySQL. FileMaker reste souvent cité mais ne semble pas très pratique. Restent les logiciels des suites bureautiques les plus connues : Access pour MSOffice, et Base pour Libre/OpenOffice.

Petit tour d’horizon pour ces 4 possibilités.

S’auto-former : Access

Access est probablement le plus connu des logiciels de base de données, même pour les plus néophytes. Jetez un œil au rayon informatique chez Gibert par exemple, vous pourrez constater qu’il existe pléthore de manuels, plus ou moins accessibles, pour apprendre à l’utiliser.

Traiter données 1Dans le premier volume qu’ils ont consacré au traitement des données historiques, Martine Cocaud et Jacques Cellier avaient fait le choix de ce logiciel. Je vous recommande vivement leur livre (et je vous remet la couverture pour la peine) car, si le logiciel à beaucoup évolué depuis, leurs démonstrations reposent systématiquement sur des exemples historiques concrets.

Vous pourrez, en outre, vous reporter à la page annexe à l’ouvrage, TDH1, sur le site de Jacques Cellier.

Pour vous familiariser avec le fonctionnement des versions les plus récentes du logiciel, vous trouverez bien votre bonheur dans un des très nombreux guides publiés, et plusieurs tutoriels vidéos existent. Voir, par exemple, la série de 4 vidéos mises en ligne en juin 2014 par Lydia Provin :

La limite principale des tutoriels en ligne concerne le domaine d’application très souvent éloigné des sciences sociales… C’est la raison pour laquelle il me semble que la lecture de traiter des données historiques reste indispensable à celles et ceux qui souhaiteraient se lancer dans l’apprentissage d’Access.

Dans le second volume qu’ils ont consacré au traitement des données en histoire et sciences sociales, les deux auteurs ont néanmoins adopté MySQL…

S’auto-former : Base

Le concurrent libre de la suite office dispose aussi de son propre logiciel de base de données. Vous trouverez sur le wiki du Pireh un tutoriel fondé sur un exemple historique, une base de données des représentants élus à l’Assemblée nationale constituante en avril 1848 :

WikiPireh-Oo_Base

Vous trouverez aussi – c’est l’un des avantages non négligeables du libre – une communauté active d’utilisateurs et de nombreux conseils. Par exemple, sur le site officiel, vous trouverez la traduction française des guides d’utilisation de Calc (le tableur) :

GuidesCalc

 

Pour Base en revanche, il faudra pour le moment vous contenter des versions en anglais qui n’ont pas encore été traduite (témoignage, peut-être, de la moindre utilisation du logiciel). Il existe un manuel complet (traduit de l’allemand vers l’anglais) et une série de guides. L’ensemble se trouve ici :

LO_GuideBaseEn

 

 

 

S’auto-former : FileMaker

Dans les résultats de mon enquête auprès des historiens, si de nombreuses réponses ne mentionnaient que « bases de données » dans une perspective générale, un logiciel a été cité à plusieurs reprises : FileMaker.

Cela a suscité quelques suprises sur Twitter lorsque je m’en suis fait l’écho. Comme le notent CL et CZ :

« Beaucoup d’historiens utilisent FileMaker. Il semble s’agit en bonne partie d’une tradition quelque peu irrationnelle, due à la fois à l’usage d’ordinateurs Macintosh et à la forte personnalité de quelques utilisateurs. Il est vrai que le système de prosopographie mis en place par Jean-Pierre Dedieu à l’intérieur de ce logiciel (voir par exemple ici) est tout à fait intelligent et adapté aux données historiques. Il reste que les fichiers construits sous FileMaker s’avèrent particulièrement difficiles à exporter ailleurs… Il faut donc bien réfléchir avant de faire ce choix » (source)

Je me contenterai ici d’indiquer à celles et ceux qui souhaitent l’utiliser que le site officiel de FileMaker propose de nombreux « webinaires » des tutoriels les plus basiques aux fonctions les plus avancées (voir le site des séminaires Web FileMaker). Par exemple, ce tour d’horizon « découvrir FileMaker en 20 minutes » :

S’auto-former : MySQL

Je le notais plus haut, MySQL est le choix que Jacques Cellier et Martine Cocaud ont fait pour le deuxième volume sur le traitement des données historiques :

couvtdh2Ils expliquent en effet que :

« Compte tenu de l’offre en la matière, il nous paraît pertinent de proposer MySQL comme alternative à [Access]. Parmi les raisons qui plaident en faveur de ce dernier, on peut invoquer la gratuité, son caractère multi-utilisateur, l’existence d’une interface puissnte et conviviale PhpMyAdmin qui rend aisées les tâches d’administration et offre de nombreuses possibilités d’échanges avec d’autres logiciels (comme Excel ou Access…). Mais le plus important est le fait que pratiquement tous les hébergeurs de site Web proposent le couple MySQL/PhpAdmin. Ce qui ouvre l’opportunité de mettre la base en ligne, tout en ayant un contrôle fin sur les accès : depuis la simple consultation, jusqu’à l’administration, en passant par l’insertion de données. La porte est ainsi ouverte sur un véritable travail collectif réunissant plusieurs contributeurs géographiquement épars autour du développement d’une base de données. » (source, p. 17)

Si avec ça vous n’êtes pas convaincus !? J’ajouterai que vous disposez pour vous aider du volume dont est tiré cette citation, qu’il est – comme son prédécesseur, accompagné d’une annexe en ligne très fournie, et d’un « kit » complet pour s’initier et se perfectionner dans l’art subtil de l’interrogation SQL.

Notez aussi que la seconde partie l’ouvrage cité plus haut de Jean-Luc Hainaut, est intégralement consacrée au langage SQL.

[édit. du 15 mai 2015] La plateforme de MOOC OpenClassrooms propose une formation complète à l’administration de bases de données avec MySQL. L’accès au cours est totalement gratuit et la version payante vous permet de télécharger le cours, voire d’obtenir un certificat de réussite en cas de besoin.

*

*    *

Comme pour le billet précédent, si vous repérez des approximations ou des erreurs, ou si vous souhaitez partager vos expériences, recommander des formations, etc. n’hésitez surtout pas à utiliser les commentaires !

Je souhaite, pour conclure ce billet, insister sur la nécessité de beaucoup réfléchir à vos besoins avant de vous lancer dans l’apprentissage d’un logiciel de bdd, qu’il ait ou non été cité ici. Si l’apprentissage des règles de bonnes pratiques en termes de conception, de structuration des données à travers la saisie des sources est quelque chose de très formateur, quel que soit l’usage que vous ferez du résultat, l’apprentissage de l’utilisation d’un logiciel de ce type, surtout en autoformation, peu d’avérer lourde et… décourageante si finalement ses possibilité dépassent de très loin vos besoins.

Si pour les logiciels de bibliographies je vous incitais à vous lancer quoiqu’il arrive en toute confiance dans l’autoformation, en ce qui concerne les bases de données je ne peux que vous encourager à d’abord demander conseil à des chercheurs qui pratiquent ces outils – et encore mieux, à ceux qui forment des apprentis historiens à leur usage – et qui seront le plus à même de vous aider à définir vos besoins, et à choisir l’outil le plus adapté.

______________

Crédit image bandeau : « original database » par shinichi / 真一 … just call me Shin! en cc sur Flickr

Se former aux logiciels de bibliographie

L’analyse des résultats de l’enquête relative aux usages et besoins de formation « au numérique » des historiennes et historiens – voir le billet – a fait ressortir plusieurs séries d’outils considérés par les répondants comme des priorités. Comme je l’avais noté 3 sortent particulièrement du lot :

  1. les logiciels de bibliographie
  2. les logiciels de bases de données
  3. les logiciels de cartographie et SIG

L’objectif de ce billet et de ceux qui suivront est de donner quelques pistes à celles et ceux qui souhaiteraient partir à la découverte de ces outils. En effet, il existe aujourd’hui de très nombreuses ressources qui permettent d’envisager une autoformation à certains outils – même si en pratique, les enseignements présentiels et le conseil personnalisé restent les plus efficaces. Continuer la lecture de Se former aux logiciels de bibliographie

Les historien-nes et le numérique : usages et besoins de formation

Vous l’attendiez impatiemment, voici venu le temps de vous communiquer mon analyse des résultats de ma petite enquête sur les pratiques numériques et les besoins de formation des historien-nes.

Pourquoi cette petite enquête ?

Il y a maintenant quatre ans presque jour pour jour, j’avais été invité à parler « transformations numériques du métier d’historien » à une table ronde de la Société d’histoire moderne et contemporaine (voir mon support de présentation). L’un des premiers constats que j’avais fait pour préparer cet exposé, que nous avions repris ensuite avec Franziska dans notre article  pour la RHMC (lire l’article : fr. / en.), était que s’il était désormais convenu de parler de « transformations des pratiques » voire de « révolution épistémologique », en réalité nous ne disposions d’aucune forme d’objectivation de l’appropriation des outils numériques par les historiens. C’est ce qui nous conduit, la plupart du temps, tous autant que nous sommes, à fonder nos analyses sur des « retours d’expériences » de recherches, d’enseignements, de publications, etc. sans jamais pouvoir vraiment savoir à quel point il nous est possible de les généraliser à la profession dans son ensemble.

J’avais donc saisi l’occasion de cette intervention pour mener une petite enquête auprès des étudiants en Master de l’EHESS concernant leurs pratiques et afin d’améliorer notre connaissance de leurs besoins en termes de formation. Nous avions publié les résultats de cette petite enquête dans notre article de 2011, puis j’avais réitéré l’expérience en vue d’une tentative (ratée…) de pérennisation des formations aux outils numériques à l’EHESS (voir le rapport d’activités que j’avais rédigé sur cette base avec, notamment, une reprise de l’ensemble des réponses des étudiants à la seconde enquête).

Le temps a un peu passé et Franziska et moi avons été invités par Aurore Dumont et Pablo Aviles Flores à participer à une journée d’études en décembre 2014 à propos du « numérique, un défi pour l’historiographie? » Leur invitation consista en une proposition de mise à jour des conclusions de notre article de 2011 sur la base des évolutions que nous avions pu observer depuis… C’est ainsi que, dans un moment d’égarement, je me suis lancé dans une extension de la petite enquête concernant les étudiants en Master à un public plus large. S’agissant d’un questionnaire en ligne destiné à être ensuite analysé de façon individuelle, en parallèle d’un agenda professionnel déjà bien rempli, j’ai pris sur moi de restreindre les enquêtés aux seuls historiens en formation et jeunes-quoique-chercheurs (master/doctorat/postodctorants) ainsi qu’à celles et ceux qui les encadrent et dirigent leurs recherches (maîtres de conférences, professeurs des universités, chargés et directeurs de recherches), auxquels j’ai ajouté les chercheurs enseignants dans le secondaire.

Bien entendu, j’aurais pu étendre une telle étude à une conception plus large du métier d’historien, en incluant les ingénieurs, les bibliothécaires, etc. mais j’y ai renoncé pour me faciliter l’analyse des résultats. De même il aurait fallu aller beaucoup plus loin et être plus précis dans certaines questions. Gageons que ce billet incitera des collectifs – et peut-être même institutionnels – à mettre sur pied une telle enquête qui permettrait de vraiment saisir « ce que le numérique fait aux historiennes et historiens » (pour reprendre le titre d’un entretien que je vous (ré-)incite vivement à lire).

Diffusion du questionnaire et profils des répondants

J’ai donc diffusé un questionnaire – accessible ici – fabriqué un peu vite – parce que je croyais naïvement arriver à avoir beaucoup de réponse en moins d’une semaine…. – à travers plusieurs réseaux :

  • certains des blogs que j’anime ou co-anime (ici et là bas notamment)
  • des listes de diffusion, celle des DH ainsi que celle de l’AFHE.
  • des e-mail « individuels » à des jeunes chercheurs et à des enseignants-chercheurs que je connais
  • des tweets et autres posts sur facebook

Par ailleurs, je sais que le lien a ensuite été diffusé par d’autres chercheurs sur d’autres listes de diffusion (que je vous invite au passage à découvrir : AHMUF, SFHU, SFHOM, Theuth…) à leurs étudiants, leurs laboratoires, via leurs comptes sur les réseaux sociaux, etc.

J’avais inclus une question ouverte – facultative –  « comment êtes-vous arrivé sur ce questionnaire ? » je remercie donc vivement celles et ceux qui sont cités par certains répondants comme leur « source » : Nicolas Barreyre, Natacha Coquery ; Joh Peccadille ; Béatrice Touchelay ; « l’informaticien » de la MSH de Nantes – les guillemets ne sont pas de moi – les community managers des bibliothèques universitaires qui ont diffusé l’information sur leurs réseaux (la BULSH d’Aix notamment) ; Infoclio.ch… Et bien sûr merci à toutes celles et ceux qui ont contribué à la diffusion du questionnaire d’une façon ou d’une autre !

Le lien court fourni par le service goo.gl permet de se faire une idée de l’origine des 1225 personnes qui ont cliqué sur le lien (cela ne présume pas des partages du lien original, pour lequel je n’ai pas de statistiques…) :

Clics sur le lien court "goo.gl" (cliquez pour agrandir)
Clics sur le lien court « goo.gl » (cliquez pour agrandir)

Un peu moins de la moitié de celles et ceux qui ont cliqué sur le lien l’ont fait depuis Twitter & Facebook (usagers des médias sociaux donc). En y ajoutant celles et ceux qui sont passés par Devenir historien-ne ou La boîte à outils des historiens (lecteurs de blogs donc) on arrive à plus de 60% – et sans compter celles et ceux qui y sont arrivés via la liste « digital humanities » : ce questionnaire a sans conteste d’abord touché des personnes déjà intéressés, d’une façon ou d’une autre, par les questions numériques.

Sur les 280 répondants qui ont indiqué leur source, 89 sont arrivés via twitter, 48 via facebook, 11 via la liste DH : soit au total 41,6% de l’ensemble des réponses au questionnaire.

Sur les 1225 clics sur le lien court, j’ai en effet obtenu 353 réponses. En à peine un mois cela me semble pas mal… Voici le profil de ces répondants :

Profils des répondants (cliquez pour agrandir)
Profils des répondants (cliquez pour agrandir)

De l’usage de quelques outils numériques

Dans un billet sur la question des pratiques numériques dans l’enseignement scolaire, Bruno Devauchelle dressait un constat qui me semble tout à fait convenir à l’analyse que l’on fait généralement des « transformations numériques du métier d’historien-ne » :

« Ce qui crée un trouble dans l’analyse du développement du numérique en éducation c’est que l’on survalorise les expérimentations/innovations par rapport aux pratiques ordinaires. La médiatisation des faits tend à encourager cette survalorisation : on parle des évènements rares et pas de ceux qui sont fréquents et ordinaires » (source)

N’allons pas jusqu’à parler de « médiatisation » pour les humanités numériques, mais reconnaissons que les grandes envolées lyriques sur la mutation-radicalement-profonde-et-irréversiblement-révolutionnaire-d’un-point-de-vue-épistémologique ne sont pas si rares que cela et que, d’un point de vue institutionnel, il est parfois plus facile d’organiser un colloque international ultra pointu avec quelques stars internationales du domaine que de mettre en place une formation pérenne à quelques outils fondamentaux.

Ainsi, il me semble que, pour saisir les transformations les plus profondes de nos pratiques, c’est par mesurer l’acclimatation des historien-nes à quelques outils « ordinaires » principalement apparus à « l’ère numérique » qu’il faut commencer.

Bien entendu, une enquête de plus grande ampleur permettrait d’aller plus loin, en visant des outils spécialisés de traitement de diverses données – de l’analyse statistique à la fouille de texte et aux visualisations de réseaux… -, mais ici j’ai entrepris d’interroger les historien-nes sur des pratiques qui aujourd’hui semblent aller de soi à beaucoup d’observateurs :

Les usages de quelques "outils numériques" (cliquez pour agrandir)
Les usages de quelques « outils numériques » (cliquez pour agrandir)

Et finalement, cela ne va pas tant de soi… Certes, l’usage de l’appareil photo numérique c’est sans conteste généralisé. De même, la consultation de bases de données bibliographiques (c’est à dire de portail d’accès à des ressources bibliographiques telles que Cairn, Revues.org, Jstor, etc.) font désormais bien partie du paysage.

Le fait qu’une très très faible majorité des répondant utilisent un logiciel de bibliographie me semble encore plus marquant. Lors de mes premières enquêtes auprès des étudiants de l’EHESS nous avions ce type de réponses. Or, à cette époque pas si lointaine, les formations à un outil tel que Zotero n’étaient vraiment pas aussi répandues qu’aujourd’hui. Franziska et moi étions ainsi parfois sollicités par des écoles doctorales qui ne trouvaient pas d’intervenants interne pour l’enseigner aux doctorants. Aujourd’hui, il n’y a quasiment pas une bibliothèque universitaire qui ne propose de formation à un logiciel de bibliographie, qu’il s’agisse de Zotero ou de l’un de ses concurrents. (En outre, j’ajoute que vous pouvez vous auto-former ici avec nos tutoriels bien sûr… et même en vidéo!)

La proportion des utilisateurs ne semble pas pour autant avoir beaucoup évolué…

Si l’usage des bases de sources en ligne est plus modéré que celui des ressources bibliographiques, ce n’est pas vraiment une surprise : les logiques de numérisations sont complexes et ne répondent pas forcément aux besoins de toutes les spécialités. On a beau être « à l’heure du big data« , pour faire un travail de démographie historique à l’échelle départementale, il vous faudra saisir vous même « à la main » les données départementales du recensement de la population pour 1946 et 1954 par exemple (enfin, plus maintenant… je mettrai bientôt mes saisies en ligne).

Peut-être plus étonnant : la moitié des répondants ne consulte quasiment jamais de blogs scientifiques. Que l’écriture dans des blogs ne soit pas répandue, ce n’est pas une surprise, et le fait est que la pratique de développe de plus en plus. Lors des formations aux outils informatiques que nous avions organisé à l’EHESS, que les intervenants soient politistes (avec François Briatte et Joël Gombin en 2009) ou historiens (avec Martine Sonnet – ici et Frédéric Clavert et Benoît Kermoal en 2011), le constat du faible investissement des historien-nes (en France) s’imposait toujours. Dès lors, que presque un quart des répondants publie régulièrement ou souvent dans un ou plusieurs blogs est à ce titre très encourageant quant à la « normalisation » de cette pratique. En outre, force est de constater que, depuis les pionniers de l’usage du blog en histoire (de Blitztoire né en 2004, aujourd’hui Médiévizmes aux Actualités de la recherche en histoire visuelle né en 2005, aujourd’hui L’image sociale) – la pratique s’est considérablement répandue. Pour ne prendre qu’un exemple, la plateforme Hypotheses.org compte à ce jour pas moins de 375 carnets de recherche classés dans la catégorie « Histoire et archéologie« . Et il ne s’agit que des carnets inscrits au catalogue ! [Pour une analyse des pratiques de blogging en histoire, je vous invite à jeter un œil à cette présentation]

Cela nous ramène à la faiblesse de leur lecture : je pense qu’ici on se trouve face à une réticence vis à vis des blogs qui repose sur une certaine méfiance relative à la qualité des productions scientifiques qui y sont proposées. Il n’est ainsi pas rare d’entendre ou de lire qu’il ne faut pas citer un billet de blog dans un travail universitaire. Pourtant, n’est-ce pas justement la base de notre « métier » que d’évaluer la pertinence d’un écrit à l’aune de son contenu plutôt que de son support de publication ?

Quels besoins de formations aux outils informatiques ?

C’est là aussi, comme souvent, une question de formation. En outre, c’est à mon sens le principal enseignement de cette enquête : les historiennes et historiens de tous niveaux estiment globalement avoir d’importants besoins de formation.

Besoins de formations (cliquez pour agrandir)
Besoins de formations (cliquez pour agrandir)

 

Besoins de formations
Besoins de formations – détail (cliquez pour agrandir)

 

Seule exception lisible tant dans le tableau que dans le graph. animé qui précèdent : une courte majorité des postdoctorants et autres chercheurs contractuels répond avoir des besoins « moyens » à « importants ». Cela s’explique peut-être en partie (mais ce n’est qu’une hypothèse) parce qu’aujourd’hui, beaucoup de spécialistes des questions numériques sont justement recrutés sur des postes de contractuels dans les laboratoires…

Ces importants besoins de formation méritent toutefois d’être lus à l’aune du type d’outils pour lesquels les répondants souhaiteraient être formés ou s’auto-former en priorité.

Passons rapidement sur celui ou celle qui brûle d’apprendre à utiliser « une serpette » et sur ce ou cette autre qui semble douter de la pertinence de la question (« je ne me forme pas, je forme ») – je les remercie ici vivement, ces réponses m’ont servi de récréation pendant le codage des réponses à cette question ouverte…

En effet ici le résultat que je présente est basé sur un codage des réponses qui se sont logiquement avérées très diverses, tant dans les outils cités que dans les formulations concernant une même pratique…

Echantillon des réponses avant codage (cliquez pour agrandir)
Échantillon des réponses avant codage (cliquez pour agrandir)

Les 353 répondants ont donné au total 510 réponses, y compris « rien/aucun » ou « tout/les outils numériques en général ». J’ai reclassé l’ensemble en 17 catégories :

  • Analyse statistique
  • Analyse textuelle/Lexicométrie/Textométrie
  • Analyse/Visualisation de réseaux
  • Annotation/Collaboration
  • Bases de données
  • Bibliographie
  • Cartographie/SIG
  • Gestion documentaire
  • Programmation/Langages informatiques
  • Recherches/Veille documentaires
  • Traitement de texte/Composition de document/PAO
  • Traitements audiovisuels
  • Valorisation / Médiation / Diffusion
  • Visualisation
  • Autres (9 outils cités une seule fois et n’entrant dans aucune catégorie : outre la serpette…: le TBI (que j’interprète comme « tableau blanc interactif » ; l’OCR ; le FTP (que j’interprète comme « file transfer protocol ») ; outils d’analyse qualitative ; « toute technologie cloud » ; Web sémantique ; Web service ; Bureautique ; et 3 « je ne sais pas »)
  • Aucun
  • Tout

Le codage n’est certainement pas parfait, mais il donne une bonne première vision des réponses et je mettrai sûrement dès que possible à disposition le fichier .xls de toutes les réponses obtenues au questionnaire pour celles et ceux qui souhaiteraient jouer avec les données et aller plus loin que moi dans leur analyse…

Les 5 outils les plus cités (cliquez pour agrandir)
Les 5 outils les plus cités (cliquez pour agrandir)

Le graphique animé qui précède (s’il vous donne mal au cœur, voir le tableau statique infra) reprend, pour l’ensemble des répondants ainsi que pour chaque profil, les 5 regroupements qui arrivent en tête des réponses à la question « à quel outil souhaiteriez-vous vous former ou être formés en priorité ? » avec la précision suivante :

Outil informatique/numérique au sens le plus large où vous l’entendrez | Vous pouvez répondre « aucun »

A posteriori, indiquer la possibilité de répondre « aucun » n’était peut-être pas pertinent…  En effet, cette réponse figure parmi les 5 premières de tous les profils de répondants. Elle est même en seconde position pour l’ensemble.

Cela entre en contradiction avec celui des « besoins de formation »  : seulement 7 répondants on indiqué que leurs besoins de formation étaient inexistants (0 sur l’échelle). Si l’on étant à celles et ceux qui ont coché 1, on arrive à 42 répondants : on est loin des 72 personnes ayant inscrit « aucun » (ou « rien », etc.) ici. Dès lors, il n’est pas déraisonnable de penser que cela signifie plus « aucune idée en particulier » que « je ne veux pas me former ou être formé à quelque outil que ce soit ». Ce n’est bien sûr qu’une hypothèse… et encore une piste pour l’amélioration de l’enquête si jamais elle devait être menée à plus grande échelle.

Si l’on admettais cette hypothèse, cela confirmerait une certitude que j’ai acquise au fil des années d’enseignements de méthodologie de la recherche et d’usage des outils numérique : notre rôle n’est pas seulement de former les étudiants à des outils spécifique mais bien de leur faire entrevoir le champ des possibles qui s’offrent à eux. C’était la méthode que nous avions adopté avec Franziska dans le cadre de nos formations aux outils informatiques mais aussi en méthodologie « générale » de la recherche, en insistant sur l’importance du « repères » de Claire Lemercier et Claire Zalc comme lecture indispensable et, surtout, en organisant des conférences de chercheurs au terme de chaque journée de formation.

Pour le dire vite : former en « tronc commun » à la TEI, aux SIG ou à l’analyse de réseaux des étudiants en M1 qui cherchent encore un sujet de mémoire n’a pas de sens. Il est toutefois tout à fait indispensable qu’ils sachent que cela existe et qu’ils aient vu ce que cela peut donner comme résultats dans le cadre d’une recherche concrète.

Le fait est que, pour revenir aux réponses à la question « quels outils voudriez-vous apprendre en priorité ? » ce sont des outils assez généralistes qui sont mentionnés aux premières places.

Quels que soient les profils, les logiciels de bibliographie (type zotero ou endnote par exemple) sont classés dans les 3 réponses les plus récurrentes. En fait ils se classent premiers pour tous les profils à l’exception des doctorants qui les placent troisièmes.

Viennent ensuite les logiciels de bases de données, mentionnés par tous à l’exception des postdocs et contractuels. De fait, si l’on regroupe les logiciels de bibliographie, les logiciels de bases de données et les outils de « veille et recherche » ainsi que de « gestion documentaires », on arrive à minimum 30% (postdocs et contract.) et maximum 45% (masters et chercheurs ens. du secondaire) d’outils cités concernant la recherche, l’organisation et la gestion de la documentation. Il existe de réels besoins de formation à des outils souvent considérés comme « basiques » et qui en tous les cas, se trouvent depuis toujours au cœur des pratiques de recherche en histoire.

La troisième série d’outils les plus cités concerne la cartographie et les SIG (pour système d’information géographique). Certains citent explicitement un logiciel (type QGis par exemple), d’autres indiquent juste : « un logiciel de représentations cartographiques ». Ici encore la question de la formation est fondamentale : savoir représenter une carte est fondamental – et pas uniquement du fait de ce lien particulier et spécifique à la France entre histoire et géographie… – mais pour dessiner une carte de toponyme ou la répartition d’un taux de mortalité par exemple, il n’est pas nécessaire d’apprendre à utiliser un SIG, un logiciel de cartographie suffira amplement (voir par exemple, mon mini-tutoriel sur philcarto). Il faut toutefois savoir que des outils avancés existent et permettent d’aller plus loin (voir, par exemple, ce que Baptiste Coulmont ou Joël Gombin arrivent à faire avec R – voir aussi le carnet « Element-R« ).

Le tableau suivant détail le « score » de chaque groupe d’outils :

Détails des besoins de formations par profils (cliquez pour agrandir)
Détails des besoins de formations par profils (cliquez pour agrandir)

Le graph. animé comme le tableau précédent permettent d’observer que les outils les plus spécialisés commencent à véritablement faire leur apparition dans les 5 outils les plus cités pour les profils les plus avancés dans la recherche. La programmation et l’apprentissage de langages informatiques spécifiques n’apparaissent ainsi dans les 5 premiers outils cités que chez les profs d’universités et directeurs/directrices de recherche.

Comme je l’ai dit ou écrit ailleurs à plusieurs reprises (voir ici par exemple), je ne pense pas que faire de tous les historiens des programmeurs soit la priorité des priorités. Cela ne semble pas non plus être celle des répondants à ce questionnaire.

Bien sûr, savoir ce qu’est une ligne de code, savoir comment fonctionnent les outils que l’on mobilise est indispensable. Tout comme il nous faut connaître l’origine et les modes de fabrication des sources que l’on mobilise pour pouvoir les lire correctement. Cela implique une certaine initiation / découverte des principes de base, mais pas un apprentissage avancé dès le début de la formation à la recherche.

Ce parti pris se veut aussi un antidote aux positions extrêmes vis à vis du numérique. La nouveauté et le caractère ludique ou spectaculaire de certains outils conduisent en effet parfois à un engouement – sans parler des rejets parfois encore plus puissants – qui comporte certains risques, qui ne sont pas sans rappeler les écueils que « l’histoire quantitative » a pu connaître dans les années 1980-1990. Voir par exemple l’usage qui est fait du google ngram viewer en dépit de toutes les précautions d’usage que nous étions plusieurs à formuler dès son lancement… voir ici mais aussi là et, plus récemment, par exemple). Voir aussi l’exaltation autour des « big data« . Sur ce point, en suivant une initiation à IRaMuTeQ (pour Interface de R pour les Analyses Multidimensionnelles de Textes et de Questionnaires), j’avais noté cette remarque du formateur (Andrew Maho) à propos de la taille des échantillons :

« Pour savoir si un vin est bon, un verre suffit, vous n’avez pas besoin de boire toute la bouteille« 

Ne jamais oublier les fondamentaux, de la sélection des documents à la critique des sources, au croisement des documentations permettant de faire avec les absences et les lacunes, c’est là, il me semble, un élément fondamental à intégrer à toute formation aux outils numériques. En ce sens, je n’en démords pas, l’enseignement des outils informatiques doit toujours être lié ou intégré à l’enseignement de l’historiographie et de la méthodologie de la recherche en histoire.

J’achèverai ce billet sur un dernier commentaire des résultats : on voit apparaître un groupe d’outils de valorisation, médiation et diffusion de la recherche parmi les outils prioritaires cités par les postdocs et contractuels, les maîtres de conf. et chargés de recherches ainsi que par les profs. des universités et dir. de recherche. Ces outils vont de « la création de sites internets » à la mise en place d’une « exposition virtuelle » – omeka est cité à trois reprises par exemple – en passant par le « blogging scientifique ».

Les nouveaux mode de diffusion de la recherche – tant vers les pairs que vers un public plus large dans une perspective d’éducation populaire – sont désormais nombreux, mais leur faible prise en main par « la communauté historienne » semble ici encore liée à des questions de formation. Dans le détail, il est ainsi parfois mentionné le besoin d’une formation aux dimensions juridiques de la diffusion de travaux via des archives ouvertes ou de la mise en ligne de sources. Le faible investissement des chercheurs dans le blogging ou dans la diffusion de leurs travaux en libre accès doit ainsi être mise en relation avec  l’affirmation de ces besoins de formation (voir aussi ce billet).

Concluons provisoirement…

Que nous dit finalement cette petite enquête ? Si la « révolution numérique » n’en peut plus de finir, c’est qu’elle s’apparente plus à une « révolution permanente » à laquelle il convient de nous adapter continuellement. Et le phénomène n’a pas commencé avec le tournant du web 2.0 au début des années 2000, mais plutôt dès la « révolution informatique » des années 1970-1980.

Le « numérique » n’est pas une nouvelle spécialité que seulement quelques geeks passionnés doivent investir et développer de façon très pointue. C’est plutôt le contexte dans lequel nous évoluons tous, que nous soyons chercheurs ou non. Dès lors, ce qu’il faut mettre en place ce sont des enseignements pérennes, évolutifs et ne plus nous contenter uniquement de formations ponctuelles.

En témoigne l’importance des besoins de formation à tous les niveaux d’expérience de la recherche et de l’enseignement en histoire. Besoins qui s’expriment particulièrement à propos de pratiques numériques ordinaires, parfois présentées comme « basiques », pré-requis des générations « nativement numériques« , la prochaine étape étant de tous devenir programmeurs…

Cela me ramène, encore et toujours, à notre proposition de « socle commun« , disons peut être plutôt de culture numérique commune, des outils qu’il me semble nécessaire de maîtriser dès le terme d’une Licence et d’un Master :

CultureNumCommune

Élaboré pour les étudiants en master de l’EHESS, ce schéma des outils indispensable à tout apprenti chercheur correspond à peu de choses près aux priorités communes à tous les profils de répondants au questionnaire – seuls manquait l’initiation aux outils de cartographie… (ajouté dans cette mise à jour du schéma, pour sa présentation initiale voir ici).

Chaque regroupement me semble ainsi offrir les bases essentielles à des approfondissement spécialisés par la suite, que ce soit vers des logiciels de base de données plus puissants, vers des logiciels d’analyse statistique, des SIG, ou l’analyse de réseaux…

Peut-être de quoi faire en sorte d’arrêter de parler de « tournant » ou de « révolution » numérique pour faire de tous ces outils des instruments parmi d’autres dans la boite à outils des historiens ?

__________

Crédit image de une : Vintage Computer Festival 10.0 by Julia Wolf (via Flickr – creative commons)

Écriture connectée : le retour d’expérience de @peccadille

L’une des questions centrales qui se posent à toutes celles et ceux d’entre nous qui nous intéressons au « numérique » concerne les transformations pratiques, dans le quotidien des chercheurs, occasionnées par le développement des outils informatiques et des ressources numériques utiles à la recherche.

En effet, s’il est courant de parler de « révolution numérique », c’est souvent sous la forme de grandes déclarations tonitruantes (qui ne sont pas sans rappeler celle d’Emmanuel Le Roy Ladurie concernant les historiens programmeurs en 1967… on sait aujourd’hui ce qu’il en est advenu) ou de « success story » de projet informatiques lourds ou d’investissements considérables de chercheurs dans l’apprentissage et l’utilisation d’outils – dont je ne dément absolument pas l’utilité et le caractère parfois révolutionnaire bien sûr – mais dont la majorité des historiennes et historiens n’auront probablement pas besoin au cours de leur carrière… En tous cas ils et elles en sont persuadés et cela limite généralement les discussions autour du « numérique » à celles et ceux que cela intéresse a priori.

Dans ces conditions, il est difficile d’appréhender les transformations pratiques les plus diffuses du métier d’historien-ne autrement que par des retours d’expériences (voir ici et ), ou des petites enquêtes individuelles – telle que celle que j’ai lancée il y quelques jours (et à laquelle vous pouvez continuer de répondre!).

Johanna Daniel, que vous connaissez probablement sur Twitter sous le nom de Joh Peccadille, n’est pas seulement l’auteur de l’excellent blog Orion en aéroplane. Elle tient aussi depuis quelques mois un carnet de recherche : Isidore et Ganesh.

Dans un billet tout juste publié : « Écriture 2.0/connectée : retour sur la rédaction d’un mémoire« ,  elle vient d’apporter une nouvelle pierre à l’édifice qui nous permet de mieux comprendre ce que veut dire faire de la recherche à « l’ère numérique ». Auteure d’un mémoire qui, déjà, visait à étudier, comme son titre l’indique, « Les outils d’annotation et l’édition de corpus textuels pour la recherche en SHS« , elle revient ici en détail sur ses propres pratiques d’ « écriture connectée » et se pose quelques questions du type :

  • à quoi lui a servi Twitter ?
  • en quoi participer à un blog collectif « privé » puis tenir son propre carnet de recherche lui a-t-il été utile ?
  • quelles circulations entre « écriture papier » et « écriture numérique » ?
  • quels outils d’écriture / relecture collaborative a-t-elle mobilisé ? avec quels résultats ?

Vous l’aurez compris, je vous recommande vivement la lecture de ce billet très éclairant et stimulant. Il constitue un excellent témoignage des transformations du métier de chercheur, et une invitation à nous intéresser de plus près à ces mutations concrètes qui sont en mesure d’affecter toutes les pratiques historiennes, et non seulement celles des seuls « digital humanists« .

*

*     *

Si le billet de @peccadille vous inspire et que vous souhaitez revenir de la même façons sur vos pratiques (avec photos de vos espaces de travail notamment – cela apporte beaucoup au billet) , n’hésitez pas à nous contacter, une publication sur La boîte à outils des historiens est tout à fait envisageable 😉