Archives de catégorie : Organiser ses données / Gérer sa documentation

Se former aux logiciels de bases de données

Après un premier billet relatif aux logiciels de bibliographie, suite de la série de conseils pour se former aux outils numériques plébiscités lors de ma petite enquête : les bases de données.

Bases de données, kézako ?

Commençons par une définition générale, celle que l’on trouve à l’entrée base de données de Wikipedia par exemple :

« Une base de données (en anglais : database) est un outil permettant de stocker et de retrouver l’intégralité de données brutes ou d’informations en rapport avec un thème ou une activité ; celles-ci peuvent être de natures différentes et plus ou moins reliées entre elles. Dans la très grande majorité des cas, ces informations sont très structurées, et la base est localisée dans un même lieu et sur un même support. Ce dernier est généralement informatisé. » (source)

Indépendamment de toute question logicielle, constituer une base de données (bdd), c’est donc organiser, rationaliser la collecte, le stockage et la gestion de sa documentation. Quand vous utilisez Zotero par exemple, vous alimentez une base de données de références bibliographiques (en l’occurrence, ce qu’il y a derrière votre bibliothèque Zotero, c’est une bdd SQL), voire plus si vous l’utilisez pour organiser toute votre documentation.  Dans ce cas comme avec d’autres outils plus généralistes, la structuration des données a été pensée pour vous : vous entrez les informations que vous souhaitez stocker et organiser directement dans une interface munie de champs prédéfinis (dans zotero : le nom de l’auteur, le titre, une pièce jointe, une note…).

Vous l’aurez certainement compris, les bdd se trouvent derrière quasiment tous les outils que vous utilisez sur internet. Dès que vous remplissez un formulaire en ligne par exemple vous alimentez une bdd : elles « constituent donc le cœur de nos systèmes d’information » (source).

Un outil pour les historien-nes ?

Pourquoi utiliser une base de données spécifique pour le traitement de vos sources ? D’abord parce qu’en construisant votre bdd vous même, vous maîtriserez la structuration de vos informations, c’est à dire la façon dont elles seront organisées. Bien sûr, toutes les sources ne se prêtent pas forcément à une structuration de ce type. Dans la plupart des cas, l’intérêt que vous trouverez à transformer vos sources en données, c’est de pouvoir ensuite opérer des traitements d’ordre quantitatif. Ce qui ne veut pas dire que la pratique des bdd est une exclusive de l’histoire économique ou sociale, réputée plus quantitative. Voir par exemple le retour d’expérience en histoire politique que propose Pierre-Marie Delpu sur le carnet NHumérisme. En outre, il m’est arrivé de rencontrer des doctorants qui, sachant utiliser des logiciels de bdd, avaient décidé d’organiser toute la documentation de leur thèse comme d’autres, telle Franziska, l’auraient fait avec Zotero.

Voici ce que notent Jacques Cellier et Martine Cocaud dans le principal ouvrage de référence (dont je vous recommande vivement la lecture) :

« La démarche débute avec l’examen des documents qui vont permettre la recherche historique : nous les appellerons les sources. (…) Il est rare qu’un seul document suffise à une recherche, qui exige souvent de collecter tout un corpus, composé de documents de même type ou de types variés. La recherche de documents, suivie de leur dépouillement et de leur collecte, dévore une grande partie du temps de l’historien. L’objectif est d’obtenir des données qui seront soumises par la suite à sa sagacité et à son talent d’analyste. Elles résultent d’une curieuse cuisine qui prend les sources comme ingrédient et les laisse ensuite bien éloignées tant que par leur contenu que par leur forme du modèle d’origine. « Physiquement », les données devront se présenter sous forme de fichier, c’est à dire d’une collection d’informations portant un nom et pouvant être stockées sur la mémoire d’un système informatique (…).
Des représentations iconographiques peuvent être stockées sous forme d’images numérisées mais on peut aussi n’en conserver qu’une description établie selon des rubriques précises (nom du peintre, date, techniques, personnages, etc.) ; un discours peut aussi être analysé de la même manière : nom de l’orateur, thèmes évoqués, expressions utilisées, date, etc. Toutes les sources peuvent être décrites sous forme de séries d’informations composées de rubriques, mais ce découpage, qui facilite le traitement des données sérielles, ne se révèle pas intéressant dans tous les cas : les analyses textuelles, par exemple, relèvent d’autres méthodes. » (source, p. 13-14)

 Vous l’aurez compris, tout-e historien-ne n’aura pas besoin de construire une base de données… en revanche la démarche intellectuelle qui est à la base de sa construction est commune à tout chercheur mobilisant de la documentation. C’est, il me semble un point de départ fondamental lorsqu’il est question de formation.

Se former aux bdd (1) – La démarche avant les logiciels !

Je n’ai, en ce qui me concerne, pas eu à créer une base de données pour ma thèse. Peut-être que, si j’avais été initié aux principes qui président à leur construction un peu plus tôt, je me serais lancé, surtout par goût de la découverte des outils par moi même. Néanmoins, avec le recul, je suis persuadé que cela ne m’aurait pas forcément apporté grand chose pour ma thèse (en revanche, pour la gestion à plus long terme de l’ensemble de ma documentation, c’est autre chose!).

SumSchool2008J’ai néanmoins suivi une formation qui m’a permis de m’exercer à la démarche intellectuelle qui préside à la fabrication d’une bdd. Dans le cadre d’une école d’été en « méthodologie de la recherche en histoire sociale » organisée par Frédéric Vesentini en 2008 à l’UCL (d’autres ont eu lieu en 2010, 2013 et 2014), nous étions une bonne trentaine à avoir été initiés aux bdd ; à l’analyse des discours et aux statistiques textuelles ; ainsi qu’aux enjeux d’échantillonnage et de tests statistiques. Sur les 5 jours que comptait la formation, deux furent consacrés aux bdd et, c’est là que je voulais en venir… à aucun moment nous n’avons manipulé un logiciel !

En effet, l’initiation dispensée par Aurore François et Frédéric Vésentini était alors tournée vers le travail – à mon sens le plus complexe, mais aussi le plus intéressant et formateur  – la conception d’une bdd à partir d’une réflexion sur l’organisation de sa documentation : principes de théorie relationnelle, conception d’un schéma conceptuel, transformation du schéma conceptuel en structure de données…

Comme le soulignent Claire Lemercier et Claire Zalc, la saisie d’une source dans une bdd, ou dans un tableur (j’y reviendrai) doit être envisagée, comme « un moment de recherche » (p. 35). Cette opération suppose en effet une réflexion préalable et permanente sur le contenu de la source, son organisation originale, les informations que l’on souhaite en tirer, etc. Réflexion dont on se passe généralement lorsqu’il s’agit simplement de transcrire une source dans un traitement de texte, et a fortiori lorsque l’on se « contente » au départ de photographier les sources :

« Promouvoir la saisie de la source par le chercheur ne correspond pas au désir d’imposer un « rite de passage » pénible et ingrat, mais bien à la conviction que cette étape constitue un véritable moment de recherche. (…) Fastidieuse, [la saisie] permet aussi d’appréhender réellement les données et de commencer à réfléchir sur leur structure. (…) C’est souvent au cours de la saisie que l’on prend presque physiquement contact avec son sujet, mais aussi que naissent de nombreuses questions (…). La saisie, pour l’historien peut ainsi être comparée au terrain pour l’ethnographe ou le sociologue : elle engage physiquement, induit une connaissance intime de la source et suscité nombre de questionnements de recherche. » (source, p. 36)

Traiter données 1Bien entendu, cela ne veut pas dire que toute source, en toutes circonstances, se prêterait à une saisie systématique. Néanmoins, il me semble indispensable de toujours se poser la question…

Ce qui impose de connaître quelques règles de bonnes pratiques, telles les « dix commandements de la saisie » que proposent Claire Lemercier et Claire Zalc.

METHODESQUANTICOUVC’est la première étape d’une auto-formation selon moi : lire les chapitres « De la source aux données » :

– p. 34-47 dans Méthodes quantitatives pour l’historien

– et p. 16-57 dans Traiter des données historiques par Jacques Cellier et Martine Cocaud.

HainautJe vous recommande aussi la consultation du livre de Jean-Luc Hainaut : Bases de données. Concepts, utilisation et développement, l’auteur y prend en effet le temps de bien expliquer les enjeux méthodologiques et conceptuels qui président à la création et à l’utilisation d’une bdd. En outre, la conception de l’ouvrage est très intéressante : plusieurs parcours sont possibles parmi les chapitres selon que vous souhaitiez « simplement » bénéficier d’une introduction aux bdd, ou que vous cherchiez une formation complète. [Voir la page du livre sur le site de l’auteur – Lire la table des matières et l’introduction (PDF)]

 

Se former aux bdd (2) – Les enseignements présentiels

Nous avions vu qu’il existe de très nombreuses formations présentielles aux logiciels de bibliographies, ateliers de doctorants, formations des bibliothèques et des urfist, elles ne manquent pas. Pour les bdd, l’offre existe mais elle est sans conteste moins pléthorique.

Il faut bien sûr commencer par citer les formations du Pireh (Pôle Informatique de Recherche et d’Enseignement en Histoire) de l’université Paris 1 qui, depuis de nombreuses années, dispense de la Licence au Doctorat des enseignements pointus à divers outils, dont les bases de données (ici ou par exemple). Voir aussi, bien qu’il dépasse la seule question des bdd à proprement parler, le programme du séminaire organisé par Stéphane Lamassé et Léo Dumont : « Structuration et analyse de données pour historien (2014-2015)« 

J’ai cité celles de Frédéric Vésentini et Aurore François ont organisé à plusieurs reprises depuis 2008, les écoles d’été peuvent être une excellente occasion de se former correctement en un minimum de temps. Il faut les guetter dans vos établissement et vous abonner aux flux de Calenda (écoles d’été ; méthodes de traitement et de représentation ; approches de corpus, enquêtes, archives ; etc.)

Bien entendu, il y a aussi l’atelier de Claire Zalc et Claire Lemercier, qui dépasse ici encore la seule question des bdd, mais dont l’approche très concrète basée sur les travaux des participants ouvrent de nombreuses perspectives. Voir, pour information, le programme 2014-2015.

Si vous avez connaissances de formations spécifiques orientées histoires et sciences sociales, n’hésitez pas à les partager. Une solution alternative lorsqu’il n’existe pas de formation dans votre discipline, est d’aller voir du côté des formations plus pointues des informaticiens, ou d’autres disciplines. Cela implique néanmoins d’avoir été particulièrement sensibilisé aux enjeux propres à la recherche en sciences sociales (en lisant les références mentionnées plus haut notamment!)

Jetez par exemple un œil à l’offre très riche du CNAM sur les domaines « bases de données » et « bases de données relationnelles« .

S’auto-former : le tableur

Utiliser un tableur comme base de données ? J’entends d’ici les puristes pousser des cris d’orfraie… Il n’empêche que bien souvent, ce sera une solution largement suffisante. Comme toujours, j’insiste sur le fait qu’en matière d’informatique, il est indispensable de toujours tenter de mobiliser les outils correspondant au mieux à nos besoins, nous n’avons pas besoin d’une masse pour planter un clou… Comme le notent Claire Lemercier et Claire Zalc (vous voyez bien que la lecture de leur « repères » est indispensable…) :

« En pratique, le choix est souvent entre tableur et logiciel spécifique de base de données. (…) En fait, dans la plupart des cas, un tableur, plus souvent présent à la base sur l’ordinateur et d’un accès plus intuitif, suffit largement, d’autant que les données saisies sont plus facilement exportables par la suite, pour des traitements que l’on n’imagine que rarement à l’avance. Outre le gain de temps, la discipline imposée par le fait d’entrer les données directement dans un tableau, visualisé comme tel, peut d’ailleurs aider à poser certains choix de recherche » (source, encadré p. 37)

Pour apprendre les bases de l’utilisation d’un tableur, je vous rappelle en premier lieu mon tutoriel, « initiation à l’utilisation d’Excel 2010« . Le tutoriel a pris – esthétiquement – un petit coup de vieux (le premier qui dit qu’il était déjà moche à l’origine verra son adresse IP blacklistée!) mais les fonctionnalités restent valables et facilement transposables à LibreOffice Calc. L’essentiel ici est d’apprendre à utiliser les outils de tri, filtre, croisements de données. Voir par exemple :

Pour LibreOffice ou OpenOffice, vous trouverez des tutoriels facilement, voir, par exemple, ces « conseils pour réaliser une table de données » (PDF) ou encore ces exemples vidéos :


(il s’agit de la première vidéo d’une série de 12…)

Reste que le tableur trouvera vite ses limites pour certains usages, et là, les choses se compliquent un peu.

À la lecture de conseils divers et variés, il semble que la plupart des historiens rompus aux outils de ce type recommandent désormais le passage à MySQL. FileMaker reste souvent cité mais ne semble pas très pratique. Restent les logiciels des suites bureautiques les plus connues : Access pour MSOffice, et Base pour Libre/OpenOffice.

Petit tour d’horizon pour ces 4 possibilités.

S’auto-former : Access

Access est probablement le plus connu des logiciels de base de données, même pour les plus néophytes. Jetez un œil au rayon informatique chez Gibert par exemple, vous pourrez constater qu’il existe pléthore de manuels, plus ou moins accessibles, pour apprendre à l’utiliser.

Traiter données 1Dans le premier volume qu’ils ont consacré au traitement des données historiques, Martine Cocaud et Jacques Cellier avaient fait le choix de ce logiciel. Je vous recommande vivement leur livre (et je vous remet la couverture pour la peine) car, si le logiciel à beaucoup évolué depuis, leurs démonstrations reposent systématiquement sur des exemples historiques concrets.

Vous pourrez, en outre, vous reporter à la page annexe à l’ouvrage, TDH1, sur le site de Jacques Cellier.

Pour vous familiariser avec le fonctionnement des versions les plus récentes du logiciel, vous trouverez bien votre bonheur dans un des très nombreux guides publiés, et plusieurs tutoriels vidéos existent. Voir, par exemple, la série de 4 vidéos mises en ligne en juin 2014 par Lydia Provin :

La limite principale des tutoriels en ligne concerne le domaine d’application très souvent éloigné des sciences sociales… C’est la raison pour laquelle il me semble que la lecture de traiter des données historiques reste indispensable à celles et ceux qui souhaiteraient se lancer dans l’apprentissage d’Access.

Dans le second volume qu’ils ont consacré au traitement des données en histoire et sciences sociales, les deux auteurs ont néanmoins adopté MySQL…

S’auto-former : Base

Le concurrent libre de la suite office dispose aussi de son propre logiciel de base de données. Vous trouverez sur le wiki du Pireh un tutoriel fondé sur un exemple historique, une base de données des représentants élus à l’Assemblée nationale constituante en avril 1848 :

WikiPireh-Oo_Base

Vous trouverez aussi – c’est l’un des avantages non négligeables du libre – une communauté active d’utilisateurs et de nombreux conseils. Par exemple, sur le site officiel, vous trouverez la traduction française des guides d’utilisation de Calc (le tableur) :

GuidesCalc

 

Pour Base en revanche, il faudra pour le moment vous contenter des versions en anglais qui n’ont pas encore été traduite (témoignage, peut-être, de la moindre utilisation du logiciel). Il existe un manuel complet (traduit de l’allemand vers l’anglais) et une série de guides. L’ensemble se trouve ici :

LO_GuideBaseEn

 

 

 

S’auto-former : FileMaker

Dans les résultats de mon enquête auprès des historiens, si de nombreuses réponses ne mentionnaient que « bases de données » dans une perspective générale, un logiciel a été cité à plusieurs reprises : FileMaker.

Cela a suscité quelques suprises sur Twitter lorsque je m’en suis fait l’écho. Comme le notent CL et CZ :

« Beaucoup d’historiens utilisent FileMaker. Il semble s’agit en bonne partie d’une tradition quelque peu irrationnelle, due à la fois à l’usage d’ordinateurs Macintosh et à la forte personnalité de quelques utilisateurs. Il est vrai que le système de prosopographie mis en place par Jean-Pierre Dedieu à l’intérieur de ce logiciel (voir par exemple ici) est tout à fait intelligent et adapté aux données historiques. Il reste que les fichiers construits sous FileMaker s’avèrent particulièrement difficiles à exporter ailleurs… Il faut donc bien réfléchir avant de faire ce choix » (source)

Je me contenterai ici d’indiquer à celles et ceux qui souhaitent l’utiliser que le site officiel de FileMaker propose de nombreux « webinaires » des tutoriels les plus basiques aux fonctions les plus avancées (voir le site des séminaires Web FileMaker). Par exemple, ce tour d’horizon « découvrir FileMaker en 20 minutes » :

S’auto-former : MySQL

Je le notais plus haut, MySQL est le choix que Jacques Cellier et Martine Cocaud ont fait pour le deuxième volume sur le traitement des données historiques :

couvtdh2Ils expliquent en effet que :

« Compte tenu de l’offre en la matière, il nous paraît pertinent de proposer MySQL comme alternative à [Access]. Parmi les raisons qui plaident en faveur de ce dernier, on peut invoquer la gratuité, son caractère multi-utilisateur, l’existence d’une interface puissnte et conviviale PhpMyAdmin qui rend aisées les tâches d’administration et offre de nombreuses possibilités d’échanges avec d’autres logiciels (comme Excel ou Access…). Mais le plus important est le fait que pratiquement tous les hébergeurs de site Web proposent le couple MySQL/PhpAdmin. Ce qui ouvre l’opportunité de mettre la base en ligne, tout en ayant un contrôle fin sur les accès : depuis la simple consultation, jusqu’à l’administration, en passant par l’insertion de données. La porte est ainsi ouverte sur un véritable travail collectif réunissant plusieurs contributeurs géographiquement épars autour du développement d’une base de données. » (source, p. 17)

Si avec ça vous n’êtes pas convaincus !? J’ajouterai que vous disposez pour vous aider du volume dont est tiré cette citation, qu’il est – comme son prédécesseur, accompagné d’une annexe en ligne très fournie, et d’un « kit » complet pour s’initier et se perfectionner dans l’art subtil de l’interrogation SQL.

Notez aussi que la seconde partie l’ouvrage cité plus haut de Jean-Luc Hainaut, est intégralement consacrée au langage SQL.

[édit. du 15 mai 2015] La plateforme de MOOC OpenClassrooms propose une formation complète à l’administration de bases de données avec MySQL. L’accès au cours est totalement gratuit et la version payante vous permet de télécharger le cours, voire d’obtenir un certificat de réussite en cas de besoin.

*

*    *

Comme pour le billet précédent, si vous repérez des approximations ou des erreurs, ou si vous souhaitez partager vos expériences, recommander des formations, etc. n’hésitez surtout pas à utiliser les commentaires !

Je souhaite, pour conclure ce billet, insister sur la nécessité de beaucoup réfléchir à vos besoins avant de vous lancer dans l’apprentissage d’un logiciel de bdd, qu’il ait ou non été cité ici. Si l’apprentissage des règles de bonnes pratiques en termes de conception, de structuration des données à travers la saisie des sources est quelque chose de très formateur, quel que soit l’usage que vous ferez du résultat, l’apprentissage de l’utilisation d’un logiciel de ce type, surtout en autoformation, peu d’avérer lourde et… décourageante si finalement ses possibilité dépassent de très loin vos besoins.

Si pour les logiciels de bibliographies je vous incitais à vous lancer quoiqu’il arrive en toute confiance dans l’autoformation, en ce qui concerne les bases de données je ne peux que vous encourager à d’abord demander conseil à des chercheurs qui pratiquent ces outils – et encore mieux, à ceux qui forment des apprentis historiens à leur usage – et qui seront le plus à même de vous aider à définir vos besoins, et à choisir l’outil le plus adapté.

______________

Crédit image bandeau : « original database » par shinichi / 真一 … just call me Shin! en cc sur Flickr

Se former aux logiciels de bibliographie

L’analyse des résultats de l’enquête relative aux usages et besoins de formation « au numérique » des historiennes et historiens – voir le billet – a fait ressortir plusieurs séries d’outils considérés par les répondants comme des priorités. Comme je l’avais noté 3 sortent particulièrement du lot :

  1. les logiciels de bibliographie
  2. les logiciels de bases de données
  3. les logiciels de cartographie et SIG

L’objectif de ce billet et de ceux qui suivront est de donner quelques pistes à celles et ceux qui souhaiteraient partir à la découverte de ces outils. En effet, il existe aujourd’hui de très nombreuses ressources qui permettent d’envisager une autoformation à certains outils – même si en pratique, les enseignements présentiels et le conseil personnalisé restent les plus efficaces. Continuer la lecture de Se former aux logiciels de bibliographie

« Les grand corpus en ligne changeront-ils la boîte à outils de l’historien.ne ? » par Claire Lemercier

Un bref billet pour vous signaler la mise en ligne d’une intervention de Claire Lemercier au séminaire Data, digital methods and mapping social complexity intitulée :

« Les grand corpus en ligne changeront-ils la boîte à outils de l’historien.ne »
Résumé : « Cette intervention tentera de remettre en perspective les changements en cours, liés à la numérisation massive de corpus variés, avec la première période d’âge d’or proclamé de la quantification en histoire et dans les humanités, aujourd’hui souvent oubliée. Cet âge d’or avait été suivi d’un rejet assez massif et n’avait pas réellement modifié la boîte à outils de la plupart des historien.ne.s. Peut-il en aller autrement aujourd’hui, et à quelles conditions ? Quelques pistes seront présentées à partir d’une expérience de chercheuse ayant parfois sollicité de grands corpus, et de formatrice ayant souvent accompagné des collègues ou étudiants dans une réflexion à ce sujet. Le propos sera ancré dans les spécificités de l’histoire comme communauté disciplinaire, mais pensé pour appeler réponses ou comparaisons de la part de spécialistes d’autres disciplines, notamment de la littérature ou de l’informatique. » (source)



Claire Lemercier: « Les grand corpus en ligne… par ENSCI

Gérer la documentation II – une approche possible utilisant Zotero

Dans un premier billet, j’ai évoqué les possibilités logicielles qui existent pour gérer la documentation d’une thèse. Dans ce billet-ci, je reviens sur mon mode de fonctionnement personnel, pour l’essentiel une utilisation intensive du logiciel de gestion de bibliographie Zotero (bien connu des lecteurs de ce blog). Pourquoi ce choix ? Au départ c’est une volonté d’éviter l’éparpillement. Il me fallait de toute façon un outil pour gérer la bibliographie et il me semblait naturel d’y stocker mes notes concernant la lecture de la dite bibliographie. De là, il n’y avait qu’un pas pour y intégrer également mes notes d’archives – surtout pour pouvoir profiter des fonctions d’organisation, d’annotation et de recherche en plein texte sur l’ensemble de ma documentation. Continuer la lecture de Gérer la documentation II – une approche possible utilisant Zotero

Gérer la documentation I – Quelques considérations générales

jo and the filingI love clutter

Émilien a lancé cet été une réflexion sur la gestion de la documentation, en partant de sa situation de fin de thèse et spécifiquement d’un incident qui l’amenait à revoir ses pratiques de sauvegarde. J’aimerais revenir sur ces questions – dans un premier billet avec quelques possibilités informatiques existantes pour gérer l’information nécessaires à la rédaction d’un travail conséquent de recherche, puis dans un deuxième où j’ouvrirai en quelque sorte les placards pour montrer mes choix personnels pour ma thèse.

La documentation – quels types de document, quels formats ?

Quand on parle de documentation pour une thèse, et ici spécifiquement en histoire, cela comprend une multitude de documents divers dans beaucoup de formats différents :

2011 K-12 Archives Education Institute

Les archives génèrent de la documentation de travail, que ce soit sous la forme de photos prises directement aux archives (nous en avons déjà parlé) ou téléchargées à partir d’archives numériques, de photocopies faites sur place, de transcriptions sur papier ou sur ordinateur ou de notes de lecture.

La lecture de travaux secondaires fait de même : exemplaires physiques et/ou numériques de livres et articles, listes de réferences bibliographiques, notes de lecture, citations extraites d’ouvrages
Au cours du travail on accumule les ecrits : brouillons d’idées, textes exploratoires discutés avec le directeur, papiers présentés en colloque (éventuellement accompagnés de diapositives), articles pour publication

    Métaphores et choix

    Seau rose

    Il existe différents logiciels et stratégies pour gérer ce type de documentation abondante (il existe même un laboratoire qui les étudie). Pour simplifier et en même temps reprendre un débat vif dans les blogs sur la question, nous allons les regrouper en deux grands groupes.

    Les premiers sont ce que l’on appelle en anglais des « everything buckets », des « seaux-fourre-tout », si on veut: Il s’agit de logiciels conçus pour capter des informations venus de différents horizons et dans des formats différent (fichier text, pdf, image, vidéo, son…) pour les regrouper, sans se préoccuper beaucoup du classement. Les interfaces se ressemblent. Dans les grands noms dans le domaine, vous pouvez croiser Evernote, voici la présentation du logiciel sous forme vidéo :

    D’autres outils fonctionnant sur un principe similaire sont DevonThink et Yojimbo (tous deux OS Mac uniquement) ainsi que Microsoft OneNote (Windows et iOS).
    L’autre groupe concerne d’avantage des stratégies de gestion que des logiciels. Pour dire vite, ils s’appuient sur la structure du système d’opération pour classer et organiser les différents éléments de documentation. C’est ce que vous faites si vous prenez des notes d’archives dans un traitement de texte par carton ou dossier pour ensuite les classer dans des dossiers par fonds d’archive, par exemple. Ensuite, il faut utiliser les capacités d’indexation du système d’exploitation pour retrouver les documents (ce qui marche beaucoup mieux sous MacOS avec Spotlight qu’ailleurs).

    On serait tenté de dire que le choix entre l’une ou l’autre des méthodes relève de la préférence personnelle, mais il est néanmoins utile de connaître les débats vifs qui opposent les défenseurs. Tout a commencé avec un billet d’Alex Payne, à ce moment-là dans l’équipe de développement de Twitter, ou il explique pourquoi il déconseille fortement l’usage des « everything buckets ». Pour lui, le gain de temps au moment de l’enregistrement est un facteur de risque pour plusieurs raisons : les données sont peu structurées et donc peu exploitables après, il y a un risque de perte de l’information en cas de corruption de la base du logiciel, et surtout cela amène à utiliser pour tout un logiciel peu adapté alors qu’il existe des logiciels spécialisés qui accomplissent mieux les tâches individuelles. Adam Pash the Lifehacker a suivi cette ligne argumentaire dans un billet exposant son aversion pour les « everything buckets » (lisez aussi les commentaires – en cliquant sur « all » pour tous les voir, illustrant bien la diversité des usages possibles).
    Le contre-argument a été pris par David Karger dans un long billet très intéressant, que je vous conseille de lire en entier parce qu’il renvoie aussi vers beaucoup d’autres logiciels, en expliquant les nuances le leur fonctionnement. Pour lui les « everything buckets » sont inévitables, il s’agit de les rendre vraiment opérant pour les besoins des utilisateurs.
    Vous noterez que les auteurs des billets cités ne sont pas chercheurs en SHS, ce qui nuance leurs besoins par rapport aux nôtres. Cela concerne en particulier la bibliographie pour lequel il faudrait de toute façon un logiciel spécialisé, même si on utilise un « everything bucket » (à moins, bien sûr de considérer son logiciel de bibliographie comme un « everything bucket » structuré, mais je vous en parlerai plus en détail la semaine prochaine en expliquant comment je travaille.

    L’exemple du Zettelkasten

    J’ajoute un dernier élément parce qu’il me fascine et que je compte en reparler la semaine prochaine en exposant mes méthodes de travail. Le classement de la documentation a bien sûr existé avant les outils informatiques. Le sociologue allemand Nikolas Luhmann (1927-1998) a développé une méthode qui lui est propre, en utilisant de façon extensive des fiches en papier. La meilleure description que j’ai pu trouver en anglais se trouve ici, mais si cela vous intéresse et que vous lisez l’allemand, je vous encourage à lire le chapitre ou Luhmann lui-même explique son système : Luhmann Niklas, « Kommunikation mit Zettelkästen: Ein Erfahrungsbericht », in André Kieserling (éd.), Universität als Milieu, Bielefeld, Haux, 1992, pp. 53-61.
    Luhmann notait toutes les idées qui lui venaient de ses lectures ou d’ailleurs et il les reliait aux notes préexistantes par un système de numérotation extensible et sous-divisible à l’infini. Ils ne prenait pas des notes pour un projet spécifique, mais alimentait en quelque sorte en permanence sa base, le « Zettelkasten ». Dans l’analyse citée ci-dessus il explique qu’il se faisait souvent surprendre par les liens entre idées qui deviennent apparents par son système de classement et lui inspirent de nouveaux travaux. Pour Luhmann, sa « boîte à fiches » est son « Zweitgedächtnis », une sorte de cerveau secondaire ou deuxième cerveau qui fait apparaître ses idées sous d’autres angles. Après la mort de Luhmann un long combat a commencé entre les ayant-droit et les chercheurs intéressés par ce fond énorme que représente la « boite à fiches ». Il est aujourd’hui résolu et des chercheurs essaient maintenant de comprendre et exploiter cet objet insolite.
    Voici une vidéo où Luhmann lui-même explique le fonctionnement de son « Zettelkasten »:

    Sauvegarde et récupération de données… un billet de blog, un rappel et une découverte

    Aujourd’hui, j’ai dû faire face à une petite mésaventure alors que je classais ma documentation en vue d’une poursuite un peu plus rationnelle de l’écriture de ma thèse… Je relate cette petite expérience dans un bille de Devenir historien-ne et me permets de vous y renvoyer pour le détail :

    Je voudrais saisir l’occasion pour rappeler ici l’importance d’une sauvegarde régulière de vos données.

    Sans entrer dans les détails, je vous renvoie aux billets de Franziska à ce sujet et vous encourage vivement à créer un compte Dropbox (en suivant ce lien vous gagnerez un peu d’espace gratuit supplémentaire, tout comme votre serviteur ;))
    Dans mon semi-malheur (puisque cela s’est relativement bien fini, je vous renvoie à Devenir historien-ne…) j’ai fait une découverte avec le logiciel Easy Drive Data Recovery.
    Sur la page de MunSoft, qui développe ce logiciel, il est présenté ainsi :
    Restaurez vos données depuis les disques perdus ou formatés par hasard à l’aide de Easy Drive Data Recovery. Le programme utilise des algorithmes uniques puissants, qui permettent de restaurer même les fichiers, les informations sur lesquels sont absentes dans les enregistrements du système de fichiers. Il suffit de choisir le disque contenant des données pour l’analyser et vous pourrez choisir les fichiers à restaurer, en prévisualisant leur contenu. Il n’est pas important comment ces données ont été perdues, le programme va restaurer le maximum possible de fichiers.
    Il se trouve que pour des données que je venais tout juste d’effacer, sur un disque dur où après coup je n’avais procédé à aucune autre opération (ni écriture de nouveau fichier, ni effacement d’autres données), ce logiciel à mieux fonctionné que tout ce qu’il m’avait été donné de tester auparavant.  Je n’ai aucune action dans cette société et ne saurait garantir que logiciel fonctionnera pour des données plus compliqué à retrouver (ici il s’agissait juste d’un effacement « total » (sans passer par la corbeille) par erreur).
    Dans mon cas précis, il lui a fallu quelques heures pour identifier tous les fichiers perdus récupérable sur le disque dur (une partition d’environ 675Go remplie à un peu moins de 40%) et deux heures pour restaurer environ 15.000 fichiers (25Go de données). Ce qui m’a quand même coûté 49€… pour gagner deux à trois jours de boulot (enfin, pour éviter de les perdre…) et me permettre d’écrire vite fait deux billets de blogs avant de repartir dans l’aventure de la fin de thèse…
    *
    Avez-vous déjà dû chercher une solution pour restaurer des fichiers effacés par erreur ? N’hésitez pas à partager vos expériences en commentaires (en particulier si vous connaissez des outils libres qui permettent d’obtenir de bons résultats…).
     

    Etablir et gérer une chronologie fine – deux petits outils

    Creative Commons Attribution-Noncommercial-No Derivative Works 2.0 Generic LicenseIl m’est arrivé récemment de devoir gérer une chronologie fine et compliquée de négociations, pour lesquelles j’avais consulté les archives des deux côtés. Je me suis mise à chercher le meilleur outil pour mettre les choses au clair pour moi, en amont de la rédaction du chapitre correspondant de thèse. Ayant écarté les documents de texte (trop facile de perdre la vision globale, peu adapté à un enchainement chronologique avec des dates) et le tableur (trop de texte pour réussir à en faire quelque chose de lisible), j’ai testé deux autres outils qui pourraient intéresser certains parmi vous, pour gérer des chronologies out toute autre masse de données un peu structurée.

    Treesheets

    Treesheets est un petit logiciel très peu gourmand en mémoire, disponible pour l’instant sur windows et linux (une version alpha pour mac, encore peu stable, existe). C’est en quelque sorte une fusion du tableur (structure en cellules) et d’un outil de carte heuristique « mind map » (relations hiérarchiques, souplesse dans l’ajout d’informations).
    Les captures d’écran sur le site du logiciel montrent de façon convaincante le fonctionnement, en voici une qui montre bien la double filiation :

    Pour mon cas précis concernant les négociations franco-britanniques à la veille de la Première Guerre mondiale, j’ai donc pu établir une chronologie comportant une colonne de dates au milieu de la feuille et l’ensemble des références d’archives et textes complets regroupés par pays des deux côtés de la date. Cela donne le résultat suivant :

    J’ai pu, avec une grande facilité, ajouter des lignes et des champs précisément là où j’en avais besoin pour compléter ma chronologie de travail et aussi jouer sur les tailles de texte et de champ pour garder une vision globale, tout en ayant à ma disposition les principaux textes sur lesquels je travaille actuellement.
    Contrairement à la plupart des logiciels de création de carte heuristique, Treesheets dispose de plusieurs formats d’export pour les données. Ceci est particulièrement apprécié lorsqu’on utilise l’outil pour organiser des idées en vue de la rédaction et que l’on peut donc récupérer au choix un fichier html ou un fichier .txt pour continuer le travail ailleurs ensuite.
    Lors du premier lancement du logiciel Treesheets après l’installation, un tutoriel vous est proposé. Il est très bien fait et vous apprend en très peu de temps à utiliser l’essentiel des fonctionnalités, y compris les raccourcis clavier qui en font un outil particulièrement ergonomique.

    Workflowy

    L’autre outil que j’ai découvert dans cette recherche s’appelle Workflowy et il mérite une mention pour la facilité déconcertante d’adoption et une très grande ergonomie d’utilisation également.
    Cette vidéo montre en 45 secondes le fonctionnement général de cette application web:

    Vous l’aurez compris, il s’agit de créer une arborescence que vous pouvez déployer et refermer – pour rentrer dans les détails ou avoir à nouveau une vision globale de votre projet. L’outil est à l’origine prévu pour de la gestion de projet et il s’y prête à merveille, mais il rend également de grands services dans la gestion de bouts de texte dans une étape d’écriture ou d’élaboration d’un plan. Je m’en suis servi, par exemple, à un moment pour retravailler le plan de ma thèse et j’ai beaucoup apprécié la facilité avec laquelle je pouvais passer d’un niveau de travail à un autre. Là encore, l’export est possible sans souci, en texte brut, mais aussi en version formatée, ce qui permet de retravailler le document avec d’autres logiciels ensuite.

    La photographie numérique des sources – conseils, astuces, méthodes

    source : kellan sur Flickr, license CC

    Après le creux de l’été où nous avons d’avantage travaillé nos thèses, nous reprenons le rythme de croisière en termes de publications sur ce blog, cette fois-ci avec un billet explicitement plébiscité par mes étudiants de M1 de l’année dernière. La pratique de la photo numérique de sources dans des dépôts d’archives se généralise, mais ensuite chacun doit bidouiller pour gérer la masse de photos, les travailler – et en général c’est à la fin d’un long processus d’apprentissage que l’on peaufine une stratégie et regrette, bien souvent, des erreurs faites au début.

    Dans ce sens, ce billet n’est absolument pas une règle d’or à suivre, mais plutôt une collection d’astuces et de conseils issus de ma propre pratique et de mes lectures, assortis de quelques indications techniques et logicielles pour vous faciliter la gestion de vos photos d’archives. Et, comme toujours, nous attendons vos retours et astuces supplémentaires en commentaire.

    Réfléchir en amont

    Il est absolument impératif de réfléchir à sa stratégie d’exploitation des sources avant même de mettre les pieds dans un dépôt d’archives. Vous allez me dire que ceux qui débutent dans une recherche ne savent souvent pas du tout ce qu’ils vont trouver – c’est très vrai, et il sera toujours nécessaire d’adapter en fonction de ce que vous trouverez. Cependant, dans tous les cas, votre séjour en archives gagnera en efficacité, si vous êtes préparés :

    • Cela paraît évident, mais il faut d’abord savoir si la photo de sources est autorisé dans le dépôt en question et sous quelles conditions. C’est une information que vous trouverez souvent sur le site web des archives en question, s’il existe. Pour la France, l’annuaire des Archives de France est un bon point de départ, tout comme le répertoire des bibliothèques et fonds documentaires du CCRF de la BNF. Vous pouvez aussi regarder sur le Wiki des Archives que nous avons déjà présenté sur ce blog ou poser la question à des chercheurs dont vous savez qu’ils fréquent les archives en question. Dans certaines archives et pour certains matériaux il peut être nécessaire de demander une autorisation de photographie bien en amont – mieux vaut le savoir avant d’y aller. Attention : les politiques d’autorisation de la photo ont tendance à évoluer, en cas de doute il vaut mieux appeler les archives pour avoir la confirmation.
    •  Il faut bien évidemment réfléchir au matériel nécessaire. La photo numérique a fait de gros progrès et il est de nos jours tout à fait possible de se servir d’un appareil de photo d’entrée de gamme et d’obtenir des résultats satisfaisants. Si vous êtes un fan de photo, que vous possédez déjà un reflex numérique, c’est très bien et vous pourrez l’utiliser, mais je déconseille d’investir des sommes importantes rien que pour faire des photos aux archives. Si vous prévoyez d’acheter un appareil, entre autre pour cet usage, il est utile de garder certains critères en tête : un appareil avec une fonction automatique « document » ou au moins « macro » peut vous simplifier la photographie de documents papier. Il est indispensable de pouvoir désactiver facilement le flash, presque toujours interdit pour des raisons de conservation des documents.Il sera plus facile d’avoir sous la main des piles de rechange si l’appareil utilise des piles standards et non pas un modèle propriétaire, très cher. Pour plus de conseils à l’achat, voir cette liste très complète. Sachez toutefois que le appareils photo des smartphones actuels peuvent servir, au moins en dépannage, voir pour un véritable usage aux archives. Il sera pour cela judicieux de leur associer des applications qui traitent les photos, comme celle-ci, par exemple.

      Il ne suffit pas d’avoir l’appareil, il faut aussi penser à se munir de cartes de stockage avec un volume suffisant (ou deux, pour pouvoir transférer le contenu de l’une sur un ordinateur portable pendant que vous continuez à travailler avec l’autre) et les piles de rechange/de quoi recharger si des prises existent en nombre suffisant dans les archives en question (pas toujours le cas !)

    • Pieds fixes à disposition des chercheurs, National Archives, Kew, GB. Photo : F.H.

      Avec le temps et en fonction du nombre de photos que vous êtes amenés à prendre, vous pouvez vous simplifier la vie avec quelques équipements supplémentaires. Un petit nombre de dépôts d’archives merveilleux mettent à disposition des lecteurs des pieds fixes. D’autres (mais pas toutes) autorisent la photo avec votre trépied. Il en existe des petits qui peuvent être utiles. De même, un câble ou une télécommande pour déclencher la prise de photo sont appréciable en cas de nombre très important de photos (et d’appareil permettant d’utiliser ce genre de dispositif), mais très loin d’être nécessaires dans tous les cas. Voir ce billet concernant les outils de la photo en archive.

    Cela n’est en rien propre à la photo, mais un liste des cartons commandés/à consulter dans le dépôt, que ce soit sur papier ou sur ordinateur est un outil précieux, autant pour savoir où vous en êtes que pour garder une trace de ce qui a été fait, de ce qui reste à faire.

    Stratégie sur place

    Une fois arrivé aux archives, essayez, dans la mesure du possible, d’avoir une place à bonne luminosité, souvent la meilleure solution est de demander à être près de la fenêtre.
     Quand vous vous trouvez face à vos documents, il faut donc décider de ce que l’on photographie. Inutile de tout mitrailler sans discernement, cela dépend de plusieurs facteurs :

    • si vous vous êtes déplacé loin pour consulter ces archives et que vous disposez de peu de temps sur place, mieux vaut trop photographier que pas assez. Vous ferez l’évaluation détaillée une fois rentré.
    • s’il s’agit de documents que vous ne pensez pas forcément utiles pour votre travail, mais qui pourraient s’avérer intéressants par la suite, il vaut souvent mieux les photographier rapidement et prendre bonne note (voir ci-dessous), plutôt que de les lire en détail sur place.
    • si par contre il s’agit d’un document central pour vous et que vous avez le temps dans le dépôt d’archives, il peut s’avérer utile de le recopier directement sur place (quitte à prendre aussi une photo, pour d’éventuelles vérifications plus tard).

    Avant de commencer à photographier, il faut mettre en place un système robuste pour établir le lien entre la photo et le document d’archive qu’elle représente. Pour illustrer cette nécessité, j’aime évoquer le scénario d’horreur : imaginez que vous trouvez sur votre disque dur une photo d’archives avec une citation absolument centrale à votre travail, mais que vous vous rendez compte que vous ne pourrez pas l’utiliser dans la rédaction parce que vous ne disposez pas des informations nécessaires pour la citer correctement. Pour éviter cette catastrophe plusieurs possibilités existent (et peuvent aussi se combiner) :

    • Vous pouvez noter les indications essentielles (carton/chemise/dossier) sur un petit papier et le placer à côté de votre document, de façon à l’inclure dans votre photo. C’est à priori la méthode la plus sûre (les informations étant maintenant indissociables), mais c’est aussi laborieux d’établir toutes ces mini-fiches pendant l’exploitation et la photo.
    • Vous pouvez maintenir une fiche courante (un document de traitement de texte, un fichier simple ou une note dans votre logiciel de bibliographie) où vous noterez chaque carton/chemise/dossier consulté et à côté les numéros automatiques que votre appareil photo attribue aux photos. Chez moi cela ressemble à cela :
    • Vous pouvez prendre soin de toujours photographier soit la fiche de commande du carton ou l’étiquette, et dans la suite les documents qu’il contient. De même, je vous conseille de ne jamais photographier une page isolée d’un document qui en comporte plusieurs – prenez au moins la première page, qui en général contient les informations nécessaires pour citer le document et ensuite les pages qui vous intéressent particulièrement.

    • Dernière possibilité : en prenant bien soin de synchroniser l’horloge système de votre ordinateur et celle de votre appareil photo, vous pouvez aussi noter l’heure exacte à laquelle vous commencez chaque carton/dossier etc. et vous servir ensuite des données Exif des photos pour faire le raccord entre les deux.

      Très important : ne pas oublier de vérifier de temps en temps la qualité des photos, pour ne pas perdre une demi-journée de photos d’archive à cause d’un mauvais réglage de l’appareil.

      Traitement et exploitation

      Je vous encourage très fortement à revoir vos photos et notes tout de suite après une consultation d’archives, le soir en rentrant – quand vous vous souvenez encore bien de ce que vous avez vu. En fonctions de vos préférences vous pourrez ensuite faire plusieurs choses :

      • créer des dossiers et sous-dossiers par carton/chemise/dossier et repartir les photos selon leur origine. Si vous avez pris les cartons/étiquettes en photo, cela permet de trier très vite les miniatures.
      • regrouper des images issus d’un dossier/document comportant plusieurs pages etc. dans un pdf en utilisant soit les fonctions natives d’impression dan sun fichier .pdf sous mac/linux, soit un des nombreux logiciels gratuits d’impression en .pdf sous windows (comme PDFCreator).

      Quand vous passez à l’étape de l’exploitation proprement dite de vos photos, plusieurs possibilités sont encore ouvertes :

      • Si vous avez fait le choix de créer des .pdf, vous pourrez très facilement les annoter en utilisant un lecteur de .pdf qui comprend cette fonction (FoxitReader fait cela très bien sous windows, pour linux je suis encore à la recher…). Cela permet de mettre des mots-clés au bon endroit dans un pdf comportant nombre de pages et ainsi de se retrouver de façon très commode dans ses archives et notes
      • Si vous utilisez Zotero pour gérer votre bibliographie, vous pouvez tout à fait aussi ajouter des entrées pour vos documents d’archives, leur associer des fichiers images ou pdf et des notes. C’est mon choix personnel, car il me permet de garder toute ma recherche dans un même cadre où je peux faire des recherches par mots-clés. Vous pouvez en voir un aperçu ici.

        Un outil qui s’avère précieux dès que vous avez beaucoup de photos à exploiter, et surtout si vous devez transcrire intégralement des documents texte ou saisir des renseignements pour une base de données, c’est l’écran extérieur ou supplémentaire branché sur votre poste principal. Vous pourrez ouvrir d’un côté la photo de votre document d’archive et de l’autre le logiciel dans lequel vous effectuez la saisie. Si vous utilisez principalement un netbook, comme moi, cela peut vous changer la vie !

        Dernier conseil, mais peut-être le plus important de tous : pensez à sauvegarder vos photos d’archives dans les règles de l’art. Si je dispose d’une connection internet de bonne qualité, je préfère, lors de mes séjours en archives à l’étranger, déposer toutes mes photos de la journée dans un dispositif de stockage en ligne le soir même, pour peu qu’un vol de sac le lendemain ne me fasse perdre des jours entiers de travail précieux.

        Et maintenant c’est votre tour : décrivez vos stratégies, vos astuces etc. en commentaire pour que tout le monde puisse en profiter !

        Pour aller plus loin : un guide très complet édité par la bibliothèque de l’université d’Illiois [en anglais]

          Zotero – version 2.0 et la sauvegarde des données

          La version 2.0 vient de sortir

          On vous l’avait promis lors de la formation en octobre 2009 et maintenant ça y est enfin: la version 2.0 de ZOTERO n’est plus en béta, la version finale et stable vient de sortir. Plus de détails sur cette version sur le site de zotero.
          Voici comment faire pour passer à cette version:

          • Si vous travailliez déjà avec la version béta, la mise à jour devrait se faire automatiquement lors du prochain démarrage de zotero.
          • Si vous travailliez encore sous la version 1.0, il suffit normalement de cliquer sur bouton ‘download’ sur la page de zotero, en prenant soin de faire une sauvegarde de vos données (voir ci-dessous) pour pouvoir revenir en cas de problèmes à la version antérieure
          • Si vous ne connaissez pas encore Zotero, je vous conseille de commencer ici

          Comment sauvegarder vos données ZOTERO?

          On m’a posé plusieurs fois la question récemment, donc voici les infos nécessaires pour sauvegarder vos données ZOTERO. Je suppose dans le suivant une utilisation de la version 2.0 finale

          1. Sachez que la fonction de synchronisation de la version 2.0 vous crée de fait déjà une sauvegarde sur le serveur ZOTERO. Vous pouvez même accéder à votre bibliothèque ainsi sauvegardé à partir de n’importe quel ordinateur connecté à internet en vous identifiant sur la page de zotero et en choisissant ‘My library’. Très pratique si on vous demande un renseignement bibliographique et que vous n’avez pas votre ordinateur habituel de travail sous la main. Plus d’informations sur la synchronisation
          2. Pour sauvegarder l’intégralité de vos données ZOTERO, vous devez d’abord localiser le répertoire ZOTERO crée par le plug-in. Par défaut il se trouve dans votre profil firefox et vous pouvez facilement le localiser en cliquant sur ‘Show Data Directory’ dans l’onglet ‘Advanced’ de la fenêtre de préférences ZOTERO. C’est tout ce répertoire qu’il faut sauvegarder – il contient l’ensemble de votre bibliothèque. Il suffit de quitter firefox et puis de copier le répertoire dans votre lieu de sauvegarde préféré (par exemple un disque dur externe). Tout cela expliqué en plus de détails sur le site de ZOTERO

          Les bonnes résolutions… ou comment mettre en place un système complet et automatique de sauvegarde

          De quand date votre dernière sauvegarde? D’il y a un an, quand un ami vous a raconté la catastrophe qu’était la mort subite de son disque dur? Nous connaissons tous l’importance fondamentale de bonnes sauvegardes des données personnelles et professionnelles – mais de là à en faire un réflexe régulier…?

          Heureusement il existe des solutions logicielles qui vous facilitent la mise en place d’un système de sauvegardes qui fonctionne automatiquement et sans que vous ayez à y penser de manière systématique. Avant de vous expliquer les détails, quelques idées générales sur des stratégie inadéquates mais répandues concernant la sauvegarde de données:

          1. Stocker des données uniquement sur un support extérieur.
          Imaginons que vous avez des notes informatiques des années antérieures de votre parcours. Si vous les transférez sur un disque dur externe et les supprimez de votre ordinateur, vous n’avez pas crée une sauvegarde. Le premier principe de la sauvegarde, c’est de créer de la redondance. Tant que les données n’existent pas à plusieurs endroits séparés, vous n’êtes en rien protégé – que ce soit contre une défaillance matérielle ou un cambriolage, par exemple.

          2. La sauvegarde sur un disque dur externe stocké avec l’ordinateur.
          Si vous faites des sauvegardes régulières sur un disque dur externe, c’est bien. Si vous le transportez tous les jours dans votre sac de cours avec votre ordinateur portable, vous comprenez bien qu’un simple vol de votre sac vous fera perdre à la fois vos données d’origine et la sauvegarde. Vous devez donc créer des sauvegardes sur des supports différents, stockés dans différents endroits. Dans l’idéal, par exemple avec une copie physique sur un disque dur chez vous et une autre copie sur un serveur en ligne (cf plus loin pour les détails).

          3. Une sauvegarde immédiate de tout fichier modifié (et rien d’autre)
          Il faut bien comprendre que la sauvegarde doit vous protéger de deux dangers: la perte de vos données par vol/destruction de votre matériel informatique (couverte par les points 1 et 2) et la corruption ou suppression par erreur de vos fichiers. Si tous les soirs vous faites une sauvegarde qui écrase la sauvegarde de la veille, vous comprenez bien que le fichier ‘sain’ dans votre sauvegarde sera très rapidement remplacé par la version corrompue lors de la prochaine sauvegarde. Il faut donc travailler avec plusieurs sauvegardes, par exemple une tous les soirs, une autre une fois par semaine, et une autre une fois par mois. Comme ca, on peut toujours revenir à une sauvegarde antérieure quand on se rend compte qu’un fichier est corrompu ou a été supprimé par erreur.

          Comment faire concrètement, alors?

          Les conseils que je viens de donner s’appliquent à tout utilisateur, quel que soit son système d’exploitation. Les détails suivants concernent en priorité les utilisateurs de Windows qui ne disposent pas de la solution de TimeMachine pour Mac. Nous sommes preneurs de conseils pour Linux dans les commentaires.

          1. Faire des sauvegardes redondantes et régulières sur un disque dur externe, par exemple à l’aide d’un logiciel comme SyncBack (version gratuite qui suffit pour la plupart des usages). Cet article décrit de façon très claire comment mettre en place une sauvegarde journalière, hebdomadaire et mensuelle de vos données.

          2. Ajouter une couche de sécurité en sauvegardant vos données les plus importantes en ligne aussi. Les offres gratuites sont la plupart du temps limitées en taille, mais devraient suffire pour sauvegarder vos documents les plus importants, les travaux en cours etc.

          Syncplicity, pensé à priori pour synchroniser des données à travers plusieurs ordinateurs, permet de facto aussi une sauvegarde commode, à la fois sur les serveurs de syncplicity et sur un autre ordinateur, si vous en avez un à votre disposition. Les fichiers sauvegardés par syncplicity sont accessibles à travers l’interface web et en cas de vol d’ordinateur, par example, il suffit d’installer syncplicity sur un autre ordinateur et de récupérer toutes les données sauvegardées. Dans la limite des 5GB le service est gratuit et il est même possible, dans certaines limites, de répondre aux exigences de la 3e contrainte ci-dessus. Un fichier supprimé sur l’ordinateur sera placé dans la corbeille de l’interface web de Syncplicity et donc récupérable. S’il s’agit d’un plus grand nombre de fichiers, il faut faire la demande à Syncplicity pour les récupérer.

          Dropbox fonctionne de manière un peu différente – il vous permet de créer un dossier qui sera synchronisé à travers autant d’ordinateurs que vous voudrez (même sur des systèmes d’exploitations différents) et également accessible via une interface web. C’est gratuit dans la limite des 2GB

          – Les véritables systèmes de sauvegarde automatique en ligne sont un peu plus lourds et couteux. Il s’agit, pour les plus connus, de Mozy (2GB gratuits, puis 5$ par mois pour une quantité illimitée de données) et de Carbonite (55$ par an pour une quantité illimitée).

          Voilà tous les conseils nécessaires pour prendre de bonnes résolutions de sauvegarde cette année et des logiciels pour vous aider à les tenir!