La veille informationnelle et ses outils (application dans le domaine juridique)

Un article de Wiki URFIST.

Rédacteur: Michel Roland (Veille numérique: mécanisme et outils)

ATTENTION: cet article rédigé pour le c2i niveau 2 "métiers du droit" en 2009 n'a pas été mis à jour depuis décembre 2010. Un certain nombre d'informations sont obsolètes, en particulier le service "Google Reader" n'existe plus et nous l'avons remplacé dans nos formations par l'application "Feedly". (150414)

Sommaire

[modifier] Veiller

On appelle "veille" le fait de se tenir au courant des informations pertinentes à un domaine défini. A la différence de la recherche d'informations, action ponctuelle, la veille est une activité continue. La recherche d'informations peut être une action de veille si elle est réitérée selon un principe périodique régulier.

[modifier] La veille en entreprise

Dans le domaine professionnel, le mot "veille" est utilisé d'abord en entreprise pour désigner une activité au service de l'innovation technologique et de la stratégie commerciale de celle-ci. Lorsqu'une taille critique pour l'entreprise est atteinte, elle est généralement assumée par un professionnel spécialisé au sein de l'entreprise: le veilleur-documentaliste ou chargé de veille.

L'Association des professionnels de l'information et de la documentation (ADBS) a défini ainsi le rôle de celui-ci:

Le veilleur-documentaliste alimente les décideurs d'une entreprise en informations sélectionnées et traitées en vue de les alerter sur l'évolution de l'environnement (technique, concurrentiel, économique, réglementaire, etc.) de l'entreprise et de les aider dans leurs prises de décision. [1]

[modifier] Les différents types de veille en entreprise

On distingue plusieurs types de veille dans le cadre de l'entreprise:

  • La veille stratégique (Strategic foresight), la plus générale qui couvre et synthétise les veilles particulières. Comme son nom l'indique elle informe les prises de décision stratégiques. Le concept de veille stratégique est pertinent aussi bien pour une administration ou pour un Etat.

Parmi les veilles sectorielles, les plus importantes sont:

  • la veille économique (Competitive intelligence), à quoi rattacher la veille concurrentielle,
  • la veille technologique (Technology forecasting),
  • la veille juridique (Legal research), à quoi rattacher la veille règlementaire et qui nous intéresse plus particulièrement ici.

On trouvera en outre, dans la littérature entrepreneuriale, définies d'autres types de veille nommées selon le domaine surveillé: veille commerciale, concurrentielle, d'opinion, environnementale, financière, médiatique, politique (ou institutionnelle), sociale, sociétale etc. [2]

[modifier] note: la traduction de "veille" en anglais

Le mot "veille" se traduit en anglais par watch, cependant comme on vient de le voir, il est, pour signifier le concept de veille informationnelle, d'usage moins régulier qu'en français, sans doute à cause d'homonymes beaucoup plus fréquents qu'en français, et on trouvera, pour traduire "veille", foresight (prévision, prospective), intelligence (renseignement, voire espionnage) ou research (recherche) selon que l'on voudra insister sur le but de l'activité, son résultat ou sa méthode.

Il est important d'être conscient de cette différence d'usage linguistique au moment de faire des recherches dans des sources anglophones[3].

[modifier] La veille dans le domaine juridique sur Internet

[modifier] Spécificités de la documentation juridique

La veille dans le domaine juridique et la veille personnelle pour les métiers du droit commence par la veille juridique au sens strict, à savoir la veille sur l'état et l'évolution du droit. Sur Internet ou sur papier, la documentation juridique possède un certain nombre de caractéristiques qui la distingue nettement des autres champs documentaires.

La documentation juridique distingue traditionnellement trois ensembles d'autorité décroissante:

  • la législation
  • la jurisprudence
  • les commentaires

Ces trois ensembles ne sont pas indépendants: les commentaires portent sur l'application (jurisprudence) de la législation. Une bonne information sur un objet juridique particulier doit donc intégrer les trois niveaux. D'où l'importance, avant le numérique, de publications à feuillets mobiles comme les jurisclasseurs.

Cette documentation est aujourd'hui produite sur support numérique en même temps que sur papier, néanmoins l'information juridique ancienne est loin d'être intégralement numérisée et une recherche juridique complète ne peut se dispenser de la recherche dans la documentation papier. L'exigence est plus pressante pour les démarches de recherche que pour la veille qui s'intéresse principalement à l'information fraîche. Cependant la veille déclenche souvent des recherches complémentaires pour éclairer ou compléter l'information récoltée[4]. Le veilleur sur Internet doit savoir qu'il peut avoir à aller dans une bibliothèque.

[modifier] sur Internet

La numérisation de la documentation juridique va permettre des traitements automatisés simplifiant l'accès à l'information juridique mais met le veilleur en face de deux risques qu'on peut définir selon les concepts classiques en théorie de l'information:

  • risque de bruit: la quantité d'information disponible "au bout des doigts" sur Internet expose à la sur-information et à la dispersion,
  • risque de silence: la facilité d'accès à l'information numérique tend à éliminer dans la pratique celle qui n'est disponible que sur papier, on verra que le même problème va se poser dans le champ même de l'information numérique: la visibilité de l'information qui se prête aisément aux techniques modernes de veille, comme la syndication[5] , tend à occulter celle qui est publié sur des sites moins dynamiques, or, dans le domaine juridique en particulier, un grand nombre, la majorité peut-être, des sources pertinentes appartiennent à cette deuxième catégorie.

Enfin, si les spécificités de la documentation juridique "colore" fortement une veille dans ce domaine, elle ne se limite pas à ce domaine. Le côté prospectif de la veille demande une écoute des sources qui reflètent la réflexion juridique et politique ainsi que ce qu'on appelle une "veille sociétale" sur l'état de l'opinion et des débats. Dans cette mesure elle inclut dans son champ de sources des sources comme les blogs et symétriquement les travaux de recherche publiés dans les revues scientifiques. Cette extension du champ de la veille accroit encore les risques de bruit ou de silence.

Le choix des outils et des stratégies de veille doit s'appliquer à limiter ces risques. Dans la suite de cette formation nous allons essentiellement nous appliquer à élucider la nature, le fonctionnement et les fonctionnalités spécifiques des différents outils disponibles pour le veilleur sur Internet de façon à permettre à ce dernier de déterminer ceux qu'il utilisera et leurs complémentarités. Mais si ces éclaircissements techniques et fonctionnels sont indispensables, pour éviter une dérive technologique, il est important de commencer, pour construire une veille efficiente, par définir les finalités particulières de son activité de veille.

[modifier] Construire sa veille

L'ambition de maintenir une connaissance en temps réel de l'état de l'information dans un domaine déterminé va affronter plusieurs risques: comme toute activité informationnelle (et comme évoqué ci-dessus) les risques de "silence" et le risque de "bruit" (manque d'efficacité). S'agissant d'une activité régulière, le facteur temps prend une importance plus grande que dans la cas de la recherche ponctuelle. Ce qui va se traduire par des risques pratiquement ressentis comme:

  • manque d'efficience: l'activité de veille prend trop de temps,
  • distraction, dispersion: l'activité de veille présente des résultats intéressants mais qui éloignent de l'objectif fixé,
  • sur-information: l'activité de veille est trop efficace! je suis noyé sous l'information, je n'ai pas le temps de la traiter.

Pour pallier ces risques, il convient en amont de définir une stratégie de veille: en définissant le plus précisément possible ses objectifs et en installant dans son environnement de travail les outils les plus performants au service de ces objectifs.

[modifier] poser ses objectifs de veille

D'abord poser ses objectifs de veille, c'est-à-dire:

  1. en formaliser les finalités: au sein d'une structure comme une entreprise ou un cabinet d'avocats, ces finalités vont être déterminées par la stratégie de l'organisation, ses domaines d'intervention privilégiés, dans le cas d'une veille personnelle à fin de formation continuée, elle sera déterminée par les compétences qu'on veut entretenir, la veille permettra aussi de déterminer quelles sont les compétences nouvelles à acquérir pour compléter les compétences acquises,
  2. définir les cibles informationnelles correspondant à ces finalités,
  3. préciser ces cibles en les mettant en mots.

Sur ce dernier point la veille va se situer en aval de la recherche documentaire. On a vu plus haut que la veille se distingue de la recherche d'information en ce qu'elle est continue où la recherche est ponctuelle. C'est dire que les mots, ceux que je vais utiliser pour une recherche ponctuelle sur un moteur de recherche ou sur une base de données, s'ils ont été pertinents pour celle-ci (s'ils m'ont ramené des résultats pertinents), vont être pertinents pour définir un objectif de veille.

J'ai intérêt à définir le plus précisément possible mes objectifs, sachant qu'il me sera toujours possible de redéfinir ces objectifs en fonction des résultats de ma veille: les élargir si mes sources / outils me donnent trop peu de résultats ("silence" informationnel), les préciser si au contraire j'ai trop de résultats peu ou pas pertinents ("bruit" documentaire).

Les objectifs peuvent être et sont souvent multiples et plus ou moins liés entre eux. Je peux vouloir me tenir au courant de l'actualité de la profession d'avocat et de l'évolution des accords commerciaux entre l'Europe et les Etats-Unis. J'ai intérêt donc à définir des objectifs de veille distincts qui peuvent être traités en même temps et par les mêmes outils mais qui le seront de manière clairement distincte.

[modifier] identifier les sources pertinentes

Les objectifs vont définir des sources correspondantes. Ici encore la veille se trouve en aval de la recherche informationnelle: les sources pertinentes pour la recherche seront des sources pertinentes pour la veille. Cependant les sources de la veille peuvent être plus nombreuses que celles de la recherche dans la mesure où les outils de la veille permettent de traiter des ensembles plus larges et plus flous que la recherche informationnelle. Par exemple je peux vouloir rester au courant de l'ambiance d'un certain milieu ou de la société en général sur certaines questions (veille sociétale), un agrégateur de flux va me permettre de parcourir rapidement des billets de blogs ou des actualités (un peu comme je parcourrais le journal du matin). C'est dans ce domaine que la veille se distingue par son champ de la recherche informationnelle.

[modifier] construire son environnement de travail, les outils de la veille

On va choisir ses outils en fonction de leur efficacité ET en fonction des sources. En effet toutes les sources ne sont pas susceptibles de traitement par tous les outils de veille. On les choisira aussi avec le souci d'en limiter le nombre ou de les rendre interopérables[6] en sorte de n'avoir pas à se disperser entre des interfaces de veille multiples. L'idéal serait de réaliser sa veille dans un environnement numérique de travail unique. Cet idéal reste cependant encore impossible et une veille complète ne peut se dispenser de recourir à la fois au courrier électronique et au web (à quoi rajouter un recours qui peut rester nécessaires aux sites web ou aux bases de données originales pour certaines sources très spécifiques).

Les outils de la veille vont d'abord être ceux qui permettent de recevoir l'information, les "oreilles" de la veille en quelque sorte. Mais ils doivent être complétés d'outils qui permettent de gérer les résultats de cette "écoute", outils de mémorisation et d'organisation de l'information.

[modifier] écouter

Le principe général des outils de veille va être d'automatiser des opérations réalisées au coup par coup lors de la recherche d'information ou de la consultation de sources. Pour utiliser les concepts de push et de pull utilisés en théorie de la communication, on peut dire qu'ils permettent de transformer du pull en ''push. Une communication est dite push lorsqu'elle vient à son récepteur "poussée" par l'émetteur, ainsi lorsque je regarde la télévision ou lorsque je reçois un courrier électronique; elle est dite pull lorsque c'est l'émetteur qui la "tire" à lui, ainsi lorsque j'achète un livre ou que je fais une recherche sur une base de données. On peut dire que les techniques spécifiques de veille combinent, à la différence de la recherche informationnelle, le push et le pull: je vais d'abord "tirer" des sources, des émissions d'informations pertinentes à mes objectifs pour qu'ensuite, automatisées, elles soient "poussées" vers moi sans qu'il me soit nécessaire de faire une opération spécifique, sans qu'il me soit nécessaire de la "tirer" à nouveau.

Les outils de veille par internet peuvent être de trois sortes:

  • ceux qui utilisent un logiciel dédié (desktop applications), il faut installer le logiciel sur son ordinateur pour pouvoir l'utiliser, ils sont de moins en moins populaires mais ils restent puissants et un certain nombre de produits commerciaux sophistiqués sont de cette sorte,
  • ceux qui utilisent le courrier électronique, ils présentent l'avantage de "l'information" sur une interface qui est un passage obligé d'un travail sur internet, en revanche ils risquent de venir mélanger les informations de veille à des informations qui impliquent un régime d'attention très différent[7],
  • ceux qui sont utilisés via un navigateur web, ce sont les outils au développement le plus récent, ils font partie de la famille des outils de ce qu'on appelle le web 2.0.

Les principales techniques de veille sont:

  • la réitération de consultation ou de recherche, c'est le niveau zéro, si l'on veut, mais certaines sources n'en permettent pas d'autre,
  • les listes de diffusion et les lettres d'information reçues par courrier électronique,
  • les alertes reçues également par courrier électronique,
  • les notificateurs de mise à jour de pages web (web monitoring), qui permettent de surveiller les modifications de pages qui ne proposent pas de flux de syndication,
  • les lecteurs / agrégateurs de flux de syndication qui permettent de tirer le meilleur parti des flux de syndication.

Cette dernière technique est la plus récente et la plus puissante. Cependant ni son principe, ni son utilisation ne sont intuitives. C'est pourquoi la plus grande partie de cette formation sera consacrée à cette technologie. Les autres techniques seront ensuite examinées dans leur complémentarité à la syndication.

[modifier] mémoriser

Il nous restera ensuite à considérer une autre catégorie d'outils pertinents pour la veille. En effet, il faut aux "oreilles" de la veille une mémoire, faute de quoi la veille se réduirait à une exposition passive à un flux et les techniques artisanales ne peuvent suffire face à l'ampleur de ce flux.

Les outils de mémorisation ne sont pas des outils de veille à proprement parler (sauf à les utiliser indirectement comme nous allons voir) mais ils constituent des compléments indispensables à l'équipement du veilleur.

[modifier] déléguer sa veille?

Et si je n'ai pas le temps de réaliser la veille dont j'ai besoin (malgré tous les outils que nous envisageons ici)? Puis-je déléguer ma veille?

[modifier] en interne (documentaliste)

Dans de nombreuses organisations, entreprises, cabinets d'avocats, etc. la veille est délégué à un personnel spécialisé, la veille est alors une des missions du documentaliste. Dans ce cas, la problématique de la restitution des outils de traitement des résultats de la veille devient très importante. Mais avec la formation tout au long de la vie, nous sommes évidemment dans un cas différent.

[modifier] "la méta-veille"

Même ainsi je peux déléguer ma veille à d'autres personnes, non pas directement mais en suivant leur propre activité de veille sur le web, en utilisant ce qu'on appelle la dimension "sociale", de partage, du web 2.0.

  • d'abord en incluant dans mes sources des veilleurs. C'est très souvent le cas même lorsque je ne m'en rends pas compte: les actualités d'un portail juridique réalisent une opération de veille, les blogueurs sont généralement des veilleurs pour leur propre compte, etc.
  • plus spécifiquement en utilisant les outils de mémorisation d'autres veilleurs, je n'écoute pas les sources primaires mais les résultats de la veille de personnes que j'ai identifiées comme ayant des objectifs de veille analogues aux miens,
  • pour les veilles les moins spécifiques et qui correspondent aux intérêts d'un milieu, je peux utiliser un réseau social, comme Facebook ou l'outil de micro-blogging Twitter.

Pour le veilleur individuel qui tient à rester à jour sur ses domaines de compétences les techniques de "méta-veille" sont précieuses dans les périodes où sa disponibilité en termes de temps et d'attention est moindre qu'à l'ordinaire.

[modifier] Les techniques de veille électronique

La numérisation de la documentation et l'inflation de l'information disponible en ligne, sur Internet essentiellement, ont eu pour conséquence la mise au point et le développement de techniques spécifiques qui s'éloignent de plus en plus d'une simple automatisation des procédures utilisées pour la documentation publiée sur papier.

La technique de veille aujourd'hui la plus spécifique repose sur une technologie connue sous l'acronyme "RSS". Nous verrons que cette désignation, bien que populaire, est trompeuse et qu'il vaut mieux parler de "syndication"[8]. Parce que cette technique est la plus efficace, que ses usages dérivés sont multiples et nombreux et parce que son appréhension n'est pas évidemment intuitive, nous allons lui consacrer l'essentiel de cette partie. Il faut cependant garder à l'esprit qu'elle ne suffit pas à couvrir tous les besoins de veille, qu'à côté d'elle existent d'autres techniques de veille, certaines plus simples, d'autres plus complexes, intégrant éventuellement comme moment du processus la syndication. Aussi, après avoir marqué et caractérisé les limites de la syndication, nous examinerons d'autres techniques qui viennent la compléter au sein d'une stratégie de veille cohérente[9]

[modifier] La syndication (RSS)

Logo
Logo

L'acronyme RSS désigne une famille de formats XML utilisés pour la syndication de contenu Web. Il est couramment utilisé pour désigner la technologie de syndication de contenu web dans son ensemble.

Cette habitude a plusieurs inconvénients graves:

  • il existe un format populaire de syndication qui ne fait pas partie de la famille RSS: Atom, qui fonctionne selon les mêmes principes;
  • il existe des différences importantes entre les différents formats RSS (RSS 2.0 est plus proche d'Atom que RSS 1.0);
  • selon les différents versions de RSS, l'acronyme se développe différemment;
  • l'utilisation même d'un acronyme donne à cette technologie une connotation très technique et ésotérique qui semble la réserver à une petite caste d'initiés.

Nous reviendrons plus tard sur les formats. Pour l'instant retenons qu'il vaut mieux parler de "syndication" que de "RSS" et que la plupart du temps, hors littérature technique spécialisée, lorsqu'on trouve "RSS", c'est de syndication qu'il s'agit.

[modifier] La syndication: qu'est-ce?

La syndication, c'est le fait de publier un contenu à différents endroits, sur différents supports et sous différentes formes, en particulier à un endroit différent de celui pour lequel ce contenu a été originellement conçu (généralement sous une forme abrégée, voire sommaire).

[modifier] Origine: la syndication dans la presse et les médias

Dans le champ des médias, la syndication désigne le processus par lequel un contenu, offert sous forme de flux, est distribué sur différents supports qui n'ont pas participé à sa production. Les supports achètent le droit de publication de ce contenu qui vient ensuite se mettre à jour automatiquement sans qu'un acte commercial individuel soit nécessaire, on parle d'"abonnement" (subscription). Ce mécanisme est utilisé notamment dans la presse (éditoriaux, bandes dessinées...), pour les chaînes télévisuelles (séries TV...) et sur le web pour les sites commerciaux, de journaux en particulier (mais comme on va le voir le mécanisme de la syndication se généralise avec des caractéristiques particulières).

Exemple:

Le quotidien X est abonné au comic "Dilbert" auprès d'United Features Syndicate. Dans son édition du 16 septembre, dans la page où sont publiés les comics est publié la bande du 16 (seconde ci-dessus), le lendemain, c'est celle du 17 qui est publié sans que celle-ci ait fait l'objet d'un acte d'achat particulier. Et ainsi de suite.

Quelques caractéristiques qu'on retrouvera pour la syndication de contenu web:

  • le contenu acheté a la forme d'un flux, c'est-à-dire la réitération, en principe périodique, d'un contenu renouvelé sous une forme homogène. On parle d'"abonnement": lorsque je m'abonne à un périodique, journal ou magazine, je n'achète pas un exemplaire particulier mais un "flux" continu d'exemplaires pour une période déterminée;
  • le contenu est produit indépendamment du support sur lequel il sera publié; lorsqu'un contenu a été contenu pour un support particulier, on parlera de syndication dans le cas où il sera vendu pour être publié sur un support différent de son support d'origine.

[modifier] Qu'est-ce que la syndication de contenu web?

La syndication de contenu web est une procédure qui permet de publier partiellement ou en totalité le contenu d'un site sur d'autres sites. L'usage le plus important de cette procédure a pour but d'amener sur un site de référence de l'information glanée à différents endroits du web et de permettre ainsi à l'utilisateur de prendre connaissance des mises à jour en un lieu unique au lieu d'avoir à se rendre sur les différents sites d'origine.

Elle se fait par l'abonnement à un "flux de syndication" proposé par le site d'origine du contenu.

[modifier] Pratiquement, comment ça se passe?

[modifier] je repère un contenu intéressant dont je vérifie qu'il propose un flux de syndication

Une icône /logo signale la présence d'un flux de syndication dans la fenêtre d'adresse (URL) de la page web lorsque le flux de syndication a été repéré automatiquement par le navigateur. Pour ce navigateur (Firefox 3), l'icône est le petit carré bleu figurant des ondes qui est à droite dans la fenêtre de l'adresse[10].

Cependant le navigateur peut échouer à reconnaître des flux de syndication effectivement proposés par le site visité. Ils sont repérables par différentes icônes placées sur la page web ou simplement par les mots "RSS" ou "syndication" ou "feeds" ou encore "XML" (liste non limitative).

Dans le cas d'un blog, et plus généralement d'un site réalisé avec un outil de gestion de contenu web, un flux de syndication est à peu près toujours proposé.

[modifier] je m'abonne par l'intermédiaire de mon navigateur

Les navigateurs modernes proposent une procédure automatique de syndication, paramétrable (choix du lecteur). Il est cependant toujours possible, en particulier dans les cas où, pour une raison ou pour une autre la procédure automatique échoue, de réaliser l'abonnement "à la main" par un copier/coller de l'URL du flux de syndication dans une fenêtre dédiée du lecteur de flux (cf. infra).

Ici, nous suivons la procédure automatique, dans un navigateur Firefox 3 et avec le choix préalable de Google Reader comme lecteur-agrégateur.

J'ai cliqué sur l'icône bleue et se déroule une liste.

J'ai le choix entre deux utilisations possibles du flux de syndication: soit en "live bookmark" dans le navigateur ou sur delicious (il se comporte alors comme un dossier de favoris mis automatiquement à jour), soit, et c'est ce qui nous intéresse ici, pour abonnement. Par ailleurs peuvent être proposés plusieurs formats de fichier de syndication. Pour l'usage courant, la différence entre les différents formats est de peu de conséquence[11]. Enfin une même page peut proposer plusieurs syndications: typiquement deux sur un blog, comme ici: une syndication du contenu principal et une syndication des commentaires, d'autres types de sites peuvent en proposer un nombre beaucoup plus grand, les sites de quotidiens par exemple.

Ici, nous sélectionnons le premier choix proposé qui correspond à l'abonnement au contenu principal du blog sous le format RSS 2.0.

Le navigateur m'ouvre alors une page qui me présente le contenu du flux de syndication à l'instant t où j'ai requis l'abonnement. Il est important de vérifier que le contenu présenté correspond bien au contenu souhaité avant de continuer la procédure (il n'est pas rare qu'on ait, sur certains sites, comme Wikipedia, par exemple, une mauvaise surprise).

Il faut noter que ce qui est présenté ici n'est pas une page html normale mais l'interprétation de la page XML de syndication par un lecteur de flux de syndication intégré au navigateur.

Le menu déroulant me présente les principaux outils de lecture de flux de syndication. Je peux choisir une apllication non-prédéfinie et la rajouter à la liste.

Je peux en cliquant sur la case carrée demander au navigateur de sauter désormais cette étape et de toujours utiliser Google pour m'abonner. Cette simplification est dangereuse dans la mesure où je saute alors l'étape de vérification de la pertinence du flux proposé. Il ne m'est plus possible non plus de changer de choix d'outil de lecture. Je peux à tout moment revenir en arrière, restituer cette étape en passant par les préférences de mon navigateur.

L'écran suivant me donne le choix entre les deux outils de lecture / agrégation que propose Google pour les flux de syndication (ce qui correspond aux deux types d'outils les plus courants): l'un qui va publier les flux sur une page d'accueil (homepage) personnalisée dans des widgets (window gadgets, des petits cadres ou fenêtres qui viennent se placer dans une page web pour y accomplir certaines tâches ou y publier certain contenu, ici un flux de syndication), l'autre qui va mettre les flux dans les dossiers et permettre de lire l'ensemble des flux contenus dans un dossier, ou tous les flux ensemble comme un seul flux. Si le premier outil permet une vue panoptique d'un ensemble restreint, le deuxième est plus puissant pour la consultation, la gestion et le traitement d'un grand nombre de flux.

Dans l'exemple que nous suivons, c'est la deuxième méthode, "Google Reader", que nous choisissons.

Le choix "Google Reader" cliqué, une nouvelle page s'ouvre où le flux est affiché dans Google Reader.

[modifier] je classe le flux dans mon agrégateur

Une dernière étape me permet, par le menu déroulant "Feed settings" d'assigner le flux nouvellement abonné à un dossier, ici "blogs juridiques". Si aucun des dossiers créés jusqu'à présent ne me convient, je peux créer un nouveau dossier. Le choix se trouve tout en bas du menu déroulant.

IMPORTANT: on tend naturellement à créer des dossiers regroupant les flux selon leur contenu. Cependant une autre logique de regroupement, à partir du moment où le nombre de flux abonnés devient important, s'avère plus performante pour régler le "régime d'attention", c'est-à-dire pour correspondre au degré d'attention (temps + disponibilité d'esprit) mobilisable, c'est le rangement des flux dans des dossiers organisés selon un principe de priorité. Je vais créer un dossier regroupant les quelques flux qu'il faut absolument que j'ai lus dans un période donnée, correspondant à la périodicité de mon activité de veille (chaque jour ou chaque semaine...). Google Reader permet de classer le flux dans plusieurs dossiers. Je vais donc classer umes flux selon une double logique: selon son continu et selon sa priorité. Comme Google Reader liste les dossiers alphabétiquement, je vais intituler numériquement mon ou mes dossiers prioritaires (je ne les multiplie pas: un ou deux, éventuellement répétés si j'ai plusieurs objectifs de veille bien distincts, voir sur l'exemple [12]), de façon à ce qu'ils se placent en tête de liste.

Je suis désormais abonné à ce nouveau flux que je viendrai lire avec ceux précédemment abonnés au moment de faire ma veille.

[modifier] je lis le flux dans mon agrégateur

Je vais généralement consulter les flux auxquels je suis abonné au niveau du dossier dans lequel je l'ai rangé. Par défaut je ne ferai apparaître des flux que les éléments (items) nouveaux, ceux que je n'ai pas encore lus / consultés. Les différents flux contenus dans un dossier sont fusionnés et apparaissent comme un seul flux.

Je peux toujours faire apparaître (comme dans l'exemple ici) les items déjà consultés et les flux sans éléments nouveaux. Les dossiers vides sont en maigre, derrière l'intitulé de chaque dossier le nombre entre parenthèses indique le nombre d'items non lus restant dans le dossier. Je peux également choisir de n'afficher qu'un flux individuel (alors réapparaît le menu "feed settings" qui me permet de modifier les paramètres du flux et en particulier de me désabonner.

[modifier] automatiquement mon agrégateur va marquer mon flux comme lu

Lorsque je suis en mode extended comme ci-dessus (c'est-à-dire lorsque l'ensemble du contenu du fichier de syndication est affiché item par item), chaque élément est automatiquement marqué comme lu lorsqu'il a été affiché.

Lorsque je dois parcourir un grand nombre d'items en peu de temps, soit que j'ai dû interrompre ma veille et que je la reprends, soit que je consulte des dossiers de moindre priorité, je peux passer en mode liste. Alors ne sont affichés que les titres des items avec leur provenance.

En ce cas ils ne sont marqués comme lus que si je les ouvre pour en découvrir le contenu. De cette manière je peux n'ouvrir que les items dont le titre m'aura suggéré que le contenu pourrait m'intéresser.

Les items lus sont en maigre dans la liste.

Il est possible de marquer comme lus l'ensemble des items d'un dossier par une action unique.

[modifier] je traite les informations pertinentes trouvées dans mes flux - et je peux partager ma veille

Au bas de l'affichage de chaque item dans Google Reader, une ligne de commande permet de traiter les items.

Je peux:

  • le mémoriser en un clic dans:
    • Google Reader lui-même (il paraîtra ensuite dans la liste de suivi accessible par le menu de gauche)
    • dans Google+ (et éventuellement le publier sur mon profil Google+)
    • dans Pocket, un outil de mémorisation (bookmarking) simple (sans tagging)
  • envoyer un courriel pour communiquer cet item à quelqu'un d'autre,
  • le partager en l'envoyant à différents comptes /outils comme
    • des réseaux sociaux:
      • Facebook
      • Twitter
    • des blogues:
      • Blogger
      • Wordpress (à rajouter aux sites prédéfinis)
    • des gestionnaires de signets:
      • delicious
      • diigo (à rajouter aux sites prédéfinis)
  • enfin modifier ses "étiquettes" (tags): tous les items portent comme étiquette(s) le nom du ou des dossiers dans lesquels le flux dont ils font partie a été classé mais il est possible de rajouter une ou des étiquettes aux items individuels, ces tags rajoutés vont créer des dossiers où ce ne sont plus des flux qui sont regroupés mais des items, des éléments de flux.

[modifier] Qu'est qu'un "flux" de syndication web?

Concrètement, un "flux" ou "fil" de syndication (anglais: feed[13]), c'est une suite de fichiers XML dont chacun décrit le contenu (et non la mise en forme de ce contenu) d'un même site ou d'une même partie d'un site à l'instant t. Typiquement le flux sera mis à jour, c'est-à-dire qu'un nouveau fichier pour l'instant t+1 sera généré, chaque fois que le contenu aura été modifié.

(La syndication de contenu web n'est en réalité qu'une application particulière de la technologie XML appliquée au transfert de données sur le web.)

[modifier] XML

"XML" vaut pour eXtensible Markup Language, "langage de balisage extensible". Bien que le mot "language" apparaisse dans son intitulé et que conséquemment XML soit couramment défini comme un langage informatique, cette qualification peut induire en erreur. Un langage, au sens courant du terme, requiert des règles de formation, une grammaire, et une sémantique, un vocabulaire. Dans cette mesure HTML peut être dit un langage puisqu'il me donne à la fois un vocabulaire et des règles de composition qui me permettent de créer des pages web directement "comprises" par mon navigateur. XML ne se donne pas de sémantique a priori, c'est ce qui le rend extensible, il ne définit que des règles de composition. Pour qu'un fichier XML puisse être compris, il doit être composé suivant un "vocabulaire" particulier, un format ou "DTD (Document Type Definition ou "Définition de Type de Document") connu du "lecteur" ie de l'application qui va utiliser le fichier. Atom ou les différentes versions de RSS sont de ces formats XML, certains lecteurs ne les connaissent pas tous. Ainsi il vaudrait mieux parler à propos de XML de "métalangage" ou de syntaxe ou encore de méthode.

Les applications de la technologie XML sont nombreuses, principalement pour le transport de données et l'interopérabilité entre diverses applications mais aussi pour l'archivage.

[modifier] Billet sur le blog et dans Google Reader

La version d'un billet de blog tel qu'affiché dans le lecteur / agrégateur Google Reader. Le contenu du billet original peut-être affiché intégralement dans l'agrégateur ou seulement partiellement. Pour le vérifier, je clique sur le titre du billet pour ouvrir le billet sur son site d'origine.

La "quantité de contenu" du billet affichée par le lecteur de flux est très variable. Elle dépend de deux types de facteurs:

  • en "amont", du côté de la production du contenu,
    • le flux est paramétré pour recevoir plus ou moins de contenu. Typiquement, le producteur pourra souhaiter ramener le plus possible de lecteurs sur le site original: dans ce cas il n'incluera qu'une petite partie du contenu dans le flux, un résumé, le début du billet ou le titre du billet seul, au risque de diminuer le nombre d'abonnement à un fil jugé pauvre. La plupart des outils de gestion de contenu web permettent de paramétrer la quantité de contenu incluse dans le flux;
    • généralement le flux d'un blog publie le contenu de la page d'accueil du blog où viennent se publier en ordre chronologique inverse les billets; l'auteur du billet peut choisir de "couper" le billet et d'en réserver une partie, qui peut être importante, sur la page particulière du billet; dans ce cas le flux n'inclut généralement que la partie du billet publiée en page d'accueil; de même le contenu ajouté que sont les commentaires, soumis à leur propre rythme de publication, ne sont pas inclus dans le flux principal du blog; dans la plupart des cas, ils bénéficient de leur propre flux;
  • en "aval", du côté de la réception du contenu: tous les lecteurs de flux ne vont pas extraire de la même manière du contenu des flux qu'ils traitent, grand nombre de widgets[14] ne publient que le titre de l'item et un lien vers le site d'origine, les lecteurs-agrégateurs permettent un affichage succint et un affichage le plus complet possible.

Et bien sûr l'environnement du contenu, mise en forme et contenus marginaux, ne se trouvent que sur le site d'origine.

[modifier] Code HTML du billet

On affiche le code source des pages affichées dans le navigateur Firefox par la commande Affichage > code source de la page (ou cmd / ctrl U). Le code source s'affiche alors dans une nouvelle fenêtre.

Les balises HTML donnent des informations, techniques et de contenu sur la page, puis mettent en forme le contenu qui sera publié.

En réalité le format utilisé ici n'est pas du HTML simple mais du XHTML (Extensible HyperText Markup Language), c'est-à-dire une version de HTML conforme à la "grammaire" XML.

Le contenu principal du billet occupe une partie relativement restreinte de la page de code (observer l'ascenseur sur la barre de défilement à droite).

[modifier] Le fichier de syndication

Si je clique sur l'icône bleue (comme au cours de la procédure supra), mon navigateur affiche le fichier de syndication. J'affiche le code source du fichier de syndication qui reflète le contenu du blog tel que mis à jour au moment où je l'affiche (bien distinguer le flux ou fil, feed, du fichier XML lui-même: c'est la suite dans le temps des fichiers de syndication, publiés à la même adresse, qui constitue le flux).

On constate certaines similitudes et certaines différences avec le fichier HTML[15]:

Similitudes:

  • organisation générale du fichier
  • utilisation de balises
    • ouvrantes: <balise>
    • fermantes: </balise>
    • ouvrantes-fermantes (ou vides): <balise/>

Différences:

  • contenu différent des balises
    • pas de balisage de mise en forme (sauf code html entre les balises <content>)
    • les balises spécifient la nature du contenu qu'elles encadrent
  • compacité beaucoup plus grande du fichier
  • plus grande "lisibilité" du fichier

A la différence du code HTML (ou XHTML) où le contenu des balises est pré-défini, XML ne définit pas le contenu de ses balises, je pourrais écrire <titre> ou <toto> à la place de <title>, à condition que la balise <toto> soit fermée par une balise </toto>, le fichier serait un fichier XML correct. C'est le format Atom, défini en tête de fichier) qui va définir le contenu des balises (le vocabulaire).

L'extrait ci-dessus souligne les éléments principaux de ce balisage. On remarque en particulier que le fichier est daté (balise "<updated>"), ce qui lui permet de prendre sa place dans un flux.

On donne ci-dessus deux copies d'écran affichant un fichier de syndication en format RSS 2.0. Une comparaison avec le fichier Atom montre que si le contenu et l'organisation des fichiers sont analogues, le "vocabulaire", le contenu des balises est différent. Pour la plupart, elles sont suceptibles d'une "traduction" d'un format dans l'autre.

[modifier] Multipublication du flux

Le flux peut être publié sous différentes formes en différents endroits: dans des widgets sur une page d'accueil personnalisée comme iGoogle ou Netvibes, dans un lecteur-agrégateur sophistiqué comme Google Reader mais aussi bien dans un widget de blog ou d'autre outil de gestion de contenu web, dans un article de wiki, etc...

[modifier] La syndication de contenu: une pratique du web 2.0

[modifier] les formats

Les formats de syndication se distinguent essentiellement quant à la richesse des métadonnées incluses et corrélativement quant au ambitions sous-jacentes. Ces différences apparaissent dans les développements de l'acronyme RSS selon les diverses versions.

  • RDF Site Summary pour RSS 0.90 and 1.0,
  • Rich Site Summary pour RSS 0.91 à 0.94
  • Really Simple Syndication pour RSS 2.0.

Cette diversité recouvre deux lignes de formats: 0.90 et 1.0 veulent intégrer le modèle de graphe RDF (Resource Description Framework), langage de base du web sémantique, soit un format ambitieux, 0.91 à 0.94 et 2.0 à quoi rattacher (avec un vocabulaire de base différent mais une structure analogue) Atom sont plus simple et orienté non vers de possibles applications sémantiques mais vers l'usage qui se développe exponentiellement entre 2000 et 2003 à savoir la syndication. Ainsi, malgré les apparences, le format 2.0, le plus récent, est plus proche de 0.91 que de 1.0. Son développement de l'acronyme, Really Simple Syndication, atteste de cette ambition pragmatique, adapté à un usage massif.

Pour les besoins pratiques de la veille, ces précisions sont de peu d'importance: les différents formats se comportent de façon analogue voire identique pour les lecteurs agrégateurs de flux. Le seul problème de format qui peut se poser est l'incompatibilité d'Atom pour certains lecteurs.

[modifier] adoption

Le premier graphique montre l'évolution du nombre de flux de syndication produits entre 2001 et septembre 2009. Il montre une progression extrêmement rapide, exponentielle entre 2001 et 2005. Au cours de l'année 2005 la progression se ralentit fortement sans s'arrêter néanmoins. La première période correspond à la vulgarisation de la technologie et aussi à l'arrivée des outils de gestion de contenu web ("blogosphère", 2002 - 2003) qui, en raison de leur technologie, vont tous produire des flux de syndication générés automatiquement.

La seconde courbe qui montre l'évolution du nombre d'utilisateurs de flux de syndication présente un profil très différent. Si l'on a bien une progression exponentielle, moins spectaculaire, dans les mêmes années et pendant un peu plus d'une année ensuite que celles de la progression exponentielle de la production de flux, malgré un ralentissement modéré fin 2006

Si l'on a bien une progression exponentielle dans les premières années (2001-2006), elle est moins spectaculaire que celle de la production et ensuite, malgré un ralentissement modéré, elle continue de façon linéaire sur un rythme important.

Ces deux graphiques montrent que si la syndication est entré dans une phase de maturité quant à l'offre (mais ce serait à nuancer, voir infra), elle est loin d'avoir fait le plein du côté de l'usage. La vigueur maintenue de sa courbe d'adoption atteste que cet important retard de la demande sur l'offre tient moins à une inadaptation de la technique aux besoins ou aux usages de ses utilisateurs potentiels qu'à sa nature peu intuitive et à la nécessité d'une initiation pour l'utilisateur moyen.

Au vu des chiffres il peut sembler que la syndication n'ait plus quant à la production, à la différence de l'usage, de nouveaux territoires à conquérir. L'approche quantitative est ici trompeuse, une approche qualitative montrerait qu'en réalité les flux de syndication manquent encore massivement sur des catégories sites où ils seraient utiles, où ils sembleraient à première vue indispensable: catalogues de bibliothèques, bases de données (voir infra l'état de l'offre), sites officiels (le Journal Officiel par exemple), etc. Dans ce domaine comme dans d'autres sur le web, les sites non officiels, non professionnels, à usage individuel et / ou privé plutôt que professionnel, sont souvent en avance et plus efficace, et c'est plus vrai encore en France que d'en d'autres pays d'importance comparable.

[modifier] syndication et gestion de contenu web
Gestion de Contenu Web
Gestion de Contenu Web

Comme on vient de le voir la popularisation de la syndication est liée au développement des outils de gestion de contenu web (CMS: Content Management System). On désigne par ce nom un ensemble d'applications web, bâties autour des mêmes principes technologiques, qui facilitent la publication sur le web. Ce sont, en particulier:

  • les blogs, où le contenu est organisé en billets publiés sur la page d'accueil du site en ordre anté-chronologique (le plus récent sur le dessus), chaque billet ayant sa page propre;
  • les wikis, à finalité d'écriture collaborative, où le contenu est organisé en pages ou articles organisés en réseau par des liens internes, caractérisés par la facilité d'écriture et la perméabilité entre la fonction de lecture et la fonction d'écriture, lae plus célèbre est bien sûr Wikipedia mais dont les applications possibles sont nombreuses et encore sous-exploitées;
  • les autres outils de gestion de site ou CMS au sens restreint, qui visent à intégrer toutes les fonctions d'un site web classique de type portail en particulier.

Ces outils, on parle de moteurs[16], peuvent être hébergés "dans les nuages", c'est-à-dire sur les serveurs de l'application, ou bien ils peuvent être installés par l'utilisateur sur un serveur sur lequel il a la main. Le premier cas est le plus confortable pour l'utilisateur qui ne se préoccupe de l'application que pour la paramétrer selon des choix préparés par l'application mais sa liberté est limitée. Le second cas symétriquement permet un plein contrôle de l'application mais demande à l'utilisateur de posséder ou de pouvoir disposer de compétences informatiques.

Le schéma ci-contre[17] montre comment gestion de contenu et syndication web sont liés. Dans la partie haute du schéma est rappelée la chaîne de production du contenu en HTML statique, la manière "web 0.1" si l'on veut: je réalise une page web sous forme de fichier HTML à l'aide d'un éditeur de texte ou plus souvent d'un logiciel d'édition web comme DreamWeaver ou FrontPage. Lorsque je suis content de ma page, je la charge, via FTP (File Transfer Protocol) sur le serveur web de mon site pour lequel j'ai les autorisations nécessaires. Lorsqu'un internaute va vouloir lire ma page, mon navigateur, via HTTP (HyperText Transfer Protocol), va aller copier le fichier depuis le serveur web sur son disque dur puis l'interpréter et l'afficher de façon lisible pour l'internaute.

Cette méthode, où le contenu et sa mise en forme sont codés en même temps dans le même fichier, exige une double compétence, HTML et FTP (compétence technique et compétence en terme d'autorisation: l'accès FTP est sensible) qui ne peut être générale. Elle correspond à la grande époque des webmasters, soient les personnes qui au sein d'une organisation possédaient cette double compétence. La première fonction des outils de gestion de contenu web va être, en séparant la gestion de la forme de la gestion du contenu, de séparer compétence technique et compétence éditoriale et d'élargir ainsi considérablement la base humaine de production de contenu web.

Les moteurs d'outils de gestion de contenu fonctionnent pour leur presque totalité à l'aide d'un gestionnaire de base de données (MySql par exemple) et d'un langage de script (PHP par exemple). Lorsque je veux publier du contenu sur le web, sur un blog par exemple, je vais me connecter sur l'interface web d'administration du blog en m'identifiant, je vais ensuite entrer du contenu dans un formulaire comportant plusieurs cadres: un pour le titre du billet, un pour le texte du billet, un autre pour les tags ou étiquettes, sortes de mots-clés décrivant le contenu de mon billet, etc. Lorsque je sauvegarde mon billet pour publication, ces différents éléments vont être envoyés dans une base de donnée, dans des champs correspondant aux fenêtres de saisie du formulaire. D'autres champs sont alimentés automatiquement: un champ "auteur" puisque je me suis identifié avant de saisir le contenu de mon billet, un champ "date" correspondant au moment où je sauvegarde mon billet. Ensuite un fichier de script va extraire de la base et mettre en ordre les données correspondant au contenu du billet, ces données vont être mises en forme selon une feuille de style CSS valable pour tous les billets du blog. Le fichier HTML correspondant à la page d'accueil va être mis à jour (le nouveau billet placé en tête, au-dessus des précédents) et une nouvelle page est crée pour le billet. Ainsi le code HTML, qui va pouvoir être lu par l'internaute, n'est produit qu'à la fin du processus.

Pour publier je n'ai plus besoin de compétence HTML ni de droits d'accès au serveur, tout ce qui m'est nécessaire, c'est de m'identifier comme personne habilitée à écrire sur le site. Mais cette nouvelle méthode a une autre conséquence, moins apparente mais tout aussi voire plus importante: en faisant passer le contenu par une base de données et en le répartissant à cette fin dans des champs, je donne des informations sur la nature des contenus que je publie. Et l'application va pouvoir, à l'aide d'un fichier de script particulier, extraire le contenu de mon site et le publier sans renseigner sa mise en forme particulière sur son site d'origine mais en renseignant la nature des différents segments qui le compose. Ce fichier, automatiquement produit par l'application chaque fois qu'un nouveau contenu est ajouté, c'est le fichier de syndication qui va pouvoir être lu sur d'autres sites que son site d'origine dans différents formats correspondants à ces nouveaux sites[18].

Syndication et gestion de contenu web ont ainsi partie liée et ces deux technologies sont à la base de la mutation des pratiques de l'internet qu'on a appelé à la suite de Tim O'Reilly le "web 2.0".

[modifier] La syndication: les outils

[modifier] Lire ses flux

Dans les exemples ci-dessus nous avons déjà rencontré les deux principales méthodes de lecture de flux: soit par le biais de widgets sur une page d'accueil personnalisée, soit dans un lecteur-agrégateur spécialisé.

[modifier] Widgets: pages personnalisées

Chaque flux est publié individuellement dans une petite fenêtre sur la page. Cette méthode présente l'avantage de présenter une vision panoptique d'un ensemble de flux. Ses limites apparaissent vite lorsqu'il faut gérer un grand nombre de flux: les widgets placés "au fond" de la page et qui ne sont accessibles que via l'ascenseur de la page web échappent à cette vue panoptique et tendent à être négligés. Il est possible de limiter le nombre de widgets par écran en multipliant les onglets mais cela aussi trouve assez vite sa limite.

Il existe d'autres page d'accueil fonctionnant sur le même principe: iGoogle, Mon Yahoo... Elles sont cependant moins efficaces pour le traitement des flux de syndication. De plus Netvibes permet de créer une page publique qui permet de partager sa sélection de flux de syndication.

Une fonction de iGoogle est cependant intéressante pour la veille: il est possible d'y installer un widget dédié à Google Reader qui va afficher les premiers items d'un dossier GR (par exemple le dossier des flux prioritaires, cf. supra) en sorte de pouvoir y jeter un coup d'oeil chaque fois qu'on revient sur sa page d'accueil.

[modifier] Lecteurs-agrégateurs

Nous avons déjà vu le fonctionnement de Google Reader lors de l'examen de la procédure d'abonnement ci-dessus. Les outils de ce type permettent de ranger les flux dans des dossiers et ensuite de consulter ses flux à plusieurs niveaux: au niveau du flux individuel, au niveau du dossier et au niveau de l'ensemble des flux. Le premier lecteur-agrégateur web de ce type a été Bloglines mais il est petit à petit distancé par Google Reader au fur et à mesure que celui-ci ajoutait d'utiles fonctions supplémentaires.

Signalons-en deux qui contribuent sans doute à ce que Google Reader soit aujourd'hui le lecteur le plus populaire pour les veilles qui traitent un grand nombre de flux.

  • Moyennant l'installation de Google Gears dans le navigateur, il est possible de faire fonctionner GR off line lorsqu'on ne peut pas rester connecté à Internet. Pendant qu'on est connecté sur le net, en cliquant sur un bouton dans l'interface de GR on charge sur son disque dur les 2000 items les plus récents de ses flux (pour économiser l'espace occupé et accélérer la copie, les images ne sont pas chargées). Ceci fait il deviendra possible de lire ses flux sans être connecté (dans le train par exemple). Lorsqu'on a nouveau connecté à Internet, on rebascule en mode on line. GR fonctionne alors comme une application de bureau et rattrape ainsi le principal avantage concurrentiel de ceux-ci (cf. infra). Les opérations réalisés hors ligne (marquage des items comme lus, partage ou sélection en favori...) vont alors être reportées sur le compte web.
  • Google Reader intègre une fenêtre de recherche qui peut porter sur tous les flux, sur un sous-ensemble (items en favoris, partagés...) ou sur un dossier particulier, elle peut porter également sur les flux de ses contacts. Cette fonction rend utiles même les flux qu'on n'a pas le temps de consulter et transforme une sélection de flux de syndication en sous-ensemble choisi du web.

Les outils de ce type ont d'abord existé comme applications de bureau (desktop apps), c'est-à-dire de logiciels indépendants du navigateur à installer sur son ordinateur. Il existe toujours une offre, gratuite ou commerciale, pour ces outils souvent efficaces et puissants, citons: Feedreader, RSSBandit, FeedDemon pour Windows ou Vienna pour Mac OS.

L'avantage principal de ces applications est qu'elles permettent de travailler hors ligne: les items sont conservés sur le disque dur. Nous venons de voir que la fonction "off line" de Google Reader relativise cet avantage.

Un autre avantage serait qu'à déconnecter la lecture des flux de la consultation du web sur son navigateur habituel[19], une application de bureau aide le veilleur à gérer son attention. Evidemment l'intégration de différents outils autour de la veille, tels les outils de mémorisation ou de partage.

[modifier] autres lecteurs

Plusieurs logiciels de courrier électronique permettent d'intégrer la lecture des flux de syndication, ainsi Thunderbird ou le client Mail de Mac OS. Ils fonctionnent alors de façon analogue aux applications de bureau avec en général des fonctionnalités moindres. Cette possibilité est intéressante pour ceux dont le courrier électronique reste l'outil internet principal ou dont la plus grande partie de la veille n'utilise pas la syndication mais des services basés sur le courrier électronique (alertes, listes de discussion, newsletters). Elle présente l'inconvénient de traiter dans le même espace des informations qui impliquent des régimes d'attention très différents: le courrier "normal" demande généralement une action en réponse...

Enfin les navigateurs intègrent dans leurs fonctions la lecture des flux de syndication, directement (marques pages dynamiques dans Firefox) ou par l'intermédiaire d'une extension (Sage pour Firefox). Le traitement est assez pauvre est ne convient que pour le traitement d'un nombre très restreint de flux.

[modifier] Echanger des flux de syndication: OPML

Logo OPML
Logo OPML

A la différence d'autres outils web, le transfert du contenu d'un agrégateur de flux à un autre est en général facile. Il existe même un format XML adapté à ce transfert. C'est le format OPML (Outline Processor Markup Language), c'est un format XML très simple utilisé pour contruire des listes ou des sommaires (outlines).

Il existe un logo spécifique pour indiquer la proposition de fichier OPML. A la différence du logo pour la syndication, il est peu utilisé.

Nous allons voir concrètement comment utiliser OPML pour transférer un ensemble de flux de syndication d'un agrégateur à un autre, de Google Reader dans Netvibes.

[modifier] Exporter un ensemble de flux de syndication de Google Reader

Je vais dans l'interface de gestion (Settings) de mon Google Reader (coin bas gauche: "Manage subscriptions"). En haut de la page, j'ai un onglet "Import/Export" qui me permet soit d'importer des flux par le biais d'un fichier OPML, soit d'exporter mes flux dans un fichier OPML. Google Reader ne me donne pas la possibilité de sélectionner certains flux ou dossiers pour l'export. L'export se fait pour la totalité de mes abonnements.

On remarquera que le fichier porte l'extension .xml, on trouve aussi .opml.

Une fois le fichier sauvegardé, nous allons l'ouvrir dans un éditeur de texte simple.

[modifier] Les fichiers OPML, comment les manipuler

Comparé aux autres formats XML que nous avons vu jusqu'à présent, Atom, RSS 2.0 ou a fortiori XHTML, le format OPML est très simple et n'utilise qu'un "vocabulaire" de balises assez restreint, ce qui le rend très lisible. Les éléments <outline> peuvent s'emboîter les uns dans les autres à plusieurs niveaux. Ici on voit qu'on à 2 niveaux: le niveau du dossier et le niveau du flux. Le niveau du flux est défini par une blaise vide: <outline ... />.

Cette simplicité de structure et cette lisibilité vont me permettre de manipuler facilement le fichier directement sur le code à l'aide d'un éditeur de texte et pallier ainsi le manque de paramétrage possible à l'export. En particulier je vais pouvoir effacer des dossiers entre des balises <outline...> et </outline> et ainsi réaliser des fichiers OPML pour certains dossiers. Ici on a extrait du fichier original un fichier pour le dossier "blogs juridiques" et un autre pour le dossier "droit".

ATTENTION: veiller à ce que l'en-tête du fichier original soit conservé et qu'à chaque balise ouvrante corresponde bien une balise fermante.

[modifier] Importer des flux dans Netvibes

Je peux importer ensuite ce ou ces fichiers OPML dans Netvibes. Je clique sur l'onglet vert en haut et à gauche de la page, "Ajouter du contenu", puis sur "Ajouter un flux". L'interface qui s'ouvre permet de s'abonner manuellement à un flux individuel mais permet aussi d'importer un fichier OPML, c'est-à-dire de s'abonner à un ensemble de flux en une seule fois. Je clique sur "Importer" et s'ouvre une petite fenêtre qui va me permettre d'aller chercher le fichier OPML sur mon disque dur. Et je clique sur le nouveau bouton "Importer".

Je réalise cette opération deux fois: une pour le fichier OPML correspondant au dossier "blogs juridiques" et une deuxième pour celui correspondant au dossier "droit".

Netvibes a créé automatiquement un onglet pour chacun des fichiers importés avec le nom du dossier comme intitulé, sous chacun de ses onglets les flux sont affichés, chacun dans sa petite fenêtre (widget)[20]. Sous l'onglet les widgets sont rangés alphabétiquement, il est possible de les réorganiser, comme il est possible de modifier l'intitulé des onglets.

[modifier] utilisation avancée

Yahoo Pipes permet un traitement complexe ds flux de données issus de sources diverses, dont les flux de syndication. C'est un outil puissant et sophistiqué mais dont le maniement est délicat et demande un certain apprentissage.

[modifier] La syndication: les sources

Pour les sources spécifiquement juridiques, nous renvoyons aux précieuses synthèses de Didier Frochot sur le site des infostratèges:

De façon générale, les ressources utilisées pour la recherche documentaire sont généralement susceptibles d'être des ressources de veille. Il convient pour chacune d'entre elles de chercher si elle fournit un flux de syndication.

Nous nous contentons ici de signaler la situation de quelques groupes de sources particuliers.

[modifier] différents types de contenus syndicables distingués du point de vue de la forme

  • page web (c'est la forme la plus simple: le fichier XML est un "reflet" de la page html débarrassé de la mise en forme globale de cette page)
  • site web composé de plusieurs pages (correspond à plusieurs développements de l'acronyme RSS, en réalité si l'on excepte les cas où une page (page d'accueil de blog typiquement) reflète l'activité de tout le site, ce cas est plutôt rare)
  • partie de site (voir les fils rss proposés par les sites de quotidiens: fils thématiques)
  • extraction d'une base de données (comme les fils construits à la demande à partir d'une équation de recherche sur Science Direct)

En réalité dans la quasi totalité des cas, les fils RSS sont construits par extraction automatique d'une base de données mais cette base de données peut être cachée comme telle, invisible au lecteur du site. Dans le cas 1, typiquement, le fichier xml apparaîtra comme un double, comme une copie de la page du site. A l'autre extrémité du spectre, fils thématiques ou extractions à la demande, le fil rss apparaîtra comme un produit spécifique du site, distinct de la page html qui peut lui correspondre (et que l'utilisateur du flux ne verra peut-être jamais).

[modifier] Les blogs

Comme vu ci-dessus, le flux de syndication est un produit automatique de la quasi totalité des blogs. Or le domaine juridique est particulièrement riche en blogs.

Deux répertoires:

La Blogosphère des avocats.fr est une plateforme de blogs spécialisée.

[modifier] Les wikis

Jurispedia est un wiki juridique international réalisé à l'aide de Mediawiki, le moteur de Wikipedia. A la différence symétrique des blogs, les wikis se prêtent mal à la syndication. On trouve néanmoins des flux sur un wiki comme Jurispedia mais ils se limitent aux contenus qui ont la forme de flux.

[modifier] Les bases de données

L'offre des bases de données (y compris les plateformes de revues électroniques) est très inégale. Certaines, rares, comme Science Direct ou PubMed permettent de générer des flux de syndication à partir d'une équation de recherche, d'autres n'offrent que des fils de syndication thématiques plus ou moins précis (Dalloz, LamyLine, Lextenso[21], Proquest...) et / ou des alertes par courriel (Diane, ProQuest...).

[modifier] Extraction d'un flux de syndication sur ScienceDirect

A l'issue d'une recherche Science Direct propose, avec l'affichage des résultats, un certain nombre d'outils en particulier une panoplie d'outils de veille dont un fil RSS. Cette fonctionnalité va me permettre de définir des veilles très précises sur la base de données.

[modifier] Limites de la syndication

Un article d'Emmanuel Barthe sur son blog Un blog pour l’information juridique fait le point sur les limites de la syndication pour la veille juridique. Il en conclut que le veilleur ne peut se contenter de la syndication en premier lieu à cause de l'incomplétude de l'offre.

Il faut donc envisager d'autres outils de veille.

[modifier] Autres outils de veille

[modifier] notificateurs de mise à jour

[modifier] produire un flux de syndication à partir d'un site qui n'en produit pas

Page2rss est une application web très simple d'utilisation (cf. copies d'écran) et qui... ne marche pas à tous les coups.

Feed43 demande plus de travail à l'utilisateur: celui-ci va définir sur le site les éléments à inclure dans le fil de syndication, l'application construit celui-ci à partir des données de mise en forme qu'elle "sémantise" en quelque sorte à partir des indications de l'utilisateur.

Attention: les flux de syndication produits ainsi ne sont pas "offerts" par le site d'origine et dans cette mesure demande encore plus de prudence et de précaution en cas de republication[22].

[modifier] Par le courrier électronique

Le courrier électronique a été le premier instrument de veille, avant que le web prenne une importance qui tend à l'identifier à l'internet lui-même. Pour certains le courrier reste l'outil privilégié et comme on l'a vu ils préfèreront l'utiliser pour lire les flux de syndication eux-mêmes. Certaines ressources de veille incontournables restent accessibles seulement par le courrier électronique.

[modifier] listes de diffusion (newsletters)

Les listes de diffusion sont l'équivalent numérique des bulletins d'informations professionnels sur papier. Techniquement il s'agit de mails envoyés à une grande quantité de destinataires abonnés. Petit à petit elles migrent sur le web, soit par une publication simultanée, soit en abandonnant le vecteur courrier. Cependant les newsletters qui restent seulement diffusées par liste de diffusion, conçues spécifiquement à fin de veille, sont souvent irremplaçables. En particulier le courrier permet une diffusion sélective des lettres confidentielles.

[modifier] listes de discussion

Les listes de discussion se distinguent des listes de diffusion en ce que les destinataires sont aussi des participants. Elles sont l'occasion pour ceux-ci de diffuser des informations qui se mêlent aux débats et aux demandes de renseignements précis. La fonction informative, qui fournit une ressource plus spécifique pour la veille, tend à migrer sur le web[23].

[modifier] alertes

Une alerte est l'envoi automatique au souscripteur d'un courriel contenant les nouveaux résultats d'une requête sur une base de données. C'est l'équivalent courriel du flux de syndication sur une équation de recherche. Ce sont les techniques qui permettent de poser une veille la plus précise et la plus spécifique possible. Elles sont donc précieuses, or, comme on l'a vu, l'offre d'alertes est beaucoup plus courante que celle de flux de syndication. A la différence de la syndication, la création d'une alerte suppose que son souscripteur soit identifié.

[modifier] Poser une alerte sur ScienceDirect et par Google Alerts

Dans Science Direct, l'alerte est proposée en même temps que le flux de syndication. La périodicité de l'alerte est réglé par l'utilisateur. L'alerte peut être programmée pour être envoyée non sur une base périodique mais chaque fois que l'équation de recherche ramène de nouveaux résultats.

Dans Google Alerts, outre la périodicité on peut programmer la cible de l'alerte en correspondance avec les différentes recherches particulières de Google, en particulier je peux réduire mon alerte à la recherche sur les blogs, les actualités, les groupes ou bien sûr le web.

[modifier] Le niveau zéro: réitération de recherches

"Niveau zéro" du point de vue technique: la veille ici n'est pas automatisée. Selon ses objectifs de veille, il ne sera pas possible d'avoir recours à une technique qui "pousserait" vers moi l'information et je reste obligé de la "tirer". C'est-à-dire que je vais refaire régulièrement la même recherche ou la même consultation d'un site. C'est la répétition de la recherche ou de la consultation qui en fait une opération de veille. Pour une bonne efficience, il faudra que la répétition soit la moins fastidieuse possible et qu'elle soit régulière.

Pour répondre à la seconde exigence, je peux m'aider d'outils comme un gestionnaire de tâches ou un agenda électronique[24] dans lesquels je peux programmer à intervalles réguliers les réitérations.

Pour rendre la réitération la plus rapide et la moins fastidieuse possible, il existe des outils ou des fonctions liées aux sources.

[modifier] mettre ses recherches en favoris

On peut utiliser la fonction de mémorisation de son navigateur: enregistrement d'un favori ou d'un signet (bookmark) non seulement pour retourner facilement sur les sites pertinents repérés mais également dans un grand nombre de cas pour mémoriser une recherche.

Par exemple je peux mettre la recherche sur "droit et patrimoine génétique" sur Google Scholar en mettant en favori la page d'affichage des résultats (http://scholar.google.com/scholar?q=droit+%22patrimoine+g%C3%A9n%C3%A9tique%22).

[modifier] sauvegarder une équation de recherche dans ScienceDirect

La plupart des bases de données en ligne proposent une sauvegarde des équations de recherche dans leur interface, comme ici dans Science Direct. Noter que la mémorisation n'est possible qu'à la condition préalable d'avoir créé un compte auprès de la base de données et de s'être préalablement identifié.

[modifier] veille secondaire ou "méta-veille"

[modifier] les signets partagés (social bookmarking)

Les outils de mémorisation, lorsqu'ils sont partagés, constituent un moyen très efficace d'intégrer dans sa veille celle d'autres veilleurs qui partagent certains objectifs de veille. On verra plus bas un exemple de cette utilisation avec delicious. La méthode est transposable pour les autres outils de mémorisation partagée mais le nombre d'utilisateurs de delicious rend cette appplication particulièrement idoine.

[modifier] le micro-blogging et les réseaux sociaux

Une grosse partie de l'activité sur les réseaux sociaux comme Facebook ou sur les sites de micro-blogging comme Twitter consiste en la communication de trouvailles faites sur Internet, une façon de faire rebondir sa veille en quelque sorte.

Twitter en particulier bénéficie d'une grande popularité qui a été mise en lumière récemment à l'occasion des évènements qui ont suivi les élections iraniennes. La brièveté des messages dans Twitter (140 caractères maximum) interdisent le bavardage, un message typique combine une courte phrase et un lien raccourci par un service comme tinyurl ou bit.ly. Les messages (tweets) peuvent être "retweetés" ce qui leur donne un indice de popularité et permet de faire communiquer plusieurs ensembles d'utilisateurs. Les "hashtags" sont une technique inventés par les utilisateurs qui permet d'ajouter une étiquette ou un mot-clé à un twweet, permettant de rendre plus spécifique la recherche plein texte. Si généralement les réseaux sur Twitter se constituent plutôt par la connexion de personnes qui se connaissent dans la vie réelle, la recherche par hashtags permet de trouver des utilsateurs partageant mes intérêts et qui peuvent être support d'une méta-veille.

L'intérêt principal de Twitter est dans la rapidité avec laquelle il fait circuler l'information. Par Twitter une nouvelle information m'arrivera plus vite que par les flux de syndication ou les sites d'actualité comme Google News. Une application de bureau dédiée à Twitter comme TweetDeck m'avertit en temps réel de l'arrivée de nouveaux tweets. La pertinence de Twitter dans un dispositif de veille est donc déterminée par l'importance que l'on donne la fraîcheur de l'information. De ce point de vue il sera plus utile à une veille stratégique professionnelle qu'à une veille d'auto-formation. C'est cependant un recours pour rester au courant lorsqu'on n'a pas le temps de réaliser une veille normale.

[modifier] Mémoriser sa veille, organiser sa "récolte"

[modifier] critères

Le tableau suivant présente une répartition des différents outils de mémorisation disponibles, représentés par quelques exemples, selon plusieurs critères.

Basiquement il croise deux critères: selon l'objet mémorisé et selon que l'outil est local, hébergé en ligne ou encore installable sur un serveur local. Concernant les outils de gestion de références, un troisième critère, celui de la gratuité ou du caractère onéreux fournit une bi-partition secondaire (tous les outils de gestions de signets présentés ici sont gratuits).

[modifier] 1er critère: signets ou références

Les outils examinés mettent en mémoire:

  • soit des pages web, on parle alors de signets, de marque-pages, de bookmarks ou de favoris (ce dernier terme, qui est celui d'Internet Explorer désigne plutôt l'objet mémorisé alors que les précédents désignent plutôt le lien vers cet objet tel qu'il est stocké par l'outil), le coeur de la description (de ce qui est effectivement mis en mémoire) consiste en deux élements: une URL et un titre, des éléments automatiquement donnés au moment où une page web est chargée dans le navigateur;
  • soit des documents, on parle alors de références ou de citations, la description mise en mémoire, si elle est complète, est beaucoup plus complexe que dans le cas précédent puisqu'elle rassemble les éléments d'une description bibliographique susceptible de figurer dans un travail universitaire, une URL associée au document n'est pas obligatoire et dans le cas où le document est effectivement attaché à une page web, les éléments descriptifs (métadonnées) nécessaires ne sont pas forcément récoltables automatiquement depuis cette page. Les outils de cette catégorie sont donc plus complexes que ceux de la catégorie précédente.

[modifier] 2e critère: local ou en ligne

Les outils examinés sont:

  • soit utilisables en local, c'est-à-dire à partir d'une application installée sur une machine particulière, en pratique intégrés à un navigateur;
  • soit en ligne, c'est-à-dire accessibles depuis n'importe quelle machine, les signets étant mis en mémoire et disponibles sur un serveur web, les gestionnaires de signets font partis de la grande famille des outils 2.0 utilisables moyennant la création d'un compte sur une plateforme et identification sur ce compte;
  • une sous-répartition distingue parmi les outils en ligne les services hébergés (le cas le plus courant) et les services installables sur un serveur local, ce qui est intéressant lorsqu'on veut inégrer la mémorisation à un système d'information propre.

[modifier] tableau

objets mémorisés →

accès à l'outil↓
SIGNETS
(Pages web)
REFERENCES
(Documents)
Gratuit Onéreux
LOCAL Favoris IE
Marques-pages Firefox
Bibus
Zotero
BibDesk
EndNote
EN LIGNE hébergé delicious
Pocket
...
Google bookmarks
Diigo
CiteuLike
Bibus
Zotero 2.0
Refworks
EndNote Web
Bibsonomy
serveur
local
Semantic Scuttle Wikindx

[modifier] Mémoriser des pages web: gestion des signets en ligne

[modifier] diigo 1: "bookmarking"

Le bookmarking social ou gestion des favoris en ligne est l'application qui permet de mémoriser les pages web "dans les nuages" plutôt qu'en local sur son navigateur. Les avantages immédiats de cette méthode sont:

  • l'accessibilité depuis quelque machine que ce soit,
  • une gestion plus facile des favoris, notamment par le biais des tags,
  • la possibilité de partager ses mémorisations et symétriquement de profiter de celles effectuées par autrui.

Pour utiliser diigo, je commence par créer un compte. Une fois mon compte créé je vais installer une barre d'outils dans mon navigateur.

Je peux en cochant une case décider de ne pas partager le favori, c'est-à-dire qu'il ne sera visible sur mon compte diigo, par ailleurs public, que pour qui se sera identifié comme étant le propriétaire du compte.

[modifier] diigo 2: mémoriser ses lectures

Diigo est un outil de gestion de favoris en ligne qui permet de lire sur le web "crayon à la main". Avec diigo je peux rajouter des annotations dans le corps de la page et faire des extraits par surlignage. Pour éviter la dispersion, il est possible de paramétrer diigo pour que chaque mémorisation dans diigo soit automatiquement reportée dans delicious.

[modifier] diigo3: partager et organiser une veille collective


[modifier] Conclusion

L'examen des outils et des techniques de veille ainsi que la considération de la nature des sources utilisées par la veille posent assez clairement la problématique de la mise au point d'un dispositif de veille: la technique la plus efficace est la syndication mais toutes les sources ne s'y prêtent pas. C'est l'examen des sources qui va déterminer la configuration des outils de veille. On tendra à intégrer le maximum de sources dans un lecteur agrégateur Google Reader ou éventuellement Netvibes si l'on peut se suffire d'un nombre modéré de flux, à moins que les sources les plus importantes soient accessibles seulement par le courrier électronique - en ce cas on pourra choisir de ramener ses flux de syndication dans le client mail.

Quoi qu'il en soit, il faut rester conscient de deux choses:

Quelque soit l'outil principal choisi, il ne couvrira pas tous les besoins et qu'une multiplicité d'outils est inévitable, et cette multiplicité ne se limite pas au domaine numérique: une veille vraiment complète ne se dispensera pas du détour occasionnel ou régulier par la bibliothèque;

Un dispositif de veille, quelque soit le soin qu'on ait mis à le régler, n'est jamais définitif: les apports mêmes de la veille, les développements de sa problématique, l'accroissement de ses sources vont décaler le dispositif par rapport à la réalité et aux besoins de la veille. Il est donc nécessaire de le repenser régulièrement et de lui garder assez de souplesse.

[modifier] Questionnaire

  1. Quelle différence entre "veille" et "recherche d'information"?
    1. La veille est plus précise que la recherche
    2. La veille n'utilise pas les mêmes sources que la recherche
    3. La veille est une activité continuée alors que la recherche est ponctuelle
  2. Quelles ont été les conséquences de la numérisation de la documentation?
    1. J'accède plus rapidement à l'information dont j'ai besoin
    2. L'information est devenue gratuite
    3. Je n'ai plus besoin de la documentation papier
  3. Je n'ai pas toujours le temps de suivre toutes mes sources de veille. Que faire?
    1. Remplacer la veille par une recherche ponctuelle lorsque nécessaire
    2. Suivre un site de confiance
    3. Sélectionner des sources prioritaires
    4. Surveiller le résultat des veilles d'autres veilleurs que j'ai repérés
  4. Qu'est-ce que la syndication de contenu web?
    1. Le fait de s'associer pour produire le contenu d'un site web
    2. L'utilisation des flux RSS
    3. Une technique qui permet de publier du contenu sur plusieurs sites simultanément
  5. Qu'est-ce que signifie RSS?
    1. RDF Site Summary
    2. Rich Syndication System
    3. Rich Site Summary
    4. Really Simple Syndication
  6. Qu'est-ce qu'un flux de syndication?
    1. Un fichier RSS
    2. Un podcast
    3. Un ensemble de données publiées par une agence de presse
    4. Une suite de fichiers XML
  7. Qu'est-ce qu'Atom?
    1. Un format RSS
    2. Un format XML
    3. Un format de syndication
    4. Une technique de publication
  8. Qu'est-ce que s'abonner à un flux de syndication?
    1. Mémoriser un flux dans un lecteur de flux
    2. S'inscrire auprès du producteur de flux
    3. Payer annuellement le droit de recevoir un flux
  9. Dans la liste, quels sont les formats XML?
    1. RSS 0.91
    2. HTML
    3. Atom
    4. RSS 2.0
    5. XHTML
  10. Je ne peux m'abonner qu'à des sites qui fournissent des flux de syndication.
    1. vrai
    2. faux
  11. La période de fort développement de la production de flux de syndication:
    1. 1999-2001
    2. 2002-2003
    3. 2003-2005
    4. 2005-2007
  12. Un fichier de syndication offre l'intégralité du contenu d'une page web.
    1. vrai
    2. faux
  13. Quels types de sites web offrent les flux de syndication les plus complets?
    1. CMS
    2. blogs
    3. wikis
    4. bases de données
  14. Quelle(s) affirmation(s) est/sont vraie(s)?
    1. Les bases de données de revues électroniques fournissent toutes des fils de syndication
    2. Les bases de données de revues électroniques ne fournissent pas de fils de syndication
    3. Certaines bases de données de revues électronique fournissent des fils de syndication
    4. Les fils de syndication des bases de données de revues électroniques sont thématiques
  15. Pour lire mes fils de syndication, je peux utiliser ces outils
    1. Google Reader
    2. Delicious
    3. Google Alerts
    4. Netvibes
  16. Qu'est-ce qu'un "widget"?
    1. un petit lecteur de flux RSS
    2. une petite fenêtre dédiée à une tâche particulière
  17. Pour exporter/importer un ensemble de flux de syndication, je vais utiliser un fichier au format
    1. XHTML
    2. RSS
    3. Atom
    4. OPML
    5. OMPL
    6. XTML
  18. Quels outils de veille sont spécifiquement conçus pour le courrier électronique?
    1. listes de discussion
    2. newsletters
    3. forums
    4. FAQ
    5. alertes
    6. BAL intelligentes
  19. Qu'est-ce que le bookmarking social?
    1. un réseau de partage de références bibliographiques
    2. un technique de mémorisation en ligne de pages web
    3. un réseau social basé sur l'échange de livres
  20. Quel outil choisir pour mémoriser des références bibliographiques?
    1. Zotero
    2. diigo
    3. Endnote
    4. Google Reader

corrigé

[modifier] Activités

[modifier] Activité 1: compréhension XML

A l'aide des copies d'écran ci-dessus (2.1.1.4.4 Le fichier de syndication), déterminez (balises) comment sont encodées les éléments de contenu affichés par le lecteur de flux intégré à Firefox 3, en RSS 2.0 et en Atom/

[modifier] Activité 2: compréhension sources de flux

Sur l'exemple de Wikipedia, déterminer quels contenus d'un wiki peuvent faire l'objet d'un flux de syndication.

corrigé



  1. Ancienne version du référentiel des métiers de l'ADBS, citée sur la Wikipédia française (consultée le 16.09.2009). La nouvelle version (consultée le 16.09.2009) intègre l'évolution générée par la numérisation, l'internet et les nouvelles pratiques du web:
    [Le chargé de veille]
    • Conçoit, met en oeuvre et fait évoluer les dispositifs de veille concurrentielle, juridique, technologique... en interne comme en externe.
    • Détecte et aide à l'anticipation des changements survenant dans l'environnement technique et/ou socioéconomique de l'entreprise et susceptibles d'en affecter l'activité, signale les opportunités et informe sur les risques et les tendances.
    • Met en place des réseaux permettant la cartographie des flux et des acteurs.
  2. Source Wikipédia française consultée le 16.09.09.
  3. Voir plus haut les différentes traductions pour des veilles particulières en entreprise, d'après les correspondances entre les Wikipédias francophone et anglophone
  4. dans un cadre professionnel, en particulier, le veilleur aura souvent à compléter ses synthèses de veille par des informations produites par des recherches documentaires rétrospectives
  5. C'est ce facteur qui explique un phénomène comme l'explosion de la "blogosphère" en 2003: les blogs offrant, de par leur technologie (cf. infra: "Gestion de Contenu Web"), des flux de syndication, leur adoption a défini un sous-ensemble du web à visibilité décuplé aux dépends des pages html statiques.
  6. C'est-à-dire de publier le contenu d'une interface de veille "secondaire" sur une interface consultée prioritairement ou plus souvent
  7. L'explosion de l'information et de sa disponibilité via l'internet obligent à élaborer des stratégies de l'attention, qui permettent d'adapter le flux d'information reçu au type d'activité que l'on entend réaliser: si le flux d'information que je reçois demande de ma part des opérations très hétérogènes: mémoriser une information importante, rédiger une synthèse, programmer un évènement, répondre à un courrier..., mon régime d'attention va être cahotique et je risque de me disperser voire de me perdre. Le choix des outils et leur paramétrage doit tenir compte de ce facteur.
  8. "Syndication" est un anglicisme dans la mesure où il ne se réfère pas aux syndicats de travailleurs (sens français) mais aux syndicates de la presse anglo-saxonne. Nous l'utiliserons néanmoins, faute d'un terme français satisfaisant et parce qu'il est rentré dans l'usage.
  9. La syndication est pull dans la mesure je suis allé sur le web pour chercher des flux et que j'y retourne pour les lire, elle est push dans la mesure où l'information va venir s'afficher "chez moi", c'est-à-dire sur une interface unique que j'ai défini.
  10. Dans les versions antérieures de ce navigateur ainsi que dans la plupart des autres navigateurs, cette icône carrée est de couleur orange.
  11. Les différents formats sont plus ou moins riches en métadonnées descriptives. Et par ailleurs, le format atom n'est pas lu par certains lecteurs RSS utilisés pour la republication de flux.
  12. C'est une méthode mise au point empiriquement. On peut faire mieux!
  13. soit "nourriture" ou "fourrage"
  14. de même que le lecteur / extension de MediaWiki
  15. Le fichier HTML correspondant au fichier de syndication n'est en réalité pas le fichier encodant la page du billet mais celui encodant la page d'accueil de tout le blog.
  16. "Moteurs" plutôt que logiciels parce qu'ils ne fonctionnent pas à partir de fichiers exécutables dédiés mais par une combinaisons de logiciels généralistes et de fichiers comme on va le voir.
  17. C'est une présentation simplifiée. En particulier il existe des méthodes de publication intermédiaire entre la gestion de contenu web et le html statique. Mais leur introduction compliquerait le propos sans le modiffier sur le fond.
  18. En particulier va être possible une mise en forme particulière adaptée aux contraintes spécifiques des téléphones mobiles.
  19. ces applications intègrent un navigateur simple qui permet de suivre un lien sans avoir passer sur son navigateur
  20. Supra nous avons fait deux fichiers OPML soit un par dossier. Il aurait été parfaitement possible de laisser dans un seul fichier les deux dossiers. Nous n'aurions alors importé qu'un seul fichier et le résultat aurait été le même: deux onglets intitulés du nom des dossier créés dans Google Reader.
  21. un fil général et un fil par revue.
  22. Même si l'on peut considérer que le fait d'offrir un flux de syndication vaut accord pour la republication - c'est après tout l'objet même de la syndication, la chose n'est pas absolument établie en droit et il convient en cas de republication d'éviter une republication intégrale sans valeur ajoutée.
  23. Récemment la liste biblio-fr, dont les archives étaient disponibles et syndicable sur le site du CRU depuis plusieurs années, a fermé déclenchant un certain émoi parmi les bibliothécaires et les documentalistes français.
  24. Voir Mettez un agenda électronique dans votre veille Didier Frochot (2006 - consulté le 4.10.2009).