Discuter:La Recherche floue

Un article de Wiki URFIST.

--MRG 9 juillet 2008 à 11:47 (CEST)

Transfert depuis: http://urfist-intra.unice.fr/wiki/index.php/La_Recherche_floue/v1

Sommaire


--MRG 16 juillet 2008 à 09:03 (CEST)

[modifier] après 1er envoi

J'ai reporté les dernières corrections de Gabriel pour mettre l'article en conformité avec l'envoi. Cependant rajouté qques corrections mineures (Lévi-Strauss), pas rajouté d'autres (parenthèses autour de "choix" à propos de Danah Boyd) et surtout rétabli pourl'essentiel la version première du paragraphe sur St Mary College: je n'avais pas vu les corrections et il y a un pb de compréhension. A revoir à l'occasion. Voir notes dans le retour du doc envoyé par GG.

--GG 14 juillet 2008 à 23:48 (CEST)

[modifier] Ultimes points de discusion avant l'envoi du texte

  • littéracie ou litteratie ?
  • 61000 caractères avec les notes , 47 000 sans les notes... c'est trop de toute manière...mais j'ai vraiment du mal à "tronçonner" ce soir

--GG 10 juillet 2008

[modifier] qques points, vu avec JA au tel hier

  • Importance de la question de la literatie
  • Notion : usagers/experts
  • Effet des dispositifs, google appareil de mise en visibilité des citations
  • La relation recherche floue / serendipity pas assez mise en évidence : l'invisible structure le visible , la question de la causalité. Exemple : avant on ne savait pas nécessairement mieux chercher dans les base de données existantes que maintenant sur les outils du web (la preuve -> naissance des urfist). 2 choses à mettre en avant :
    • oui mais l'usager ne sachant pas chercher (opérateurs booléens et syntaxe spécifique) ne trouvait pas ou peu. Aujourd'hui il trouve des résultats qui lui conviennent
    • les fondements pour comprendre les "anciennes" bases au-delà des aspects intrumentalistes (opérateurs booléens et syntaxe spécifique) se retouvre autour des notions d'indexation-thésaurus-shéma relationel d'une base. Les notions aujourd'hui pour les outils c'est Indexation_pagerank. Le trait d'union entre ces générations d'outils me semble être la "relevance".
  • Pour renforcer le point ci-dessus on pourrait mettre en avant
    • Relevance = Pertinence = Serendipity > modèle de la consommation
    • P = R + S > modèle de la création
  • La raison graphique et les modèles mentaux : si l'écriture à bien changé les modèle mentaux, les outils du web ("d'écriture" du monde : au sens d'écrits d'écran, mais aussi de "faconnage"d'une représentation de la réalité) changent-ils aussi les modèles mentaux ? et sur quelle base ?

[modifier] Contexte/Introduction

--MRG 9 juillet 2008 à 12:16 (CEST)

La problématique objectivation / subjectivation et ses conséquences sur le paradigme "sérendipité" demanderait un petit développement spécifique / éclaircissement. Tel quel c'est trop allusif et difficilement compréhensible.

--GG 10 juillet 2008 à 00:40 (CEST) j'écris le déroulement de l'idée, je rerédigerai aprés, notamment à lumière de vos commentaires. la méconnaissances des outils de recherche par certains usagers tend à objectiviter n'importe quel résultat (dit brutalement donne une impression de réelle pertinence voire d'exhaustivité... mais la 1ère réponse est considérée comme bonne), la réintroduction d'un questionnement, d'un doute sur les résultats obtenu revient à introduire une subjectivité... le sujet, l'usager "reprend la main".

  • par compréhension du principe des moteurs ... il n'accorde plus le même crédit
  • par des artéfacts techniques que l'usager pilote (de préférence la aussi avec maîtrise)... Il ordonne autrement les résultats

c'est finalement ses schèmes cognitifs qui changent on ne "joue" plus de la même manière avec les moteurs. Là où l'usager fonctionnait avec R = P = S, mettant tout sur le même plan, il fonctionne (si il s'est approprié un ceratain nombre de concepts/notion, notamment tous ce qui tourne autour de la relevance) maintemant avec le schéma P = R + S. Ce qui change c'est bien le "+ S". Entre hasard-selection (darwin), harsard-nécessité (Monod) et le fait d'avoir l'esprit préparé (Pasteur)

--GG 10 juillet 2008 à 22:54 (CEST) je viens d'introduire le complément d'info démandé, je l'ai mis en évidence dans le texte

--GG 11 juillet 2008 à 22:37 (CEST) sur la réécriture de JA, il faudrait préciser "l'existence de lieux ou l'information était stockée et archivée "... c'est toujours le cas même dan sla nouvelle proposition...il faut évoquer l'ubiquité...

de même "plus largement, nous ne ferons pas référence au concept d'appropriation des techniques largement développé sous l'angle de la communication et qui nous semble présenter un intérêt moindre sous l'angle de l'information." ...j'ai toujours pensé l'inverse... il me semble que les études d'impacte, de dispersion, puis d'appropriation et d'usage versaient plutôt du coté de l'info.

le passage "La recherche floue renvoie également à un principe générateur : la sérendipité...... " est difficile à suivre

--GG 11 juillet 2008 à 22:37 (CEST) Passage coupé et sauvegardé ici , je renvoie le paradigme de la serendipity dans la partie théorique

La recherche floue renvoie également à un principe générateur : la sérendipité. Nous avons mentionné plus haut l'existence d'un gap, d'un écart entre révolution numérique et évolution des pratiques. Ce gap existe dans la mesure où la révolution numérique ne peut être évaluée comme cause de nouvelles pratiques dont la mise en place se trouve dépendre de la combinaison de deux propositions : le support analogique et la recherche de documents et de ses effets contextuels non prévisibles a priori. De même les résultats fournis par un moteur de recherches sont pertinents dans la mesure où ils permettent cette combinaison d'informations anciennes et nouvelles par l'internaute. Autrement dit, un résultat fourni par un moteur, aussi relevant soit-il de la question posée, ne sera pas nécessairement pertinent. Entre relevance et pertinence, s'impose un écart déterminé par la réorganisation cognitive générée chez l'utilisateur par la réponse. Cet écart est lié a priori à un hasard dépendant du contexte.

Ces situations de flou peuvent être corrigées (mais non résolues) par la réintroduction d'un questionnement, d'un doute sur les résultats obtenus, il s'agit de subjectiviter ce que les outils tendent à objectiviter... le sujet, l'usager "reprend la main" :

  • par compréhension du principe de fonctionnement des outils, les usagers n'accorde alors plus aveuglément le même crédit aux résultats.
  • par des artéfacts techniques que l'usager pilote (de préférence la aussi avec maîtrise), les usagers appréhendent alors autrement les résultats

Les schèmes cognitifs changent, on ne "joue" plus de la même manière avec les moteurs. Là où l'usager fonctionnait sur le mode de la "consommation" en tenant pour égales les notions de relevance, de pertinence et de serendipity (R = P = S), il peut fonctionner (s'il a intégré quelque peu ces notions) sur le mode de la "création" où la serendipity est l’écart entre relevance et pertinence (P = R + S). Le paradigme de la serendipity rentre en action : entre hasard-sélection (Darwin), hasard-nécessité (Monod) et le fait d'avoir l'esprit préparé (Pasteur).

Dans nos représentations, l'idée de "révolution numérique" est en train de laisser place à l'appréhension d'une évolution plus fondamentale dont celle-ci ne serait qu'un aspect. Evolution qu'on hésite à qualifier de "révolution" faute de percevoir encore clairement quels nouveaux équilibres pourraient en sortir, évolution souvent perçue comme inquiétante qu'on peut nommer "crise de la littératie", en francisant le terme anglais traduit classiquement par "alphabétisation" mais qui désigne plus largement l'ensemble des compétences liées aux techniques du savoir, une représentation du savoir comme tout organique et un ensemble de processus de production, d'évaluation, de validation, de diffusion et de réception des savoirs. Sans être complètement fixe, l'état qu'on appellera pré-numérique pour simplifier, présentait des régularités familières qui permettent de dessiner un paysage cohérent, de l'école à la recherche, en passant par les institutions culturelles et les procédures de l'édition, scientifique, littéraire ou journalistique, sur quoi pouvaient se repérer pratiques culturelles et scientifiques.

L'explosion quantitative et la disponibilité des données mises en ligne par le biais du web, les pratiques nouvelles induites regroupées sous l'étiquette "web 2.0" viennent bouleverser ce paysage, remettre en cause ses équilibres, contourner les médiateurs (enseignants, bibliothécaires, journalistes, éditeurs, autorités académiques) qui en étaient les opérateurs et les garants. Il suffit d'évoquer les polémiques et les inquiétudes suscitées par la popularité de l'encyclopédie "libre" Wikipédia ou l'utilisation massive du moteur de recherche généraliste Google.

L'idée de "révolution numérique" focalisait sur les supports. Aujourd'hui, ce sont les usages et les pratiques induits ou solidaires de ces nouveaux supports et de ces nouveaux modes d'organisation de l'information qui attirent l'attention des chercheurs et des opérateurs du monde scientifique. Il devient nécessaire de considérer une mutation dont on commence à se rendre compte qu'il faut remonter au moins à la Renaissance et à l'adoption de l'imprimerie pour en trouver un analogue dans ses dimensions anthropologiques, c'est-à-dire d'abord, du point de vue de la méthode, sociologiques.

Cette "crise de la littératie" a des enjeux évidents dans le domaine universitaire, dont on a pu croire dans un premier temps qu'il profiterait de la "révolution numérique" (bouquets numériques, open access) sans que soient remis en cause ses équilibres fondamentaux. Or nous constatons aujourd'hui que peu à peu sont importés dans les outils de la science des techniques, des manières et des pratiques originaires du monde spontané, foisonnant et désordonné du web 2.0. Cette importation se fait elle-même de façon apparemment désordonnée. De récents articles américains ont pointé, par exemple, que si l'utilisation de Google comme outil premier d'accès à l'information numérique par les étudiants semble une réalité massive, elle n'est pas exclusive[1] et qu'il existe d'autres patterns d'organisation des procédures de recherche. Encore faut-il les recenser et en évaluer l'importance et l'effectivité[2].

Dans le présent article, nous aborderons la "crise de la littératie" sous l'angle particulier des modes d'accès à l'information et plus précisément des procédures de recherche dans le milieu de la recherche scientifique universitaire, en cherchant à y reconnaître des patterns et des stratégies qui seraient autant de réponses à la nouvelle situation de l'information. Nous regrouperons l'ensemble de ces patterns et de ces stratégies sous l'intitulé de la "recherche floue" qui nous semble synthétiser les caractéristiques de cette nouvelle donne.

Par cette expression, nous souhaitons rendre compte de phénomènes distincts et pourtant connexes dans les pratiques de recherche d'information en ligne. D'une part, des usagers désorientés par la déconstruction/reconstruction de leur univers documentaire, phénomène lié à la versatilité des services, des sources, des interfaces d'interrogation, rythmée par les rachats et les fusions d'entreprises, ainsi qu'à l'évolution des techniques. D'autre part, des usagers dont la méconnaissance des outils de recherche tend à objectiver également n'importe quel résultat: un phénomène lié à l'intelligibilité imparfaite des typologies documentaires, des techniques stochastiques et à la surcharge informationnelle. Ainsi nous devons considérer à la fois une perte de repère ou flou sémiotique et une perte d'intelligibilité ou flou cognitif.

Indiquons dès maintenant que l’expression "recherche floue" est généralement employée pour désigner un "mode de recherche d'information tolérante vis-à-vis d'approximations ou d'erreurs (d'orthographe, par exemple) sur les termes de la question et/ou des documents, utilisant des techniques statistiques, phonétiques ou de reconnaissance de forme" [3]. Traduction de fuzzy search (ou fuzzy matching), elle fait référence à la fuzzy logic (la logique floue) où, à la différence de la logique booléenne qui ne connaît d’autres états que vrai ou faux (binaire), la "recherche floue" traite les états la précision relative. Nous élargissons donc cette définition de « recherche floue » en considérant les pratiques informationnelles comprises dans une palette très large de situations de flou, entre une vision amoindrie de la réalité documentaire et une recherche aléatoire contrôlée.

[4]

<Paragraphe à Valider pour remplacer la ref au dessus et répondre à la question de Michel et jacques sur le fait d'expliciter un peu mieux la relation flou serednipity, ojectivation/subjectivité et serendipity>

Ces situations de flou peuvent être corrigées (mais non résolues) par la réintroduction d'un questionnement, d'un doute sur les résultats obtenus, il s'agit de subjectiviter ce que les outils tendent à objectiviter... le sujet, l'usager "reprend la main" :

  • par compréhension du principe de fonctionnement des outils, les usagers n'accorde alors plus aveuglément le même crédit aux résultats.
  • par des artéfacts techniques que l'usager pilote (de préférence la aussi avec maîtrise), les usagers appréhendent alors autrement les résultats

Les schèmes cognitifs changent, on ne "joue" plus de la même manière avec les moteurs. Là où l'usager fonctionnait sur le mode de la "consommation" en tenant pour égales les notions de relevance, de pertinence et de serendipity (R = P = S), il peut fonctionner (s'il a intégré quelque peu ces notions) sur le mode de la "création" où la serendipity est l’écart entre relevance et pertinence (P = R + S). Le paradigme de la serendipity rentre en action : entre hasard-sélection (Darwin), hasard-nécessité (Monod) et le fait d'avoir l'esprit préparé (Pasteur).

</Paragraphe à Valider>

Une étude sur les pratiques informationnelles des étudiants avancés et des enseignants chercheurs des pôles universitaires de la région Paca, pilotée par l'Urfist-Paca, est programmée pour 2008-2009. Elle a pour ambition de collecter des données permettant de reconnaître, de décrire et d'évaluer les différentes procédures élaborées dans le contexte de la "recherche floue" par ses acteurs. Nous souhaitons donc ici, par le biais d'une observation participante au sein de stages réalisés à l'Urfist et le défrichage de la littérature sur le sujet, proposer, en amont de l'enquête, des axes de réflexion, des pistes d'observation, des éléments à quantifier ou à vérifier, des faits à expliciter.

Nous distinguerons quelques lignes d'interrogation qui nous semblent être les nœuds caractérisant le passage d'un flou incontrôlé à une intelligibilité guidée par un certain flou:

  1. Les universitaires connaissent-ils les ressources disponibles en ligne (sur leur campus ou sur le web), et maîtrisent-ils les procédures d'interrogation des sources? Les aspects formation sont notamment évoqués.
  2. La fausse évidence des interfaces d'interrogation des ressources en ligne induit-elle une perte des repères cognitifs généralement convoqués dans l'activité de recherche d'information? Des points d'ancrages sont proposés.
  3. La réintroduction d'une subjectivité (d'un flou contrôlé) par des pratiques informationnelles avancées permet-elle une véritable intelligibilité des résultats de la recherche d'information ? Des situations sont observées.

Et nous tenterons de mesurer si la mise en avant du paradigme de la serendipité permet le passage du flou à la netteté d'une situation de recherche d'information par la maîtrise accrue des sources et des outils et par l'introduction d'une subjectivité.

[modifier] Résultats d'enquêtes

--MRG 14 juillet 2008 à 11:57 (CEST)

Je viens de terminer la partie "résultats d'enquêtes". Ce fut assez pénible (en partie parce que frustrant). Je n'ai pas mis tout ce que j'avais là-dessus, ça aurait fait un article à soi seul. En particulier des choses discutées avec Jacques l'autre jour.

Pour que ce week-end ne soit pas tout à fait foutu je ne regarde pas les modifications apportées par Jacques aujourd'hui ni la fin de l'article. La partie ajoutée par Jacques à l'introduction ne me semble pas à sa place: elle gonfle une partie qui était déjà trop importante (discussion avec GG l'autre jour au téléphone). Trop de méta, en particulier se défendre d'un plaidoyer pro domo me semble maladroit - il faut faire en sorte que l'article ne soit pas un plaidoyer pro domo, pas s'en défendre. L'essentiel de l'ajout de Jacques me semble cependant avoir une place ailleurs dans l'article en particulier dans la partie "résultats d'enquêtes". Je ne me sens pas la force ni le droit de reprendre le texte de JA pour l'intégrer dans la partie que je viens de rédiger mais, Jacques, si tu peux jeter un coup d'oeil?...

--MRG 9 juillet 2008 à 17:25 (CEST)

Il faudrait problématiser un peu: l'enquête "Beyond Google" dans l'état est un peu passée par pertes et profits. S'en servir plutôt pour montrer l'hétérogénéité des stratégies. On a l'impression à la lecture qu'il n'y a qu'une stratégie massive et désespérante (Google + Wikipedia) or tout l'enjeu de l'enquête est de comprendre et d'articuler la diversité des stratégies, attestée par ailleurs (faut que je cherche dans mes signets!).

--GG 10 juillet 2008 à 00:57 (CEST) je liste quelques stratégies observées/lues, comme tu le dis la mixité existe... ça me fait penser qu'on pourrait faire un sondage dans le labo avec JA pour savoir comment ça se passe

  • Google + Wikipedia
  • recherche sur web, vérification en BU
  • utlisation d'une base, indiquées par le DR ou le copain chercheur
  • outils "à la maison" / outils "au boulot"
  • portail de éditeurs/revues... le tour des sites connu régulièrement
  • alerte mail ou rss... revue de sommaire
  • liste de diff.
  • bibliographie de bibliographie, de biblio..... > modèle papier et électro
  • ... c'est pas fini

[modifier] Sondage Flash

--MRG 10 juillet 2008 à 15:09 (CEST) Bonne idée. Ce sondage pourrait être une maquette d'une partie de ce que devrait réaliser l'enquête. Pas oublier que notre cible ne se limite pas aux étudiants.

--GG 10 juillet 2008 à 18:38 (CEST) sondage envoyé à la liste... mais le modérateur ne semble pas être là :-(

Recherche floue/Enquête flash (I3M)

[modifier] Conclusion

--MRG 11 juillet 2008 à 08:16 (CEST)

On ne peut pas, amha, conclure sur le paradigme de la sérendipité:

  • l'objet de l'article était au départ de dégager des modèles/scénarios de stratégies de recherche en amont de l'enquête; déboucher sur la promotion d'un paradigme, c'est en qqsorte mettre la charrue avant les boeufs et refermer la question;
  • le paradigme lui-même (me) reste peu clair;
  • en l'état ça peut être compris comme une pure légitimation de l'errance du browsing: je ne trouve pas ce que je cherche mais ce que je trouve m'intéresse. Je lis bien que tu marques la différence entre sérendipité = relevance = pertinence et pertinence = relevance + sérendipité mais il n'en reste pas moins que l'impression générale est de conclure sur un modèle valorisé.

Il faudrait replacer le paradigme comme une des pistes possibles (c'est-à-dire réintégrer ce développement plus haut) et récapituler en conclusion les questions / scénarios à proposer à l'enquête.

--GG 11 juillet 2008 à 10:45 (CEST) je suis en partie d'accord avec toi mais

  • il y a le titre du colloque et "l'obligation" de cadre quelques peu avec "Traitements et pratiques documentaires : vers un changement de paradigme ?". D'ailleurs propal, acceptée par les relecteurs, comportait la mention "paradigme qui pourrait être celui de la serendipity"
  • La serendipity constitue bien une façons de penser la recherche d'info. Ce n'est pas un modèle informatique, ce n'est pas un modèle philosophique, ce n'est pas un modèle cognitiviste...je dirais qu'il relève des sciences de l'information et des sciences cognitive il ne s'agit pas non plus de légitimé le browsing a posteriori.
  • Alors comment le définir ? comment décrire ce paradigme... tentative : il relève de la maîtrise de l'information et d'artéfact techniques

.... appel de michel.... --GG 11 juillet 2008 à 13:08 (CEST) se mettre d'accord sur paradigme recherche flou ou serendipity

  • si la serendipity est une notion, on peu "upgrader" la notion en paradigme
  • idem la recherche floue fait déjà réference à une notion existante

.... appel de michel.... --GG 11 juillet 2008 à 13:08 (CEST) répartition des tâches michel travail sur la partie "enquête" gabriel et jacques sur la partie "théorique" je vais intégrer le passage "en gras" de l'intro en fin de partie "théorique"... pour mieux définir la paradigme "serendipity", je reprend en conclusion les stratégies d'enquête et les pistes théorique.

[modifier] Références / Bibliographie

--GG 15 juillet 2008 à 01:44 (CEST) supprimé de l'article


--MRG 9 juillet 2008 à 13:14 (CEST)

Je mets ici mes références CiteULike & del.icio.us:

Error: It's not possible to get http://www.citeulike.org/rss/user/bibliothecaire/tag/pratiques_informationnelles...
Error: It's not possible to get http://feeds.delicious.com/rss/bibliothecaire/pratiques_informationnelles...