Fil d'ariane

Icône

Se retrouver dans le dédale du savoir et de l'information – Pour une gestion structurée de l'information

Taxonomie : petit dossier de lecture

Il y a quelques mois, je réalisais un dossier de lecture sur la taxonomie. Je ne savais pas alors que ce serait exactement ce que j’aurai comme métier… Ce sera intéressant de confronter mes premières impressions d’étudiantes avec mon expérience sur le terrain.

Voici donc le premier volet : le regard d’une étudiante.

Dossier : Taxonomie

Le but de ce dossier de lecture sur le concept de taxonomie est de faire un tour global sur le sujet pour comprendre son utilité, ses domaines d’applications et ses usages étendus au domaine de l’entreprise et dans l’univers numérique. Nous avons donc privilégié ici des articles qui apportaient des définitions et nous aidaient à cerner la variété possible de schémas et d’utilisation des taxonomies. Ceci nous a donné l’occasion de voir l’évolution de la terminologie mais également l’évolution interne à ce concept depuis quelques années avec notamment l’apparition de l’indexation sociale (ou folksonomie) et l’élargissement à partir du domaine de la gestion des publications à la gestion de l’information globale à l’intérieur des entreprises. C’est-à-dire que l’usage de la taxonomie s’étend au-delà du périmètre d’un centre de documentation, d’une bibliothèque, d’un catalogue ou même de la navigabilité au sein d’un site internet, elle peut s’appliquer aussi à l’ensemble de l’organisation des ressources informationnelles d’une entreprise (soit l’information créée à des fins de publication et de diffusion et l’information créée dans le cadre des activités d’une entreprise).

Le premier article : Knowledge taxonomies, écrit par Jo Anne Côté de l’Université McGill, en 2005, évoque le rôle des professionnels en information dans la création et l’usage des taxonomies.

Le deuxième : Taxonomies to tags : from tree to piles of leaves, de David Weinberger, nous parle des origines de la taxonomie jusqu’à l’usage des étiquettes (tags), de nos jours, pour organiser le savoir.

Le troisième : How semantic tagging increases findability, d’Heather Hedden, tout frais sorti de presse, évoque une évolution du vocabulaire pour désigner la taxonomie, l’extraction d’information et l’indexation au sein de l’industrie qui utilise et vend ce genre de services.

Enfin, le dernier article, mais non le moindre, Disembodied information, de Ruth Frendo, évoque la perspective de la taxonomie dans un contexte de gestion de l’information corporative dans sa globalité et de sa complémentarité avec les plans de classification (dans le sens archivistique du terme : organisation selon les fonctions de l’entreprise et non des sujets), ce à quoi et les archivistes, et les bibliothécaires devraient veiller de concert.


Côté, Jo Anne. 2005. Knowledge taxonomies. Information Outlook, vol.9, no 6, juin 2005 : p. 45-52

Note sur l’auteur et la publication

Jo Anne Côté possède une maîtrise en bibliothéconomie et sciences de l’information de l’Université McGill. Elle était bibliothécaire à la référence à la McGill Music Library et la Reginald J.P. Dawson Library à Montréal, au moment de la rédaction de cet article.

 Information Outlook est une publication de la Special Libraries Association (SLA).

Résumé

Dans cet article, l’auteure met en valeur les compétences des professionnels de l’information qui sont utiles et nécessaires pour établir une taxonomie au sein d’une organisation.

Après avoir défini ce qu’est la taxonomie, soit une aide au repérage de l’information qui établit le portrait de concepts abstraits, reflétant les différentes formes que peut prendre la connaissance, sous forme tangible ou intangible.

Elle développe son argument autour des compétences de base nécessaires pour mettre en place cette dernière : techniques d’analyse, de condensation, de recherche, connaissance du catalogage et des systèmes de classification, capacité de synthèse et connaissance des principes du vocabulaire contrôlé, des thésaurus et de l’indexation. Elle signale que les professionnels de l’information possèdent ces savoir-faire et qu’ils sont transférables dans le cadre de la création d’une taxonomie, quel que soit son type : taxonomie à plat (sans relation entre les catégories), taxonomie hiérarchique (architecture en arborescence), réseau de taxonomies (architecture complexe composée de nœuds ayant plus d’une relation parentale) ou taxonomie à facette (ex. : les métadonnées).

De plus, les professionnels de l’information possèdent des compétences interpersonnelles comme l’écoute, l’usage des entrevues et la capacité de s’exprimer efficacement à l’oral comme à l’écrit, qui sont indispensables.

Elle conclut que malgré des désavantages des méthodes traditionnelles en taxonomie, les professionnels de l’information ont leur place dans le domaine des taxonomies du savoir qui consiste à représenter la réalité de ce dernier au sein d’une organisation et à aider les clients à identifier et repérer l’information selon leurs besoins spécifiques.

 


Weinberger, David. 2005. Taxonomies to tags : from trees to piles of leaves. Release 1.0, vol. 23, no 2, février 2005. En ligne < http://downloads.oreilly.com/radar/r1/02-05.pdf >

 Note sur l’auteur et la publication

David Weinberger est un technologue spécialiste de l’Internet (il possède un doctorat en philosophie). Écrivain, chroniqueur, il enseigne The web difference à la faculté de droit de Harvard conjointement avec un autre professeur. Il s’intéresse particulièrement aux taxonomies, aux ontologies et aux métadonnées et comment les principes de base de l’organisation des choses du monde sont en train d’évoluer.[1]

 Release 1.0 est une publication numérique éditée par Esther Dyson depuis 1983, acquise par O’Reilly en 2006, le bulletin de nouvelles a été renommé Release 2.0 (http://radar.oreilly.com/r2/ ). Elle se spécialise dans l’observation de l’évolution des technologies de l’information.

 Résumé

Cet article d’une trentaine de pages évoque l’évolution du concept de taxonomie en tant qu’organisation du savoir depuis Aristote jusqu’à nos jours avec l’émergence de l’indexation sociale : «The idea that knowledge is shaped like a tree is perhaps our oldest knowledge about knowledge».

Il illustre les définitions, avantages, inconvénients de trois types de taxonomies : la hiérarchie, les facettes et les étiquettes (tags), par des exemples d’usage et de choix stratégiques de différents gros joueurs dans le monde Internet (fournisseurs de services ou de logiciels). Commençant par aborder la classification de Dewey, il présente le répertoire de Yahoo !, le choix de Corbis pour le vocabulaire contrôlé, l’automatisation de la catégorisation de ClearForest, l’OSA Foundation, Endeca et Siderean pour l’usage des facettes, del.icio.us, Flickr, Wikipedia, Frassle et Technorati sur l’usage des étiquettes (tags) et de l’indexation sociale (folksonomie).

Il conclut que l’utilisation des étiquettes (tags) est une révolution et force l’innovation en taxonomie. Par contre, il met en doute l’efficacité de l’usage de l’étiquetage à lui seul, sur le long terme, pour organiser le savoir et faciliter le repérage. L’étiquetage amène une perte du contexte qui nuit à la compréhension et au tri des concepts entre eux. Conscient, que l’on se trouve au début d’une transformation, il pose plusieurs questions sur l’avenir possible d’un usage conjoint des taxonomies telles qu’utilisées jusque là et cette nouvelle forme d’indexation. Il souligne que ces changements de paradigme offrent de nouvelles opportunités pour une nouvelle industrie dont, notamment, des experts de contenu (spécialistes en schémas de relations et de vocabulaire contrôlé), des courtiers en tags (fournissant grappes d’étiquettes reliées entre elles, outils d’automatisation, outils d’étiquetage sur la base d’abonnements) et des fournisseurs services de forages de données pourront tirer profit.


[1] Source : David Weinberger – Berkman Center. En ligne http://cyber.law.harvard.edu/people/dweinberger (consulté le 12 octobre 2008, page mise à jour le 27 mars 2008)

 

Hedden, Heather. 2008. Semantic tagging increases findability. EContent, vol. 31, no 8, octobre 2008 : p. 38-43.

Note sur l’auteur et la publication

Heather Hedden est spécialiste en taxonomie avec Viziant Corporation à Boston. Elle est également consultante, Hedden Information Management, et enseigne dans le cadre d’ateliers de formation continue au Simmons College School of Library and Information Science.

 Le magazine EContent se spécialise dans l’information concernant le contenu numérique : «essential reading for executives and professionals involved in content creation, management, acquisition, organization, and distribution in both commercial and enterprise environments

 Voir aussi :

Hedden, Heather. 2008. Taxonomy tool roundup. EContent, avril 2008 : p.40-44. Disponible en ligne via Maestro pour les étudiant de l’UdeM.

Hedden, Heather. 2008. Better living through taxonomies. Digital Web Magazine, 5 février 2008. En ligne <http://www.digital-web.com/articles/better_living_through_taxonomies >

 Résumé

Cet article nous présente l’émergence d’une nouvelle notion qui se répand dans l’industrie spécialisée dans les technologies de l’information le «semantic tagging». Plusieurs moyens aident à trouver l’information : l’indexation selon un vocabulaire contrôlé, l’architecture de l’information (navigabilité), moteurs de recherche, les signets et l’indexation sociale. Chacune de ces méthodes a ses propres limites. Issu de nouvelles techniques et outils développés dans le contexte très compétitif de l’industrie de l’information, le «semantic tagging» est compris selon plusieurs définitions. Ce concept est identifié dans trois secteurs : l’indexation, l’extraction de l’information et l’indexation sociale.. 

Pour certains, il n’y a rien de nouveau là : il s’agit d’attribuer des mots issus d’un vocabulaire contrôlé, par des professionnels, à certains contenu, l’aspect sémantique étant apporté par le fait que l’opération est effectuée par un être humain. Pour d’autres, ce qui distingue l’indexation sémantique de la forme traditionnelle de l’indexation par sujet, c’est que le processus se concentre sur les concepts à l’intérieur d’un document plutôt que sur le document en tant que globalité. Dans le monde de l’extraction de l’information, les nouvelles technologies telles que la catégorisation automatique ou l’analyse textuelle automatisée relèveraient du «semantic tagging» intégré aux moteurs de recherche. Enfin, du côté de l’indexation sociale, l’étiquetage distribué et relié en réseau à des synonymes ou à une carte standardisée de sujets constitue un service de «semantic tagging».

L’auteure conclut que le «semantic tagging» peut être défini comme l’indexation pour le web sémantique. Cela implique que les étiquettes (tags) sont reliées aux spécifications RDF (Resource Description Framework) ou au OWL (Web Ontology Language) du W3C. Bref, il ne s’agit pas simplement d’associer des sujets à des termes mais d’ajouter des métadonnées à propos des étiquettes apposées. Ceci donne une autre perspective à l’indexation sociale se résumant à traduire la popularité d’un terme et s’oriente davantage vers une facilitation du repérage de l’information (meilleure réponse possible).

  

Frendo, Ruth. 2007. Disembodied information : metadata, file plans, and the intellectual organisation of records. Records Management Journal, vol. 17, no 3 : p. 157-168

Note sur l’auteur et la publication

Ruth Frendo est une étudiante à l’Université de Glasgow où elle étudie dans le cadre d’un MSc en Information Management and Preservation.

 Le Records Management Journal traite de tous les aspects concernant la gestion des documents (dans le sens records management).

 Résumé

L’auteure fait un état de la question autour des pratiques contemporaines de gestion de l’information dans un contexte où cette dernière est de plus en plus isolée de son contexte et dématérialisée. La problématique se rapporte au traitement et à la circulation de l’information tout au long de son cycle de vie au sein d’une organisation. Alors qu’une entreprise a besoin de connaître le contexte de création de ses documents, de prouver qu’ils sont authentiques et non altérés, les métadonnées deviennent les témoins d’une traçabilité qui aide à établir ces faits dans un contexte numérique. Cependant, les métadonnées peuvent ne pas suffire pour établir le contexte de création puisque leur lien est fragile avec le document qu’elles décrivent ou qualifient. Mis à part l’avantage de pouvoir automatiser l’indexation, l’usage unique des métadonnées comporte des désavantages : la machine n’est pas aussi intelligente qu’on le souhaiterait (elle ne repère pas les ambiguïtés, ne comprend pas les concepts, ni les liens entre ceux-ci par elle-même) d’où la nécessité d’une taxonomie pour structurer les données et reconnaître le degré de profondeur d’un concept. Cependant, même une taxonomie ne s’avère pas suffisante pour révéler le contexte de création d’une information ce qui est nécessaire pour une information organique et l’est moins pour une information ayant fait l’objet d’une publication où le lien de propriété intellectuelle est plus facilement identifiable. Les métadonnées sont pertinentes quand l’information est un produit de consommation et un outil de marketing, mais le sont-elles pour la gestion de l’information ? En conclusion, les métadonnées sont pratiques d’usage et sans doute moins coûteuses à mettre en place. Leur implantation est viable à court terme. Mais, elles ne peuvent totalement remplacer le rôle d’un plan de classification dont l’objectif est d’aider à planifier le cycle de vie et mettre en contexte l’information reçue et créée par les entreprises dans le cadre de leurs activités : ce qui est important au présent comme au futur pour une saine gestion et préserver la signification de l’information.

 Conclusion

Les articles retenus présentaient des points de vue complémentaires et différents sur le concept de taxonomie.

 Les professionnels de l’information ont d’importants atouts pour prendre leur place dans le domaine de la taxonomie. En effet, cette dernière n’est pas simplement un outil technique de structuration de l’information ajouté aux commodités possibles d’un site web, tel que les professionnels en technologies de l’information ou les ergonomes ont tendance à l’utiliser ou le comprendre. Une taxonomie peut être essentielle pour aider l’utilisateur à trouver l’information dont il a besoin, même s’il ne sait pas exactement ce qu’il cherche. Exercé à organiser la complexité du savoir, à comprendre les questionnements et les attentes des utilisateurs, ainsi que l’ambiguïté des termes, les professionnels de l’information sont bien placés pour être les interlocuteurs privilégiés dans le cadre de la mise en place d’une taxonomie pour le système d’information d’une entreprise conjointement avec les autres professionnels et les utilisateurs.

 Outil de repérage aux multiples visages et toujours en évolution, la taxonomie peut également être un outil de marketing, comme nous l’a montré l’article sur la segmentation stratégique des marchés ou l’utilisation des étiquettes pour exprimer ou repérer la popularité d’un terme et donner plus de visibilité à certaines informations. Dans le mouvement de dématérialisation de l’information (contenu séparé du support mais aussi de plus en plus décontextualisé), la taxonomie permet de maintenir des liens entre différents concepts ou au sein d’un même concept et, donc, une meilleure compréhension de l’information et de sa validité.

 Cependant, en s’étendant en dehors du périmètre contrôlé d’un site web ou d’une interface utilisateur, l’usage d’une taxonomie seule n’est pas suffisant pour retracer l’authenticité, la validité ou témoigner de l’existence originelle et intentionnelle de cette information. Si appliquée à une information organique (créée dans le cadre des activité d’une entreprise), une taxonomie doit être accompagnée d’un plan de classification calqué sur les activités de l’entreprise concernée.

 Ce que nous retenons, c’est qu’il est nécessaire de rester conscient qu’aucune taxonomie n’est neutre, ni n’est destinée à être objective. Dans le cadre particulier d’une entreprise, nous ne nous inscrivons pas dans une perspective humaniste et universelle de l’organisation du savoir. Nous savons qu’une taxonomie révèle et doit refléter la culture de la société ou d’une organisation. Elle se doit de coller à la réalité qu’elle représente en répondant à des objectifs précis. L’information n’est pas organisée pour la beauté de l’exercice, une taxonomie répond à des fins qu’il est bon d’identifier.

 La taxonomie est un outils complémentaire à la recherche plein texte, puisqu’elle permet de plus rapidement identifier les concepts et d’éviter les ambiguïtés, ce que ne permet pas la recherche plein texte à elle seule. Une taxonomie qui mixte hiérarchie et facette semble le plus efficace pour permettre de naviguer du global au spécifique et inversement. Les relations entre différents «silos», c’est-à-dire une navigation horizontale et transversale, permet de compenser quelque peu le risque de rester dans une trop grande spécificité, laissant croire à l’utilisateur que l’information n’existe pas ou n’est pas disponible à tort s’il s’engage dans une branche qui ne contient finalement pas l’information qu’il cherche.

Si l’indexation sociale laisse entrevoir d’autres possibilités et permet aux utilisateurs de s’approprier un contenu, l’intervention d’un contrôle et d’un cadre de référence n’en est pas moins important pour assurer une cohérence globale et répondre au besoin de base pour lequel le concept de taxonomie est né : permettre d’avoir une vue d’ensemble et faciliter le repérage de l’information particulièrement quand il faut gérer la complexité. Complexité qui s’accroît d’ailleurs d’autant avec la diversité des interprétations possibles et l’accroissement exponentiel de la quantité d’information disponible.

 Enfin, étant donné qu’un système d’information corporatif ne se limite pas à son intranet (compris en tant qu’information rendue disponible et partagée via un navigateur) mais intègre également les informations créées par et nourrissant des activités administratives, financières, légales et spécifiques à une entreprise, il est important de voir et réfléchir à la question de savoir si une taxonomie peut être ou est un outil valable, efficace et pertinent, à lui seul et à quelles conditions, pour organiser l’information organique et baliser son traitement tout au long de son cycle de vie, de sa création à son élimination ou son versement aux archives définitives, donc dans une perspective de conservation pérenne et à long terme. L’information organique aussi peut être et devrait être considérée comme un intrant et une source de savoir dans le cadre d’une gestion des connaissances, pour ne citer que cet exemple. Les enjeux et les points de vue de la documentation (trouver l’information pertinente) et de gestion (organiser l’information pour répondre à des obligations administratives, légales et financières) ne sont pas en compétition mais bien en complémentarité, particulièrement dans un contexte corporatif, tout en ayant chacun leurs exigences spécifiques. Dans le contexte du numérique, il devient d’autant plus pertinent et important pour les professionnels de l’information de connaître à tout le moins les bases régissant ces différents aspects concernant l’information et les ressources informationnelles que l’on aura à gérer.


Recommandations

Dans notre exploration des articles, nous n’avons volontairement pas insisté sur les logiciels ou applications qui intègrent, aident à la création manuelle ou permettent l’automatisation ou l’importation d’une taxonomie. Il en existe plusieurs et l’industrie, comme le reste de l’industrie des technologies de l’information, est en constante évolution. Chaque application répond à des besoins et des objectifs différents (applications dédiées, portails, fournisseurs de services, etc.). L’évaluation de chaque logiciel ou service doit s’effectuer en fonction de besoins précis.

 Pour information, voici quelques joueurs et produits parmi les plus répandus pour développer des taxonomies personnalisées manuellement (Hedden, avril 2008) : MultiTes Pro (www.multites.com), Term Tree (www.termtree.com.au), TCS-10 (www.webchoir.com).

 Une taxonomie doit, entre autres, :

         Être collée à la réalité des besoins informationnels des utilisateurs et à la culture de l’entreprise où elle sera implantée .

         Être homogène et cohérente : il n’est pas idéal de mêler produits et fonctions par exemple. Dans ce cas, l’un peut être une des facettes de l’autre mais non se retrouver au même niveau.

         Être évolutive : l’information est comme un organisme vivant, elle évolue. Les grandes classes doivent être suffisamment larges pour permettre aux catégories inférieures de croître tout en évitant une trop grande profondeur, si possible (ergonomiquement, cela impliquerait trop de clics et découragerait le furetage).

–    Attention aux chevauchements d’une catégorie à l’autre, cela engendre un risque d’ambiguïté ;

         Correspondre au vocabulaire utilisé par les utilisateurs. Dans le cas d’un intranet, il faut repérer la terminologie utilisée et à mettre en valeur pour assurer que les employés parlent le même langage et se comprennent les uns les autres : si l’on arrive à déterminer une base commune la communication est facilitée d’un département à l’autre. D’un autre côté, identifier des experts de contenu, pour les unités qui utilisent un vocabulaire très spécifique, est indispensable pour s’entendre la définition d’un terme et valider s’il s’agit bien du concept tel que compris et utilisé. Cela permet, de plus, d’intégrer plus rapidement les nouveaux employés.

         Ne pas être utilisée comme seul moyen d’organisation (soit en tant que métadonnées, essentiellement de description et par sujet) de l’information au sein d’un système d’information corporatif. L’implantation d’une taxonomie ne dispense pas de la pertinence d’utiliser un cadre de classification en fonction des activités de l’entreprise afin d’assurer une gestion cohérente et permettre de faire une transition plus facile entre les besoins à court terme (décisions, compétitivité, production, etc.) et à long terme (patrimonial, scientifique et historique).

 En résumé, une taxonomie est bâtie sur la base d’un dialogue entre plusieurs interlocuteurs : utilisateurs, experts de contenus, professionnels des technologies de l’information et ergonomes avec l’appui des hauts responsables dans le respect de la vision, de la culture et des objectifs de l’entreprise.

 

Bibliographie

Côté, Jo Anne. 2005. Knowledge taxonomies. Information Outlook, vol.9, no 6, juin 2005 : p. 45-52

Frendo, Ruth. 2007. Disembodied information : metadata, file plans, and the intellectual organisation of records. Records Management Journal, vol. 17, no 3 : p. 157-168

Hedden, Heather. 2008. Semantic tagging increases findability. EContent, vol. 31, no 8, octobre 2008 : p. 38-43.Hedden, Heather. 2008. Taxonomy tool roundup. EContent, avril 2008 : p.40-44. Disponible en ligne via Maestro pour les étuidiants de l’UdeM.

Hedden, Heather. 2008. Better living through taxonomies. Digital Web Magazine, 5 février 2008. En ligne <http://www.digital-web.com/articles/better_living_through_taxonomies >

Weinberger, David. 2005. Taxonomies to tags : from trees to piles of leaves. Release 1.0, vol. 23, no 2, février 2005. En ligne < http://downloads.oreilly.com/radar/r1/02-05.pdf >

Classé dans:Documents (accès, organisation, structuration), Folksonomie, Métadonnées,

2 Responses

  1. Antonin Benoît DIOUF dit :

    Très intéressant et riche dossier, bien documenté avec une rigueur d’analyse à saluer. A quand la suite ?

  2. […] Taxonomie : petit dossier de lecture, par Karin Michel, archiviste : […]

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s