La correction participative de l'OCR : Le crowdsourcing au profit des bibliothèques numériques
Mots-clés : numerisation, patrimoine, biens_communs_de_la_connaissance
Les documents numérisés par les bibliothèques font très souvent l’objet d’une océrisation, c’est à dire d’un traitement informatique de reconnaissance optique de caractères (OCR) qui va chercher à identifier à quel caractère correspond la photographie de tel caractère. Malheureusement, ce type de traitement génère de nombreuses erreurs.
Les bibliothèques externalisent aujourd’hui ce travail de correction manuelle de l’OCR auprès de prestataires qui font appel à de la main d’œuvre à bas coût, à Madagascar, en Inde ou encore au Viêt Nam. Une alternative à ces coûteuses et parfois critiquables prestations est de faire appel au crowdsourcing, c’est à dire d’externaliser ces opérations auprès de la foule des internautes en les engageant à corriger les textes numérisés volontairement (crowdsourcing explicite), contre rémunération, sous la forme de jeux (gamification) ou encore sans qu’ils en aient conscience (crowdsourcing implicite)
Lire cet article sur le BBF
Articles portant sur des thèmes similaires :
- Des centaines de films en ligne grâce à la bibliothèque du Congrès - 25/10/18
- Résoudre le casse-tête du financement de la numérisation patrimoniale ? - 13/10/15
- Dans la forêt touffue des bibliothèques numériques patrimoniales françaises : quels choix, quelles stratégies, quelles perspectives ? - 27/02/15
- Le choix du Metropolitan Museum et les pathologies du domaine public - 14/02/17
- Le crowdsourcing appliqué aux archives numériques : concepts, pratiques et enjeux - 01/04/16
- Les musées du York mettent en libre accès plus de 160 000 oeuvres de leurs collections - 27/01/15
- Transformer les bibliothèques en « Maisons des Communs » sur les territoires - 31/03/17
- Le partenariat Apple/BnF, “pas une bonne idée” selon les libraires français - 22/01/16
- Les bibliothécaires rappellent le droit d'accès à l'information pour tous - 17/06/15
- OldNYC.org ou comment valoriser un fonds de photos patrimoniales de bibliothèque - 04/06/15
Imprimer | Commenter | Articlé publié par Lionel Dujol le 17 Juin 15 |