Ceci est une ancienne révision du document !
Table des matières
Un chantier en soi : miner les versions numériques des publications du Québec
Des échanges avec Christian Roy et Gilles Herman, qui développent le projet TAMIS (tamis.ca), ont permis d'identifier une façon de plonger plus avant dans les mentions textuelles des rivières.
Trois principales variables sont à prendre en considération.
Accès
Il faut pouvoir avoir accès aux versions numériques des livres publiés au Québec. Les entrepôts numériques de livres sont potentiellement une mine d'or, plusieurs éditeurs ayant rendu disponibles leur production de cette façon – du moins la production récente. Cependant, pour utiliser ces contenus, il faut avoir l'autorisation de miner ces contenus, de les analyser. Une entente peut être établie avec les éditeurs visés, de sorte de baliser le type d'usage qui est envisagé. Une fois ces ententes passées, la manipulation de ces textes reste somme toute assez aisée (le volume n'est pas disproportionné).
Identification
- l'identification des éléments que l'on recherche – une identification qui dépasse la liste des noms, demandant idéalement qu'on puisse s'appuyer sur un identifiant stable