Gallicagram : les archives de presse sous les rotatives de la statistique textuelle
Gallicagram est un nouvel outil de lexicométrie, fondé notamment sur les archives océrisées de la Bibliothèque nationale de France et sur celles du journal Le Monde ; il dénombre dans le corpus choisi et pour une période donnée les occurrences d’un mot ou d’un syntagme, et offre différents modes de visualisation des données obtenues. Ce logiciel mérite à plusieurs titres d’être investi par les chercheurs : outre le volume des données qu’il exploite, suffisant pour fonder des analyses lexicométriques depuis le XVIIe siècle jusqu’à nos jours, Gallicagram a sur son concurrent immédiat, Ngram Viewer, l’avantage d’une transparence très supérieure et d’une structure plus constante au cours du temps. L’article présente Gallibase, son extension qui lui applique les outils de la statistique textuelle – en particulier les analyses factorielles et arborées. Il illustre son potentiel et insiste sur l’intérêt spécifique des corpus de presse, qui permettent des études sur périodes courtes.
The SSH Open Marketplace is maintained and will be further developed by three European Research Infrastructures - DARIAH, CLARIN and CESSDA - and their national partners. It was developed as part of the "Social Sciences and Humanities Open Cloud" SSHOC project, European Union's Horizon 2020 project call H2020-INFRAEOSC-04-2018, grant agreement #823782.