Préserver et valoriser le patrimoine linguistique québécois
C’est bien connu, la langue française utilisée au Québec soulève les passions. Mais à ce jour, ce patrimoine d’une richesse exceptionnelle n’est pas aussi accessible qu’on le voudrait, notamment en ce qui concerne la langue parlée. C’est ce qui a motivé la création d’un fonds de données linguistiques et d’une plateforme numérique dédiée à ce trésor national… et une aide financière de 4,5 millions de dollars.
Réalisée par le Centre de recherche interuniversitaire sur le français en usage au Québec (CRIFUQ), cette initiative permettra de valoriser et d’illustrer la diversité de même que la richesse du français en usage au Québec. Pour l’initiateur de ce projet, le professeur Wim Remysen, directeur du CRIFUQ, « ce projet ambitieux s’inscrit dans une riche tradition de recherche sur le français au Québec qui existe à l’Université de Sherbrooke depuis les années 1970. » En effet, c’est à l’UdeS qu’a été élaboré le dictionnaire Usito, offert gratuitement au grand public.
Le projet colossal mené de front par l’Université de Sherbrooke a reçu une aide financière de 4,5 M$ du Gouvernement du Québec. Cette somme sera consacrée à la création du Fonds de données linguistiques du Québec ainsi qu’au développement d’une plateforme numérique en accès libre dotée d’une interface Web permettant d’interroger intégralement le contenu du Fonds.
« Cette subvention permettra de développer une plateforme numérique innovatrice dans le but de documenter la langue française telle qu’elle est utilisée dans le contexte québécois. En plus de sa valeur scientifique, ce fonds s’adresse au grand public, qui pourra y découvrir des usages caractéristiques des régions du Québec ou encore associés à certaines époques de son histoire », explique le professeur Remysen.
Ce projet illustre bien la valeur pour le public des recherches qui se font en linguistique à l’Université de Sherbrooke. « Les chercheuses et les chercheurs dans ce domaine agissent pour préserver notre mémoire, mais aussi pour mieux comprendre notre identité et son évolution, indique la doyenne de la Faculté des lettres et sciences humaines de l’Université de Sherbrooke, la professeure Anick Lessard. Cela démontre encore une fois toute la pertinence des études en sciences du langage au Québec. Les retombées culturelles, quoique souvent méconnues, sont immenses pour la société. »
Pour le vice-recteur à la recherche et aux études supérieures, le professeur Jean-Pierre Perreault, « cette initiative démontre encore une fois que nous avons la volonté de contribuer concrètement à la société et, dans ce cas précis, à toute la francophonie. En tant qu’établissement d’enseignement supérieur et pôle de recherche majeur du Québec, nous nous engageons à faire rayonner la langue française et favoriser le développement de la culture québécoise ».
Découvrir un immense trésor en quelques clics
Ce que la plateforme permettra de faire, ultimement, c’est de consulter un ensemble de données qui illustrent les usages du français en contexte québécois. Lorsqu’un utilisateur ou une utilisatrice cherchera un mot dans le Fonds, l’interface permettra d’afficher un court contexte d’utilisation, pour les corpus textuels, ou encore d’écouter de courts extraits, dans le cas des corpus oraux – toujours dans le respect des limites autorisées par les droits d’auteur qui sont associés aux données.
Le fait de donner accès à des corpus n’est pas nouveau en soi. Il existe en effet une foule d’initiatives intéressantes en vue d’archiver et de partager des données scientifiques par le recours à des outils informatiques. En Europe, quelques plateformes ont déjà la vocation de faciliter la consultation de corpus linguistiques.
Là où ce projet innove, c’est en permettant de rechercher des usages (des mots ou des suites de mots, par exemple) dans plusieurs corpus réunis, à l’aide d’un seul moteur de recherche. Le projet permettra de tisser des liens entre tous les corpus et de filtrer les données sur la base de plusieurs critères de recherche, par exemple, une période donnée ou une région précise.
Un vaste terrain de recherche pour les linguistes
Si notre variété de français fait l’objet de travaux et d’observations depuis le tournant des 19e et 20e siècles, ce n’est qu’à partir des années 1960, avec l’institutionnalisation de la linguistique comme discipline universitaire, que l’on a commencé à documenter plus systématiquement notre langue, entre autres avec la constitution de corpus oraux, réalisés à partir d’enquêtes et d’entrevues. Or plusieurs de ces corpus ont été enregistrés sur des supports devenus désuets et, pour sauvegarder les données, leur numérisation s’impose.
« Évidemment, du point de vue de la recherche, ces corpus sont d’une richesse considérable, estime le professeur Remysen, puisqu’ils permettent entre autres d’étudier l’évolution que le français a connue au Québec au cours des dernières décennies. Sur la plateforme, ils côtoieront des corpus constitués récemment, avec des données actuelles et représentatives des usages du français contemporain. »
Le Fonds inclura aussi des corpus textuels, c’est-à-dire des ensembles de textes, publiés ou non, qui donnent accès à d’autres registres de la langue, comme des textes littéraires, appartenant à des genres variés (roman, théâtre, poésie, bande dessinée). Là aussi, la plateforme permettra la consultation de données à la fois anciennes et contemporaines, selon les intérêts de l’utilisatrice ou de l’utilisateur. D’ailleurs, les contenus variés du Fonds permettront de contribuer à l’enrichissement du dictionnaire Usito, notamment par l’ajout de contenus linguistiques et culturels, par exemple avec des citations d’œuvres littéraires québécoises.
Et pourquoi pas en classe?!
Au Centre de recherche interuniversitaire sur le français en usage au Québec, on espère que cette plateforme deviendra un lieu de découverte, notamment pour les personnes qui œuvrent dans le milieu de l’éducation. On donnera ainsi accès à une foule de données qui pourront être utilisées en salle de classe, dans les cours de français par exemple.
Dans le cadre du projet, nous souhaitons d’ailleurs développer des activités éducatives en vue de favoriser la découverte des données et leur utilisation. Et bien sûr, je pense aux cours de francisation, où il est important d’utiliser des échantillons de la langue parlée au Québec dans des contextes très variés, à l’écrit, mais surtout aussi à l’oral.
Professeur Wim Remysen
Plus largement, le professeur Remysen croit que toutes les personnes qui ont une curiosité pour les questions liées à la langue pourront avoir un intérêt pour cette plateforme.
Et bien sûr, dès lors que ces données sont disponibles sur une plateforme numérique, il n’y a plus de frontières pour faire connaître notre français québécois au plus grand nombre, à travers le monde.
Même si le projet vient d’être annoncé, le travail, lui, est amorcé depuis un certain temps. « Nous avons déjà complété la numérisation de certains corpus – entre autres, certains corpus enregistrés sur des bandes magnétiques utilisées dans les années 1970 ont été convertis en fichiers numériques – et ces données sont en cours de transcription. Il y a aussi un important travail de préparation à faire en amont, la plateforme reposant sur un outil de gestion électronique de documents dont le développement est bien avancé. »