Bases de données : CaSSoPi, BDPRoto, DEEPER, Poissons du Gabon
Personne à contacter
Christian FRESSARD , Egidio MARSICO
Cadre de l'étude et objectifs
Avec le développement de l’informatique, l’élaboration et l’exploitation de base de données se sont développées de façon féconde en linguistique, entre autres pour approcher les problématiques de la diversité et de l’évolution des langues selon différents angles : typologie, reconstructions, modélisation des changements etc. Bien qu’elles demandent un investissement conséquent en termes de collecte, saisie, uniformisation et présentation des données, les bases de données permettent : i) de mieux caractériser un phénomène dans sa diversité, par la réflexion et les choix effectués pour le recueil des données, et la présentation de celles-ci (distribution géographique, temporelle etc. ii) d’effectuer différentes analyses, en particulier statistiques, afin de mettre en évidence d’éventuels mécanismes à la source de la distribution des données iii) l’utilisation de données réalistes en entrée de modèles de nature variée.
En savoir plus...
Grâce aux expertises linguistique ou informatique de différentes membres du laboratoire, nous tentons de constituer différentes bases de données et interfaces afin d’aborder le problème de la diversité et de l’évolution des langues. La majeure partie des domaines linguistiques étudiés par les membres de l’équipe Evolution, que ce soit la sémantique, la phonologie et la linguistique historique, peuvent en effet grandement bénéficier de l’apport de bases de données sur les sons ou les mots des langues du monde.
Parallèlement à une exploitation efficace de la base de donnée UPSID de Ian Maddieson qui regroupe les systèmes phonologiques de 451 langues actuelles (voir opération de recherche 1.1), un des objectifs est le développement d’une base de données sur les proto-systèmes phonologiques reconstruits par les spécialistes de linguistiques historiques, ceci afin de pouvoir comparer ces systèmes anciens aux systèmes plus récents et mettre en évidence d’éventuelles tendances évolutives.
Un autre volet de cette opération de recherche est la création de base de données en lien avec le travail de reconstruction et l’analyse des contacts entre langues. D’une part, nous tentons de créer des bases de vocabulaire spécialisé pour des langues actuelles qui permettent de mettre en évidence de façon très précise certaines évolutions lexicales. D’autre part, un projet ambitieux consiste en la création d’une base regroupant un large ensemble de données lexicales sur les proto-langues proposées par les spécialistes en reconstruction, à des fins de compilation, d’évaluation du processus de construction et de ses productions, et enfin d’exploitation via la mise en œuvre de méthodes automatiques destinées à faciliter le traitement des données et le travail de reconstruction.
Financements
- PICS
entre le laboratoire DDL et l’University of California Berkeley CNRS
Publications
- Marsico, E., 1998, "BDPROTO: a typological view of proto phonological systems", proc. of 2nd International Conference on the Evolution of Language, Londres, Royaume-Uni, Avril
- Marsico, E., 1999, "What can a database of proto-languages tell us about the last 10,000 years of sound changes ?", proc. of XIVth International Congress of Phonetic Sciences, San Francisco, Août
|