Science Camp - Stage scientifique 8-14 ans
Stages d'immersion scientifique sur les énergies du futur et sur la physique des glaciers
Crédits : Bénédicte Daly (CNRS)
Cette présentation porte sur l’étude linguistique et phonétique sur code-swicthing (CS) français-arabe algérien à l'aide d'outils de traitement automatique de la parole. Un corpus de 7h30 de parole de 20 locuteurs bilingues (5h de parole spontanée et 2h30 de parole lue) a été conçu, enregistré et annoté. L'un des premiers défis abordés a consisté à développer des méthodes de traitement des données telles que la segmentation en langues, la transcription du français et de l'arabe algérien. Les méthodes d'alignement automatique de la parole ont été adaptées pour traiter les données du code-switching en combinant deux systèmes d'alignement monolingues, produisant ainsi des transcriptions orthographiques et phonémiques avec des localisations temporelles dans les deux langues. Une expérience a été menée pour détecter automatiquement les changements de langue, mais cela reste un défi, en particulier pour les durées de parole monolingues très courtes. Le second aspect de ce travail porte sur l'influence du système phonologique de la langue A sur la deuxième langue B dans la parole du code-switching, en l'occurrence les productions phonétiques de l'arabe et du français.
Le corpus annoté a été utilisé pour effectuer des études phonétiques sur la variation des voyelles et des consonnes en utilisant un paradigme de discrimination automatique de type ABX. Avec ce paradigme, nos résultats sur la variation de la production correspondent aux hypothèses a priori: considérant les voyelles périphériques /i, a, u/, des taux de variantes plus élevés sont mesurés en arabe algérien (40%) qu'en français (27%). Une comparaison avec des locuteurs de langue maternelle française suggère que les locuteurs bilingues ont des productions de voyelles plus conservatrices que les locuteurs natifs (34%), du moins dans le code-switching. Trois études sur la variation des consonnes ont également été menées: la gemination, l’emphatisation et le voisement. Globalement, les consonnes présentent des tendances similaires à celles des voyelles: 42% de taux de variantes pour l'arabe algérien et 30% pour le français en code-switching, contre 38% pour les natifs français. De futures études utilisant ce corpus novateur pourront contribuer à démêler l'interaction complexe entre la variation phonétique et les systèmes phonologiques chez les bilingues dans le code-switching.
Stages d'immersion scientifique sur les énergies du futur et sur la physique des glaciers
Stages d'immersion scientifique sur le climat et sur l'intelligence artificielle
Dans la continuité du colloque du 21 janvier 2026 consacré aux libertés académiques, le Centre d’...
Webinaire "La démarche d'innovation"
avec Bal O'Gadjo
L’Harmonie du Plateau de Saclay et l’Afreubo unissent leurs énergies pour un concert exceptionnel...