Back to list

Detail of contribution

Auteur: Lorenza RUSSO

Titre:
La proximité linguistique en traduction automatique: le cas de l'italien et du français


Abstract/Résumé: La notion de proximité linguistique entre deux langues a fait l'objet d'étude dans différentes branches de la linguistique (didactique, philologie, psycholinguistique, dialectologie). Mais chacune de ces approches reste partiale et insatisfaisante à certains égards (Éloy, 2004), notamment pour ce qui est de la quantification de la proximité entre deux langues données (Nerbonne et Hinrich, 2006). En ce qui concerne la linguistique computationnelle, les recherches ayant comme objet d'étude les langues proches ont mené à des systèmes de traduction automatique (TA) qui présentent une stratégie de traduction basée sur une analyse linguistique de surface (Armentano Oller et al., 2005 et 2006, entre autres). Cette dernière est motivée par l'idée que la proximité linguistique entre langues proches garantit une plus petite différence syntaxique entre ces langues. Cependant, deux aspects n'apparaissent pas dans les travaux en TA: une définition contrastive et quantitative de la proximité entre deux langues proches; des recherches plus approfondies en TA entre l'italien et le français. Dans notre communication, nous allons essayer de combler ces deux lacunes, en proposant tout d’abord une quantification de la proximité linguistique entre l'italien et le français. Nous discuterons, donc, les résultats d’analyses contrastives et quantitatives que nous avons menées tant au niveau morphologique qu’au niveau lexical et syntaxique. Deuxièmement, nous discuterons les tenants et les aboutissants d'une TA par analyse linguistique de surface par rapport à celle par analyse linguistique profonde en nous concentrant sur la paire de langues qui nous intéresse ici. S'il est vrai que l'italien et le français partagent de nombreuses caractéristiques linguistiques (Arcaini, 2000), il est aussi vrai que les différences qui les distinguent sont bien difficiles à traduire avec un traducteur par transfert superficiel. On traitera, donc, du problème de la TA des pronoms personnels et clitiques en italien et en français. Pour le premier cas de figure, nous discuterons l’impact sur la qualité des traductions automatiques vers le français du phénomène du pro-drop (pronom sujet non exprimé) en italien. Pour le deuxième cas de figure, nous nous focaliserons sur l’impact en TA de la variation de place des clitiques (enclise ou proclise) dans les deux langues qui font l’objet de notre étude. Nous discuterons les résultats en TA obtenus non seulement par le traducteur automatique à base de règles développé dans notre laboratoire, Its-2 (Wehrli et al. 2009), mais aussi par les traducteurs automatiques Google Translate, Babelfish et Systran, ces trois derniers systèmes étant en libre accès sur Internet.