Vous êtes ici : Accueil / À consulter également

À consulter également

2 ressources contiennent le mot-clé statistique.

Rechercher aussi dans titre et résumé (recherche structurée).

Faire face au syndrome du Jabberwocky: Analyses morpho-syntaxiques en environnement hostile

par Djamé Seddah, publié le 28/10/2016

type-video.png conference.png Les analyseurs statistiques atteignent depuis quelques années un haut niveau de performance sur des textes standard. Des techniques d'adaptation au domaine ont de surcroit amélioré leur résultats sur des corpus de genres différents de ceux sur lesquels ces analyseurs sont généralement entrainés. Néanmoins, ces textes sont habituellement conformes aux normes linguistiques usuelles (orthographe, typographie, etc.). L'émergence de nouveaux médias de communication a entrainé l'apparition de nouveaux types de données textuelles. Bien qu'éminemment intéressant, en terme de data mining ou d'analyse d'opinion, ce « contenu généré par l'utilisateur » a ceci de particulier qu'il est bruité. Cette particularité empêche les outils d'analyses de traitement automatique des langues, surtout quand ceci sont « data driven », de proposer des performances satisfaisantes. Afin de déterminer quels sont les goulots d'étranglement de nos outils, nous avons développé le French Social Media Bank, le premier corpus arboré d'une langue à morphologie plus riche que l'anglais. Cette ressource contient 3700 phrases de sources diverses (Twitter, Facebook, forums web), en particulier des textes choisis pour leur caractère extrêmement bruité.

Mesure et démesure du discours. Nicolas Sarkozy 2007-2012

par Damon Mayaffre , publié le 20/12/2012

conference.png type-video.png Le sarkozysme constitue une rupture dans l’histoire politique de la Ve République. Dénonçant la pensée unique, rompant avec les codes lexicaux ou la bienséance discursive, Nicolas Sarkozy invente, jusqu’à choquer, une nouvelle forme d’expression dissensuelle au service d’une idéologie néo-droitière ou post-État providence. L’étude logométrique, faite de lecture hypertextuelle et de statistique textuelle, permet de prendre la mesure des discours. Le corpus des discours de Sarkozy (2007-2012) est systématiquement passé au crible des logiciels TXM (Ens-Icar-Lyon) et HYPERBASE (Uns-Bcl-Nice). Les conclusions sont fortes : le parler Sarkozy constitue une rupture dans l’histoire du discours politique sous la Ve République, faisant basculer la droite républicaine française vers un au-delà.