Initiation au Traitement Automatique des Langues
Guy Perrier
 Licence en Mathématiques et Informatique Appliquées aux Sciences Humaines et Sociales (MIASHS)
Université de Lorraine
Le but du cours est de donner un panomara relativement large des méthodes et outils mathématiques à la fois symboliques et satistiques utilisés dans différentes applications du Traitement Automatique des Langues.
Voici le plan du cours:
  1. Introduction au Traitement Automatique des Langues (transparents pdf)

    Nous commençons par une présentation du monde du traitement automatique des langues (TAL), tant dans ses aspects industriels que recherche ou formation. Nous introduisons les différents niveaux de la langue naturelle, ainsi que les concepts de grammaire et de lexique. Enfin, nous illustrons la complexité du TAL par un exemple de chaîne complète de traitement automatique.

  2. Traitement de textes bruts (transparents pdf

    Nous présentons les différentes méthodes de codage des caractères constituant les textes, les expressions régulières et leur application à la segmentation des textes en phrases et en mots.

  3. Etiquetage morpho-syntaxique (transparents pdf)

    Après avoir présenté l'intérêt et le principe de l'étiquetage morpho-syntaxique, nous exposons deux méthodes de mise en œuvre, une méthode statistique fondée sur les n-grammes et une méthode à base de règles, la méthode de Brill.

  4. Classification de textes (transparents pdf)

    Nous présentons deux méthodes statistiques de classification de textes, la première utilisant des arbres de décision construits à partir d'un corpus d'apprentissage et la seconde qui est une méthode de classification bayésienne naïve. 

  5. Analyse syntaxique (transparents pdf)

    Nous commençons par présenter le modèle syntagmatique de la syntaxe des langues naturelles et les grammaires algébriques qui vont de pair avec ce modèle, puis nous présentons une méthode d'analyse syntaxique qui utilise la tabulation, l'algorithme de CKY.

Bibliographie
Travaux pratiques