Logic List Mailing Archive

RLTLN 2014: Reseaux Lexicaux et Traitement des Langues Naturelles

1 Jul 2014
Marseille, France

We do accept papers written in English by those who are not fluent in French

       Les articles seront rédigés en français pour les francophones,
       en anglais pour ceux qui ne maîtrisent pas le français.
       ---------------------

       Réseaux Lexicaux et Traitement des Langues Naturelles (RLTLN)

       Atelier TALN 2014
       Faculté Saint Charles (Aix Marseille Université), 1er juillet 2014.
       Date limite de soumission : 21 avril 2014

       Organisateurs :
       Michael Zock (LIF, Marseille)
       Gemma Bel-Enguix (LIF, Marseille)
       Reinhard Rapp (LIF, Marseille et Université de Mainz)



1 PRÉSENTATION DU CHAMP

La façon dont nous regardons les unités lexicales, leur organisation et utilisation a radicalement
changée ces dernières décennies. Décrites dans des dictionnaires et considérées comme des annexes de la
grammaire dans les années 80, on les considère désormais comme de la matière première en TAL. Si à
l?époque on utilisait encore des termes comme 'mots' ou 'dictionnaires', on parle aujourd?hui plutôt de
'ressources lexicales' dont il existe un certain nombre (WordNet, FrameNet, VerbNet, PropBank, ...).
Celles-ci ont été standardisées (http://en.wikipedia.org/wiki/UBY-LMF), liées entre elles
(http://verbs.colorado.edu/semlink/) ou liées à des encyclopédies comme Wikipédia
(http://en.wikipedia.org/wiki/BabelNet). Il y a également des projets comme DBnary
(http://kaiko.getalp.org/about-dbnary) qui, partant de Wiktionary, fournit des ressources lexicales
dans de nombreuses langues.

Si dans le passé on créait des dictionnaires à la main, on le fait aujourd'hui de manière (semi-)
automatique et à l'aide de corpus. Bien entendu, cette évolution ne s'est pas faite du jour au
lendemain. Les premières tentatives de création automatique de ressources à partir de dictionnaires
imprimés (Ide Véronis, sites.univ-provence.fr/veronis/publis.html) se sont vite heurtées à des
problèmes, en raison de la pauvreté de la source : les dictionnaires papier ne contenaient pas les
informations nécessaires permettant ensuite un usage par la machine. Or, c?était justement le but
recherché. L?accès à de vastes corpus a alors permis de marquer un tournant et de construire des
ressources plus riches, plus explicites et mieux structurées. Concernant ce dernier point, WordNet (WN)
a joué un rôle capital. Bien qu?il n?a pas eu le succès escompté auprès des psycholinguistes ou auprès des
utilisateurs consultant la ressource (pour chercher des mots), WN a eu un succès considérable en TAL.
Ceci dit, il a également eu un impact incontestable sur le plan théorique. WN a profondément modifié
notre manière de voir la structure des ressources lexicales. Dorénavant, elles ne se résument plus à
des simples listes alphabétiques, mais elles sont réprésentées plutôt sous forme des graphes (réseau
lexical) dont les noeuds sont des unités lexicales liées par différents types de relations.

Parallèlement à l?évolution des ressources lexicales, on a pu observer une évolution notable concernant
les travaux portant sur les graphes. Ces derniers semblent se prêter à merveille à la modélisation de
divers domaines (Barrat, 2008, Barabási, 2003), y compris celui de la langue. En effet, il y a eu de
nombreux travaux montrant leur pertinence pour capter le sens des mots et celui des phrases (Widdows,
2004; Sowa, 1991) ou pour modéliser divers aspects du 'monde' lexical : structures associatives
(http://www.eat.rl.ac.uk, ou http://w3.usf.edu/FreeAssociation/), structure du dictionnaire (Gaume et
al. 2008), densité lexicale, distance moyenne entre les mots (Vitevitch, 2008), accessibilité (Ferrer i
Cancho Sole, 2001), aspects dynamiques des graphes (Dion, 2012), etc.

Nous constatons donc qu?il y a deux communautés, dont l?une s?intéresse aux données (concrètes commes les
unites lexicales), et l?autre plutôt à leur représentation et organisation (graphes, topologie,
navigation). C?est pour encourager l?échange d?idées entre ces deux mondes, que nous organisons cet atelier.


2 THEMES

Nous attendons des soumissions portant sur les thèmes évoqués plus haut et en particulier :
  *  Origine des données permettant la construction des ressources : corpus (web, blogs, courriels),
     êtres humains (liste d?associations), etc. ;
  *  Méthode de construction de la ressource: automatique, semi-automatique, collaborative (par des
     jeux, etc.) ;
  *  Construction automatique du réseau (repérage et caractérisation des relations sémantiques) ;
  *  Structuration des données : alphabétique, thématique, liens sémantiques, liens associatifs ;
  *  Propriétés mathématiques des réseaux lexicaux ;
  *  Facteurs affectant le poids des noeuds ou des liens : aspects dynamiques des graphes (fréquence,
     saillance, récence, changement de thème, etc.) ;
  *  Caractérisation topologique du graphe lexical : distribution, densité relative, évolution du graphe
     ;
  *  Exploitation ou utilisation de la ressource ou d?une de ses transformations comme la transformation
     du graphe en arbre pour assister la navigation (accès lexical) ;
  *  Accessibilité des mots grâce à des caractéristiques du réseau (phénomène du ?petit monde?) ;
  *  Visualisation et manipulation des graphes (traduction en arbre, clustering, calcul de similarité
     sémantique) ;
  *  Modélisation des variations linguistiques et des changements de la langue (évolution du lexique).

3 CRITÈRES DE SÉLECTION

Les soumissions seront examinées par au moins deux spécialistes du domaine.

Pour les travaux de recherches, seront considérées en particulier :

  *  l'adéquation aux thèmes de l'atelier,
  *  l'importance et l'originalité de la contribution,
  *  la correction du contenu scientifique et technique,
  *  l'organisation et la clarté de la présentation.

4 MODALITÉS DE SOUMISSION

Les articles seront rédigés en français pour les francophones, en anglais pour ceux qui ne maîtrisent
pas le français. Ils devront suivre le format de TALN 2014 et ne doivent pas dépasser 10 pages
(références comprises). Les feuilles de style (LaTeX et Word) sont disponibles sur le site web de la
conférence (http://www.taln2014.org/site/soumission/). Les propositions doivent être envoyées sous
forme pdf à l?adresse suivante : (https://www.easychair.org/conferences/?conf=RLTLN2014). Les articles
retenus donneront lieu à une présentation de 30 mn, discussion comprise.

5 COMITE DE PROGRAMME

  *  Bel Enguix, Gemma (LIF, Université Aix-Marseille, France)
  *  Bouillon, Pierrette (tim, Faculté de Traduction et d?interprétation de Genève, Suisse)
  *  Cristea, Dan (University A.I.Cuza, Iasi, Romania)
  *  Ferrer i Cancho, Ramon (larca, université polytechnique de Catalogne, Barcelone, Espagne)
  *  Ferret, Olivier (cea list, Gif sur Yvette, France)
  *  Francopoulo, Gil (Tagmatica, Paris, France)
  *  Gala, Nuria (lif-cnrs, Aix Marseille Université, Marseille, France)
  *  Granger, Sylviane (Université Catholique de Louvain, Belgium)
  *  Grefenstette, Gregory (Inria, Saclay, France)
  *  Lapalme, Guy (rali, Université de Montréal, Canada)
  *  Lenci, Alessandro (Université de Pise, Italie)
  *  L'Homme, Marie-Claude (Université de Montréal, Canada)
  *  Massip i Bonet, Àngels: (Université de Barcelone, département de philologie Catalane, Espagne)
  *  Navigli, Roberto (Sapienzia, Université de Rome, Italie)
  *  Ploux, Sabine (L2C2, Institut des Sciences Cognitives, Lyon, France)
  *  Prévot, Laurent (lpl, Université Aix Marseille, Aix en Provence)
  *  Rapp, Reinhard (lif, France) et (université de Mainz, Germany)
  *  Rosso, Paolo (nlel, Universitat Politècnica de València, Spain)
  *  Schwab, Didier (lif-getalp, Grenoble, France)
  *  Sérasset, Gilles (lig, Grenoble, France)
  *  Zock, Michael (lif, Marseille, France) et (Université de Tainan, Taiwan)

6 DATES IMPORTANTES

  *  Date limite de soumission : 21 avril 2014
  *  Notification aux auteurs : 10 mai 2014
  *  Soumission de la version définitive : 30 mai 2014
  *  Date de l?atelier : 1er juillet 2014

7 CONTACT

- Michael Zock michael.zock [arobas] lif.univ-mrs.fr
- Gemma Bel Enguix gemma.belenguix [arobas] gmail.com
- Reinhard Rapp reinhardrapp [arobas] gmx.de


Web :

http://www.taln2014.org/site/
https://sites.google.com/site/rltlntaln2014/