Title: Ne jetons pas le Wiktionnaire avec l'oripeau du Web ! Etudes et réalisations fondées sur le dictionnaire collaboratif
Abstract: Wiktionnaire est l'édition française de Wiktionary, le dictionnaire libre multilingue accessible en ligne. Satellite de Wikipédia, dont il constitue le « compagnon lexical », le projet dictionnairique reste dans l'ombre de l'encyclopédie. Fondé comme elle sur le principe du wiki, il peut être alimenté et modifié par tout internaute, avec publication immédiate. Si la ressource encyclopédique a été abondamment utilisée dans certaines disciplines, le dictionnaire collaboratif semble avoir reçu moins d'attention de la part de la communauté scientifique. Ce moindre intérêt pourrait être le fruit d'une méconnaissance ou d'un rejet a priori de l'amateurisme que l'on associe volontiers aux contributions effectuées par des naïfs. Nous présentons dans cet article quelques caractéristiques du Wikionnaire, ainsi que des réalisations issues de cette ressource. Ce travail entend illustrer les possibilités offertes par ce dictionnaire singulier, comment il est possible de l'exploiter et pour quel usage. Plus précisément, nous questionnons la légitimité des ressources « approvisionnées par les foules » et nous étudions dans quelle mesure le Wiktionnaire peut, par ses spécificités, compléter les ressources dictionnairiques existantes dans le cadre d'études linguistiques ciblées et, d'autre part, servir de point de départ à la constitution d'un lexique électronique pour des domaines comme le traitement automatique des langues et la psycholinguistique. Notre contribution à la caractérisation du Wiktionnaire s'accompagne de la mise à disposition de deux lexiques construits à partir du dictionnaire collaboratif : - le premier est un lexique flexionnel et phonologique à très large couverture. Destiné notamment aux applications de TAL, nous donnons également des exemples d'utilisations de ce lexique en linguistique outillée. - le second est un lexique orienté vers la psycholinguistique. Dérivé du premier, il contient moins d'entrées, mais comprend pour chacune d'elle un ensemble d'informations habituellement utilisées dans cette discipline. Ces lexiques sont à la fois téléchargeables librement et interrogeables en ligne.