Mise à disposition
Le code de la chaîne d’annotation morpho-syntaxique est publié sous licence libre GPLv3 et accessible ici avec le logiciel git.
Le projet regroupe en fait plusieurs dépôts. Les plus importants si vous découvrez presto sont
- la chaîne de traitement elle-même
- le générateur de profils
Les trois autres dépôts, prestoLexicalRules, prestoNormaliser et prestoTokeniser sont installés automatiquement quand vous installez la chaîne de traitement. Ils contiennent de la documentation sur le fonctionnement des différentes étapes du traitement mais vous n’avez pas besoin d’y prêter attention pour commencer à étiqueter un corpus avec presto.