Outils en ligne

Outils statistiques - Transcriptions de CFPP2000

Ces outils sont disponibles sur cette page. Ils permettent de lancer des calculs statistiques élémentaires sur les transcriptions.

Outils de Recherche dans les données CFPP2000

Recherche dans les textes des transcriptions de CFPP2000 : ce moteur permet de lancer des requêtes sur l'ensemble des données de transcription disponibles dans CFPP2000 ; l'unité de texte utilisée pour faire la recherche est le tour de parole.

Recherche via la cartes des sections (tours de parole) des transcriptions de CFPP2000 : ce moteur permet de lancer des requêtes sur l'ensemble des données de transcription disponibles dans CFPP2000 ; l'unité de texte utilisée pour faire la recherche est le tour de parole. Le résultat affiche une « représentation cartographique » des transcriptions sous la forme d'une carte des sections (cf Lexico3).

Recherche dans les textes des transcriptions annotées (via TreeTagger) de CFPP2000 : ce moteur permet de lancer des requêtes sur l'ensemble des données annotées de transcription disponibles dans CFPP2000 ; l'unité de texte utilisée pour faire la recherche est le tour de parole.

Recherche dans les métadonnées de CFPP2000 : ce moteur dispose de plusieurs modes de recherche ; pour chacun, les données interrogées sont constituées par l'ensemble des métadonnées disponibles pour CFPP2000.

Outils utilisés pour CFPP2000

Transcriber

Transcriber est un programme permettant de réaliser des transcriptions de l'oral alignées avec le signal. (mode d'emploi rédigé par J.M Debaisieux, CRAPEL)

Audacity

Audacity est un éditeur audio libre et facile d'utilisation pour Windows, Mac OS X, GNU/Linux, et bien d'autres systèmes d'exploitation.

makeMetadata

makeMetadata est un générateur de métadonnées (exécutable pour Windows). Lectures : transparents, mode d'emploi

Lexico3

Lexico3 est réalisé par l’équipe universitaire SYLED-CLA2T (André Salem et alii). Lexico3 est l'édition 2001 du logiciel Lexico dont la première version remonte à 1990. Les fonctionnalités présentes dès la première version (segmentation, concordances, décomptes portant sur les formes graphiques, spécificités et analyses factorielles portant sur les formes et les segments répétés) ont été conservées et, la plupart du temps notablement améliorées. L'originalité principale de la série Lexico est qu'elle permet à l'utilisateur de garder la maîtrise sur l'ensemble des processus lexicométriques depuis la segmentation initiale jusqu'à l'édition des résultats finaux. Les unités qui seront ensuite automatiquement décomptées sont exclusivement constituées à partir de la liste des délimiteurs fournie par l'utilisateur, sans recours à des ressources dictionnairiques extérieures. Au-delà du repérage des seules formes graphiques, le logiciel permet d'étudier dans les textes la répartition d'unités plus complexes composées de séquences de forme : segments répétés, couples de forme en cooccurrence, etc. au contenu souvent moins ambigu que les formes graphiques dont elles sont composées.

Le Trameur

Le Trameur est réalisé par l’équipe universitaire SYLED-CLA2T (Serge Fleury et alii). Trameur : outil informatique qui permet de construire une ressource textométrique Trame/Cadre (cf Le Trameur. Propositions de description et d’implémentation des objets textométriques), à partir d'une ensemble de textes rassemblés en corpus. La partie Trame de la ressource textuelle produite par le Trameur est constituée par la suite des items isolés lors de l'opération de segmentation. La partie Cadre rassemble les données relatives aux différents découpages réalisés sur le corpus. Le Trameur intègre le programme treetagger : système d'étiquetage automatique des catégories grammaticales des mots avec lemmatisation.


Le Moteur textométrique

Le texte en machine : mise au jour du Cadre, de la Trame, d'un item de la Trame

Lectures

Lafon Pierre (1984) Dépouillements et statistiques en lexicométrie. Genève-Paris, Slatkine-Champion.
Lebart Ludovic et Salem André (1994) Statistique textuelle (en ligne). Paris, Dunod.
Lamalle Cédric, Salem André (2002) "Types généralisés et topographie textuelle dans l'analyse quantitative des corpus textuels" (PDF), in Actes JADT'2002, Journées d'analyse statistique des données textuelles, St Malo, Inria, 2002.
Salem André, Lamalle Cédric, Fleury Serge (2006) "Vers une description formelle des traitements textométriques" (PDF), in Actes JADT'2006, Journées Internationales d'Analyse Statistiques des Données Textuelles, Besançon 2006.
Keyser Söze-Duval (2008) Pour une textométrie opérationnelle, (DOC).
Fleury Serge, André Salem (resp.) (2009) "Explorations textométriques", n° spécial, revue Lexicometrica, 2009.
Fleury Serge (2013) Approches textométriques des brouillons, (PDF), séminaire projet ANR ECRITURES, 14 janvier 2013.
Fleury Serge (2013) Le Trameur. Propositions de description et d’implémentation des objets textométriques, (PDF), (texte en cours).