Recherche dans les transcriptions annotées de CFPP2000

Compatible avec les navigateurs : Firefox, Opera, Safari, Chrome

Ce moteur permet de lancer des requêtes sur les contenus annotées via TreeTagger des données de transcription :
(Cocher les cases permettant de paramétrer les informations à prendre en compte pour la recherche)

Entretiens
[03-01] [05-01] [07-01] [07-02] [07-03] [07-04] [07-05] [07-06] [11-01] [11-02]
[11-03] [11-04] [12-01] [12-02] [12-03] [12-04] [13-01] [14-01] [14-02] [18-01]
[20-01] [IV-01] [KB-01] [SO-01] [SO-02] [Mo-01] [Mo-02] [SU-01] [RO-01]

 

Locuteurs
Sexe : Homme Femme Indisponible
Age : 0-25 26-35  36-45  46-55  56-65  66-75  76+  Indisponible

L'unité de texte utilisée pour faire la recherche est le tour de parole. Les données ont été préalablement annotées morphosyntaxiquement via TreeTagger en utilisant un base d'annotation adaptée pour le français oral et développée dans le cadre du projet PERCEO (Responsable scientifique: Christophe Benzitoun (ATILF)). Les données de transcription annotées sont constituées d'unités ayant la forme suivante : [FORME#POS#LEMME]. Par exemple pour le mot "quartier", on aura la description suivante : [quartier#NOM#quartier]. Chaque mot est donc décrit par un triplet : forme graphique, catégorie, lemme. La zone de saisie ci-dessous vous permet de définir le motif à rechercher dans les transcriptions de CFPP2000. La zone de résultat affiche:

  • le(s) tour(s) de parole contenant la requête exprimée (accompagné(s) de leur topic annoté dans Transcriber),
  • le locuteur (cf métadonnées enregistrées dans Transcriber),
  • et la localisation du tour de parole dans le fichier audio complet de chaque entretien.
Le bouton écouter permet d'activer la lecture audio du tour de parole résultant (grâce à un programme fourni par CoCoON).

Attention : l'accès au fichier audio extrait peut prendre un peu de temps...

La recherche n'est pas sensible à la casse (majuscule/minuscule) : "les" retrouvera "les" ou "Les". Il est possible d'utiliser des expressions régulières. Pour rechercher des formes uniquement, on pourra par exemple définir un motif du type : \[quartier# ; pour rechercher uniquement une catégorie, on pourra définir un motif du type : #NOM# ; enfin pour rechercher des lemmes, on pourra définir un motif du type #quartier\]. La liste des étiquettes utilisées (POS) pour l'annotation est la suivante : (mises à jour à venir)

Attention : le caractère : a été remplacé par le caractère _ pour le codage des catégories dans la base utilisée par ce moteur.
Ex : pour chercher les verbes au futur, il faut chercher VER_futu (ou #VER_futu#)



Recherche

Le bouton "Recherche" (défaut) retourne les tours de parole contenant le motif.
Le bouton "Recherche (contexte long)" permet d'accéder aussi aux tours de parole voisins (1 avant et 1 après).