Indexation multi-terminologique de concepts en sant - PowerPoint PPT Presentation

About This Presentation
Title:

Indexation multi-terminologique de concepts en sant

Description:

Title: PowerPoint Presentation Last modified by: adm1wxp Created Date: 1/1/1601 12:00:00 AM Document presentation format: Affichage l' cran Other titles – PowerPoint PPT presentation

Number of Views:73
Avg rating:3.0/5.0
Slides: 62
Provided by: free2524
Category:

less

Transcript and Presenter's Notes

Title: Indexation multi-terminologique de concepts en sant


1
Indexation multi-terminologique de concepts en
santé
  • Suzanne Pereira
  • EncadrĂ©e par Élisabeth Serrot, Michel Joubert
    et Stefan J. Darmoni
  • LITIS, UniversitĂ© de Rouen - Équipe CISMeF, CHU
    de Rouen
  • LERTIM, FacultĂ© de mĂ©decine, Marseille
  • Vidal, Issy les Moulineaux

1
2
Plan
  • Introduction
  • Indexation de documents en santĂ©
  • Trois contextes
  • Vers une indexation automatique
  • Objectifs
  • État de lart
  • F-MTI, un extracteur multi-terminologique pour
    laide Ă  lindexation
  • Conception
  • Évaluation
  • Applications
  • Discussion
  • Conclusion et perspectives

2
3
Introduction
3
4
Indexation de documents en santé
  • Principe
  •  consiste Ă  repĂ©rer des mots ou des expressions
    particulièrement significatifs (appelés termes)
    dans un contexte donné, et à créer un lien entre
    ces termes et le texte original. 

Terminologies adaptées
Statistique, budget, suivi médical du patient
Document
diabète de type 2 enfant santé publique épidémie o
bésite Etats-Unis Royaume-Uni épidemiologiques cou
rs diagnostique France mal prévention
Indexation contrôlée
De qualité
Aide à la décision
Recherche dinformation
4
5
Trois contextes
  • CISMeF (le Catalogue et Index des Sites MĂ©dicaux
    Francophones)
  • Projet initiĂ© en 1995 (http//www, cismef.org)
  • 60 000 ressources Web ? professionnels de santĂ©,
    Ă©tudiants, patients
  • Indexation manuelle Ă  laide du MeSH
  • Diffusion dinformation sur les mĂ©dicaments et
    aide à la prescription (société Vidal)
  • DĂ©buts en 1911
  • 5 000 mĂ©dicaments (RCP)
  • Indexation manuelle Ă  laide de 4 terminologies
    et bientĂ´t du TUV
  • Dossier MĂ©dicaux (travaux LERTIM)
  • RĂ©flexion depuis 1990
  • 4 millions de comptes rendus hospitaliers
    (CRH) pour CHU de Rouen
  • Indexation manuelle Ă  laide de la CIM10, de la
    CCAM et bientĂ´t de la SNOMED 3.5

5
6
Cinq terminologies
CCAM
SNOMED 3.5
CIM10
TUV
MeSH
UMLS
  • MeSH (Medical Subject Heading)
  • TUV (ThĂ©saurus UnifiĂ© Vidal)
  • CIM10 (Classification statistique Internationale
    des Maladies et des problèmes de santé connexes
    10ème révision)
  • CCAM (Classification Commune des Actes MĂ©dicaux)
  • SNOMED 3.5 (Nomenclature SystĂ©matique de MÉdecine
    humaine et vétérinaire version 3.5)
  • UMLS (Unified Medical Language System)

6
7
Vers une indexation automatique
  • Indexation humaine, automatique ou
    semi-automatique
  • Semi-automatique le compromis

Critères Humaine Automatique
Variabilité inter-indexeurs élevée non
Synthèse oui bas
Problème dambiguïté bas élevé
Connaissances élevées basses
Temps dindexation élevé bas
7
8
Objectifs
  • ContinuitĂ© de projets communs (CISMeF Vidal
    LERTIM)
  • UMLF Lexique mĂ©dical unifiĂ© français (Ministère
    de la Recherche ACI 2002)
  • VUMeF Terminologies françaises et aide Ă 
    lindexation (Ministère de la Recherche RNTS
    2003)
  • Faciliter lindexation des documents
  • Concevoir des mĂ©thodes dindexation automatique
  • Évaluer ces mĂ©thodes
  • Proposer des applications pour CISMeF, Vidal et
    LERTIM

8
9
État de lart
9
10
Outils existants
CIREA
SNOCODE
D. Nakache (CEDRIC)
Medsight
SNOMED 3.5
Medckare
A. Baneyx (SPIM)
CIM10
Indexation de comptes rendus
?
CCAM
MAIF
Indexation de sites Web
A. Névéol (CISMeF)
MTI
Indexation de RCP
A. Aronson (NLM)
MeSH
TUV
?
10
11
État de lart
Terminologie X
Terminologie 1 Ă  indexer
Terminologie 1 Ă  indexer
Lien de transcodage
Lien de transcodage
Terminologie 1 Ă  indexer
Terminologie 2
  • Indexation mono-terminologie directe
  • CIREA (CIM10), MAIF (MeSH), Snocode (SNOMED 3.5)
  • Indexation mono-terminologie indirecte (Ă  partir
    dun transcodage)
  • MedCKARe (ontologie pneumologie-gtCIM10),
  • Indexation multi-terminologique
  • Indexation directe et indirecte pour plusieurs
    terminologies (une seule terminologie considérée)
  • MTI (UMLS) indexation en MeSH et CIM9-CM

11
12
F-MTI, un extracteur multi-terminologique pour
laide Ă  lindexation
12
13
F-MTI
  • Indexation multi-terminologique (inspirĂ© de MTI)
  • Indexation directe CIM10, SNOMED, CCAM, MeSH,
    TUV
  • Projection vers les terminologies dĂ©sirĂ©es grâce
    aux transcodages (recherche de termes
    Ă©quivalents)
  • Indexation multi-document dĂ©pendante du type
    de document
  • Traitement particulier des CRH, des sites
    médicaux et des RCP
  • Indexation basique pour les autres documents
    (convertibles au format texte)
  • Indexation multi-tâche dĂ©pendante de la tâche
    à effectuer (règles dindexation)
  • ParamĂ©trable (terminologies Ă  utiliser,
    terminologies en sortie)

13
14
F-MTI
Un Document Un
ensemble de documents (RCP, lettre de sortie,
site Internet, ou autres convertis au format .txt)
Identification des rubriques, paragraphes et
phrases localisations
Phrases
Ensemble de phrases (corpus)
Base de données multi- terminologique
NOOJ dico de termes
NOOJ dico de constituants
Algo SDM
Termes MeSH, CCAM, SNOMED, TUV et CIM10
Agrégation
Restriction Ă  (une ou plusieurs terminologies)
Post-traitement
Proposition dindexation Ă  laide dune ou
plusieurs terminologies
14
15
Base de données multi-terminologique
Base de données multi- terminologique
  • Principe / Motivation
  • Interrogation rapide des cinq terminologies
  • Structure de donnĂ©es simple et gĂ©nĂ©rique
    contenant des terminologies de structure
    différente
  • MĂ©thode
  • ModĂ©lisation de la structure de chaque
    terminologie
  • Élaboration du modèle gĂ©nĂ©ral Ă  partir des
    modélisations unitaires (inspiré du metathesaurus
    de lUMLS)

15
16
F-MTI
Un Document Un
ensemble de documents (RCP, lettre de sortie,
site Internet, ou autres convertis au format .txt)
Identification des rubriques, paragraphes et
phrases localisations
Phrases
Ensemble de phrases (corpus)
Base de données multi- terminologique
NOOJ dico de termes
NOOJ dico de constituants
Algo SDM
Termes MeSH, CCAM, SNOMED, TUV et CIM10
Agrégation
Restriction Ă  (une ou plusieurs terminologies)
Post-traitement
Proposition dindexation Ă  laide dune ou
plusieurs terminologies
16
17
DĂ©coupage en rubriques, paragraphes et phrases
  • Principe / Motivation
  • Identifier les unitĂ©s dindexation les phrases
  • Prise en compte du contexte (rubriques et
    paragraphes)
  • Indexation du document agrĂ©gation de lensemble
    des indexations pour toutes les phrases du
    document
  • MĂ©thode


DĂ©coupage
Liste de noms de rubriques
DĂ©coupage en rubriques
Balises, retour chariot etc
DĂ©coupage en paragraphes
Logiciel NOOJ (M, Silberztein)
Transducteur NooJ
DĂ©coupage en phrase
17
18
DĂ©coupage en rubriques, paragraphes et phrases
  • Exemple

Antécédents Ulcère gastrique opéré il y a 20
ans. Tabagisme Ă  40 paquets/an. Maladie d'Osler.
Arythmie complète par fibrillation auriculaire en
90, 94 et en 2002. EXAMEN CLINIQUE 12-7. Pouls
à 70. 52 kg. Asymptomatique. Bruits du cœur
réguliers avec un souffle d'insuffisance mitrale
résiduel 1 à 2/6ème maximal au foyer mitral.
Antécédents 1 1 Ulcère gastrique opéré il y a 20
ans. Antécédents 1 2 Tabagisme à 40
paquets/an. Antécédents 1 3 Maladie
d'Osler. Antécédents 1 4 Arythmie complète par
fibrillation auriculaire en 90, 94 et en
2002. EXAMEN CLINIQUE 1 1 12-7. EXAMEN CLINIQUE
1 2 Pouls Ă  70. EXAMEN CLINIQUE 1 3 52
kg. EXAMEN CLINIQUE 1 4 Asymptomatique. EXAMEN
CLINIQUE 1 5 Bruits du cœur réguliers avec un
souffle d'insuffisance mitrale
résiduel 1 à
2/6ème maximal au foyer mitral.
18
19
Création de libellés dindexation
  • Principe / Motivation
  • 3 mĂ©thodes de TAL basĂ©es sur les libellĂ©s des
    termes
  • LibellĂ©s de chaque terme non Ă©laborĂ©s Ă  lorigine
    pour faciliter leur indexation
  • Exemple  angine, sans autre
    précision 
  • MĂ©thode
  • CrĂ©ation de libellĂ©s dindexation
  • Application Ă  la CIM10
  • Élimination des expressions  sans prĂ©cision 
     sans autre indication 
  • Élimination des exclusions
  • CrĂ©ation de 2 libellĂ©s dindexation pour les
    alternatives en  ou 
  • Traitement des prĂ©cisions entre parenthèses

19
20
F-MTI
Un Document Un
ensemble de documents (RCP, lettre de sortie,
site Internet, ou autres convertis au format .txt)
Identification des rubriques, paragraphes et
phrases localisations
Phrases
Ensemble de phrases (corpus)
Base de données multi- terminologique
NOOJ dico de termes
NOOJ dico de constituants
Algo SDM
Termes MeSH, CCAM, SNOMED, TUV et CIM10
Agrégation
Restriction Ă  (une ou plusieurs terminologies)
Post-traitement
Proposition dindexation Ă  laide dune ou
plusieurs terminologies
20
21
Lalgorithme du sac de mots
  • Principe / Motivation
  • UtilisĂ© Ă  lorigine dans CISMeF pour retranscrire
    les requĂŞtes des utilisateurs en termes MeSH
  • Phrase considĂ©rĂ©e comme un sac de mots (les plus
    signifiants) rendus Ă  leur forme la plus simple
    (lemme ou stème)
  • Termes des diffĂ©rentes terminologies (TUV,
    SNOMED, MeSH, CIM10, CCAM) considérés comme des
    sacs de mots
  • Algorithme revu pour lindexation de documents

21
22
Lalgorithme du sac de mots


MĂ©thode de lalgorithme du sac de mots
Normalisation (ponctuation, minuscules)
DĂ©coupage en mots
Élimination des mots vides et mots non pertinents
SĂ©miographe (Memodata )
Frenchstemmer (Lucene)
DĂ©suffixation ou lemmatisation
Rangement (ordre alphabétique)
Mise en correspondance avec les termes des
différentes terminologies
Base de données multi- terminologique
22
23
Lalgorithme du sac de mots
Exemple
Ulcère gastrique opéré il y a 20 ans.

ulcère gastrique opéré il y a 20 ans
ulcère gastrique opéré 20 ans
Lemmatisation
DĂ©suffixation
20angastriqueopérer ulcère ou
20angastricopér ulcèr ajouts selon la
rubrique rattachée (antécédent ou anteced)
Toutes les combinaisons sont générées
20angastriqueopéré ulcère

angastriqueopéré ulcère

gastriqueopéré ulcère

angastriqueopéré
etc Et
comparées aux termes des différentes
terminologies traités de la même façon
ulcère gastrique PE1192 TUV gastriqueulcère ga
striculcer ulcère gastrique D013276 MSH gastriq
ueulcère gastriculcer ulcère
gastrique D5-32100 SNMI gastriqueulcère gastri
culcer
RĂ©sultats
23
24
Lalgorithme du sac de mots
  • Avantages / InconvĂ©nients
  • MĂ©thode simple nĂ©cessitant peu de ressources
  • Ordre des mots non important (erreurs possibles)
  • MĂ©thode pour le moment limitĂ©e
  • Gestion des termes complexes et des nĂ©gations
    difficile

24
25
F-MTI
Un Document Un
ensemble de documents (RCP, lettre de sortie,
site Internet, ou autres convertis au format .txt)
Identification des rubriques, paragraphes et
phrases localisations
Phrases
Ensemble de phrases (corpus)
Base de données multi- terminologique
NOOJ dico de termes
NOOJ dico de constituants
Algo SDM
Termes MeSH, CCAM, SNOMED, TUV et CIM10
Agrégation
Restriction Ă  (une ou plusieurs terminologies)
Post-traitement
Proposition dindexation Ă  laide dune ou
plusieurs terminologies
25
26
Le dictionnaire de termes
  • Motivation
  • InspirĂ© de lapproche TAL de MAIF (A.NĂ©vĂ©ol)
  • Variantes validĂ©es en amont
  • Contient les diffĂ©rentes formes textuelles des
    termes leurs dérivations (ex asthme -
    asthmatique), ?exions (ex bactérie - bactéries)
    et synonymes
  • MĂ©thode très rapide
  • PossibilitĂ© de gĂ©rer les termes complexes et la
    négation
  • Principe
  • Format DELA (Dictionnaires Electroniques du
    LADL)
  • FormeTextuellePossibleDuTerme,LibellĂ©DuTerme,Infor
    mationsDivers
  • Application NOOJ

7
Laboratoire d'Analyse et de Description
Linguistique
26
27
Le dictionnaire de termes
  • Exemple

Ulcère gastrique opéré il y a 20 ans.
Dictionnaire de termes ulcère
gastrique,Ulcère gastrique,TUV ulcères
gastriques,Ulcère gastrique,TUV ulcère de
lestomac,Ulcère gastrique,TUV ulcère
gastrique,Ulcère gastrique,MSH ulcères
gastriques,Ulcère gastrique,MSH ulcère de
lestomac,Ulcère gastrique,MSH ulcère
gastrique,Ulcère gastrique,SNMI ulcères
gastriques,Ulcère gastrique,SNMI ulcère de
lestomac,Ulcère gastrique,SNMI
ulcère gastrique,Ulcère gastrique,EII2048TUV ulcè
re gastrique,Ulcère gastrique,D013276MSH ulcère
gastrique,Ulcère gastrique,D5-32100 SNMI
7
27
28
Le dictionnaire de termes
  • Constitution manuelle dun dictionnaire
  • fastidieux
  • MĂ©thode de construction automatique de
    dictionnaires
  • Reprise de lexistant
  • Variantes des diffĂ©rentes terminologies
  • Variantes provenant de prĂ©cĂ©dents travaux (UMLF,
    dictionnaire MeSH de MAIF, lexiques du projet
    VUMeF)

7
28
29
Construction automatique de dictionnaires
  • Recueil automatique de nouvelles variantes
  • Extraction de variantes Ă  partir de corpus
  • Utilisation de patrons dextraction et dun
    dictionnaire de mots
  • CrĂ©ation de nouvelles variantes (pluriels et
    singuliers)

Exemple  diminution des facteurs de
coagulation 
  • Application au TUV
  • CrĂ©ation de 33 719 transducteurs liĂ©s Ă  un
    dictionnaire 38 219 variantes de mots
  • Corpus de 50 000 documents 7 800 recueillies
    dont 1 007 pour le TUV (validation Ă  55)
  • CrĂ©ation de 4 279 pluriels/singuliers
    (validation Ă  92,3)

7
29
30
Prise en compte du contexte
  • NĂ©gations
  • NĂ©gation verbale

Négation antérieure
Négation postérieure
30
31
F-MTI
Un Document Un
ensemble de documents (RCP, lettre de sortie,
site Internet, ou autres convertis au format .txt)
Identification des rubriques, paragraphes et
phrases localisations
Phrases
Ensemble de phrases (corpus)
Base de données multi- terminologique
NOOJ dico de termes
NOOJ dico de constituants
Algo SDM
Termes MeSH, CCAM, SNOMED, TUV et CIM10
Agrégation
Restriction Ă  (une ou plusieurs terminologies)
Post-traitement
Proposition dindexation Ă  laide dune ou
plusieurs terminologies
31
32
Le dictionnaire de constituants
  • Principe / Motivation
  • Prendre en compte les Ă©lĂ©ments constitutifs du
    terme et non les mots seuls ou le terme dans sa
    globalité
  • Un constituant est dĂ©?ni comme toute variante
    incluse dans un terme,
  • Ex le terme  angine de poitrine sĂ©vère 
    comprend plus de 6 constituants  angine ,
     angines ,  poitrine ,  sévère ,  aigu ,
     angor  etc
  • Un terme est indexĂ© si la phrase couvre
    lensemble des constituants requis (calcul dun
    score)
  • Application NOOJ

32
33
Le dictionnaire de constituants
  • Exemple
  •  Le patient est atteint dun syndrome sĂ©vère, le
    syndrome de Down accompagné dasthme. 

Dictionnaire de constituants
Base de données multi-terminologique
syndrome de Down 2 syndrome de X
2 Asthme 1
syndrome, syndrome de Down, 1TUV syndrome,
syndrome de X, 1TUV syndrome, syndrome de
Down,1TUV syndrome, syndrome de X, 1TUV down,
syndrome de Down, 1TUV asthme, asthme,1TUV
Après élimination des doublons et ajout des
scores pour chaque termes 2 pour
 syndrome de Down  1 pour  syndrome de
X  1 pour  asthme 
Seuls les termes  syndrome de Down  et
 asthme  sont indexés
33
34
F-MTI
Un Document Un
ensemble de documents (RCP, lettre de sortie,
site Internet, ou autres convertis au format .txt)
Identification des rubriques, paragraphes et
phrases localisations
Phrases
Ensemble de phrases (corpus)
Base de données multi- terminologique
NOOJ dico de termes
NOOJ dico de constituants
Algo SDM
Termes MeSH, CCAM, SNOMED, TUV et CIM10
Agrégation
Restriction Ă  (une ou plusieurs terminologies)
Post-traitement
Proposition dindexation Ă  laide dune ou
plusieurs terminologies
34
35
Projection et restriction vers une ou plusieurs
terminologies
  • Principe
  • Restriction aux termes Ă©quivalents appartenant
    aux terminologies désirées
  • MĂ©thode
  • Les diffĂ©rents transcodages utilisĂ©s
  • MeSH, CIM10, SNOMED UMLS et SFINM
  • CCAM-gtMeSH crĂ©Ă© par CISMeF (P. Massari et B.
    Thirion)
  • CIM10-gtCCAM de TOTHEM (enlevĂ©)
  • TUV-gtMeSH crĂ©Ă© par CISMeF et validĂ© par Vidal
    (enlevé)
  • TUV-gtCIM10 crĂ©Ă© par Vidal (enlevĂ©)

Secrétariat Francophone International de
Nomenclature MĂ©dicale
35
36
Projection et restriction vers une ou plusieurs
terminologies
  • Exemple  Ulcère gastrique opĂ©rĂ© il y a 20
    ans. 

ulcère gastrique PE1192 TUV ulcère
gastrique D013276 MSH ulcère gastrique D5-3210
0 SNMI
RĂ©sultats Indexation directe
ulcère de l'estomac non précisé comme étant
aigu K25.9 CIM10 ou chronique, sans hémorragie
ni perforation ulcère gastrique sans
hémorragie ni perforation D5-32422 SNMI ou
obstruction estomac D013270 MSH tumeur
maligne estomac, sans précision C16.9 CIM10
RĂ©sultats Indexation indirecte
36
37
Post-traitements
Post-traitement
Proposition dindexation Ă  laide dune ou
plusieurs terminologies
  • Élimination des doublons (mĂŞmes termes ou un
    terme et son synonyme de la mĂŞme terminologie)
  • Application des règles dindexation
  • Règles gĂ©nĂ©rales
  • Indexation au plus prĂ©cis père/fils, termes
    dont le sac de mots est inclus dans un autre
  • Règles spĂ©ci?ques Ă  chaque terminologie
  • MeSH Ă©limination des termes peu pertinents,
    appariement terme/qualificatif, Ă©limination des
    qualificatifs non appariés
  • Aucune pour CCAM/TUV/SNOMED 3.5/CIM10

37
38
Évaluation de lindexation de termes CIM10 et
CCAM pour les dossiers patients
  • MĂ©thode
  • Comparaison de lindexation automatique (F-MTI -
    algorithme du sac de mots) et lindexation
    medico-Ă©conomique ou descriptive manuelle
  • MatĂ©riels
  • Corpus de 794 CRH du CHU de Rouen
  • 490 de Cardiologie
  • 304 de Pneumologie
  • Indexation manuelle mĂ©dico-Ă©conomique CCAM et
    CIM10
  • Corpus de 100 CRH
  • 50 de Cardiologie
  • 50 de Pneumologie
  • Indexation descriptive par un expert (en aveugle)
  • Mesures
  • PrĂ©cision (inverse du bruit), rappel (inverse du
    silence), F-mesure

38
39
Évaluation de lindexation de termes CIM10 et
CCAM pour les dossiers patients
  • RĂ©sultats

Restriction des termes
Cardiologie
diagnostics
15,4 76,4
Cardiologie
794 CRH
ou symptĂ´mes
3,0 35,7
Précision Rappel
3,4 29,7
51,3 75,4
Pneumologie diagnostics
Pneumologie
41,0 96,1
4,0 19,9
ou symptĂ´mes
39,3 97,5
Indexation médico-économique Indexation médico-économique Indexation médico-économique Indexation descriptive Indexation descriptive Indexation descriptive
Précision Rappel F-mesure Précision Rappel F-mesure
2,6 38,0 4,9 3,7 32,9 5,8
100 CRH
39
40
Évaluation de lindexation de termes CIM10 et
CCAM pour les dossiers patients
  • Discussion
  • PrĂ©cision faible
  • Problème des contextes (nĂ©gations, proche
    concerné)
  • Problème des transcodages
  • Problème du nombre de termes proposĂ©s gt
    difficultés à déterminer ce qui est important
  • Rappel faible
  • Problème de la rĂ©daction des CRH (manque
    précision, abréviations etc.)
  • Dispersion des informations
  • MĂ©thode dĂ©valuation discutable
  • 18 de consensus inter indexeur
  • Peu de formation Ă  lindexation
  • Restriction spĂ©cialitĂ©/diagnostic/symptĂ´me
    différentes vues pour lindexation
    semi-automatique
  • CCAM rĂ©sultats 0 (F-MTI inadaptĂ©)

40
41
Évaluation de lindexation de termes SNOMED pour
les dossiers patients
  • Principe
  • Comparaison de deux indexations automatiques
    SNOMED F-MTI et Snocode
  • DifficultĂ© dobtenir une rĂ©fĂ©rence manuelle
    (indexation manuelle fastidieuse)
  • Choix dun transcodage vers une terminologie
    moins complexe CIM10
  • MatĂ©riel
  • 100 CRH indexĂ©s manuellement Ă  laide de la CIM10

41
42
Évaluation de lindexation de termes SNOMED pour
les dossiers patients
  • RĂ©sultats

F-MTI extrait 2 fois plus de codes que Snocode
Pourcentage de codes F-MTI couvrant les codes Snocode 29,9
Pourcentage de codes Snocode couvrant les codes F-MTI 51,5
Mesure de Hooper 31,3
SNOMED
transcodage
Précision Rappel F-mesure
F-MTI 4,4 30,7 8,7
Snocode 6,1 24,7 9,8
CIM10
42
43
Évaluation de lindexation de termes MeSH pour
les sites Web
  • Principe
  • Comparaison entre lindexation automatique
    (F-MTI) pour les titres et lindexation manuelle
    (indexeurs CISMeF) de la ressource
  • MatĂ©riel
  • Corpus CISMeF (18 814 ressources) indexĂ©
    manuellement par quatre indexeurs CISMeF

43
44
Évaluations
  • Lemmatisation/DĂ©suffixation

F-MTI DĂ©suffixation F-MTI Lemmatisation
() Précision Rappel () Précision Rappel
Termes dindexation Tous 25,9 - 13,5 Tous 26,7 - 13,1
sous-analyse des variantes
  • Mono/Multi-terminologie

F-MTI Mono-termino F-MTI Multi-termino
Termes dindexation MC/Q Tous 29,4 - 13,0 Tous 25,9 - 13,5
Descripteurs MC Tous 37,7 - 21,3 Enseign 43,7 - 17,9 Recos 51,6 - 24,7 Patient 42,4 - 27,5 Tous 35,5 - 23,1 Enseign 39,9 - 18,7 Recos 44,4 - 25,7 Patient 38,3 - 27,8
sur-analyse des termes
  • Évaluation secondaire (1 000 ressources)
  • Peu pertinent 15,9, pertinent 4,5, impact
    négatif 79,6

44
45
Évaluation de lindexation de termes TUV pour les
RCP
  • Principe
  • Évaluation du dictionnaire de terme (approche
    mono-teminologique)
  • Comparaison de lindexation automatique de F-MTI
    avec lindexation manuelle de léquipe du Vidal
  • MatĂ©riels
  • Corpus de 5 191 RCP indexĂ©s manuellement Ă  laide
    des quatre thésauri Vidal
  • RĂ©alisation de la table de transcodage anciens
    thésauri TUV
  • Transcodage en TUV

45
46
Évaluation de lindexation de termes TUV pour les
RCP
  • RĂ©sultats

Rubriques concernées Précision Rappel
Indications 48,1 21,7
Contre-indications 46,1 23,5
Effets secondaires 77,0 59,4
Précautions demploi 28,4 49,3
Total des 4 rubriques 52,9 46,2
Total (non prise compte des rubriques) 57,6 43,4
  • Terminologie en adĂ©quation avec les documents
    indexés
  • Insuffisance des variantes rĂ©pertoriĂ©es dans le
    dictionnaire
  • Conversion des documents pdf en txt (titres,
    tableaux)

46
47
Applications
  • Indexation automatique de ressources Web
  • Indexation automatique des ressources
  • 2006 F-MTI mono-terminologique (34 000
    ressources)
  • Indexation semi-automatique des ressources
  • InterprĂ©tation des requĂŞtes
  • Vers une recherche dinformation
    multi-terminologique
  • Application concrète dans le PIM de CISMeF
    (Classification ATC, codes CAS, CIS, CIP en
    place)
  • 2009 F-MTI multi-terminologique (Autres
    terminologies)
  • Indexation automatique de dossiers patients
  • Recherche dinformation
  • Aide au codage mĂ©dico-Ă©conomique
  • Structuration des dossiers
  • Production de rĂ©sumĂ©s
  • Aide Ă  la rĂ©daction

47
48
Applications
  • Indexation semi-automatique de RCP BIBLIS (IMAG)

RCP
Indexation manuelle
Indexation Automatique F-MTI
Documents proches
48
49
Applications
  • Outil daide Ă  lindexation gĂ©nĂ©raliste

Type de document
Indexation multi-terminologique manuelle
Document
Indexation multi-terminologique automatique
Serveur multi-terminologique
Quelques fonctionnalités supplémentaires
49
50
Discussion
50
51
Discussion
  • RĂ©sultats dĂ©valuation diffĂ©rents selon
  • la tâche dindexation
  • la terminologie
  • le corpus
  • le type de document au sein du corpus
  • les rubriques au sein du document

Aide au transcodage
51
52
Discussion
  • Comment tendre vers une indexation de qualitĂ©?
  • AmĂ©lioration des terminologies et dĂ©veloppement
    de règles dindexation (terminologues)
  • Formation Ă  lindexation, apprentissage des
    terminologies utilisées, et développement de
    règles dindexation pour les tâches visées
    (indexeurs)
  • RĂ©daction adaptĂ©e (auteurs de documents devant
    être indexés)
  • DĂ©veloppement doutils daide Ă  lindexation et Ă 
    la rédaction automatiques plus performants
    (informaticiens)

Aide au transcodage
52
53
Discussion
  • Publications et valorisation
  • Pereira S., NĂ©vĂ©ol A., KerdelhuĂ© G., Serrot E.,
    Joubert M., Darmoni S.J. Using multi-terminology
    indexing for the assignment of MeSH descriptors
    to health resources in a french online catalogue.
    AMIA Annu Symp Proc. 2008 586-590.
  • Pereira S., NĂ©vĂ©ol A., Massari P., Joubert M.,
    Darmoni S.J. Construction of a semi-automated
    ICD-10 coding help system to optimize medical and
    economic coding, Proceedings of MIE2006. Stud
    Health Technol Inform, 2006 124 845-50.
  • Pereira S., Massari P., Joubert M., Darmoni S.
    Utilisation de métatermes pour la recherche
    dinformation dans les dossiers médicaux. In
    Actes des journées Francophones dInformatique
    MĂ©dicale. 2007.
  • Pereira S., Massari P., Buemi A., Dahamna B.,
    Serrot E., Darmoni S., Joubert M. F-MTI un
    outil dindexation automatique application Ă 
    lindexation autmoatique de la SNOMED
    Internationale. Soumis Ă  JFIM2009.

53
54
Discussion
  • Publications et valorisation
  • Massari P., Pereira S., Thirion B., Derville A.,
    Darmoni S.J. Use of superconcepts to customize
    electronic medical records data display. Stud
    Health Technol Inform. 2008 136 845850.
  • Merabti T., Pereira S., Lecroq T., Joubert M.,
    Darmoni S.J. Inheritance of SNOMED CT relations
    between concepts to two health terminologies
    (SNOMED International and ICD10). Proceedings of
    the 3rd international conference on Knowledge
    Representation in Medicine (KR-MED). 2008 118.
  • Merabti T., Pereira S., Letord C., Lecroq T.,
    Dahamna B., Joubert M., Darmoni J. Searching
    Related Resources in a Quality Controlled Health
    Gateway a Feasibility Study. Proceedings of
    MIE2008, Stud Health Technol Inform, Volume 136,
    Pages 235240, 2008
  • NĂ©vĂ©ol A., Pereira S., KerdelhuĂ© G., Dahamna B.,
    Joubert M., Darmoni S.J. Evaluation of a simple
    method for the automatic assignment of MeSH
    descriptors to health resources in a french
    online catalogue. Proceedings of Medinfo2007,
    Stud Health Technol Inform. 2007 129 407-11.
  • NĂ©vĂ©ol A., Pereira S., Soualmia F.F., Thirion B.,
    Darmoni S.J. A method of cross-lingual consumer
    health information retrieval. Proceedings of
    MIE2006, Stud Health Technol Inform. 2006 124
    601608.
  • Pereira S., NĂ©vĂ©ol A., Massari P., Darmoni S.,
    Joubert M. Evaluation de plusieurs terminologies
    médicales pour optimiser laide au codage
    médico-économique par analyse automatique de
    dossiers Ă©lectroniques de patients. In Acte
    EMOI2006. 2006.
  • Valorisation Ă  luniversitĂ© - Infobutton

53
55
Conclusion et Perspectives
54
56
Conclusion
  • Notre contribution
  • Base de donnĂ©es multi-terminologique
  • CrĂ©ation de libellĂ©s dindexation
  • Trois mĂ©thodes dindexation complĂ©mentaires
  • MĂ©thode de crĂ©ation automatique de dictionnaires
  • Prise en compte des contextes
  • Outil dindexation automatique
    multi-terminologique (F-MTI)

55
57
Perspectives
  • AmĂ©lioration de loutil
  • CoopĂ©ration des 3 mĂ©thodes
  • AmĂ©lioration des transcodages
  • Prise en compte dautres contextes
  • ImplĂ©mentation de règles mĂ©dicales
  • ImplĂ©mentation des mĂ©thodes de Metamap
  • (MTI)

56
58
Perspectives
  • CISMeF
  • Passage dune stratĂ©gie mono-terminologique Ă  une
    stratégie multi-terminologique
  • Nouvelles voies de recherche
  • InteropĂ©rabilitĂ© sĂ©mantique inter et
    intra-terminologies (T. Merabti 2A)
  • Recherche dinformation multi-terminologique dans
    un portail de santé (S. Sakji 2A)
  • Recherche dinformation multi-terminologique dans
    un dossier patient Ă©lectronique (A.D. Diriehdibad
    1A)
  • Vidal
  • Aide Ă  lindexation TUV avec BIBLIS
  • Exploitation dautres terminologies pour des
    alertes toujours plus performantes
  • LERTIM
  • Nouveau pas vers lĂ©laboration dun SIH
    performant
  • Poursuite des travaux avec T. Merabti, S. Sakji,
    A.D. Diriehdibad

Aide au transcodage
57
59
Perspectives
  • Vers dautres projets communs
  • InterSTIS InteropĂ©rabilitĂ© sĂ©mantique des
    terminologies dans les systèmes dinformation de
    santé français (ANR TecSan 2007)
  • SMTS Serveur Multi-Terminologique en SantĂ©
  • PSIP optimisation de la prescription
    informatisée (7ème PCRD)
  • ALADIN-DTH Assistant de Lutte AutomatisĂ© et de
    DĂ©tection des Infections Nosocomiales Ă  partir de
    Documents Textuels Hospitaliers (ANR TecSan 2008)

Aide au transcodage
58
60
Remerciements
  • LĂ©quipe scientifique Vidal Elisabeth,
    Mathilde, Josiane, Sophie, Francine, Olivier,
    Michelle, Blandine, Nicolas, Ghislaine, Gismonde,
    Jean-François
  • LĂ©quipe CISMeF TIBS Josette, GaĂ«tan,
    Catherine, Benoît, Saoussen, Tayeb, Yvan,
    Badisse, Philippe, Élise, Thierry, Aurélie et
    Stefan
  • LĂ©quipe du LERTIM Michel Joubert, Mario
    Fieschi, Paul Avillach
  • Les intervenants extĂ©rieurs Antoine Buemi, Max
    Silberztein, Gaëlle Lortal et Lina Soualmia

59
61
Remerciements
  • ET VOUS !
  • ?

THE END To be continued
60
Write a Comment
User Comments (0)
About PowerShow.com