Title: Indexation multi-terminologique de concepts en sant
1Indexation multi-terminologique de concepts en
santé
- Suzanne Pereira
- Encadrée par Élisabeth Serrot, Michel Joubert
et Stefan J. Darmoni - LITIS, Université de Rouen - Équipe CISMeF, CHU
de Rouen - LERTIM, Faculté de médecine, Marseille
- Vidal, Issy les Moulineaux
1
2Plan
- Introduction
- Indexation de documents en santé
- Trois contextes
- Vers une indexation automatique
- Objectifs
- État de lart
- F-MTI, un extracteur multi-terminologique pour
laide Ă lindexation - Conception
- Évaluation
- Applications
- Discussion
- Conclusion et perspectives
2
3Introduction
3
4Indexation de documents en santé
- Principe
-  consiste à repérer des mots ou des expressions
particulièrement significatifs (appelés termes)
dans un contexte donné, et à créer un lien entre
ces termes et le texte original.Â
Terminologies adaptées
Statistique, budget, suivi médical du patient
Document
diabète de type 2 enfant santé publique épidémie o
bésite Etats-Unis Royaume-Uni épidemiologiques cou
rs diagnostique France mal prévention
Indexation contrôlée
De qualité
Aide à la décision
Recherche dinformation
4
5Trois contextes
- CISMeF (le Catalogue et Index des Sites MĂ©dicaux
Francophones) - Projet initié en 1995 (http//www, cismef.org)
- 60 000 ressources Web ? professionnels de santé,
Ă©tudiants, patients - Indexation manuelle Ă laide du MeSH
- Diffusion dinformation sur les médicaments et
aide à la prescription (société Vidal) - Débuts en 1911
- 5 000 médicaments (RCP)
- Indexation manuelle Ă laide de 4 terminologies
et bientĂ´t du TUV
- Dossier MĂ©dicaux (travaux LERTIM)
- RĂ©flexion depuis 1990
- 4 millions de comptes rendus hospitaliers
(CRH) pour CHU de Rouen - Indexation manuelle Ă laide de la CIM10, de la
CCAM et bientĂ´t de la SNOMED 3.5
5
6Cinq terminologies
CCAM
SNOMED 3.5
CIM10
TUV
MeSH
UMLS
- MeSH (Medical Subject Heading)
- TUV (Thésaurus Unifié Vidal)
- CIM10 (Classification statistique Internationale
des Maladies et des problèmes de santé connexes
10ème révision) - CCAM (Classification Commune des Actes Médicaux)
- SNOMED 3.5 (Nomenclature Systématique de MÉdecine
humaine et vétérinaire version 3.5) - UMLS (Unified Medical Language System)
6
7Vers une indexation automatique
- Indexation humaine, automatique ou
semi-automatique - Semi-automatique le compromis
Critères Humaine Automatique
Variabilité inter-indexeurs élevée non
Synthèse oui bas
Problème dambiguïté bas élevé
Connaissances élevées basses
Temps dindexation élevé bas
7
8Objectifs
- Continuité de projets communs (CISMeF Vidal
LERTIM) - UMLF Lexique médical unifié français (Ministère
de la Recherche ACI 2002) - VUMeF Terminologies françaises et aide Ă
lindexation (Ministère de la Recherche RNTS
2003) - Faciliter lindexation des documents
- Concevoir des méthodes dindexation automatique
- Évaluer ces méthodes
- Proposer des applications pour CISMeF, Vidal et
LERTIM
8
9État de lart
9
10Outils existants
CIREA
SNOCODE
D. Nakache (CEDRIC)
Medsight
SNOMED 3.5
Medckare
A. Baneyx (SPIM)
CIM10
Indexation de comptes rendus
?
CCAM
MAIF
Indexation de sites Web
A. Névéol (CISMeF)
MTI
Indexation de RCP
A. Aronson (NLM)
MeSH
TUV
?
10
11État de lart
Terminologie X
Terminologie 1 Ă indexer
Terminologie 1 Ă indexer
Lien de transcodage
Lien de transcodage
Terminologie 1 Ă indexer
Terminologie 2
- Indexation mono-terminologie directe
- CIREA (CIM10), MAIF (MeSH), Snocode (SNOMED 3.5)
- Indexation mono-terminologie indirecte (Ă partir
dun transcodage) - MedCKARe (ontologie pneumologie-gtCIM10),
- Indexation multi-terminologique
- Indexation directe et indirecte pour plusieurs
terminologies (une seule terminologie considérée) - MTI (UMLS) indexation en MeSH et CIM9-CM
11
12F-MTI, un extracteur multi-terminologique pour
laide Ă lindexation
12
13F-MTI
- Indexation multi-terminologique (inspiré de MTI)
- Indexation directe CIM10, SNOMED, CCAM, MeSH,
TUV - Projection vers les terminologies désirées grâce
aux transcodages (recherche de termes
équivalents) - Indexation multi-document dépendante du type
de document - Traitement particulier des CRH, des sites
médicaux et des RCP - Indexation basique pour les autres documents
(convertibles au format texte) - Indexation multi-tâche dépendante de la tâche
à effectuer (règles dindexation) - Paramétrable (terminologies à utiliser,
terminologies en sortie)
13
14F-MTI
Un Document Un
ensemble de documents (RCP, lettre de sortie,
site Internet, ou autres convertis au format .txt)
Identification des rubriques, paragraphes et
phrases localisations
Phrases
Ensemble de phrases (corpus)
Base de données multi- terminologique
NOOJ dico de termes
NOOJ dico de constituants
Algo SDM
Termes MeSH, CCAM, SNOMED, TUV et CIM10
Agrégation
Restriction Ă (une ou plusieurs terminologies)
Post-traitement
Proposition dindexation Ă laide dune ou
plusieurs terminologies
14
15Base de données multi-terminologique
Base de données multi- terminologique
- Principe / Motivation
- Interrogation rapide des cinq terminologies
- Structure de données simple et générique
contenant des terminologies de structure
différente - Méthode
- Modélisation de la structure de chaque
terminologie - Élaboration du modèle général à partir des
modélisations unitaires (inspiré du metathesaurus
de lUMLS)
15
16F-MTI
Un Document Un
ensemble de documents (RCP, lettre de sortie,
site Internet, ou autres convertis au format .txt)
Identification des rubriques, paragraphes et
phrases localisations
Phrases
Ensemble de phrases (corpus)
Base de données multi- terminologique
NOOJ dico de termes
NOOJ dico de constituants
Algo SDM
Termes MeSH, CCAM, SNOMED, TUV et CIM10
Agrégation
Restriction Ă (une ou plusieurs terminologies)
Post-traitement
Proposition dindexation Ă laide dune ou
plusieurs terminologies
16
17DĂ©coupage en rubriques, paragraphes et phrases
- Principe / Motivation
- Identifier les unités dindexation les phrases
- Prise en compte du contexte (rubriques et
paragraphes) - Indexation du document agrégation de lensemble
des indexations pour toutes les phrases du
document - MĂ©thode
DĂ©coupage
Liste de noms de rubriques
DĂ©coupage en rubriques
Balises, retour chariot etc
DĂ©coupage en paragraphes
Logiciel NOOJ (M, Silberztein)
Transducteur NooJ
DĂ©coupage en phrase
17
18DĂ©coupage en rubriques, paragraphes et phrases
Antécédents Ulcère gastrique opéré il y a 20
ans. Tabagisme Ă 40 paquets/an. Maladie d'Osler.
Arythmie complète par fibrillation auriculaire en
90, 94 et en 2002. EXAMEN CLINIQUE 12-7. Pouls
à 70. 52 kg. Asymptomatique. Bruits du cœur
réguliers avec un souffle d'insuffisance mitrale
résiduel 1 à 2/6ème maximal au foyer mitral.
Antécédents 1 1 Ulcère gastrique opéré il y a 20
ans. Antécédents 1 2 Tabagisme à 40
paquets/an. Antécédents 1 3 Maladie
d'Osler. Antécédents 1 4 Arythmie complète par
fibrillation auriculaire en 90, 94 et en
2002. EXAMEN CLINIQUE 1 1 12-7. EXAMEN CLINIQUE
1 2 Pouls Ă 70. EXAMEN CLINIQUE 1 3 52
kg. EXAMEN CLINIQUE 1 4 Asymptomatique. EXAMEN
CLINIQUE 1 5 Bruits du cœur réguliers avec un
souffle d'insuffisance mitrale
rĂ©siduel 1 Ă
2/6ème maximal au foyer mitral.
18
19Création de libellés dindexation
- Principe / Motivation
- 3 méthodes de TAL basées sur les libellés des
termes - Libellés de chaque terme non élaborés à lorigine
pour faciliter leur indexation - Exemple  angine, sans autre
précision - Méthode
- Création de libellés dindexation
- Application Ă la CIM10
- Élimination des expressions  sans prĂ©cisionÂ
 sans autre indication - Élimination des exclusions
- Création de 2 libellés dindexation pour les
alternatives en  ou - Traitement des précisions entre parenthèses
19
20F-MTI
Un Document Un
ensemble de documents (RCP, lettre de sortie,
site Internet, ou autres convertis au format .txt)
Identification des rubriques, paragraphes et
phrases localisations
Phrases
Ensemble de phrases (corpus)
Base de données multi- terminologique
NOOJ dico de termes
NOOJ dico de constituants
Algo SDM
Termes MeSH, CCAM, SNOMED, TUV et CIM10
Agrégation
Restriction Ă (une ou plusieurs terminologies)
Post-traitement
Proposition dindexation Ă laide dune ou
plusieurs terminologies
20
21Lalgorithme du sac de mots
- Principe / Motivation
- Utilisé à lorigine dans CISMeF pour retranscrire
les requêtes des utilisateurs en termes MeSH - Phrase considérée comme un sac de mots (les plus
signifiants) rendus Ă leur forme la plus simple
(lemme ou stème) - Termes des différentes terminologies (TUV,
SNOMED, MeSH, CIM10, CCAM) considérés comme des
sacs de mots - Algorithme revu pour lindexation de documents
21
22Lalgorithme du sac de mots
MĂ©thode de lalgorithme du sac de mots
Normalisation (ponctuation, minuscules)
DĂ©coupage en mots
Élimination des mots vides et mots non pertinents
SĂ©miographe (Memodata )
Frenchstemmer (Lucene)
DĂ©suffixation ou lemmatisation
Rangement (ordre alphabétique)
Mise en correspondance avec les termes des
différentes terminologies
Base de données multi- terminologique
22
23Lalgorithme du sac de mots
Exemple
Ulcère gastrique opéré il y a 20 ans.
ulcère gastrique opéré il y a 20 ans
ulcère gastrique opéré 20 ans
Lemmatisation
DĂ©suffixation
20angastriqueopérer ulcère ou
20angastricopér ulcèr ajouts selon la
rubrique rattachée (antécédent ou anteced)
Toutes les combinaisons sont générées
20angastriqueopéré ulcère
angastriqueopéré ulcère
gastriqueopéré ulcère
angastriqueopéré
etc Et
comparées aux termes des différentes
terminologies traités de la même façon
ulcère gastrique PE1192 TUV gastriqueulcère ga
striculcer ulcère gastrique D013276 MSH gastriq
ueulcère gastriculcer ulcère
gastrique D5-32100 SNMI gastriqueulcère gastri
culcer
RĂ©sultats
23
24Lalgorithme du sac de mots
- Avantages / Inconvénients
- Méthode simple nécessitant peu de ressources
- Ordre des mots non important (erreurs possibles)
- Méthode pour le moment limitée
- Gestion des termes complexes et des négations
difficile
24
25F-MTI
Un Document Un
ensemble de documents (RCP, lettre de sortie,
site Internet, ou autres convertis au format .txt)
Identification des rubriques, paragraphes et
phrases localisations
Phrases
Ensemble de phrases (corpus)
Base de données multi- terminologique
NOOJ dico de termes
NOOJ dico de constituants
Algo SDM
Termes MeSH, CCAM, SNOMED, TUV et CIM10
Agrégation
Restriction Ă (une ou plusieurs terminologies)
Post-traitement
Proposition dindexation Ă laide dune ou
plusieurs terminologies
25
26Le dictionnaire de termes
- Motivation
- Inspiré de lapproche TAL de MAIF (A.Névéol)
- Variantes validées en amont
- Contient les différentes formes textuelles des
termes leurs dérivations (ex asthme -
asthmatique), ?exions (ex bactérie - bactéries)
et synonymes - Méthode très rapide
- Possibilité de gérer les termes complexes et la
négation - Principe
- Format DELA (Dictionnaires Electroniques du
LADL) - FormeTextuellePossibleDuTerme,LibelléDuTerme,Infor
mationsDivers - Application NOOJ
7
Laboratoire d'Analyse et de Description
Linguistique
26
27Le dictionnaire de termes
Ulcère gastrique opéré il y a 20 ans.
Dictionnaire de termes ulcère
gastrique,Ulcère gastrique,TUV ulcères
gastriques,Ulcère gastrique,TUV ulcère de
lestomac,Ulcère gastrique,TUV ulcère
gastrique,Ulcère gastrique,MSH ulcères
gastriques,Ulcère gastrique,MSH ulcère de
lestomac,Ulcère gastrique,MSH ulcère
gastrique,Ulcère gastrique,SNMI ulcères
gastriques,Ulcère gastrique,SNMI ulcère de
lestomac,Ulcère gastrique,SNMI
ulcère gastrique,Ulcère gastrique,EII2048TUV ulcè
re gastrique,Ulcère gastrique,D013276MSH ulcère
gastrique,Ulcère gastrique,D5-32100 SNMI
7
27
28Le dictionnaire de termes
- Constitution manuelle dun dictionnaire
- fastidieux
- MĂ©thode de construction automatique de
dictionnaires - Reprise de lexistant
- Variantes des différentes terminologies
- Variantes provenant de précédents travaux (UMLF,
dictionnaire MeSH de MAIF, lexiques du projet
VUMeF)
7
28
29Construction automatique de dictionnaires
- Recueil automatique de nouvelles variantes
- Extraction de variantes Ă partir de corpus
- Utilisation de patrons dextraction et dun
dictionnaire de mots - Création de nouvelles variantes (pluriels et
singuliers)
Exemple  diminution des facteurs de
coagulationÂ
- Application au TUV
- Création de 33 719 transducteurs liés à un
dictionnaire 38 219 variantes de mots - Corpus de 50 000 documents 7 800 recueillies
dont 1 007 pour le TUV (validation à 55) - Création de 4 279 pluriels/singuliers
(validation Ă 92,3)
7
29
30Prise en compte du contexte
- NĂ©gations
- NĂ©gation verbale
Négation antérieure
Négation postérieure
30
31F-MTI
Un Document Un
ensemble de documents (RCP, lettre de sortie,
site Internet, ou autres convertis au format .txt)
Identification des rubriques, paragraphes et
phrases localisations
Phrases
Ensemble de phrases (corpus)
Base de données multi- terminologique
NOOJ dico de termes
NOOJ dico de constituants
Algo SDM
Termes MeSH, CCAM, SNOMED, TUV et CIM10
Agrégation
Restriction Ă (une ou plusieurs terminologies)
Post-traitement
Proposition dindexation Ă laide dune ou
plusieurs terminologies
31
32Le dictionnaire de constituants
- Principe / Motivation
- Prendre en compte les éléments constitutifs du
terme et non les mots seuls ou le terme dans sa
globalité - Un constituant est dé?ni comme toute variante
incluse dans un terme, - Ex le terme  angine de poitrine sĂ©vèreÂ
comprend plus de 6 constituants  angine ,
 angines ,  poitrine ,  sévère ,  aigu ,
 angor etc - Un terme est indexé si la phrase couvre
lensemble des constituants requis (calcul dun
score) - Application NOOJ
32
33Le dictionnaire de constituants
- Exemple
-  Le patient est atteint dun syndrome sévère, le
syndrome de Down accompagnĂ© dasthme.Â
Dictionnaire de constituants
Base de données multi-terminologique
syndrome de Down 2 syndrome de X
2 Asthme 1
syndrome, syndrome de Down, 1TUV syndrome,
syndrome de X, 1TUV syndrome, syndrome de
Down,1TUV syndrome, syndrome de X, 1TUV down,
syndrome de Down, 1TUV asthme, asthme,1TUV
Après élimination des doublons et ajout des
scores pour chaque termes 2 pour
 syndrome de Down 1 pour  syndrome de
X 1 pour  asthmeÂ
Seuls les termes  syndrome de Down et
 asthme sont indexés
33
34F-MTI
Un Document Un
ensemble de documents (RCP, lettre de sortie,
site Internet, ou autres convertis au format .txt)
Identification des rubriques, paragraphes et
phrases localisations
Phrases
Ensemble de phrases (corpus)
Base de données multi- terminologique
NOOJ dico de termes
NOOJ dico de constituants
Algo SDM
Termes MeSH, CCAM, SNOMED, TUV et CIM10
Agrégation
Restriction Ă (une ou plusieurs terminologies)
Post-traitement
Proposition dindexation Ă laide dune ou
plusieurs terminologies
34
35Projection et restriction vers une ou plusieurs
terminologies
- Principe
- Restriction aux termes Ă©quivalents appartenant
aux terminologies désirées - Méthode
- Les différents transcodages utilisés
- MeSH, CIM10, SNOMED UMLS et SFINM
- CCAM-gtMeSH créé par CISMeF (P. Massari et B.
Thirion) - CIM10-gtCCAM de TOTHEM (enlevé)
- TUV-gtMeSH créé par CISMeF et validé par Vidal
(enlevé) - TUV-gtCIM10 créé par Vidal (enlevé)
Secrétariat Francophone International de
Nomenclature MĂ©dicale
35
36Projection et restriction vers une ou plusieurs
terminologies
- Exemple  Ulcère gastrique opéré il y a 20
ans.Â
ulcère gastrique PE1192 TUV ulcère
gastrique D013276 MSH ulcère gastrique D5-3210
0 SNMI
RĂ©sultats Indexation directe
ulcère de l'estomac non précisé comme étant
aigu K25.9 CIM10 ou chronique, sans hémorragie
ni perforation ulcère gastrique sans
hémorragie ni perforation D5-32422 SNMI ou
obstruction estomac D013270 MSH tumeur
maligne estomac, sans précision C16.9 CIM10
RĂ©sultats Indexation indirecte
36
37Post-traitements
Post-traitement
Proposition dindexation Ă laide dune ou
plusieurs terminologies
- Élimination des doublons (mêmes termes ou un
terme et son synonyme de la même terminologie) - Application des règles dindexation
- Règles générales
- Indexation au plus précis père/fils, termes
dont le sac de mots est inclus dans un autre - Règles spéci?ques à chaque terminologie
- MeSH Ă©limination des termes peu pertinents,
appariement terme/qualificatif, Ă©limination des
qualificatifs non appariés - Aucune pour CCAM/TUV/SNOMED 3.5/CIM10
37
38Évaluation de lindexation de termes CIM10 et
CCAM pour les dossiers patients
- MĂ©thode
- Comparaison de lindexation automatique (F-MTI -
algorithme du sac de mots) et lindexation
medico-économique ou descriptive manuelle - Matériels
- Corpus de 794 CRH du CHU de Rouen
- 490 de Cardiologie
- 304 de Pneumologie
- Indexation manuelle médico-économique CCAM et
CIM10 - Corpus de 100 CRH
- 50 de Cardiologie
- 50 de Pneumologie
- Indexation descriptive par un expert (en aveugle)
- Mesures
- Précision (inverse du bruit), rappel (inverse du
silence), F-mesure
38
39Évaluation de lindexation de termes CIM10 et
CCAM pour les dossiers patients
Restriction des termes
Cardiologie
diagnostics
15,4 76,4
Cardiologie
794 CRH
ou symptĂ´mes
3,0 35,7
Précision Rappel
3,4 29,7
51,3 75,4
Pneumologie diagnostics
Pneumologie
41,0 96,1
4,0 19,9
ou symptĂ´mes
39,3 97,5
Indexation médico-économique Indexation médico-économique Indexation médico-économique Indexation descriptive Indexation descriptive Indexation descriptive
Précision Rappel F-mesure Précision Rappel F-mesure
2,6 38,0 4,9 3,7 32,9 5,8
100 CRH
39
40Évaluation de lindexation de termes CIM10 et
CCAM pour les dossiers patients
- Discussion
- Précision faible
- Problème des contextes (négations, proche
concerné) - Problème des transcodages
- Problème du nombre de termes proposés gt
difficultés à déterminer ce qui est important - Rappel faible
- Problème de la rédaction des CRH (manque
précision, abréviations etc.) - Dispersion des informations
- Méthode dévaluation discutable
- 18 de consensus inter indexeur
- Peu de formation Ă lindexation
- Restriction spécialité/diagnostic/symptôme
différentes vues pour lindexation
semi-automatique - CCAM résultats 0 (F-MTI inadapté)
40
41Évaluation de lindexation de termes SNOMED pour
les dossiers patients
- Principe
- Comparaison de deux indexations automatiques
SNOMED F-MTI et Snocode - Difficulté dobtenir une référence manuelle
(indexation manuelle fastidieuse) - Choix dun transcodage vers une terminologie
moins complexe CIM10 - Matériel
- 100 CRH indexés manuellement à laide de la CIM10
41
42Évaluation de lindexation de termes SNOMED pour
les dossiers patients
F-MTI extrait 2 fois plus de codes que Snocode
Pourcentage de codes F-MTI couvrant les codes Snocode 29,9
Pourcentage de codes Snocode couvrant les codes F-MTI 51,5
Mesure de Hooper 31,3
SNOMED
transcodage
Précision Rappel F-mesure
F-MTI 4,4 30,7 8,7
Snocode 6,1 24,7 9,8
CIM10
42
43Évaluation de lindexation de termes MeSH pour
les sites Web
- Principe
- Comparaison entre lindexation automatique
(F-MTI) pour les titres et lindexation manuelle
(indexeurs CISMeF) de la ressource - Matériel
- Corpus CISMeF (18 814 ressources) indexé
manuellement par quatre indexeurs CISMeF
43
44Évaluations
- Lemmatisation/DĂ©suffixation
F-MTI DĂ©suffixation F-MTI Lemmatisation
() Précision Rappel () Précision Rappel
Termes dindexation Tous 25,9 - 13,5 Tous 26,7 - 13,1
sous-analyse des variantes
F-MTI Mono-termino F-MTI Multi-termino
Termes dindexation MC/Q Tous 29,4 - 13,0 Tous 25,9 - 13,5
Descripteurs MC Tous 37,7 - 21,3 Enseign 43,7 - 17,9 Recos 51,6 - 24,7 Patient 42,4 - 27,5 Tous 35,5 - 23,1 Enseign 39,9 - 18,7 Recos 44,4 - 25,7 Patient 38,3 - 27,8
sur-analyse des termes
- Évaluation secondaire (1 000 ressources)
- Peu pertinent 15,9, pertinent 4,5, impact
négatif 79,6
44
45Évaluation de lindexation de termes TUV pour les
RCP
- Principe
- Évaluation du dictionnaire de terme (approche
mono-teminologique) - Comparaison de lindexation automatique de F-MTI
avec lindexation manuelle de léquipe du Vidal - Matériels
- Corpus de 5 191 RCP indexés manuellement à laide
des quatre thésauri Vidal - Réalisation de la table de transcodage anciens
thésauri TUV - Transcodage en TUV
45
46Évaluation de lindexation de termes TUV pour les
RCP
Rubriques concernées Précision Rappel
Indications 48,1 21,7
Contre-indications 46,1 23,5
Effets secondaires 77,0 59,4
Précautions demploi 28,4 49,3
Total des 4 rubriques 52,9 46,2
Total (non prise compte des rubriques) 57,6 43,4
- Terminologie en adéquation avec les documents
indexés - Insuffisance des variantes répertoriées dans le
dictionnaire - Conversion des documents pdf en txt (titres,
tableaux)
46
47Applications
- Indexation automatique de ressources Web
- Indexation automatique des ressources
- 2006 F-MTI mono-terminologique (34 000
ressources) - Indexation semi-automatique des ressources
- Interprétation des requêtes
- Vers une recherche dinformation
multi-terminologique - Application concrète dans le PIM de CISMeF
(Classification ATC, codes CAS, CIS, CIP en
place) - 2009 F-MTI multi-terminologique (Autres
terminologies) - Indexation automatique de dossiers patients
- Recherche dinformation
- Aide au codage médico-économique
- Structuration des dossiers
- Production de résumés
- Aide à la rédaction
47
48Applications
- Indexation semi-automatique de RCP BIBLIS (IMAG)
RCP
Indexation manuelle
Indexation Automatique F-MTI
Documents proches
48
49Applications
- Outil daide à lindexation généraliste
Type de document
Indexation multi-terminologique manuelle
Document
Indexation multi-terminologique automatique
Serveur multi-terminologique
Quelques fonctionnalités supplémentaires
49
50Discussion
50
51Discussion
- Résultats dévaluation différents selon
- la tâche dindexation
- la terminologie
- le corpus
- le type de document au sein du corpus
- les rubriques au sein du document
Aide au transcodage
51
52Discussion
- Comment tendre vers une indexation de qualité?
- Amélioration des terminologies et développement
de règles dindexation (terminologues) - Formation à lindexation, apprentissage des
terminologies utilisées, et développement de
règles dindexation pour les tâches visées
(indexeurs) - Rédaction adaptée (auteurs de documents devant
ĂŞtre indexĂ©s) - DĂ©veloppement doutils daide Ă lindexation et Ă
la rédaction automatiques plus performants
(informaticiens)
Aide au transcodage
52
53Discussion
- Publications et valorisation
- Pereira S., Névéol A., Kerdelhué G., Serrot E.,
Joubert M., Darmoni S.J. Using multi-terminology
indexing for the assignment of MeSH descriptors
to health resources in a french online catalogue.
AMIA Annu Symp Proc. 2008 586-590. - Pereira S., Névéol A., Massari P., Joubert M.,
Darmoni S.J. Construction of a semi-automated
ICD-10 coding help system to optimize medical and
economic coding, Proceedings of MIE2006. Stud
Health Technol Inform, 2006 124 845-50. - Pereira S., Massari P., Joubert M., Darmoni S.
Utilisation de métatermes pour la recherche
dinformation dans les dossiers médicaux. In
Actes des journées Francophones dInformatique
MĂ©dicale. 2007. - Pereira S., Massari P., Buemi A., Dahamna B.,
Serrot E., Darmoni S., Joubert M. F-MTI un
outil dindexation automatique application Ă
lindexation autmoatique de la SNOMED
Internationale. Soumis Ă JFIM2009.
53
54Discussion
- Publications et valorisation
- Massari P., Pereira S., Thirion B., Derville A.,
Darmoni S.J. Use of superconcepts to customize
electronic medical records data display. Stud
Health Technol Inform. 2008 136 845850. - Merabti T., Pereira S., Lecroq T., Joubert M.,
Darmoni S.J. Inheritance of SNOMED CT relations
between concepts to two health terminologies
(SNOMED International and ICD10). Proceedings of
the 3rd international conference on Knowledge
Representation in Medicine (KR-MED). 2008 118. - Merabti T., Pereira S., Letord C., Lecroq T.,
Dahamna B., Joubert M., Darmoni J. Searching
Related Resources in a Quality Controlled Health
Gateway a Feasibility Study. Proceedings of
MIE2008, Stud Health Technol Inform, Volume 136,
Pages 235240, 2008 - Névéol A., Pereira S., Kerdelhué G., Dahamna B.,
Joubert M., Darmoni S.J. Evaluation of a simple
method for the automatic assignment of MeSH
descriptors to health resources in a french
online catalogue. Proceedings of Medinfo2007,
Stud Health Technol Inform. 2007 129 407-11. - Névéol A., Pereira S., Soualmia F.F., Thirion B.,
Darmoni S.J. A method of cross-lingual consumer
health information retrieval. Proceedings of
MIE2006, Stud Health Technol Inform. 2006 124
601608. - Pereira S., Névéol A., Massari P., Darmoni S.,
Joubert M. Evaluation de plusieurs terminologies
médicales pour optimiser laide au codage
médico-économique par analyse automatique de
dossiers Ă©lectroniques de patients. In Acte
EMOI2006. 2006. - Valorisation à luniversité - Infobutton
53
55Conclusion et Perspectives
54
56Conclusion
- Notre contribution
- Base de données multi-terminologique
- Création de libellés dindexation
- Trois méthodes dindexation complémentaires
- Méthode de création automatique de dictionnaires
- Prise en compte des contextes
- Outil dindexation automatique
multi-terminologique (F-MTI)
55
57Perspectives
- Amélioration de loutil
- Coopération des 3 méthodes
- Amélioration des transcodages
- Prise en compte dautres contextes
- Implémentation de règles médicales
- Implémentation des méthodes de Metamap
- (MTI)
56
58Perspectives
- CISMeF
- Passage dune stratégie mono-terminologique à une
stratégie multi-terminologique - Nouvelles voies de recherche
- Interopérabilité sémantique inter et
intra-terminologies (T. Merabti 2A) - Recherche dinformation multi-terminologique dans
un portail de santé (S. Sakji 2A) - Recherche dinformation multi-terminologique dans
un dossier patient Ă©lectronique (A.D. Diriehdibad
1A) - Vidal
- Aide Ă lindexation TUV avec BIBLIS
- Exploitation dautres terminologies pour des
alertes toujours plus performantes - LERTIM
- Nouveau pas vers lélaboration dun SIH
performant - Poursuite des travaux avec T. Merabti, S. Sakji,
A.D. Diriehdibad
Aide au transcodage
57
59Perspectives
- Vers dautres projets communs
- InterSTIS Interopérabilité sémantique des
terminologies dans les systèmes dinformation de
santé français (ANR TecSan 2007) - SMTS Serveur Multi-Terminologique en Santé
- PSIP optimisation de la prescription
informatisée (7ème PCRD) - ALADIN-DTH Assistant de Lutte Automatisé et de
DĂ©tection des Infections Nosocomiales Ă partir de
Documents Textuels Hospitaliers (ANR TecSan 2008)
Aide au transcodage
58
60Remerciements
- LĂ©quipe scientifique Vidal Elisabeth,
Mathilde, Josiane, Sophie, Francine, Olivier,
Michelle, Blandine, Nicolas, Ghislaine, Gismonde,
Jean-François - Léquipe CISMeF TIBS Josette, Gaëtan,
Catherine, Benoît, Saoussen, Tayeb, Yvan,
Badisse, Philippe, Élise, Thierry, Aurélie et
Stefan - LĂ©quipe du LERTIM Michel Joubert, Mario
Fieschi, Paul Avillach - Les intervenants extérieurs Antoine Buemi, Max
Silberztein, Gaëlle Lortal et Lina Soualmia
59
61Remerciements
THE END To be continued
60