Indexation multi-terminologique de concepts en sant - PowerPoint PPT Presentation

About This Presentation
Title:

Indexation multi-terminologique de concepts en sant

Description:

Title: PowerPoint Presentation Last modified by: adm1wxp Created Date: 1/1/1601 12:00:00 AM Document presentation format: Affichage l' cran Other titles – PowerPoint PPT presentation

Number of Views:79
Avg rating:3.0/5.0
Slides: 62
Provided by: free2524
Category:

less

Transcript and Presenter's Notes

Title: Indexation multi-terminologique de concepts en sant


1
Indexation multi-terminologique de concepts en
santé
  • Suzanne Pereira
  • Encadrée par Élisabeth Serrot, Michel Joubert
    et Stefan J. Darmoni
  • LITIS, Université de Rouen - Équipe CISMeF, CHU
    de Rouen
  • LERTIM, Faculté de médecine, Marseille
  • Vidal, Issy les Moulineaux

1
2
Plan
  • Introduction
  • Indexation de documents en santé
  • Trois contextes
  • Vers une indexation automatique
  • Objectifs
  • État de lart
  • F-MTI, un extracteur multi-terminologique pour
    laide à lindexation
  • Conception
  • Évaluation
  • Applications
  • Discussion
  • Conclusion et perspectives

2
3
Introduction
3
4
Indexation de documents en santé
  • Principe
  •  consiste à repérer des mots ou des expressions
    particulièrement significatifs (appelés termes)
    dans un contexte donné, et à créer un lien entre
    ces termes et le texte original. 

Terminologies adaptées
Statistique, budget, suivi médical du patient
Document
diabète de type 2 enfant santé publique épidémie o
bésite Etats-Unis Royaume-Uni épidemiologiques cou
rs diagnostique France mal prévention
Indexation contrôlée
De qualité
Aide à la décision
Recherche dinformation
4
5
Trois contextes
  • CISMeF (le Catalogue et Index des Sites Médicaux
    Francophones)
  • Projet initié en 1995 (http//www, cismef.org)
  • 60 000 ressources Web ? professionnels de santé,
    étudiants, patients
  • Indexation manuelle à laide du MeSH
  • Diffusion dinformation sur les médicaments et
    aide à la prescription (société Vidal)
  • Débuts en 1911
  • 5 000 médicaments (RCP)
  • Indexation manuelle à laide de 4 terminologies
    et bientôt du TUV
  • Dossier Médicaux (travaux LERTIM)
  • Réflexion depuis 1990
  • 4 millions de comptes rendus hospitaliers
    (CRH) pour CHU de Rouen
  • Indexation manuelle à laide de la CIM10, de la
    CCAM et bientôt de la SNOMED 3.5

5
6
Cinq terminologies
CCAM
SNOMED 3.5
CIM10
TUV
MeSH
UMLS
  • MeSH (Medical Subject Heading)
  • TUV (Thésaurus Unifié Vidal)
  • CIM10 (Classification statistique Internationale
    des Maladies et des problèmes de santé connexes
    10ème révision)
  • CCAM (Classification Commune des Actes Médicaux)
  • SNOMED 3.5 (Nomenclature Systématique de MÉdecine
    humaine et vétérinaire version 3.5)
  • UMLS (Unified Medical Language System)

6
7
Vers une indexation automatique
  • Indexation humaine, automatique ou
    semi-automatique
  • Semi-automatique le compromis

Critères Humaine Automatique
Variabilité inter-indexeurs élevée non
Synthèse oui bas
Problème dambiguïté bas élevé
Connaissances élevées basses
Temps dindexation élevé bas
7
8
Objectifs
  • Continuité de projets communs (CISMeF Vidal
    LERTIM)
  • UMLF Lexique médical unifié français (Ministère
    de la Recherche ACI 2002)
  • VUMeF Terminologies françaises et aide à
    lindexation (Ministère de la Recherche RNTS
    2003)
  • Faciliter lindexation des documents
  • Concevoir des méthodes dindexation automatique
  • Évaluer ces méthodes
  • Proposer des applications pour CISMeF, Vidal et
    LERTIM

8
9
État de lart
9
10
Outils existants
CIREA
SNOCODE
D. Nakache (CEDRIC)
Medsight
SNOMED 3.5
Medckare
A. Baneyx (SPIM)
CIM10
Indexation de comptes rendus
?
CCAM
MAIF
Indexation de sites Web
A. Névéol (CISMeF)
MTI
Indexation de RCP
A. Aronson (NLM)
MeSH
TUV
?
10
11
État de lart
Terminologie X
Terminologie 1 à indexer
Terminologie 1 à indexer
Lien de transcodage
Lien de transcodage
Terminologie 1 à indexer
Terminologie 2
  • Indexation mono-terminologie directe
  • CIREA (CIM10), MAIF (MeSH), Snocode (SNOMED 3.5)
  • Indexation mono-terminologie indirecte (à partir
    dun transcodage)
  • MedCKARe (ontologie pneumologie-gtCIM10),
  • Indexation multi-terminologique
  • Indexation directe et indirecte pour plusieurs
    terminologies (une seule terminologie considérée)
  • MTI (UMLS) indexation en MeSH et CIM9-CM

11
12
F-MTI, un extracteur multi-terminologique pour
laide à lindexation
12
13
F-MTI
  • Indexation multi-terminologique (inspiré de MTI)
  • Indexation directe CIM10, SNOMED, CCAM, MeSH,
    TUV
  • Projection vers les terminologies désirées grâce
    aux transcodages (recherche de termes
    équivalents)
  • Indexation multi-document dépendante du type
    de document
  • Traitement particulier des CRH, des sites
    médicaux et des RCP
  • Indexation basique pour les autres documents
    (convertibles au format texte)
  • Indexation multi-tâche dépendante de la tâche
    à effectuer (règles dindexation)
  • Paramétrable (terminologies à utiliser,
    terminologies en sortie)

13
14
F-MTI
Un Document Un
ensemble de documents (RCP, lettre de sortie,
site Internet, ou autres convertis au format .txt)
Identification des rubriques, paragraphes et
phrases localisations
Phrases
Ensemble de phrases (corpus)
Base de données multi- terminologique
NOOJ dico de termes
NOOJ dico de constituants
Algo SDM
Termes MeSH, CCAM, SNOMED, TUV et CIM10
Agrégation
Restriction à (une ou plusieurs terminologies)
Post-traitement
Proposition dindexation à laide dune ou
plusieurs terminologies
14
15
Base de données multi-terminologique
Base de données multi- terminologique
  • Principe / Motivation
  • Interrogation rapide des cinq terminologies
  • Structure de données simple et générique
    contenant des terminologies de structure
    différente
  • Méthode
  • Modélisation de la structure de chaque
    terminologie
  • Élaboration du modèle général à partir des
    modélisations unitaires (inspiré du metathesaurus
    de lUMLS)

15
16
F-MTI
Un Document Un
ensemble de documents (RCP, lettre de sortie,
site Internet, ou autres convertis au format .txt)
Identification des rubriques, paragraphes et
phrases localisations
Phrases
Ensemble de phrases (corpus)
Base de données multi- terminologique
NOOJ dico de termes
NOOJ dico de constituants
Algo SDM
Termes MeSH, CCAM, SNOMED, TUV et CIM10
Agrégation
Restriction à (une ou plusieurs terminologies)
Post-traitement
Proposition dindexation à laide dune ou
plusieurs terminologies
16
17
Découpage en rubriques, paragraphes et phrases
  • Principe / Motivation
  • Identifier les unités dindexation les phrases
  • Prise en compte du contexte (rubriques et
    paragraphes)
  • Indexation du document agrégation de lensemble
    des indexations pour toutes les phrases du
    document
  • Méthode


Découpage
Liste de noms de rubriques
Découpage en rubriques
Balises, retour chariot etc
Découpage en paragraphes
Logiciel NOOJ (M, Silberztein)
Transducteur NooJ
Découpage en phrase
17
18
Découpage en rubriques, paragraphes et phrases
  • Exemple

Antécédents Ulcère gastrique opéré il y a 20
ans. Tabagisme à 40 paquets/an. Maladie d'Osler.
Arythmie complète par fibrillation auriculaire en
90, 94 et en 2002. EXAMEN CLINIQUE 12-7. Pouls
à 70. 52 kg. Asymptomatique. Bruits du cœur
réguliers avec un souffle d'insuffisance mitrale
résiduel 1 à 2/6ème maximal au foyer mitral.
Antécédents 1 1 Ulcère gastrique opéré il y a 20
ans. Antécédents 1 2 Tabagisme à 40
paquets/an. Antécédents 1 3 Maladie
d'Osler. Antécédents 1 4 Arythmie complète par
fibrillation auriculaire en 90, 94 et en
2002. EXAMEN CLINIQUE 1 1 12-7. EXAMEN CLINIQUE
1 2 Pouls à 70. EXAMEN CLINIQUE 1 3 52
kg. EXAMEN CLINIQUE 1 4 Asymptomatique. EXAMEN
CLINIQUE 1 5 Bruits du cœur réguliers avec un
souffle d'insuffisance mitrale
résiduel 1 à
2/6ème maximal au foyer mitral.
18
19
Création de libellés dindexation
  • Principe / Motivation
  • 3 méthodes de TAL basées sur les libellés des
    termes
  • Libellés de chaque terme non élaborés à lorigine
    pour faciliter leur indexation
  • Exemple  angine, sans autre
    précision 
  • Méthode
  • Création de libellés dindexation
  • Application à la CIM10
  • Élimination des expressions  sans précision 
     sans autre indication 
  • Élimination des exclusions
  • Création de 2 libellés dindexation pour les
    alternatives en  ou 
  • Traitement des précisions entre parenthèses

19
20
F-MTI
Un Document Un
ensemble de documents (RCP, lettre de sortie,
site Internet, ou autres convertis au format .txt)
Identification des rubriques, paragraphes et
phrases localisations
Phrases
Ensemble de phrases (corpus)
Base de données multi- terminologique
NOOJ dico de termes
NOOJ dico de constituants
Algo SDM
Termes MeSH, CCAM, SNOMED, TUV et CIM10
Agrégation
Restriction à (une ou plusieurs terminologies)
Post-traitement
Proposition dindexation à laide dune ou
plusieurs terminologies
20
21
Lalgorithme du sac de mots
  • Principe / Motivation
  • Utilisé à lorigine dans CISMeF pour retranscrire
    les requêtes des utilisateurs en termes MeSH
  • Phrase considérée comme un sac de mots (les plus
    signifiants) rendus à leur forme la plus simple
    (lemme ou stème)
  • Termes des différentes terminologies (TUV,
    SNOMED, MeSH, CIM10, CCAM) considérés comme des
    sacs de mots
  • Algorithme revu pour lindexation de documents

21
22
Lalgorithme du sac de mots


Méthode de lalgorithme du sac de mots
Normalisation (ponctuation, minuscules)
Découpage en mots
Élimination des mots vides et mots non pertinents
Sémiographe (Memodata )
Frenchstemmer (Lucene)
Désuffixation ou lemmatisation
Rangement (ordre alphabétique)
Mise en correspondance avec les termes des
différentes terminologies
Base de données multi- terminologique
22
23
Lalgorithme du sac de mots
Exemple
Ulcère gastrique opéré il y a 20 ans.

ulcère gastrique opéré il y a 20 ans
ulcère gastrique opéré 20 ans
Lemmatisation
Désuffixation
20angastriqueopérer ulcère ou
20angastricopér ulcèr ajouts selon la
rubrique rattachée (antécédent ou anteced)
Toutes les combinaisons sont générées
20angastriqueopéré ulcère

angastriqueopéré ulcère

gastriqueopéré ulcère

angastriqueopéré
etc Et
comparées aux termes des différentes
terminologies traités de la même façon
ulcère gastrique PE1192 TUV gastriqueulcère ga
striculcer ulcère gastrique D013276 MSH gastriq
ueulcère gastriculcer ulcère
gastrique D5-32100 SNMI gastriqueulcère gastri
culcer
Résultats
23
24
Lalgorithme du sac de mots
  • Avantages / Inconvénients
  • Méthode simple nécessitant peu de ressources
  • Ordre des mots non important (erreurs possibles)
  • Méthode pour le moment limitée
  • Gestion des termes complexes et des négations
    difficile

24
25
F-MTI
Un Document Un
ensemble de documents (RCP, lettre de sortie,
site Internet, ou autres convertis au format .txt)
Identification des rubriques, paragraphes et
phrases localisations
Phrases
Ensemble de phrases (corpus)
Base de données multi- terminologique
NOOJ dico de termes
NOOJ dico de constituants
Algo SDM
Termes MeSH, CCAM, SNOMED, TUV et CIM10
Agrégation
Restriction à (une ou plusieurs terminologies)
Post-traitement
Proposition dindexation à laide dune ou
plusieurs terminologies
25
26
Le dictionnaire de termes
  • Motivation
  • Inspiré de lapproche TAL de MAIF (A.Névéol)
  • Variantes validées en amont
  • Contient les différentes formes textuelles des
    termes leurs dérivations (ex asthme -
    asthmatique), ?exions (ex bactérie - bactéries)
    et synonymes
  • Méthode très rapide
  • Possibilité de gérer les termes complexes et la
    négation
  • Principe
  • Format DELA (Dictionnaires Electroniques du
    LADL)
  • FormeTextuellePossibleDuTerme,LibelléDuTerme,Infor
    mationsDivers
  • Application NOOJ

7
Laboratoire d'Analyse et de Description
Linguistique
26
27
Le dictionnaire de termes
  • Exemple

Ulcère gastrique opéré il y a 20 ans.
Dictionnaire de termes ulcère
gastrique,Ulcère gastrique,TUV ulcères
gastriques,Ulcère gastrique,TUV ulcère de
lestomac,Ulcère gastrique,TUV ulcère
gastrique,Ulcère gastrique,MSH ulcères
gastriques,Ulcère gastrique,MSH ulcère de
lestomac,Ulcère gastrique,MSH ulcère
gastrique,Ulcère gastrique,SNMI ulcères
gastriques,Ulcère gastrique,SNMI ulcère de
lestomac,Ulcère gastrique,SNMI
ulcère gastrique,Ulcère gastrique,EII2048TUV ulcè
re gastrique,Ulcère gastrique,D013276MSH ulcère
gastrique,Ulcère gastrique,D5-32100 SNMI
7
27
28
Le dictionnaire de termes
  • Constitution manuelle dun dictionnaire
  • fastidieux
  • Méthode de construction automatique de
    dictionnaires
  • Reprise de lexistant
  • Variantes des différentes terminologies
  • Variantes provenant de précédents travaux (UMLF,
    dictionnaire MeSH de MAIF, lexiques du projet
    VUMeF)

7
28
29
Construction automatique de dictionnaires
  • Recueil automatique de nouvelles variantes
  • Extraction de variantes à partir de corpus
  • Utilisation de patrons dextraction et dun
    dictionnaire de mots
  • Création de nouvelles variantes (pluriels et
    singuliers)

Exemple  diminution des facteurs de
coagulation 
  • Application au TUV
  • Création de 33 719 transducteurs liés à un
    dictionnaire 38 219 variantes de mots
  • Corpus de 50 000 documents 7 800 recueillies
    dont 1 007 pour le TUV (validation à 55)
  • Création de 4 279 pluriels/singuliers
    (validation à 92,3)

7
29
30
Prise en compte du contexte
  • Négations
  • Négation verbale

Négation antérieure
Négation postérieure
30
31
F-MTI
Un Document Un
ensemble de documents (RCP, lettre de sortie,
site Internet, ou autres convertis au format .txt)
Identification des rubriques, paragraphes et
phrases localisations
Phrases
Ensemble de phrases (corpus)
Base de données multi- terminologique
NOOJ dico de termes
NOOJ dico de constituants
Algo SDM
Termes MeSH, CCAM, SNOMED, TUV et CIM10
Agrégation
Restriction à (une ou plusieurs terminologies)
Post-traitement
Proposition dindexation à laide dune ou
plusieurs terminologies
31
32
Le dictionnaire de constituants
  • Principe / Motivation
  • Prendre en compte les éléments constitutifs du
    terme et non les mots seuls ou le terme dans sa
    globalité
  • Un constituant est dé?ni comme toute variante
    incluse dans un terme,
  • Ex le terme  angine de poitrine sévère 
    comprend plus de 6 constituants  angine ,
     angines ,  poitrine ,  sévère ,  aigu ,
     angor  etc
  • Un terme est indexé si la phrase couvre
    lensemble des constituants requis (calcul dun
    score)
  • Application NOOJ

32
33
Le dictionnaire de constituants
  • Exemple
  •  Le patient est atteint dun syndrome sévère, le
    syndrome de Down accompagné dasthme. 

Dictionnaire de constituants
Base de données multi-terminologique
syndrome de Down 2 syndrome de X
2 Asthme 1
syndrome, syndrome de Down, 1TUV syndrome,
syndrome de X, 1TUV syndrome, syndrome de
Down,1TUV syndrome, syndrome de X, 1TUV down,
syndrome de Down, 1TUV asthme, asthme,1TUV
Après élimination des doublons et ajout des
scores pour chaque termes 2 pour
 syndrome de Down  1 pour  syndrome de
X  1 pour  asthme 
Seuls les termes  syndrome de Down  et
 asthme  sont indexés
33
34
F-MTI
Un Document Un
ensemble de documents (RCP, lettre de sortie,
site Internet, ou autres convertis au format .txt)
Identification des rubriques, paragraphes et
phrases localisations
Phrases
Ensemble de phrases (corpus)
Base de données multi- terminologique
NOOJ dico de termes
NOOJ dico de constituants
Algo SDM
Termes MeSH, CCAM, SNOMED, TUV et CIM10
Agrégation
Restriction à (une ou plusieurs terminologies)
Post-traitement
Proposition dindexation à laide dune ou
plusieurs terminologies
34
35
Projection et restriction vers une ou plusieurs
terminologies
  • Principe
  • Restriction aux termes équivalents appartenant
    aux terminologies désirées
  • Méthode
  • Les différents transcodages utilisés
  • MeSH, CIM10, SNOMED UMLS et SFINM
  • CCAM-gtMeSH créé par CISMeF (P. Massari et B.
    Thirion)
  • CIM10-gtCCAM de TOTHEM (enlevé)
  • TUV-gtMeSH créé par CISMeF et validé par Vidal
    (enlevé)
  • TUV-gtCIM10 créé par Vidal (enlevé)

Secrétariat Francophone International de
Nomenclature Médicale
35
36
Projection et restriction vers une ou plusieurs
terminologies
  • Exemple  Ulcère gastrique opéré il y a 20
    ans. 

ulcère gastrique PE1192 TUV ulcère
gastrique D013276 MSH ulcère gastrique D5-3210
0 SNMI
Résultats Indexation directe
ulcère de l'estomac non précisé comme étant
aigu K25.9 CIM10 ou chronique, sans hémorragie
ni perforation ulcère gastrique sans
hémorragie ni perforation D5-32422 SNMI ou
obstruction estomac D013270 MSH tumeur
maligne estomac, sans précision C16.9 CIM10
Résultats Indexation indirecte
36
37
Post-traitements
Post-traitement
Proposition dindexation à laide dune ou
plusieurs terminologies
  • Élimination des doublons (mêmes termes ou un
    terme et son synonyme de la même terminologie)
  • Application des règles dindexation
  • Règles générales
  • Indexation au plus précis père/fils, termes
    dont le sac de mots est inclus dans un autre
  • Règles spéci?ques à chaque terminologie
  • MeSH élimination des termes peu pertinents,
    appariement terme/qualificatif, élimination des
    qualificatifs non appariés
  • Aucune pour CCAM/TUV/SNOMED 3.5/CIM10

37
38
Évaluation de lindexation de termes CIM10 et
CCAM pour les dossiers patients
  • Méthode
  • Comparaison de lindexation automatique (F-MTI -
    algorithme du sac de mots) et lindexation
    medico-économique ou descriptive manuelle
  • Matériels
  • Corpus de 794 CRH du CHU de Rouen
  • 490 de Cardiologie
  • 304 de Pneumologie
  • Indexation manuelle médico-économique CCAM et
    CIM10
  • Corpus de 100 CRH
  • 50 de Cardiologie
  • 50 de Pneumologie
  • Indexation descriptive par un expert (en aveugle)
  • Mesures
  • Précision (inverse du bruit), rappel (inverse du
    silence), F-mesure

38
39
Évaluation de lindexation de termes CIM10 et
CCAM pour les dossiers patients
  • Résultats

Restriction des termes
Cardiologie
diagnostics
15,4 76,4
Cardiologie
794 CRH
ou symptômes
3,0 35,7
Précision Rappel
3,4 29,7
51,3 75,4
Pneumologie diagnostics
Pneumologie
41,0 96,1
4,0 19,9
ou symptômes
39,3 97,5
Indexation médico-économique Indexation médico-économique Indexation médico-économique Indexation descriptive Indexation descriptive Indexation descriptive
Précision Rappel F-mesure Précision Rappel F-mesure
2,6 38,0 4,9 3,7 32,9 5,8
100 CRH
39
40
Évaluation de lindexation de termes CIM10 et
CCAM pour les dossiers patients
  • Discussion
  • Précision faible
  • Problème des contextes (négations, proche
    concerné)
  • Problème des transcodages
  • Problème du nombre de termes proposés gt
    difficultés à déterminer ce qui est important
  • Rappel faible
  • Problème de la rédaction des CRH (manque
    précision, abréviations etc.)
  • Dispersion des informations
  • Méthode dévaluation discutable
  • 18 de consensus inter indexeur
  • Peu de formation à lindexation
  • Restriction spécialité/diagnostic/symptôme
    différentes vues pour lindexation
    semi-automatique
  • CCAM résultats 0 (F-MTI inadapté)

40
41
Évaluation de lindexation de termes SNOMED pour
les dossiers patients
  • Principe
  • Comparaison de deux indexations automatiques
    SNOMED F-MTI et Snocode
  • Difficulté dobtenir une référence manuelle
    (indexation manuelle fastidieuse)
  • Choix dun transcodage vers une terminologie
    moins complexe CIM10
  • Matériel
  • 100 CRH indexés manuellement à laide de la CIM10

41
42
Évaluation de lindexation de termes SNOMED pour
les dossiers patients
  • Résultats

F-MTI extrait 2 fois plus de codes que Snocode
Pourcentage de codes F-MTI couvrant les codes Snocode 29,9
Pourcentage de codes Snocode couvrant les codes F-MTI 51,5
Mesure de Hooper 31,3
SNOMED
transcodage
Précision Rappel F-mesure
F-MTI 4,4 30,7 8,7
Snocode 6,1 24,7 9,8
CIM10
42
43
Évaluation de lindexation de termes MeSH pour
les sites Web
  • Principe
  • Comparaison entre lindexation automatique
    (F-MTI) pour les titres et lindexation manuelle
    (indexeurs CISMeF) de la ressource
  • Matériel
  • Corpus CISMeF (18 814 ressources) indexé
    manuellement par quatre indexeurs CISMeF

43
44
Évaluations
  • Lemmatisation/Désuffixation

F-MTI Désuffixation F-MTI Lemmatisation
() Précision Rappel () Précision Rappel
Termes dindexation Tous 25,9 - 13,5 Tous 26,7 - 13,1
sous-analyse des variantes
  • Mono/Multi-terminologie

F-MTI Mono-termino F-MTI Multi-termino
Termes dindexation MC/Q Tous 29,4 - 13,0 Tous 25,9 - 13,5
Descripteurs MC Tous 37,7 - 21,3 Enseign 43,7 - 17,9 Recos 51,6 - 24,7 Patient 42,4 - 27,5 Tous 35,5 - 23,1 Enseign 39,9 - 18,7 Recos 44,4 - 25,7 Patient 38,3 - 27,8
sur-analyse des termes
  • Évaluation secondaire (1 000 ressources)
  • Peu pertinent 15,9, pertinent 4,5, impact
    négatif 79,6

44
45
Évaluation de lindexation de termes TUV pour les
RCP
  • Principe
  • Évaluation du dictionnaire de terme (approche
    mono-teminologique)
  • Comparaison de lindexation automatique de F-MTI
    avec lindexation manuelle de léquipe du Vidal
  • Matériels
  • Corpus de 5 191 RCP indexés manuellement à laide
    des quatre thésauri Vidal
  • Réalisation de la table de transcodage anciens
    thésauri TUV
  • Transcodage en TUV

45
46
Évaluation de lindexation de termes TUV pour les
RCP
  • Résultats

Rubriques concernées Précision Rappel
Indications 48,1 21,7
Contre-indications 46,1 23,5
Effets secondaires 77,0 59,4
Précautions demploi 28,4 49,3
Total des 4 rubriques 52,9 46,2
Total (non prise compte des rubriques) 57,6 43,4
  • Terminologie en adéquation avec les documents
    indexés
  • Insuffisance des variantes répertoriées dans le
    dictionnaire
  • Conversion des documents pdf en txt (titres,
    tableaux)

46
47
Applications
  • Indexation automatique de ressources Web
  • Indexation automatique des ressources
  • 2006 F-MTI mono-terminologique (34 000
    ressources)
  • Indexation semi-automatique des ressources
  • Interprétation des requêtes
  • Vers une recherche dinformation
    multi-terminologique
  • Application concrète dans le PIM de CISMeF
    (Classification ATC, codes CAS, CIS, CIP en
    place)
  • 2009 F-MTI multi-terminologique (Autres
    terminologies)
  • Indexation automatique de dossiers patients
  • Recherche dinformation
  • Aide au codage médico-économique
  • Structuration des dossiers
  • Production de résumés
  • Aide à la rédaction

47
48
Applications
  • Indexation semi-automatique de RCP BIBLIS (IMAG)

RCP
Indexation manuelle
Indexation Automatique F-MTI
Documents proches
48
49
Applications
  • Outil daide à lindexation généraliste

Type de document
Indexation multi-terminologique manuelle
Document
Indexation multi-terminologique automatique
Serveur multi-terminologique
Quelques fonctionnalités supplémentaires
49
50
Discussion
50
51
Discussion
  • Résultats dévaluation différents selon
  • la tâche dindexation
  • la terminologie
  • le corpus
  • le type de document au sein du corpus
  • les rubriques au sein du document

Aide au transcodage
51
52
Discussion
  • Comment tendre vers une indexation de qualité?
  • Amélioration des terminologies et développement
    de règles dindexation (terminologues)
  • Formation à lindexation, apprentissage des
    terminologies utilisées, et développement de
    règles dindexation pour les tâches visées
    (indexeurs)
  • Rédaction adaptée (auteurs de documents devant
    être indexés)
  • Développement doutils daide à lindexation et à
    la rédaction automatiques plus performants
    (informaticiens)

Aide au transcodage
52
53
Discussion
  • Publications et valorisation
  • Pereira S., Névéol A., Kerdelhué G., Serrot E.,
    Joubert M., Darmoni S.J. Using multi-terminology
    indexing for the assignment of MeSH descriptors
    to health resources in a french online catalogue.
    AMIA Annu Symp Proc. 2008 586-590.
  • Pereira S., Névéol A., Massari P., Joubert M.,
    Darmoni S.J. Construction of a semi-automated
    ICD-10 coding help system to optimize medical and
    economic coding, Proceedings of MIE2006. Stud
    Health Technol Inform, 2006 124 845-50.
  • Pereira S., Massari P., Joubert M., Darmoni S.
    Utilisation de métatermes pour la recherche
    dinformation dans les dossiers médicaux. In
    Actes des journées Francophones dInformatique
    Médicale. 2007.
  • Pereira S., Massari P., Buemi A., Dahamna B.,
    Serrot E., Darmoni S., Joubert M. F-MTI un
    outil dindexation automatique application à
    lindexation autmoatique de la SNOMED
    Internationale. Soumis à JFIM2009.

53
54
Discussion
  • Publications et valorisation
  • Massari P., Pereira S., Thirion B., Derville A.,
    Darmoni S.J. Use of superconcepts to customize
    electronic medical records data display. Stud
    Health Technol Inform. 2008 136 845850.
  • Merabti T., Pereira S., Lecroq T., Joubert M.,
    Darmoni S.J. Inheritance of SNOMED CT relations
    between concepts to two health terminologies
    (SNOMED International and ICD10). Proceedings of
    the 3rd international conference on Knowledge
    Representation in Medicine (KR-MED). 2008 118.
  • Merabti T., Pereira S., Letord C., Lecroq T.,
    Dahamna B., Joubert M., Darmoni J. Searching
    Related Resources in a Quality Controlled Health
    Gateway a Feasibility Study. Proceedings of
    MIE2008, Stud Health Technol Inform, Volume 136,
    Pages 235240, 2008
  • Névéol A., Pereira S., Kerdelhué G., Dahamna B.,
    Joubert M., Darmoni S.J. Evaluation of a simple
    method for the automatic assignment of MeSH
    descriptors to health resources in a french
    online catalogue. Proceedings of Medinfo2007,
    Stud Health Technol Inform. 2007 129 407-11.
  • Névéol A., Pereira S., Soualmia F.F., Thirion B.,
    Darmoni S.J. A method of cross-lingual consumer
    health information retrieval. Proceedings of
    MIE2006, Stud Health Technol Inform. 2006 124
    601608.
  • Pereira S., Névéol A., Massari P., Darmoni S.,
    Joubert M. Evaluation de plusieurs terminologies
    médicales pour optimiser laide au codage
    médico-économique par analyse automatique de
    dossiers électroniques de patients. In Acte
    EMOI2006. 2006.
  • Valorisation à luniversité - Infobutton

53
55
Conclusion et Perspectives
54
56
Conclusion
  • Notre contribution
  • Base de données multi-terminologique
  • Création de libellés dindexation
  • Trois méthodes dindexation complémentaires
  • Méthode de création automatique de dictionnaires
  • Prise en compte des contextes
  • Outil dindexation automatique
    multi-terminologique (F-MTI)

55
57
Perspectives
  • Amélioration de loutil
  • Coopération des 3 méthodes
  • Amélioration des transcodages
  • Prise en compte dautres contextes
  • Implémentation de règles médicales
  • Implémentation des méthodes de Metamap
  • (MTI)

56
58
Perspectives
  • CISMeF
  • Passage dune stratégie mono-terminologique à une
    stratégie multi-terminologique
  • Nouvelles voies de recherche
  • Interopérabilité sémantique inter et
    intra-terminologies (T. Merabti 2A)
  • Recherche dinformation multi-terminologique dans
    un portail de santé (S. Sakji 2A)
  • Recherche dinformation multi-terminologique dans
    un dossier patient électronique (A.D. Diriehdibad
    1A)
  • Vidal
  • Aide à lindexation TUV avec BIBLIS
  • Exploitation dautres terminologies pour des
    alertes toujours plus performantes
  • LERTIM
  • Nouveau pas vers lélaboration dun SIH
    performant
  • Poursuite des travaux avec T. Merabti, S. Sakji,
    A.D. Diriehdibad

Aide au transcodage
57
59
Perspectives
  • Vers dautres projets communs
  • InterSTIS Interopérabilité sémantique des
    terminologies dans les systèmes dinformation de
    santé français (ANR TecSan 2007)
  • SMTS Serveur Multi-Terminologique en Santé
  • PSIP optimisation de la prescription
    informatisée (7ème PCRD)
  • ALADIN-DTH Assistant de Lutte Automatisé et de
    Détection des Infections Nosocomiales à partir de
    Documents Textuels Hospitaliers (ANR TecSan 2008)

Aide au transcodage
58
60
Remerciements
  • Léquipe scientifique Vidal Elisabeth,
    Mathilde, Josiane, Sophie, Francine, Olivier,
    Michelle, Blandine, Nicolas, Ghislaine, Gismonde,
    Jean-François
  • Léquipe CISMeF TIBS Josette, Gaëtan,
    Catherine, Benoît, Saoussen, Tayeb, Yvan,
    Badisse, Philippe, Élise, Thierry, Aurélie et
    Stefan
  • Léquipe du LERTIM Michel Joubert, Mario
    Fieschi, Paul Avillach
  • Les intervenants extérieurs Antoine Buemi, Max
    Silberztein, Gaëlle Lortal et Lina Soualmia

59
61
Remerciements
  • ET VOUS !
  • ?

THE END To be continued
60
Write a Comment
User Comments (0)
About PowerShow.com