Recherche d'information sur Internet par algorithme gntique - PowerPoint PPT Presentation

1 / 21
About This Presentation
Title:

Recherche d'information sur Internet par algorithme gntique

Description:

Un outil g n tique pour la veille strat gique sur Internet ... Fourmis artificielles. Recherche tabou. Recuit simul , ... Outil de veille strat gique ... – PowerPoint PPT presentation

Number of Views:113
Avg rating:3.0/5.0
Slides: 22
Provided by: fabienpi
Category:

less

Transcript and Presenter's Notes

Title: Recherche d'information sur Internet par algorithme gntique


1
JET 9
Un outil génétique pour la veille stratégique sur
Internet
F. Picarougne, N. Monmarché, M. Slimane, G.
Venturini
Laboratoire Informatique, Université de Tours,
France
2
Déroulement de l'exposé
  • Problème
  • Modélisation
  • Algorithme Génétique
  • Expérimentation
  • Résultats obtenus

3
1- Problème
  • Recherche dinformation sur Internet
  • Outil de veille stratégique
  • Diffère dun moteur de recherche classique
    (Google, Altavista, )
  • Notion de temps différente
  • Mise à jour des résultats
  • But fournir des URL de départ à des outils de
    veille existants

4
2- Modélisation (1)
  • Espace de recherche
  • Particularité des document texte liens
    hypertextes
  • Réduction de tous les documents
  • Relation de voisinage
  • Graphe orienté

5
2- Modélisation (2)
  • Fonction dévaluation
  • Basée sur la requête de lutilisateur
  • Plusieurs champs de mots-clés (K, S, SN, M, MN)
  • Utilisation dexpression régulières
  • Choix du type de fichier,
  • Score mesures statistiques

6
2- Modélisation (3)
  • Fonction dévaluation formule
  • Fonction Uniform() basée sur une fonction
    similaire à lentropie
  • Bornée entre 0 et 1
  • Valeur max pour une égale proportion des mots-clés

7
2- Modélisation (4)
  • Fonction dévaluation
  • Évaluation des liens
  • Exploration locale autour du lien
  • Utilisation de la ponctuation du texte
  • Appliquée à chaque page
  • Espace de recherche mathématique
  • Appliquée à chaque lien
  • Estimation de la page cible

8
2- Modélisation (5)
  • Parcours de l'espace de recherche opérateurs de
    recherche
  • Index robots,
  • Agents,
  • 2 types
  • Création
  • Transformation

9
2- Modélisation (6)
  • Problème doptimisation
  • Espace mathématique
  • Algorithmes classiques doptimisation
  • Utilisation dun AG

10
3- AG (1)
  • Algorithme Génétique "steady state"
  • Individu Page
  • Comporte des liens
  • Texte évalué -gt score individu
  • Liens évalués -gt exploration

11
3- AG (2)
  • Opérateurs génétiques
  • Initialisation création heuristique
  • Opérateur de création moteurs classiques
  • Opérateur de mutation tournoi binaire
    exploration du meilleur lien

12
3- AG (3)
  • Évaluation d'un individu (adaptation de la
    fonction précédente)
  • Texte extrait
  • Liens hypertextes
  • Uniformité des mots clés
  • Favorise
  • Pages de liens prometteurs
  • Présence de tous les mots clés

13
3- AG (4)
  • Algorithme général

Résultats Moteur classique
?
Création
Mutation
Init
Pmutation
Population
  • Insertion si score gt min pop

14
4- Expérimentation (1)
  • Méthodologie
  • 1000 pages max
  • 5 moteurs classiques
  • Yahoo
  • Google
  • Altavista
  • Lycos
  • Voilà
  • 10 requêtes réalistes
  • 5 essais sur chaque requête

15
4- Expérimentation (2)
  • Requêtes utilisés

16
5- Résultats (1)
  • Étude du paramètre Pmutation

Tests effectués sur la requête 3
17
5- Résultats (2)
  • Taille de la population

Tests effectués sur la requête 8
18
5- Résultats (3)
  • Comparaison avec un méta-moteur

19
Conclusion
  • Modélisation en graphe de l'espace de recherche
  • AG pour la recherche d'info sur le Web
  • Premiers résultats encourageants
  • Difficulté de comparaison avec les outils de
    recherche existants

20
Perspectives
  • Adaptabilité des opérateurs
  • Utilisation dune fonction dévaluation plus
    complexe
  • Utilisation de plus de critères (proportion des
    mots-clés, typographie, )
  • Comparaison critère de Pareto

21
Perspectives
  • Comparaison avec dautres types dalgorithmes
  • Fourmis artificielles
  • Recherche tabou
  • Recuit simulé,
  • Outil de veille stratégique
Write a Comment
User Comments (0)
About PowerShow.com