Title: Aucun titre de diapositive
1- Présentation des Technologies Datops
- en termes simples
- Risk Survey Analysis System
- 14 Jan 02 -
2Noms propres
Exemples de noms propres "The market is taking a
breather after a pretty impressive display the
last two days," said Arnie Owen, managing
director of capital markets for Roth Capital
Partners.
L'identification des noms propres repose à la
fois sur des critères linguistiques et
typographiques. En effet, en anglais et français
par exemple, une première lettre en majuscule est
une condition nécessaire mais pas suffisante pour
qu'un mot soit un nom propre. La technologie
utilisée applique les opérations suivantes
. analyse de la structure des textes détection
des paragraphes et phrases . analyse
linguistique de la phrase détection des
propositions, des formes nominales et verbales
. rechercher les noms propres au sein des formes
nominales par application de critères
topographiques (première lettre en majuscule )
3Reprise de discours
Exemples de citation directe
Il s'agit de l'identification des segments de
texte comportant . des citations directes
(reprise intégrale d'un discours ou d'un extrait
d'article de presse, et délimitée par des
guillemets) . ou indirectes (présentation d'une
déclaration ou d'une opinion externe avec
reformulation), La technologie utilisée
applique les opérations suivantes .
recherche d'indices (mots ou expressions) qui
annoncent, suivent (ou sont contenus dans) une
reprise de discours. . application de règles
pour confirmer ou infirmer ces indices au regard
des formes linguistiques . application de
règles pour déterminer les limites du segment de
texte concerné
Wall Street réagit comme une armée, par une
succession de garde-Ã -vous et de repos ,
considère Larry Wachtel, chez Prudential
Securities.
Exemples de citations indirectes
- le consensus des investisseurs sur ses
résultats est plutôt positif, et certains
opérateurs l'estiment trop prudent.
- La compagnie aérienne a annoncé après la
clôture du marché une progression de 2 de son CA
sur l'exercice fiscal 2001/02 et a confirmé dans
la foulée ses objectifs de croissance
4Tonalité
- Exemples de mots et dexpressions
- Profit warning -3
- Recover 1
- Recover dammage -2
- Le calcul de la tonalité seffectue en plusieurs
étapes - 1-La première étape concerne le traitement des
documents publiés sur une période donnée
comprenant - La recherche dans les documents de mots ou
dexpressions comportant différents niveaux de
tonalité positifs ou négatifs parmi environ 15000
éléments. - La détermination de la zone dinfluence de ces
tonalités (au sein de la phrase) - Lapplication dune cinquantaine de règles
linguistiques corrigeant les formes ambiguës
(phrases négatives, phrases au conditionnel) - Lidentification des noms propres auxquels
sapplique la tonalité (synonymes de chaque nom
de sociétés). - 2-La deuxième étape détermine ainsi une mesure de
tonalité moyenne pour chaque nom propre (exemple
nom de société), ainsi quune mesure de la
tonalité globale des documents (exemple
environnement global de la société).
- Exemples de règles
- Augmentation, diminution de la tonalité pour des
formes linguistiques telles que despite, boost,
slightly. - Annulation de tonalité opposée, etc
Exemple Tyco International et Tyco
International Limited
5Intensité et Topographie
- Lintensité, selon limportance du taux de
publication quotidien de la société, se détermine
- Par comparaison du volume de documents publiés au
jour j au volume habituel de la société (prenant
en compte la correction de la périodicité
hebdomadaire). - Par un traitement adapté aux signaux faibles.
- La topographie détermine
- Les changements dans la distribution de lorigine
des informations (géographique et types de
presse) - Ou le comportement anormal dune ou plusieurs
sources.
Modèle de traitement des séries volumiques
Exemple Distribution géographique
6Modèle dalerte
Un modèle statistique prenant en compte les
métriques de tonalité, dintensité et de
topographie détermine après combinaison et
pondération si le comportement de ces métriques
est anormalement élevé ou pas. Un bulletin
dalerte est généré expliquant automatiquement
les données, fournissant des graphiques commentés
des extraits négatifs des documents et ainsi que
des extraits illustrant les sujets les plus
fortement évoqués.
Tonality Explanation negative extracts
Intensity Explanation news extracts