Title: Introduction lInternet
1Certificat de formation continue universitaire
en informatique médicale
Henning Müller Division d'Informatique
Médicale Université de Genève Septembre 2004
Internet Commercialisation et enjeux
2Notre position dans le cours
- Quatre parties sur Internet
- Réseau et protocoles
- Histoire et organisation de lInternet
- XML, Web sémantique
- Enjeux de la commercialisation du Web
3Contenu
- Le Web interactif
- Commercialisation du Web
- Guerre des browsers,
- services illégaux Napster,
- Fournisseurs d'accès doivent gagner de largent,
Moteurs de recherche aussi - Enjeux
- Virus, dialer, phishing, piratage des serveurs,
- Spam
- Future du Web
4Le web interactif
5Au niveau du client Javascript, Applet Java,
ActiveX
- Javascript
- Langage en format similaire que Java qui est
intégré dans le code html - Interprété par le browser
- Appel des fonctions internes du browser
- Applets Java
- Programme qui tourne sur le client
- Marche sur toute sortes de plate formes
- Lent, car interprété, mais il y a des
compilateurs - Énormément de ressources accessible pour le
développement - ActiveX (Microsoft, seulement Internet Explorer)
- Problèmes de sécurité (trous, etc.)
6PHP - PHP Hypertext Processor
- http//www.php.net/
- Syntaxe similaire à perl, relativement simple
- Scripts peuvent être insérés dans le html
- Séparation possible
- Code non visible par le client, client reçoit
html - Module dans le serveur (Apache) exécute le php
- Extension .php
lthtmlgt ltheadgtlttitlegtPHP Testlt/titlegtlt/headgt
ltbodygt lt?php if (strstr(_SERVER"HTTP_USER_A
GENT", "MSIE")) echo "You are
using Internet Explorerltbr /gt" ?gt
lt/bodygt lt/htmlgt
7PHP (2)
- Facilité à accéder à des bases de données
- Interface avec mySQL et d'autres
- Requêtes SQL
- Parsing des résultats
- Génération de pages complètes, avec des textes et
graphiques,à partir de bases de données - Génération des pages multilingues
- Beaucoup de documentation, souvent utilisé
- Composants accessible en Open Source
8CGI - Common Gateway Interface
- Programmation souvent en perl mais n'importe quel
langage de programmation possible - Module pour serveur Web apache
- Extension .cgi
- Exécution du programme dans un espace réservé,
mais execution sur le serveur - Directory /cgi-bin/
- Problèmes de sécurité (Attention!!)
- "Buffer overflow" avec des paramètres
- Implémentation de la sécurité incombe au
développeur
9CGI (2)
- Accès aux bases de données
- Transfert de paramètres
- http//mon.url.net/cgi-bin/mon-script.pl?paramval
eur - http//www.google.ch/search?qcgiieUTF-8oeUTF8
hldebtnGGoogleSuchemeta - Milliers de scripts accessible par le Web
- Compteurs
- http//cgi.resourceindex.com/
- Possibilité d'intégrer des boutons sur des pages
Webs et dy lier des actions
ltimg src"http//yourserver.com/path/to/cgi-bin/hi
tmat.cgi?PAGECODEGROUPCODECOMMAND"gt
10Flash/SVG
- Flash
- Produit de Macromédia
- Basé sur des vecteurs, pour des animations, plus
rapide que Java - Pages actives (par exemple sous la souris
l'image change) - Plugin propriétaire pour des browsers
- SVG - Scalable Vector Graphics
- Images vectorielle, initiative du W3C
- Description en XML
- Taille d'image changeable, plus compact que gif
ou jpg - Texte en SVG est accessible
- Animations sont possible, similaire à Flash
11ASP/JSP
- ASP (Active Server Pages)
- Solution Microsoft, intégré dans Internet
Information Server (IIS) or Personal Web Server
(PWS) - Moteur ASP génère html à partir de scripts
- VBScript (Visual Basic) défaut, mais d'autres
langages sont possible - JSP (Java Server Pages)
- Génération de html à l'aide de Java
- Solution Sun pour des pages Webs interactives
- Accès aux bases de données (API JDBC)
- Apache Tomcat est un serveur pour JSP
12Gestionnaires de sites
- Zope
- Open Source
- Ecrit en python
- Base de données objets
- Templates de pages
- DreamWeaver
- Produit commercial de Macromédia
- Utilisé pour le site de la DIM
- Gestion avec CSS templates, flash
- Editeur de html
13Commercialisation
"The subordering of cultural and non-material
values unter commercial interests, often
connected with a trivialization of content"
14Commercialisation
- Du réseau militaire au réseau scientifique puis
au réseau commercial - Développement du e-shopping
- Un marché global
- Développement des offres payantes
- Guerres de pouvoir dans le Web
- Également des influences politiques, industriels,
- Abus du Web (criminel, pour jouer)
- Publicité dans le Web (spam est illégal dans
beaucoup de pays) - Beaucoup d'entreprises pour la gestion des pages
15Amazon.com
- Paradoxe seulement un trimestre avec un gain
(4/2002) depuis existence (1994) - Capitalisation 19 Mrd US (9/2003), 17 Mrd
(9/2004) - Apple, 7,5 Mrd, General Motors 21,67 Mrd
- Vente de rêves? Ou est-ce que les expériences et
clients comptent? - Vente 2002 4 Mrd
- Vente 2003 5,2 Mrd
16La guerre des browsers
- Netscape vs. Microsoft
- Microsoft a dormi au début du Web
- Après investissements énormes
- Intégration d'Internet Explorer dans Windows
- Netscape Navigateur est aussi devenu gratuit
- Procès contre Microsoft
- AOL achète Netscape
- Fin du procès 2003 (sauf en Europe)
- AOL reçoit de l'argent de Microsoft (750 M., )
17(No Transcript)
18Statistiques des browsers
- Statistique 11820 serveurs dans 89 pays (UIUC),
Mars 2003 - Windows 90, Linux 4, Mac 3
- MS IE 84, Netscape 11, autres 5
- Microsoft a gagné
- Problème de domination/monopole
- Modification des standards (incompatibilités)
- Pages non-adaptées pour tous les browsers
19Mozilla Firefox/Thunderbird
- NCSA Mosaic, NetscapeMozilla
- Browser/Client mail gratuit
- Open Source
- Communauté très large
- Beaucoup de fonctionnalités
- Filtre de spam
- Plusieurs fenêtres dans un browser (tabs)
- Fonctionnalité contre l'ouverture des fenêtre
(Pop up) - Maintenant stable et rapide
- Depuis 2004 Firefox, Thunderbird pour mail et
web - Aussi Opera est une alternative
20Moteurs de recherche
- Pression financière des investisseurs
- Infrastructure est extrêmement chère
- Indexation des pages est chère
- Enormément de données
- Enormément de requêtes à traiter
- Volume de données transférées coûte cher
- "Dot com bubble burst" a tué le marche de la
publicité - Nouveaux modèles
- Vendre les meilleures places
- Pay-per click
- Services pour entreprises (NorthernLight)
- Service additionnels
21Pages indexés (Dec 2002), utilisation (Jan 2003)
Google 3,033 mio AlltheWeb 2,106
mio AltaVista 1,689 mio WiseNut 1,453
mio Hotbot 1,147 mio MSN Search 1,018
mio Teoma 1,015 mio NLResearch 733
mio Gigablast 275 mio
GGGoogle, YHYahoo, MSNMSN, AOLAOL, AJAsk
Jeeves,OVROverture (GoTo), ISInfoSpace,
NSNetscape, AVAltaVista,LYLycos,
ELINKEarthLink.com, LSLookSmart,Â
Source http//www.searchengineshowdown.com/
stats/sizeest.shtml
22Overture (anciennement goto.com)
- Pay-per-click, premier à faire ça
- Avantages, profitable
- Génération des liens (du trafic) très ciblée
- Les moteurs de recherche sont les cibles
commerciales - Coopérations avec
- Altavista
- Alltheweb
- Yahoo
- Excite, Lycos, hotbot, AOL, MSN,
23Liaison entres moteurs de recherches
Résultats text
Résultats payant
24Comment influencer les moteurs de recherche?
- Entreprises qui font des placements dans les
moteurs de recherche - Soumettre les pages à chaque moteur pour être
indexé rapidement - Ajouter des mots clés invisibles dans le html
(par exemple de mots clés souvent recherchés) - Pas très sérieux
- Illégal dans un grand nombre de pays
- Payer pour être placé ou indexé plus rapidement
- Créer un réseau de sites qui sauto-référencent
25Une moteur de recherche de Microsoft
- Annoncé en Mars 2003 (mais aussi déjà en 1997)
- MSN Search a 27 des recherches sur le Web
- Parce que c'est couplé avec Internet Explorer
(quand il ne trouve pas un page, ) - Utilisation de la domination pour gagner le
marché de recherche sur le Web - Intégration dans Explorer
- Intégration de recherche directement dans Windows
- Ou seulement saine concurrence pour Google et
Yahoo?
26P2P - Peer to Peer, pair à pair
- Ordinateurs égaux entre eux (Opposé Ã
client/serveur) - Cluster/P2P/Grid
- Système distribué, interaction directe entre les
pairs, communication rapide est nécessaire - Partage d'un partie du matériel
- Hybrid P2P Instance central pour partie des
services
27Napster
- P2P pour partager de la music en MP3 sur le Web
- Énormément de succès
- Petit, facile à utiliser
- Serveur central de ressources de tous les
participants - 1.6.1999 mis en marche de Napster, écrit en trois
mois - 7.12.1999 procès contre Napster
- 13.6.2000 réduction des titres accessible
- 31.10.2000 acheté par Bertelsmann
- 11.7.2001 fermeture de Napster, malgré un
filtrage à 99 du contenu protégé par droit
d'auteur - 2004 Vendeur de musique légal (payement mensuel)
28Gnutella
- Partage des fichiers entièrement distribué
- Pas de serveur central
- Créé Mars 2001, source ouverte
- Réponse aux problèmes de Napster
- Transfère des fichiers par http
- Recherche de fichiers et d'autres moteurs
Gnutella sur le réseau - Clients pour toute sorte de fichiers
- Téléchargement en parallèle de différentes
parties du même fichier en tranches
29Freenet
- But être contre la censure du Web
- P2P, décentralisé, anonyme
- Toute information est cryptée et distribuée
- Personne sais ce qui est stocké sur son
ordinateur - Développement en source ouverte
- Aout 2004 version stable
- http//freenetproject.org/
30Enjeux
31Spam
- Toute sorte de "spam" sur Internet
- "unsollicited commercial mail" (UCM), junkmail
- Publicité qui arrive sans être demandé
- Viande en boite, utilisé dans sketch de Monty
Python ou des vikings chantent spam, supprimant
toute conversation - Parfois aussi sur de pages Webs qui s'ouvrent
automatiquement ou des banner de publicité - Problème Email est gratuit, donc envoi Ã
beaucoup (millions) de personnes sans coûts - MSN filtre 24 Mrd. Spam mails par jour
- Provient souvent des milieux criminels (extrème
droite) - Commerce avec des adresses mails, mais aussi
composition d'adresses automatiquement
32Spam - quelques chiffres
- Plus que 50 de trafic généré par du spam (depuis
mi-2003) - Hotmail filtre 300.000 mails par seconde! (2003)
- A l'Université de Genève 5 messages sur 6 sont
refusé - Il y a quand même beaucoup de spam qui passe
- Chez moi 20 messages par jour (60 filtrés)
- SIM gt1000 mails par jours avec fausses adresses
33Spam - quelques chiffres (virus unige, 20.8.2003)
34Phishing
- Password fishing
- Virus envoyent les mot de passe des utilisateurs
- 400.000.000pertes aux états unies estimés
- Souvent trèsciblé
35"Get rich quick", Viagra et le connexion Nigéria
- Comment est-ce que le commerce se fait par mail?
Qui répond??? - Vente des produits
- Pornographiques
- Viagra
- Médicaux
- Promesse de de gains importants
(argent)(connexion Nigéria) - Depuis 1988 (par fax)
- Plusieurs pays, partout ou il y a des crises
- Avant de recevoir de l'argent il faut payer un
peu (administratifs) - 2002 10 Mio. Francs rien qu'en Suisse
- Pages Webs faux des banques
- Même chose que petites annonces pour devenir
riche rapidement
36Dialer
- Numéros 090x, 0906x, prix des connections sans
limite supérieur en Suisse (mais prévu) - Très grand problème en Allemagne aussi
- Jusqu'Ã 300 Francs par minute
- Prix doit être sur l'écran et visible dans les
pubs (selon lois) - Souvent dans le milieu pornographique
- Les personnes n'osent pas aller à la police
- Souvent promis des connections rapides avec des
services supplémentaires - Parfois installé après une autre demande
- Cheval de Troie
- En Allemagne plusieurs millions d'Euro de pertes
par année
37Comment se protéger contre le spam, etc.
- Blocage de domaines entiers (SIM kr, cn, ru,)
- Filtre de spam sur les serveurs
- Risque de filtrer des mails importants
- Possibilité d'une zone de quarantaine
- Liste noire des expéditeurs de mails
- Filtre personnelle
- Laisse passer les mails des personnes dans le
carnet - Apprentissage (réseaux Bayesien)
- Eviter de donner son adresse mail dans les sites
publiques - Ou positionner sur son site comme jpg ou
javascript - Mesures de sécurité dans le browser (Java,
ActiveX)
38Futur
39Quelles idées pour la future du Web?
- Plus de trafic
- Plus de spam
- Plus d'information, mais offres payantes
- Mail encore gratuit?
- DSL gt Vidéo sur demande
- Grid gt Calcul sur demande
- UMTS gt Utilisation mobile
40Discussion
- Comment voyez vous le futur du Web?
- Peut on travailler pour aller vers une direction
positive? - Quelles sont les plus grands problèmes?
- Et comment les éviter?
- Quel est la prochaine "killer application"?
- Qui va payer pour tout ça?
- Anonyme ou pas?
- Est-ce qu'on est encore anonyme?
41Conclusion
- La commercialisation a beaucoup changé le Web
- Beaucoup de problèmes car tout le monde veut
gagner avec le Web - Légal et illégal
- Bataille sur les meilleures positionnements
- Est-ce que les moteurs de recherches vont rester
fiable? - Spam et virus sont des énormes problèmes
- Coûts sont payé par tout le monde
- Aussi l'utilisation illégale des cartes de crédits
42Liens
- http//www.w3.org/CGI/
- http//www.cen.uiuc.edu/bstats/latest.html
- http//www.php.net/
- http//java.sun.com/
- http//www.mysql.com/
- http//www.w3.org/TR/SVG/
- http//www.asp.net/
- http//java.sun.com/products/jsp/
- http//www.macromedia.com/software/dreamweaver/
- http//www.zope.org/
- http//www.zdnet.com/anchordesk/story/story_827.ht
ml - http//www.mozilla.org/
- http//www.searchengineshowdown.com/stats/sizeest.
shtml - http//freenet.sourceforge.net/
- http//www.nigeria-connection.de/
43Abbreviations
- ADSL - Asynchronous Digital Subscriber Line
- AOL - America OnLine
- ASP - Active Server Pages
- CGI - Common Gateway Interface
- DIM - Division d'Informatique Médicale
- DSL - Digital Subscriber Line
- ICQ - I seek you (Chat)
- IE - Internet Explorer
- IIS - Internet Information Server
- IRC - Internet Relay Chat
- JDBC - Java DataBase Connectivity
- JSP - Java Server Pages
44Abbreviations (2)
- MP3 - MPEG Layer 3
- MSN - MicroSoft Network
- P2P - Peer to Peer
- PHP - PHP Hypertext Processor
- PWS - Personal Web Server
- SQL - Structured Query Language
- SVG - Support Vector Graphics
- UCM - Unsolicited Commercial Mail
- UIUC - University of Illinios in Urbana Champaign
- UMTS - Universal Mobile Telecommunication system