Title: Introduction lInternet
1Certificat de formation continue universitaire
en informatique médicale
Henning Müller Division d'Informatique
Médicale Université de Genève Octobre 2005
Internet Commercialisation et enjeux
2Notre position dans le cours
- Quatre parties sur Internet
- Réseau et protocoles
- Histoire et organisation de lInternet
- XML, Web sémantique
- Enjeux de la commercialisation du Web
3Contenu
- Le Web interactif
- Commercialisation du Web
- Guerre des browsers,
- services illégaux Napster,
- Fournisseurs d'accès doivent gagner de largent,
Moteurs de recherche aussi - Enjeux
- Virus, dialer, phishing, piratage des serveurs,
- Spam
- Future du Web
4Le web interactif
5Au niveau du client Javascript, Applet Java,
ActiveX
- Javascript
- Langage en format similaire que Java qui est
intégré dans le code html - Interprété par le browser
- Appel des fonctions internes du browser
- Applets Java
- Programme qui tourne sur le client
- Marche sur toute sortes de plate formes
- Lent, car interprété, mais il y a des
compilateurs - Énormément de ressources accessible pour le
développement - ActiveX (Microsoft, seulement Internet Explorer)
- Problèmes de sécurité (trous, etc.)
6PHP - PHP Hypertext Processor
- http//www.php.net/
- Syntaxe similaire à perl, relativement simple
- Scripts peuvent être insérés dans le html
- Séparation possible
- Code non visible par le client, client reçoit
html - Module dans le serveur (Apache) exécute le php
- Extension .php
lthtmlgt ltheadgtlttitlegtPHP Testlt/titlegtlt/headgt
ltbodygt lt?php if (strstr(_SERVER"HTTP_USER_A
GENT", "MSIE")) echo "You are
using Internet Explorerltbr /gt" ?gt
lt/bodygt lt/htmlgt
7PHP (2)
- Facilité à accéder à des bases de données
- Interface avec mySQL et d'autres
- Requêtes SQL
- Parsing des résultats
- Génération de pages complètes, avec des textes et
graphiques,à partir de bases de données - Génération des pages multilingues
- Beaucoup de documentation, souvent utilisé
- Composants accessible en Open Source
8CGI - Common Gateway Interface
- Programmation souvent en perl mais n'importe quel
langage de programmation possible - Module pour serveur Web apache
- Extension .cgi
- Exécution du programme dans un espace réservé,
mais execution sur le serveur - Directory /cgi-bin/
- Problèmes de sécurité (Attention!!)
- "Buffer overflow" avec des paramètres
- Implémentation de la sécurité incombe au
développeur
9CGI (2)
- Accès aux bases de données
- Transfert de paramètres
- http//mon.url.net/cgi-bin/mon-script.pl?paramval
eur - http//www.google.ch/search?qcgiieUTF-8oeUTF8
hldebtnGGoogleSuchemeta - Milliers de scripts accessible par le Web
- Compteurs
- http//cgi.resourceindex.com/
- Possibilité d'intégrer des boutons sur des pages
Webs et dy lier des actions
ltimg src"http//yourserver.com/path/to/cgi-bin/hi
tmat.cgi?PAGECODEGROUPCODECOMMAND"gt
10Flash/SVG
- Flash
- Produit de Macromédia
- Basé sur des vecteurs, pour des animations, plus
rapide que Java - Pages actives (par exemple sous la souris
l'image change) - Plugin propriétaire pour des browsers
- SVG - Scalable Vector Graphics
- Images vectorielle, initiative du W3C
- Description en XML
- Taille d'image changeable, plus compact que gif
ou jpg - Texte en SVG est accessible
- Animations sont possible, similaire à Flash
- SMIL
11ASP/JSP
- ASP (Active Server Pages)
- Solution Microsoft, intégré dans Internet
Information Server (IIS) or Personal Web Server
(PWS) - Moteur ASP génère html à partir de scripts
- VBScript (Visual Basic) défaut, mais d'autres
langages sont possible - JSP (Java Server Pages)
- Génération de html à l'aide de Java
- Solution Sun pour des pages Webs interactives
- Accès aux bases de données (API JDBC)
- Apache Tomcat est un serveur pour JSP
12Gestionnaires de sites
- Zope
- Open Source
- Écrit en python
- Base de données objets
- Templates de pages
- DreamWeaver
- Produit commercial de Macromédia
- Utilisé pour le site du SIM
- Gestion avec CSS templates, flash
- Éditeur de html
13Commercialisation
"The subordering of cultural and non-material
values unter commercial interests, often
connected with a trivialization of content"
14Commercialisation
- Du réseau militaire au réseau scientifique puis
au réseau commercial - Développement du e-shopping
- Un marché global (ebay, )
- Développement des offres payantes
- Guerres de pouvoir dans le Web
- Également des influences politiques, industriels,
- Abus du Web (criminel, pour jouer)
- Publicité dans le Web (spam est illégal dans
beaucoup de pays) - Beaucoup d'entreprises pour la gestion des pages
15Amazon.com
- Paradoxe seulement un trimestre avec un gain
(4/2002) entre (1994-2004) - Capitalisation 19 Mrd US (9/2003), 17 Mrd
(9/2004) - General Motors 21,67 Mrd
- Vente de rêves? Ou est-ce que les expériences et
clients comptent? - Vente 2002 4 Mrd
- Vente 2003 5,2 Mrd
16La guerre des browsers
- Netscape vs. Microsoft
- Microsoft a dormi au début du Web
- Après investissements énormes
- Intégration d'Internet Explorer dans Windows
- Netscape Navigateur est aussi devenu gratuit
- Procès contre Microsoft
- AOL achète Netscape
- Fin du procès 2003 (sauf en Europe)
- AOL reçoit de l'argent de Microsoft (750 M., )
17(No Transcript)
18Statistiques des browsers
- Statistique 11820 serveurs dans 89 pays (UIUC),
Mars 2003 - Windows 88, Linux 4, Mac 3
- MS IE 68, Netscape 28, autres 4
- Microsoft avait déjà gagné
- Problème de domination/monopole
- Modification des standards (incompatibilités)
- Pages non-adaptées pour tous les browsers
19Mozilla Firefox/Thunderbird
- NCSA Mosaic, NetscapeMozilla
- Browser/Client mail gratuit
- Open Source
- Communauté très large
- Beaucoup de fonctionnalités
- Filtre de spam
- Plusieurs fenêtres dans un browser (tabs)
- Fonctionnalité contre l'ouverture des fenêtre
(Pop up) - Maintenant stable et rapide
- Depuis 2004 Firefox, Thunderbird pour mail et
web - Aussi Opera est une alternative
20Moteurs de recherche
- Pression financière des investisseurs (plus
contrôle) - Infrastructure est extrêmement chère
- Indexation des pages est chère
- Énormément de données
- Énormément de requêtes à traiter
- Volume de données transférées coûte cher
- "Dot com bubble burst" arrive à la fin
- Nouveaux modèles
- Vendre les meilleures places
- Pay-per click
- Services pour entreprises (NorthernLight)
- Service additionnels (scholar, earth, desktop
search, )
21Pages indexés (Dec 2002), utilisation (Jul 2005)
Google 8,1 mia MSN Search 5,0 mia Yahoo 4,3
mia
Source http//www.searchengineshowdown.com/
stats/sizeest.shtml
22Overture (anciennement goto.com)
- Pay-per-click, premier à faire ça
- Avantages, profitable
- Génération des liens (du trafic) très ciblée
- Les moteurs de recherche sont les cibles
commerciales - Coopérations avec
- Altavista
- Alltheweb
- Yahoo
- Excite, Lycos, hotbot, AOL, MSN,
23Liaison entres moteurs de recherches (2004)
Résultats text
Résultats payant
24Comment influencer les moteurs de recherche?
- Entreprises qui font des placements dans les
moteurs de recherche - Soumettre les pages à chaque moteur pour être
indexé rapidement - Ajouter des mots clés invisibles dans le html
(par exemple de mots clés souvent recherchés) - Pas très sérieux (browser le reconnaissent)
- Payer pour être placé ou indexé plus rapidement
- Créer un réseau de sites qui sauto-référencent
- Browsers analysent plus que les mots sur les pages
25Une moteur de recherche de Microsoft
- Annoncé en Mars 2003 (mais aussi déjà en 1997)
- MSN Search a 27 des recherches sur le Web
- Parce que c'est couplé avec Internet Explorer
(quand il ne trouve pas un page, ) - Utilisation de la domination pour gagner le
marché de recherche sur le Web - Intégration dans Explorer
- Intégration de recherche directement dans Windows
- Concurrence google toolbar
- Ou seulement saine concurrence pour Google et
Yahoo?
26P2P - Peer to Peer, pair à pair
- Ordinateurs égaux entre eux (Opposé Ã
client/serveur) - Cluster/P2P/Grid
- Système distribué, interaction directe entre les
pairs, communication rapide est nécessaire - Partage d'un partie du matériel
- Hybrid P2P Instance central pour partie des
services
27Napster
- P2P pour partager de la music en MP3 sur le Web
- Énormément de succès
- Petit, facile à utiliser
- Serveur central de ressources de tous les
participants - 1.6.1999 mis en marche de Napster, écrit en trois
mois - 7.12.1999 procès contre Napster
- 13.6.2000 réduction des titres accessible
- 31.10.2000 acheté par Bertelsmann
- 11.7.2001 fermeture de Napster, malgré un
filtrage à 99 du contenu protégé par droit
d'auteur - 2004 Vendeur de musique légal (payement mensuel)
28Gnutella
- Partage des fichiers entièrement distribué
- Pas de serveur central
- Créé Mars 2001, source ouverte
- Réponse aux problèmes de Napster
- Transfère des fichiers par http
- Recherche de fichiers et d'autres moteurs
Gnutella sur le réseau - Clients pour toute sorte de fichiers
- Téléchargement en parallèle de différentes
parties du même fichier en tranches
29Enjeux
30Spam
- Toute sorte de "spam" sur Internet
- "unsollicited commercial mail" (UCM), junkmail
- Publicité qui arrive sans être demandé
- Viande en boite, utilisé dans sketch de Monty
Python ou des vikings chantent spam, supprimant
toute conversation - Parfois aussi sur de pages Webs qui s'ouvrent
automatiquement ou des banner de publicité - Problème Email est gratuit, donc envoi Ã
beaucoup (millions) de personnes sans coûts - MSN filtre 24 Mrd. Spam mails par jour (2004)
- Provient souvent des milieux criminels (extrème
droite, ) - Commerce avec des adresses mails, mais aussi
composition d'adresses automatiquement
31Spam - quelques chiffres
- Plus que 50 de trafic généré par du spam (depuis
mi-2003) - Hotmail filtre 300.000 mails par seconde! (2003)
- A l'Université de Genève 5 messages sur 6 sont
refusé - Il y a quand même beaucoup de spam qui passe
- SIM gt1000 mails par jours avec fausses adresses
32Spam - quelques chiffres (virus unige, 20.8.2003)
33Phishing
- Password fishing
- Virus envoient les mot de passe des utilisateurs
- 400.000.000pertes aux états unies estimés
- Souvent trèsciblé
34"Get rich quick", Viagra et le connexion Nigeria
- Comment est-ce que le commerce se fait par mail?
Qui répond??? - Vente des produits
- Pornographiques
- Viagra
- Médicaux
- Promesse de de gains importants
(argent)(connexion Nigeria) - Depuis 1988 (par fax)
- Plusieurs pays, partout ou il y a des crises
- Avant de recevoir de l'argent il faut payer un
peu (administratifs) - 2002 10 Mio. Francs rien qu'en Suisse
- Pages Webs faux des banques
- Même chose que petites annonces pour devenir
riche rapidement
35Dialer
- Numéros 090x, 0906x, prix des connections sans
limite supérieur en Suisse (mais prévu) - Très grand problème en Allemagne aussi
- Jusqu'Ã 300 Francs par minute
- Prix doit être sur l'écran et visible dans les
pubs (selon lois) - Souvent dans le milieu pornographique
- Les personnes n'osent pas aller à la police
- Souvent promis des connections rapides avec des
services supplémentaires - Parfois installé après une autre demande
- Cheval de Troie
- En Allemagne plusieurs millions d'Euro de pertes
par année
36Comment se protéger contre le spam, etc.
- Blocage de domaines entiers (SIM kr, cn, ru,)
- Filtre de spam sur les serveurs
- Risque de filtrer des mails importants
- Possibilité d'une zone de quarantaine
- Liste noire des expéditeurs de mails
- Filtre personnelle
- Laisse passer les mails des personnes dans le
carnet - Apprentissage (réseaux Bayesien)
- Éviter de donner son adresse mail dans les sites
publiques - Ou positionner sur son site comme jpg ou
javascript - Mesures de sécurité dans le browser (Java,
ActiveX)
37Futur
38Quelles idées pour la future du Web?
- Plus de trafic
- Plus de spam
- Plus d'information, mais offres payantes
- Mail encore gratuit?
- Multimédia, téléphone,
- DSL gt Vidéo sur demande
- Grid gt Calcul sur demande
- UMTS gt Utilisation mobile
39Discussion
- Comment voyez vous le futur du Web?
- Peut on travailler pour aller vers une direction
positive? - Quelles sont les plus grands problèmes?
- Et comment les éviter?
- Quel est la prochaine "killer application"?
- Qui va payer pour tout ça?
- Anonyme ou pas? Protection de données.
- Est-ce qu'on est encore anonyme?
40Conclusion
- La commercialisation a beaucoup changé le Web
- Beaucoup de problèmes car tout le monde veut
gagner avec le Web - Légal et illégal
- Bataille sur les meilleures positionnements
- Est-ce que les moteurs de recherches vont rester
fiable? - Spam et virus sont des énormes problèmes
- Coûts sont payé par tout le monde
- Aussi l'utilisation illégale des cartes de crédits
41Liens
- http//www.w3.org/CGI/
- http//www.cen.uiuc.edu/bstats/latest.html
- http//www.php.net/
- http//java.sun.com/
- http//www.mysql.com/
- http//www.w3.org/TR/SVG/
- http//www.asp.net/
- http//java.sun.com/products/jsp/
- http//www.macromedia.com/software/dreamweaver/
- http//www.zope.org/
- http//www.zdnet.com/anchordesk/story/story_827.ht
ml - http//www.mozilla.org/
- http//www.searchengineshowdown.com/stats/sizeest.
shtml - http//freenet.sourceforge.net/
- http//www.nigeria-connection.de/
42Abbreviations
- ADSL - Asynchronous Digital Subscriber Line
- AOL - America OnLine
- ASP - Active Server Pages
- CGI - Common Gateway Interface
- DIM - Division d'Informatique Médicale
- DSL - Digital Subscriber Line
- ICQ - I seek you (Chat)
- IE - Internet Explorer
- IIS - Internet Information Server
- IRC - Internet Relay Chat
- JDBC - Java DataBase Connectivity
- JSP - Java Server Pages
43Abbreviations (2)
- MP3 - MPEG Layer 3
- MSN - MicroSoft Network
- P2P - Peer to Peer
- PHP - PHP Hypertext Processor
- PWS - Personal Web Server
- SQL - Structured Query Language
- SVG - Support Vector Graphics
- UCM - Unsolicited Commercial Mail
- UIUC - University of Illinios in Urbana Champaign
- UMTS - Universal Mobile Telecommunication system