© Les Éditions Cybérie inc. |
14 juillet 1999 |
Salutations à tous les Cybériens et Cybériennes!
Cette Chronique n'est optimisée ni pour Netscape, ni pour Internet Explorer, elle l'est pour ses lecteurs et lectrices.
Cette semaine...
- Moteurs de recherche : la pointe de liceberg
- Les câblos devront partager leur infrastructure
- Apple, fournisseur daccès?
- Les «hacktivistes», la presse et la loi
- Rapports et évidences
- En bref..
- Beau détour
Moteurs de recherche : la pointe de liceberg
Le Web : 800 millions de pages, 180 millions dimages, 15 téraoctets (dix à la puissance douze) de données, et au mieux un moteur de recherche nen indexe que la pointe de liceberg, soit 16 %. Cest le portrait que dressent Steve Lawrence et C. Lee Giles du NEC Research Institute dans une étude publiée dans le numéro courant du magazine scientifique Nature (abonnement requis) et bientôt disponible sur le Web.Les robots indexeurs des moteurs de recherche ne suffisent plus à la tâche selon les auteurs de létude qui dressent un bilan quasi tragique de la situation. Les moteurs nindexent pas de manière égale les contenus, peuvent prendre des mois à répertorier les nouvelles pages, et répertorient collectivement (après recoupements) 42 % de ce qui est disponible sur le Web. Le plus complet, daprès les résultats des chercheurs, est Northern Light et ne couvre que 16 % du contenu disponible sur le Web. Il est suivi de Snap (15.5 %), AltaVista (15.5 %), HotBot (11.3 %), Microsoft (8.5 %), Infoseek (8.0 %), Google (7.8 %), Yahoo! (7.4 %), Excite (5.6 %), Lycos (2.5 %), et EuroSeek (2.2 %).
Si le jugement est sévère, il comporte néanmoins des conséquences lourdes pour les utilisateurs tout comme pour les diffuseurs de contenus. On estime à 85 % la proportion des utilisateurs du réseau qui ont recours, à divers degrés, aux moteurs de recherche pour trouver de linformation. Les moteurs de recherche, y compris ceux qui se dissimulent sous des allures de portails, se classent régulièrement au palmarès des sites les plus consultés. La réussite des sites marchands est souvent tributaire de leur présence dans lindex des moteurs.
Parce que les robots indexeurs cheminent de lien en lien pour trouver les nouvelles pages, ils sont donc plus susceptibles de trouver des pages vers lesquelles pointent des liens. Le référencement est donc faussé au profit des pages «populaires», surtout pour des moteurs comme Google et DirectHit qui basent leur indexation sur cette «popularité» des pages. Selon les auteurs, Infoseek serait le plus susceptible dindexer des pages jouissant dune moindre visibilité.
La «fraîcheur» du contenu indexé fait aussi problème. Lâge moyen des pages est de 186 jours, il varie de 141 jours chez Northern Light à 240 jours chez Snap. Que dire des liens invalides pointant vers des pages périmées ou déplacées? La moyenne pour les moteurs testés dans létude est de 5,3 %, elle atteint 14 % chez Lycos mais nest que de 2,2 % chez HotBot.
Les chercheurs ont aussi constaté une faible utilisation des balises meta par les auteurs de pages. Ces balises, ou marqueurs, servent à insérer dans les codes de mise en page les titres, description et mots clés relatifs à une page et facilitent lindexation par les robots indexeurs. Seulement 34,2 % des sites analysés disposaient de ces métainformations. Et là encore, on a recensé pas moins de 123 balises différentes, ce qui suggère un manque de normalisation dans leur utilisation.
Dans lensemble, ces résultats minables des moteurs de recherche seraient attribuables au modèle économique des moteurs. Il ne serait pas rentable daméliorer la couverture ou le rafraîchissement ponctuel des bases de données qui exigent une infrastructure lourde et coûteuse.
Les auteurs nabordent pas la question de la pertinence des résultats de recherche, celle-ci étant largement conditionnée par linterrogation qui est faite par les utilisateurs, doù limportance pour eux de maîtriser les fonctions de recherche propres à chaque moteur. Pour élargir la «couverture» dune recherche, ils soulignent cependant lavantage, dans bien des cas, dutiliser un métamoteur comme MetaCrawler qui lance simultanément une recherche sur plusieurs moteurs, récupère les résultats, élimine les doublons et classe les données recueillies par ordre de pertinence.
Côté contenu, les chercheurs estiment à 83 % la proportion de contenu commercial sur le Web (ce qui inclut les sites des organismes de presse nous a précisé M. Lawrence, qui songe à créer une catégorie spécifique pour les prochaines études). Suivent les contenus éducatifs et scientifiques, ceux relatifs à la santé, les pages personnelles, les sites dorganismes et sociétés. Les contenus pour adultes ne représenteraient que 1,5 % de lespace Web.
Parallèlement à la publication de ce rapport du NEC Research Institute, le service CNet publiait un banc dessai des moteurs et HotBot en sortait grand gagnant en raison de la pertinence des résultats, suivi dAltaVista, Excite, Infoseek et Lycos. CNet mettait aussi en évidence lutilité des métamoteurs pour effectuer des recherches étendues.
Dautre part, et dintérêt pour les utilisateurs qui souhaitent optimiser leurs recherches Web, on nous annonçait récemment la mise à jour du Guide d'initiation à la recherche dans Internet (GIRI) de lUniversité Laval, ainsi que le projet de mise à jour du Guide des indispensables de la recherche dans Internet (GIRI - 2) qui devrait se concrétiser en septembre.
Les câblos devront partager leur infrastructure
Le Conseil de la radiodiffusion et des télécommunications canadiennes (CRTC), dans une décision publiée le 6 juillet, ordonne aux câblodistributeurs douvrir laccès à leur infrastructure aux fournisseurs daccès Internet concurrents. Les câblodistributeurs devront donc fournir au Conseil dans les soixante jours, pour approbation, une grille tarifaire visant la vente de leurs services à haut débit aux autres fournisseurs daccès. Ces derniers pourront ensuite revendre laccès à haut débit à leur clientèle. Reste à voir si la marge entre le gros et le détail leur permettra de tirer un certain profit de lopération.Ce nouveau mécanisme avantagera à coup sûr les fournisseurs daccès traditionnels et leurs clientèles. Il ne suffira aux abonnés que de signifier à leur fournisseur actuel leur intention de passer à laccès haut débit, moyennant bien sûr les considérations techniques de cet accès (branchement préalable, modem câble). Les abonnés nauront donc pas à changer dadresse de courrier électronique, ou dadresse dhébergement de pages, ce qui constituait un irritant pour bon nombre de clients potentiels de laccès câble qui hésitaient à faire le pas.
La décision du CRTC cadre avec les orientations américaines en matière douverture des infrastructures, telles que réclamée par la OpenNet Coalition qui milite contre les monopoles des câblos. Le mois dernier, un tribunal de lOregon ordonnait à la société AT&T douvrir aux fournisseurs indépendants daccès Internet linfrastructure de câblodistribution de sa filiale Tele-Communications Inc. Des décisions semblables sont attendues en Californie, en Floride et dans lÉtat du Washington.
Grogne chez les câblodistributeurs tant canadiens quaméricains qui, après avoir investi des centaines de millions de dollars dans le déploiement de leur infrastructure, voudraient bien se réserver le monopole de laccès à haut débit qui gagne en popularité. On apprenait la semaine dernière dans Bénéfice.Net que le câblodistributeur canadien Vidéotron avait quintuplé en un an le nombre de ses abonnés Internet.
Apple, fournisseur d'accès?
La société Apple doit incessamment dévoiler les résultats de son troisième trimestre et les perspectives sont excellentes. Grâce à lénorme succès remporté par ses produits, dont le iMac, le cours du titre a connu une belle hausse dernièrement. En outre, Apple a engrangé trois milliards de dollars en disponibilités à court terme, et sapprête à annoncer de nouveaux produits à la grande foire MacWorld qui se tiendra à New York du 20 au 23 juillet.Un cousin portable pour le iMac? Le service SiliconValley.Com na aucun doute, citant des sources proches de lentreprise de Cupertino. Seule ombre à lhorizon, les délais très courts pour approvisionner le marché avant la rentrée scolaire. LiMac portable se vendrait à un prix permettant de concurrencer les produits de ce créneau déjà disponibles sur le marché et viendrait compléter la gamme Apple. De quoi aura lair le iMac portable? Rien de confirmé du côté de Apple, mais les inconditionnels du Mac ne se privent pas de suggestions pour lenrobage design des nouveaux produits du verger.
Autre question, et non des moindres, Apple se lancera-t-il dans laccès Internet? Cest la possibilité que soulevait MacWeek récemment, reprenant les propos du quotidien londonien The Register. Apple serait en négociation avec une société spécialisée dans le développement dinfrastructure daccès et envisagerait aussi de lancer un portail. Cette décision reposerait sur des données de marketing solides, dont le fait que 80 % des acheteurs diMac citent laccès Internet comme une des principales raisons dachat. Dailleurs, le fabricant dordinateurs Dell sest déjà lancé dans le marché de laccès en Allemagne et au Royaume-Uni, et vient douvrir son service daccès Internet gratuit et portail DellNet France en collaboration avec Cegetel et Excite.
Raison de plus de surveiller les annonces attendues au MacWorld plus tard ce mois-ci.
Les «hacktivistes», la presse et la loi
En fin de semaine dernière se tenait à Las Vegas le septième congrès annuel DEF CON, les grandes assises des hackers, crackers, phreakers et autres «hacktivistes» du réseau. Événement attendu : le «dévoilement» par le groupe Cult of the Dead Cow de la nouvelle version de Back Orifice, un cheval de Troie présenté comme un outil de gestion de réseau à distance.On ne compte plus les détournements de sites, intrusions illégales, infections de virus, vers et chevaux de Troie en tous genres. Cest devenu presque banal pour la presse den parler, ça remplit les colonnes des faits divers de lactualité techno. Et cest un des volets des compte rendus de DEF CON qui a attiré notre attention.
La visibilité offerte par la presse aux faits darmes des hackers serait-elle, en fait, une des causes de laugmentation du nombre dincidents rapportés? Daprès Michael Martinez de la chaîne de télévision ABC, et dont les propos sont rapportés par Wired, les hacktivistes ne parviennent pas à faire passer leur message car ils communiquent mal leurs véritables intentions à la presse. Martinez était un des conférenciers invités au DEF CON et a déclaré «Nous [les journalistes] connaissons le comment, le où et le quand, mais pas le pourquoi. Vous [les hacktivistes] vous plaignez que nous ne comprenons pas, et nous disons que vous ne nous permettez pas de comprendre.»
Le débat sur les rapports presse/hacktivistes avait été lancé sur ZDNet quelques jours auparavant et bon nombre de porte-parole de lunderground techno accusaient la presse de confondre le véritable hacking et le simple vandalisme de sites Web. Entre autres, Jon Katz estime que la visibilité accordée par la presse à la modification de certaines pages Web ne fait quassurer que les cas se multiplieront, bien quils ne représentent essentiellement que des incidents bénins sans conséquences profondes pour le réseau.
«Depuis la fin de la Guerre froide, les autorités et la presse sont en manque de méchants» selon Katz, ce qui explique la vision orwellienne projetée par la presse.
Précédant le DEF CON à Las Vegas se tenait le Black Hat Briefings 1999, événement aussi lié à la sécurité informatique. Lié à ce point que ladmission aux Black Hat Briefings donnait droit daccès au DEF CON. Une des conférencières invitées était léminente criminaliste newyorkaise Jennifer Stisa Granick, bien connue pour sa défense de personnes accusées de crimes informatiques. Citée dans Wired, Madame Granick a affirmé que les hacktivistes et agents de diffusion viraux étaient peut-être difficiles à attraper, mais faciles à inculper car la plupart avouent les faits qui leur sont reprochés lorsquils sont arrêtés.
Cest que lapplication des lois à lespace cyber et informatique est encore en train de se modeler et que les accusés connaissent mal leurs droits et les éléments de preuve nécessaires à leur incrimination. «Cest un nouveau champ dapplication du droit, et comme tous les nouveaux champs dapplication il est propice aux abus» a déclaré Madame Granick, ajoutant que la jurisprudence qui se forme présentement au fil des causes entendues et défendues est capitale car elle demeurera longtemps dans le paysage juridique du réseau.
Rapports et évidences
Abondance de rapports, cette semaine, bien quon ait parfois limpression que lon insiste sur des évidences.Commençons par le document de Human Rights Watch sur la censure des contenus Internet et la surveillance des utilisateurs du réseau dans certains pays du Moyen-Orient et dAfrique du nord. Peu de surprise, ici, quand on apprend que les autorités dArabie Saoudite, du Yémen et des Émirats Arabes Unis censurent laccès à Internet par limposition de serveurs mandataires destinés à filtrer les contenus disponibles aux citoyens de ces États. En Jordanie, on utilise les leviers fiscaux pour rendre laccès Internet hors de portée du grand public, bien quil ny ait pas à proprement parler de censure. À Bahrain et en Tunisie, on soupçonne les autorités dintercepter pour fin de surveillance les communications par courrier électronique. On relève aussi des situations étranges en Jordanie et en Égypte où des articles de journaux censurés ont été mis en ligne sur des serveurs Web locaux sans que les responsables naient été importunés. HRW suggère un ensemble de politiques destinées à assurer le respect de la liberté dexpression à cette étape décisive de limplantation dInternet dans ces pays.
Aux États-Unis, tout est question de couleur. Un rapport de la National Telecommunications and Information Administration (NTIA) du ministère du Commerce parle dun «fossé numérique» qui ne cesse de se creuser entre blancs, noirs et hispaniques. On constate en effet un recul de six points depuis 1994 dans la proportion de foyers noirs et hispaniques branchés à Internet par rapport au pourcentage de foyers de race blanche. Ladministration fédérale mise, entre autres, sur les centres daccès communautaires pour réduire lécart entre inforiches et infopauvres.
Puis, le Programme des Nations Unies pour le Développement vient de publier son rapport annuel sur létat du développement humain des nations. Le PNUD consacre un chapitre entier à Internet et aux possibilités que le réseau offre pour le développement des nations. Le journal Libération traite la nouvelle dans plusieurs articles, et souligne que «À la différence de la colonisation ou autres échanges inégaux, l'Internet est en effet ambivalent : d'une part il accentue la mise en concurrence mondiale, d'autre part il pourrait fournir une partie des outils nécessaires pour s'y insérer. À condition d'en avoir les moyens : le rapport propose une taxe sur les mails ou sur les dépôts de brevets pour financer l'accès des pays en développement aux technologies de l'information.»
Et dans ce même rapport du PNUD, le classement par pays de lindice de développement humain où le Canada arrive, pour une sixième année consécutive, au premier rang. Pour Michel Venne, dans Le Devoir, il faut cependant mettre un bémol sur les savants calculs du PNUD, quoiquen diront les autorités fédérales canadiennes. «Le Canada n'est pas le meilleur pays au monde à tous points de vue. Il est au neuvième rang pour la pauvreté humaine. Il est 20e pour le PNB par habitant. Il est 4e pour la participation des femmes. Il est 16e pour le taux net de scolarisation au secondaire. Il y a plus d'illettrés au Canada que dans trois autres pays industrialisés et le taux de chômeurs de longue durée est plus élevé ici que dans huit autres pays riches.»
En bref...
Déjà annoncée en avril dernier, lentrée en bourse de NETgraphe, éditrice des sites Web La Toile du Québec, Économédia, Mégagiciel et Multimédium est maintenant officielle. Cest par lacquisition de Ressources Cristobal inc., société inscrite à la Bourse de Montréal, que NETgraphe fait son entrée sur le parquet et devient ainsi la première entreprise Internet québécoise à devenir une société publique. Il sera intéressant de surveiller lorientation de NETgraphe et de ses sites au cours des prochains mois. On sait déjà que Économédia, netmag spécialisé en information économique et financière, permettra bientôt le courtage en ligne et la gestion des finances personnelles. Aussi à surveiller, la réaction des milieux financiers à cette entrée en bourse. Plus de détails la semaine prochaine.Un fournisseur daccès canadien a eu gain de cause devant un tribunal dans une affaire de courrier non sollicité . Le Globe&Mail rapporte que le fournisseur Nexx Online avait suspendu le service daccès et dhébergement Web dune entreprise qui envoyait pas moins de 200 000 courriers électroniques non sollicités par jour pour promouvoir ses produits. Lentreprise avait porté plainte contre le fournisseur qui, de son côté, devait essuyer les plaintes de son fournisseur de connexion. Le magistrat a estimé quil y avait infraction à la «nétiquette» de la part du spammeur, et que le fournisseur était en droit de mettre fin au contrat daccès et dhébergement. Malheureusement, comme aucune loi canadienne ninterdit comme tel lenvoi de courrier électronique non sollicité, le spammeur sest trouvé un fournisseur plus complaisant et a recommencé son petit manège.
La Bibliothèque nationale du Canada a un nouveau directeur en la personne de lauteur et homme de théâtre Roch Carrier. Les Archives nationales du Canada aussi ont un nouveau chef, soit M. Ian Wilson. Selon la ministre responsable, leur plus grand défi sera d'assurer le passage de ces institutions au troisième millénaire et d'accroître leur accès à la population canadienne. Ce mandat découle des recommandations issues du rapport présenté à la Ministre sur le «Rôle des Archives nationales du Canada et de la Bibliothèque nationale du Canada». On peut lire dans ces recommandations que «La Bibliothèque nationale devrait fermement appuyer une initiative canadienne sur les bibliothèques numériques indépendante et dotée d'une vision plus large des ressources numériques». En outre, on évoque une vocation plus virtuelle de la diffusion des produits des Archives, «Nous recommandons de faire disparaître les centres ou points d'accès décentralisés. Les Archives nationales devraient se concentrer sur les possibilités qu'offre le Web et sur la diffusion plus large et plus efficiente de microfilms afin de se donner une présence nationale accrue.»
Dans Libération, «À la recherche de la Web attitude», néologisme proposé par Bill Gates dans son dernier ouvrage et qui en a laissé bon nombre perplexe. «Aussi ne restait-il plus qu'une solution : demander, en guise de devoir de vacances, à ceux (la liste n'est évidemment pas exhaustive) qui se préoccupent de l'Internet en France et ailleurs, ce microcosme actif et pensant, ce que signifiait pour eux la Web attitude. Certains ont décliné, d'autres ont demandé des précisions sur la pensée gatesienne, très nombreux sont ceux qui ont confessé ne pas avoir lu l'ouvrage. On ne peut pas leur en vouloir.» Collection de réponses sérieuses, esquives élégantes ou pieds de nez caustiques.
Beau détour
Invitation à visiter le site de Vincent B., photographe pour voir ses photos, mais aussi celles de ses invités.Et sur ce, nous vous souhaitons à tous et toutes une excellente semaine.
© Les Éditions Cybérie inc. | Revue de presse | Publicité | |
URL : http://www.cyberie.qc.ca/chronik/990714.html |