Lo World Wide Web, literaument "la telaranha mondiau", o simplament Web, o tanben la Tela o lo WWW, qu'ei un sistèma ipertèxte public qui fonciona sus l'Internet e qui pemet de consultar, dab un navegador web, paginas hicadas en linha dens sites. L'imatge de la tela que vien deus iperligams qui ligan las paginas web enter eras.

Representacion grafica deu World Wide Web a l'entorn de Wikipèdia

Lo Web n'ei pas qu'ua de las aplicacions de l'Internet. D'autas aplicacions de l'Internet qu'existeishen, com lo corrièr electronic, la messatgeria instantanèa, Usenet, etc. Lo Web qu'estó inventat annadas arron de l'Internet, mes qu'ei eth qui aperè l'atencion deus mèdias e deu gran public sus l'Internet. Despuish ençà, lo Web e l'Internet que's sòlen con·hóner dens lo lengatge corrent.

Istòria

modificar
 
Ordinator NeXTcube utilizat per Berners-Lee com prumèr servidor web.

En 1980, lo CERN qu'avè besonh d'un sistèma entà escambiar informacion enter cercaires peu mèdi d'ipertèxte. Tim Berners-Lee que hasó un prototipe mentavut ENQUIRE. Quan lo CERN e devienó lo màger nod de l'Internet de la tempsada (en aqueth moment sonque TCP, DNS...), Berners qu'ensagè de i connectar lo sistèmi qui avè creat. Lo 12 de noveme 1990 que publiquè l'invencion dab Robert Cailliau.

Lo prumèr servidor Web qu'estó un ordinator deu tipe NeXTcube. Per Nadau de 1990 que's creè las prumèras paginas Web, qui explicavan lo projècte en si, lo prumèr servidor d'HTTP (tanben creat entad eth) e lo prumèr navegador, mentavut WorldWideWeb (totun com lo protocòl, e mei tard arrenomiat Nexus entà evitar confusions).

Foncionament

modificar

Normaument, la visualizacion d'ua pagina web que comença quan l'utilizator introduseish ua URL dens la barra de navegacion deu navegador web o quan segueish un iperligam, o ligam informatic, de cap tad aquera pagina o ressorsa.

Alavetz, l'URL introdusida que's traduseish en ua adreça IP peu mèdi de DNS, ua basa de dadas distribuida globaument qui contien las equivaléncias domeni-adreça ip. Aquera adreça IP qu'ei necessària entà saber a quin servidor e s'a a adreçar la consultacion. Puish lo navegador web qu'envia la consultacion au servidor HTTP qui a hèit la demanda.

La pagina web que restitueish en generau un archiu au format HTML. Aqueste archiu qu'ei immediatament interpretat peu navegador. Quan aqueste e sap dejà de quinas ressorsas aurà besonh entà amuishar la pagina, que torna har ua consultacion HTTP en demandant los imatges e las autas ressorsas qui hèn partida de la pagina (archius css, javascript, applets java..).

Arquitectura

modificar

Modèl matematic

modificar

Lo Worl Wide Web, com ensemble de ressorsas ipertèxte, que's pòt modelizar en est modélisable en graf orientat dab las ressorsas entà vertèx e los iperligams entà arcs. Com lo graf ei orientat, dauvuas ressorsas que pòden constituir potz (o honsets, mensh formaument): n'existeish pas nat camin de cap tà la rèsta deu web.

Exploracion deu Web e Web pregon

modificar

L’exploracion recursiva deu Web a partir de ressorsas plan causidas qu'ei lo metòde de basa programat dens los robòts d’indexacion deus motors de recèrca. En 2004, los motors de recèrca qu'indexavan uns 4 miliards de ressorsas. Lo Web pregon, o Web invisible, qu'ei la partida deu Web qui n’ei pas indexada e ei donc impossibla a trobar dab los motors de recèrca generalistas. Estudis que i a qu'indican que la partida invisibla deu Web e representa mei deu 99 % deu Web[1]. Lo Web pregon que compren las ressorsas seguentas:

  • las ressorsas inaccessiblas au public, donc aus robòts, entermiei las quaus e son las paginas administrativas o pagaderas, protegidas per un mot de passa;
  • las ressorsas qui ne son pas comunicadas per protocòls de communicacion pres en carga peus robòts (sovent ne prenen pas en carga que HTTP e HTTPS) ;
  • las ressorsas dont lo format de dadas n'ei pas pres en carga peu robòt;
  • las ressorsas listadas dens un fichèr d’exclusion deus robòts;
  • las ressorsas excludidass peu robot per'mor d'estar concebudas entà abusar deu referenciament (spamdexing);
  • las ressorsas excludidas peu robòt per'mor de non pas estar consideradas pro pertinentas (per exemple s'un site e contien milions de ressorsas qui ne son pas ligadas per nat aute site);
  • les ressorsas de cap tà las quaus los iperligams e son creats dinamicament en responsa a las interrogacions deus visitaires. Las ressorsas aquestas que sòlen proviéner de basas de dadas e que constitueishen la partida mei importanta deu Web pregon.

Servidors publics

modificar

L’exploracion recursiva n'ei pas lo sol mejan utilizat entà indexar lo Web e pagerar la soa talha. Que i a ua auta solucion, qui consisteish a pagerar l'infraestructura informatica connectada a l'Internet entà aubergar sites Web. Au lòc de seguir iperligams, aqueth metòde que consisteish a utilizar los noms de domeni enregistrats dens lo Domain Name System e ensajar de's connectar a tots los servidors Web potenciaus. Aqueth metòde que l'utiliza la societat Netcraft, qui publica regularament los resultats de las soas exploracions, dont las pagèras de popularitat deus servidors HTTP. D'aquera faiçon, totun, que s'i pagèra mei l'utilizacion de las tecnologias deu Web que lo Web medish, mes que's pòden trobar atau sites Web publics qui ne son pas ligats au World Wide Web.

Intranets e Webs privats

modificar

Un Web disponible sus un intranet qu'ei privat. Que pòt estar completament separat deu Web, o estar ua hont deu Web. Qu'ei ua hont quan l'intranet ei religat a l'Internet e qui un iperligam deu Web e punta sus ua ressorsa deu Web. Los ligams deu Web enlà que son per venciva impossibles puishque per definicion un intranet n'auhereish pas nat accès public.

Ua hont que's pòt trobar sus l'Internet. En aqueth cas, que constitueish un Web virtuaument privat, per'mor que lo public ne'u pòt pas descobrir en seguint iperligams.

  1. (en)The Deep Web: Surfacing Hidden Value, Michael K. Bergman, The Journal of Electronic Publishing, August, 2001, Volume 7, Issue 1