Découvrir

Idée reçue : Web et Internet, c’est la même chose !

On confond souvent Internet et le Web (ou « toile » en français). On trouve des choses sur Internet, on surfe sur le Web. Mais où est la différence ?

En bref, le Web est un ensemble d'informations, tandis qu'Internet est le réseau informatique qui permet de les transporter. Internet existait avant le Web, et proposait bien d'autres services, qui fonctionnent toujours aujourd'hui (mailnewsftp...).

Graphe du Web.  Image : Raphaël Bolze.

Pour bien comprendre la différence, commençons par détailler ce qui se passe quand on visualise une page Web. Nous verrons ensuite que les concepts de toile et de réseau sont assez proches, d'où une confusion possible entre le Web et Internet.

De mon ordinateur aux serveurs Web

Concrètement, le Web est constitué par les données stockées sur les serveurs Web, alors qu’Internet est ce qui permet à mon ordinateur de contacter ces serveurs Web. Un serveur est un ordinateur relié à Internet qui peut « servir » des données : on le contacte et il répond en envoyant des données qu’il a stockées.

Internet est ce qui achemine les données d’un ordinateur vers un autre. Pour cela, les ordinateurs sont identifiés par des adresses IP (« Internet Protocol ») qui sont similaires à des numéros de téléphone (une suite de quatre nombres entre 0 et 255). Quand on connaît l’adresse IP d’un ordinateur, on peut lui envoyer des données. De plus, comme on ajoute toujours sa propre adresse IP aux données qu’on envoie, l'ordinateur destinataire peut nous répondre.

Que se passe-t-il lorsque mon navigateur affiche une page Web ? Tout d’abord, je tape une URL (« Uniform Ressource Locator ») comme http://interstices.info/internet qui indique trois choses :

  • le protocole de communication (placé avant ://) à utiliser pour demander la page : ici c'est http (« hypertext transfer protocol »)
  • puis le nom du serveur Web qui contient la page Web qui m’intéresse : interstices.info,
  • et enfin la page Web qui m’intéresse sur ce serveur : /internet.

Lorsque je clique sur un lien, c'est exactement la même chose, une URL est associée au lien (elle apparaît en bas de la fenêtre de certains navigateurs quand on passe la souris dessus). Quand je clique, tout se passe comme si j’avais tapé cette URL dans la barre d’entrée d’URL en haut du navigateur. Elle apparaît d’ailleurs ensuite à cet endroit.

Que fait alors le navigateur ? Tout d’abord, il a besoin de l’adresse IP du serveur Web pour pouvoir le contacter. Il va pour cela contacter le serveur de nom (« nameserver » en anglais) de mon fournisseur d’accès à Internet. (L’adresse IP de celui-ci apparaît dans les paramètres de configuration réseau. On a généralement deux serveurs de nom, au cas où l’un d'eux tomberait en panne.) Celui-ci contacte alors un des serveurs de nom du domaine .info, puis l’un de ceux du domaine interstices.info et renvoie à mon navigateur l’adresse IP de l’ordinateur de nom interstices.info, soit 194.199.19.15.

Mon navigateur peut alors établir une connexion TCP (« Transfer Control Protocol ») avec 194.199.19.15 et envoyer la requête (conformément au protocole HTTP) :
GET /internet HTTP/1.1
Host: interstices.info

La suite de caractères ci-dessus circule dans des paquets de données indépendants avec l’adresse IP 194.199.19.15 comme destination et mon adresse IP comme source. On voit que les deux informations (le serveur Web auquel on croit s’adresser et la page Web demandée) sont reformulées selon la syntaxe définie par le protocole HTTP.

Le serveur Web possède bien un fichier texte (au format HTML, « Hypertext Markup Language ») correspondant au chemin /internet et envoie alors le contenu à mon navigateur par une suite de paquets de données qui ont pour destination mon adresse IP et pour source 194.199.19.15. Le protocole TCP régule le rythme d’envoi des paquets et s’occupe de rassembler les paquets reçus pour obtenir une copie du fichier texte envoyé. Le navigateur peut alors le mettre en forme et affiche enfin la page correspondante.

J’ai donc trouvé de l’information sur le Web, et Internet a véhiculé cette information jusqu’à moi. On peut dire que je l’ai trouvée sur Internet si on inclut dans Internet l’ensemble des ordinateurs qu’il relie. En général, on devrait plutôt dire qu’on surfe sur Internet et qu’on trouve sur le Web.

Toile versus réseau

Pour relier entre eux des ordinateurs, on utilise un réseau de liens de communication. Pour aiguiller un message d’un lien vers un autre, des ordinateurs spéciaux appelés routeurs sont placés sur les nœuds du réseau. Si on imagine que les liens sont des routes, les routeurs sont des carrefours qui relient plusieurs liens entre eux. Ce que reçoit un routeur sur un de ses liens est généralement retransmis sur un autre lien vers un autre routeur, voire vers la destination finale. Mon fournisseur d’accès, par exemple, possède un réseau qui s’étend sur tout le pays avec des routeurs placés dans les centraux téléphoniques. Ainsi, l’autre bout de mon fil téléphonique est relié à un routeur de ce réseau. De plus, ce réseau est relié aux autres réseaux d’Internet. De ce fait, Internet est un réseau de réseaux, il est constitué de centaines de milliers de réseaux.

Les serveurs Web sont éparpillés dans divers réseaux d’Internet et ne sont pas directement reliés entre eux. Cependant, une page Web peut contenir un lien hypertexte, c’est-à-dire une URL insérée dans le texte de la page, de sorte qu’en cliquant sur la zone de texte associée, j’indique à mon navigateur de charger la page Web pointée par l’URL en question. Par exemple, sur la page http://interstices.info/internet, on trouve un lien vers la page Web http://www.ietf.org/rfc/rfc791.txt qui est le texte du standard définissant IP. Il y a donc un lien logique de la première page vers la deuxième. Les liens hypertextes forment donc une sorte de toile tissée entre les pages Web.

La notion de toile est très proche de celle de réseau. En mathématiques, on parle de graphe dans les deux cas. Un graphe est constitué de nœuds (ou de sommets) reliés par des liens (ou des arêtes). On peut ainsi parler du graphe du Web ou du graphe d’Internet. Dans le cas d’Internet, les liens correspondent à des liens de communication physique (votre fil téléphonique, ou une fibre optique par exemple) le long desquels circule l’information. Dans le cas du Web, les liens sont logiques, ils ne correspondent à rien de physique. Ils nous servent juste à passer d’une page à l’autre quand nous cliquons dessus pendant notre lecture de ce grand livre qu’est le Web, avec tous ses renvois d’une page à l’autre que sont ces liens hypertexte.

Niveau de lecture

Aidez-nous à évaluer le niveau de lecture de ce document.

Il vous semble :

Si vous souhaitez expliquer votre choix, vous pouvez ajouter un commentaire (qui ne sera pas publié).