Introduction au Web

À la fin de cette leçon vous saurez tout ce qu'il faut (pour débuter) sur...


Internet et le Web

Internet est devenu populaire avec l'apparition du Web, c'est pourquoi les deux sont parfois confondus

Il est important de faire la distinction entre les deux


Internet

Internet est le réseau informatique mondial public

Ses premiers balbutiements datent des années 1960

Internet est composé de millions de réseaux publics, privés, universitaires, commerciaux et gouvernementaux

Remarque : net veut dire "réseau" en anglais, c'est pourquoi on dit parfois qu'Internet est le "réseau des réseaux"

L'information y circule à l'aide de protocoles de communication standardisés (IP, TCP, UDP, HTTP, FTP, SMTP, POP, IMAP, Telnet, etc.)

Internet permet toutes sortes d'applications dont les plus connues sont le courriel et le Web


Le Web

C'est seulement avec l'apparition du Web vers 1993 que le grand public commence à entendre parler d'Internet

Le Web est un système hypertexte public basé sur Internet

Qu'est-ce que l'hypertexte?

Un document hypertexte est un document dont les pages sont reliées entre elles par des hyperliens

La principale caractéristique d'un tel document est qu'il peut être parcouru de façon non linéaire

Le mot "Web" fait référence à une toile d'araignée en anglais

On dit aussi World Wide Web ou WWW puisque cette toile de documents hypertextes s'étend sur l'ensemble de la planète


Le client Web (navigateur)

Pour se connecter à Internet, il n'est pas toujours nécessaire de disposer d'un navigateur Web

Par exemple, si mon but est d'envoyer un courriel, une application de courrier électronique est suffisante

Pour consulter un document sur le Web, on utilise un logiciel appelé fureteur, navigateur Internet, navigateur Web ou simplement navigateur

Les navigateurs les plus connus sont :


Le serveur Web

C'est un logiciel dont le rôle est de servir des pages Web aux navigateurs (clients Web) qui en font la demande

Les serveurs Web les plus connus sont :

On appelle aussi parfois "serveur Web" l'ordinateur sur lequel s'exécute le programme


Structure d'une URL

Une URL (pour Uniform Resource Locator ou localisateur uniforme de ressource) est une adresse Web

L'URL débute généralement par http:// ou https:// (connexion sécurisée)

En voici un exemple :

https://prog101.com/html/intro_web.html

Dans le cas d'un fichier chargé dans le navigateur directement depuis le disque dur, la chaîne de départ sera file://

Vient ensuite le nom de domaine (emplacement de la ressource)

https://prog101.com/html/intro_web.html

Le nom de domaine peut parfois être remplacé par l'adresse IP (voir plus loin)

Dans le cas d'un fichier chargé depuis le disque dur, on retrouvera seulement la barre oblique (en anglais slash)

La dernière partie est constituée du nom complet de la ressource, c'est-à-dire du nom de fichier incluant le chemin (répertoires)

https://prog101.com/html/intro_web.html

Attention! La dernière partie (chemin complet) peut être sensible à la casse (lettres majuscules ou minuscules) dépendamment du sytème d'exploitation du serveur


Adresses IP et noms de domaines

Tous les ordinateurs, tablettes, téléphones "intelligents" et autres dispositifs connectés à Internet doivent avoir une adresse

Cette adresse IP (pour Intenet Protocol) est formée de quatre nombres séparés par des points

Par exemple :

149.56.47.97

Noms de domaines

Puisque de telles adresses sont difficiles à mémoriser et peu significatives, on les traduit souvent en une chaîne de caractères, c'est le nom de domaine ou simplement "domaine" (ex : prog101.com)

Il existe des outils en ligne pour savoir quelle adresse IP correspond un nom de domaine et vice versa


La requête HTTP

Voyons maintenant ce qui se passe lorsqu'un internaute (ça c'est vous) tente de se connecter, par exemple, au site prog101.com avec le navigateur Firefox

La requête suivante est pour l'obtention de la page d'accueil du site :

Une requête HTTP
Source : prog101.com

Après avoir tapé la touche "Enter", les action suivantes seront exécutées pour vous :

Remarque : tout ce qui regarde le protocole HTTP sera abordé plus tard dans la session

Le DNS

Firefox ne peut se connecter immédiatement au serveur de prog101.com, il doit d'abord trouver l'adresse IP correspondante

Pour trouver l'adresse IP correspondant au domaine prog101.com, le navigateur s'informe auprès d'un serveur DNS (Domain Name System)

L'opération est rapide et transparente pour l'internaute, car l'adresse IP d'un ou de plusieurs serveurs DNS est déjà écrite dans la configuration réseau de son ordinateur

Une fois l'adresse IP de prog101.com obtenue, Firefox envoie une requête HTTP pour obtenir la page d'accueil du site

La commande nslookup de Windows permet d'interroger manuellement le serveur DNS :

C:\>nslookup prog101.com
Serveur :   epp1.epp.clg.qc.ca
Address:  172.17.200.11

Réponse ne faisant pas autorité :
Nom :    prog101.com
Address:  72.55.186.4

C:\>

La commande équivalente sous Linux est dig


La réponse HTTP

Le document retourné par le serveur Web (la page d'accueil de prog101.com) sera finalement affiché sous vos yeux ébahis

Ce document, vous vous en doutez, ne contiendra pas seulement du texte ou des images, mais toute une série de codes étranges qui nous examinerons la semaine prochaine


Début du document