Une page HTML est un simple fichier contenant du texte formatté avec des balises HTML. Par convention l'extension donnée au fichier est .htm ou .html, mais une page web peut potentiellement porter n'importe quelle extension.
Une page web peut être construite à partir du plus basique des éditeurs
de texte (une application bloc-note par exemple), mais il existe des éditeurs
beaucoup plus évolués.
Les éditeurs WYSIWYG («What You See Is What You Get», littéralement
«ce que vous voyez est ce que vous obtenez») sont des éditeurs graphiques
permettant de travailler sur une page web telle qu'elle sera affichée sur un navigateur à
quelques détails près. Grâce à ce genre d'éditeurs il est possible
d'ajouter des balises par simple clic et d'en modifier les attributs en éditant
leur propriétés dans un formulaire. Pour autant, afin d'utiliser au mieux ce genre d'éditeur,
une connaissance préalable du HTML est tout de même très utile.
Il existe également des éditeurs permettant d'éditer le code HTML
en affichant les balises, les attributs et leurs valeurs avec différentes couleurs pour une meilleure
lecture et proposant parfois des outils pour vérifier la validité du code HTML.
Par convention l'extension donnée à une page HTML est .htm ou .html mais
une page web peut potentiellement porter n'importe quelle extension notamment les suivantes :
- .asp pour une page générée dynamiquement en ASP (Active Server Pages) ;
- .cgi pour une page générée dynamiquement avec des CGI (Common gateway Interface) ;
- .php, .php3 ou .php4 pour une page générée dynamiquement en PHP ;
- .pl pour une page générée dynamiquement en Perl (Practical Extraction and Report Language) ;
- etc.
Un document HTML commence par la balise <HTML> et finit par
la balise </HTML>. Il contient également un en-tête décrivant
le titre de la page, puis un corps dans lequel se trouve le contenu de la page.
L'en-tête est délimité par les balises <HEAD> et
</HEAD>. Le corps est délimité par les balises <BODY> et </BODY>.
Voici par exemple une page HTML minimaliste :
<HTML>
<HEAD>
<TITLE>Titre de la page</TITLE>
</HEAD>
<BODY>
Contenu de la page
</BODY>
</HTML>
Il est conseillé d'indiquer dans la page HTML le prologue du type de document,
c'est-à-dire une référence à la norme HTML utilisée, afin de spécifier le standard utilisé
pour le codage de la page. Cette déclaration se fait par une ligne du type :
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0//EN">
<HTML>
<HEAD>...</HEAD>
<BODY>Contenu de la page</BODY>
</HTML>
La déclaration du document indique la DTD (Document Type
Definition) utilisée, c'est-à-dire la référence des
caractéristiques du langage utilisé.
Le tableau ci-dessous récapitule les déclarations pour les principales
version du langage HTML :
Version |
Déclaration |
HTML 2.0 |
<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN"> |
HTML 3.2 |
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN"> |
HTML 4.01 |
- Strict : <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Strict//EN" "http://www.w3.org/TR/html4/strict.dtd">
- Transitional : <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
- Frameset : <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Frameset//EN" "http://www.w3.org/TR/html4/frameset.dtd">
|
XHTML 1.0 |
- Strict : <!DOCTYPE HTML PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
- Transitional : <!DOCTYPE HTML PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-loose.dtd">
- Frameset : <!DOCTYPE HTML PUBLIC "-//W3C//DTD XHTML 1.0 Frameset//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-frameset.dtd">
|
XHTML 1.1 |
<!DOCTYPE HTML PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
|
|