HTML, c’est quoi exactement ?

L’HyperText Markup Language, souvent abrégé HTLM, se traduit littérairement comme langage de balisage d’hypertexte. Le langage HTLM est utilisé pour écrire de l’hypertexte, mais aussi pour mettre en forme les contenus à afficher sur une page web. Il est même possible d’inclure dans la page des objets de format multimédia avec le langage. Le HTLM est indispensable pour la création de pages interopérables qui est conforme avec l’accessibilité du web. Les professionnels l’emploient avec le CSS ou encore le JavaScript. L’HyperText Markup Language est basé sur le SGML ou Standard Markup Langage.

L’histoire du HTLM

Le World Wide Web ou WWW se base sur trois principaux éléments : les adresses web, le Hypertext Transfer Protocol et le langage HTML. L’invention de l’HyperText Markup Language remonte vers la fin des années 80. Son invention a été motivée par la nécessité d’écrire de documents hypertextuels qui exploitent les ressources d’Internet et les relient avec les hyperliens. L’expression documents hypertextuels est devenue obsolète à l’heure actuelle puisqu’ils sont remplacés depuis longtemps par l’expression pages web. Tim Berners-Lee a été le premier à fournir une URL d’un document portant l’extension .html en 1991. Il a développé le langage à partir du SGML par soucis diplomatique et technique. À l’époque, Tim Berners-Lee travaillait pour le CERN ou l’Organisation européenne pour la recherche nucléaire. L’entité utilisait déjà le SGML, donc il a décidé de peaufiner ce langage pour une meilleure utilisation. Par ailleurs, il a développé le HTLM pour procurer à la communauté hypertexte une version simplifiée du Standard Markup Langage. Les premiers composants de l’HTML étaient le titre du document, les hyperliens, une structure du texte en titres, plusieurs sous-titres, le texte ou les listes ainsi qu’un filtre de recherche par index. L’année 1993 est marquée par les travaux de normalisation concernant le langage. Le navigateur NCSA Mosaic apporte deux améliorations majeures. Il y a d’abord l’apparition de IMG permettant d’intégrer des images aux formats XBM et GIF dans les pages. Ensuite, il y a l’invention d’un dispositif permettant de rendre les documents interactifs. Les internautes pouvaient envoyer des données vers le serveur web grâce à l’apparition du formulaire sur le Mosaic 2.0pre5. Le second travail signe le début du commerce électronique. Netscape Navigator est apparu sur le marché en 1994. Plusieurs options sont apportées par le navigateur comme le centrage, le clignotement et les attributs textes. L’évolution du HTML prend deux voies durant l’année puisque les responsables du navigateur souhaitaient améliorer l’apparence des pages tandis que les développeurs du web voulaient développer les capacités sémantiques et étendre les domaines d’application. Le HTML 2.0 est apparu vers 1995. Ce nouveau langage précurseur du HTML 3.0 renferme plusieurs éléments comme les figures ainsi que les expressions mathématiques et les tables. Dan Connolly est le principal responsable de cette version 2.0 qui a pris fin en septembre 1995. Le W3C ou Word Wide Web Consortium annonce au public les caractéristiques du HTML 3.2 le 14 janvier 1994. Les nouveautés sont remarquées au niveau des éléments de présentation ainsi que dans la standardisation des tables. Il a fallu attendre quelques mois avant que le W3C dévoile la version 4.0. La version devient plus complète grâce à la standardisation de plusieurs extensions capable de supporter les scripts et les styles, les objets et les cadres. En outre, cette version devient plus pratique grâce aux améliorations des éléments destinés à l’accessibilité des contenus. Trois variants de format sont d’ailleurs proposés avec le HTML 4.0 pour améliorer le balisage. Il y a d’abord la variante stricte ou strict qui enlève les attributs et les éléments dits présentations. La variante transitoire ou transitional qui étend la variante stricte. La variante frameset apporte un changement des jeux de cadres. Ces variantes seront encore visibles dans la version 4.0.1 et avec le XHTML 1.0. Plusieurs changements ont opéré sur le langage entre 2000 et 2006. Le HTML 5 qui perdure jusqu’à maintenant a vu le jour en 2007.

Les éléments de HTML

La version 4 renferme exactement 91 éléments. Ils peuvent être regroupés sous plusieurs catégories dont la structure générale du document HTML, l’information sur la langue, le marquage sémantique, les listes, les tables, les hyperliens, les inclusions d’images et d’objets divers, les éléments de regroupement, le style de présentation, le marquage de présentation de texte, les cadres, le formulaire pour l’insertion interactive de données et les scripts. Quant aux attributs, ils sont au nombre de 188 dans la version 4. Les attributs génériques et les attributs d’internalisation s’appliquent à tous les éléments. D’autres attributs vont être utilisés pour inclure des ressources graphiques sous format img ou iframe. D’autres attributs demeurent facultatifs.

Les balises fréquemment utilisées HTML

Le langage comprend jusqu’à 140 balises. Elles servent à orienter le navigateur pour l’affichage, l’interprétation ou encore les indications. C’est à partir des balises que le document est fourni en métadonnées.Elles ont pour rôle de simplifier l’ajout de fichier multimédia, de simplifier la gestion de formulaire en ligne ou encore de mettre en avant certaines phrases. Parmi les balises les plus utilisées, il y a d’abord les balises permettant de définir les titres h1, h2, h3, etc. la balise h1 est utilisée pour marquer le grand titre. Par contre, les autres formes sont pour les petits titres. La balise p est employée pour les paragraphes. Une fois en place, la balise sépare les paragraphes par des sauts de ligne. La balise a sert exclusivement à créer les liens vers une autre ressource comme une autre page web, une image, un e-mail ou une autre partie du document. La balise est généralement associée à l’attribut href. La balise img renvoie à l’intégration d’une image. Les webmasters font appel aux balises span et div pour le script et la mise en forme. Les balises ul, ol et li sont rajoutés pour créer les listes sur le document. La balise ul convient pour une liste non ordonnée alors que ol sert pour une liste ordonnée. La balise li va définir chaque élément de la liste.

Apprendre le langage ou utiliser un logiciel ?

Aujourd’hui, il existe plusieurs logiciels qui permettent de générer rapidement les codes HTML comme dreamweaver ou x-vu. Ces programmes sont conçus dans le but de produire des pages web plus facilement, même sans une connaissance approfondie du langage. L’emploi de ces outils est recommandé pour des petits projets. Ils aideront dans la création d’un petit blog destiné pour les vacances, par exemple. Cependant, ils restent déconseiller en cas de gros projet. Même s’il est facile de produire une page avec l’application, le responsable aura du mal à lire les codes générés.Or, il est important de pouvoir garder le contrôle sur les codes quand il faut procéder à la maintenance du site ou pour réaliser une modification ultérieure. Un développeur digne de ce nom aura toujours besoin de connaitre les bases du langage HTML. Il existe aujourd’hui plusieurs sites qui proposent la formation en HTML et en CSS. L’accès à ces programmes est généralement gratuit. Même une personne n’ayant pas de connaissance accrue dans les langages informatiques peut apprendre l’HyperText Markup Language avec ces plateformes. Plusieurs ouvrages existent également sur le marché pour ceux qui aiment lire. Le cours HTML figure également dans le cursus au sein des établissements spécialisés dans l’informatique.

Le référencement naturel et les balises HTML

Le référencement naturel ou SEO permet d’améliorer la visibilité d’un site sur les moteurs de recherche, donc sur le fameux Google. Le Search Engine Optimization est en constante évolution et les référenceurs sont obligés de suivre les changements pour éviter les pénalisations. Parmi les professionnels qui ont besoin du langage HTML, il y a les agences de référencement ainsi que les sociétés spécialisées en webmarketing. Ils ont recours au SEO on page pour l’optimisation des principales balises HTML. Grâce à la technique, les algorithmes de Google, Yahoo ou Bing comprennent facilement chaque élément constitutif de la page. Les professionnels travaillent essentiellement sur 4 balises afin d’optimiser le positionnement d’un site web. Il y a la balise SEO title ou titre, les balises d’en-tête h1, h2, h3…, la balise méta-description ainsi que les étiquettes de blog et les catégories. Chacune de ces balises a une importance capitale pour bien placer un site professionnel. Bien évidemment, le référenceur aura besoin de collaborer avec des rédacteurs confirmés pour obtenir des contenus de qualité.