Obligement - L'Amiga au maximum

Samedi 25 novembre 2017 - 03:12  

Translate

En De Nl Nl
Es Pt It Nl


Rubriques

 · Accueil
 · A Propos
 · Articles
 · Galeries
 · Glossaire
 · Hit Parade
 · Liens
 · Liste jeux Amiga
 · Quizz
 · Téléchargements
 · Trucs et astuces


Articles

 · Actualité (récente)
 · Actualité (archive)
 · Comparatifs
 · Dossiers
 · Entrevues
 · Matériel (tests)
 · Matériel (bidouilles)
 · Points de vue
 · En pratique
 · Programmation
 · Reportages
 · Tests de jeux
 · Tests de logiciels
 · Tests de compilations
 · Articles divers

 · Articles in english
 · Articles in other languages


Twitter

Suivez-nous sur Twitter




Liens

 · Sites de téléchargements
 · Associations
 · Pages Personnelles
 · Moteurs de recherche
 · Pages de liens
 · Constructeurs matériels
 · Matériel
 · Autres sites de matériel
 · Réparateurs
 · Revendeurs
 · Presse et médias
 · Programmation
 · Développeurs logiciels
 · Logiciels
 · Développeurs de jeux
 · Jeux
 · Autres sites de jeux
 · Scène démo
 · Divers
 · Informatique générale


Jeux Amiga

0, A, B, C, D, E, F,
G, H, I, J, K, L, M,
N, O, P, Q, R, S, T,
U, V, W, X, Y, Z


Trucs et astuces

0, A, B, C, D, E, F,
G, H, I, J, K, L, M,
N, O, P, Q, R, S, T,
U, V, W, X, Y, Z


Glossaire

0, A, B, C, D, E, F,
G, H, I, J, K, L, M,
N, O, P, Q, R, S, T,
U, V, W, X, Y, Z


Partenaires

Annuaire Amiga

Amedia Computer

Relec

Hit Parade


Contact

David Brunet

Courriel

 


Dossier : Le World Wide Web (WWW)
(Article écrit par Jean-François Richard - novembre 2007)


Quelques définitions

Dans ce cours, nous allons aborder des langages de création de pages Web, dont le langage HTML, les CSS, JavaScript, XHTML, XML, les bases de données, PHP... Mais avant, nous allons définir de façon plus précise quelques termes pour mieux saisir des concepts qui seront étudiés plus tard.

Historique d'Internet (ou comment le surf envahi la toile !)

Le World Wide Web (ou en français : la Toile) est le terme désignant la communauté des internautes et des machines composant l'Internet. Ce dernier tire son nom d'Interconnected networks (ou réseau de machines interconnectées), il représente un réseau de réseaux. Un réseau étant de nombreuses machines connectées les unes aux autres. Dans notre cas, ce réseau est en relation avec d'autres réseaux, eux-mêmes en relation avec d'autres réseaux, et ainsi de suite, alors nous commençons à entrevoir le concept d'Internet.

Historiquement, Internet doit son existence à son petit frère : l'ARPAnet (Avanced Research Project Agency network), un projet initié par le DoD (Department of Defense : ministère de la Défense des États-Unis) et pour lequel les personnes l'ayant utilisés entrevirent l'importance stratégique de ne plus avoir de machines indispensables du fait de leur unicité dans l'architecture militaire. Ils eurent l'idée de créer un réseau de machines s'autosuffisant, pouvant perdre certaines d'entre elles, tout en continuant à fonctionner correctement dans leur ensemble et ayant chacune des parties des autres (notion de duplication disparate). Ainsi, dans l'éventualité d'un conflit nucléaire (cela se déroule à l'époque de la guerre froide), si une machine était touchée, alors les autres machines du réseau pourraient prendre le relais et ne pas paralyser tout le système de commandement.

De là émergeait l'Internet, mais il était destiné à un nombre restreint de personnes du ministère de la défense des États-Unis et aux universitaires travaillant sur ce projet. Après un développement du réseau entre quelques universités pour des tests avec un nombre plus élevé de personnes, les universitaires comprirent la puissance et le potentiel de ce réseau de réseaux. Ils développèrent des logiciels et des protocoles réseaux pour mieux l'utiliser. D'abord par la mise en place des premières normes concernant un langage de balise compréhensible par la majorité des gens (le HTML provenant de travaux réalisés par le CERN et dont le créateur est Tim Berners-Lee, président du W3C) et par la mise à disposition du premier navigateur (browser) graphique nommé Mosaic issu des laboratoires du NCSA (une université américaine).

Ainsi durant l'année 1993, l'Internet pris son premier envol vers le grand public et ce fut une petite révolution, les bas débits empêchant l'essor d'Internet. Mais le second envol eut lieu vers l'année 1999 aux États-Unis et son équivalent se déroula en 2002 en France, avec l'arrivée des connexions à haut débit (utilisant des technologies au cuivre). De nos jours, les Fournisseurs d'Accès Internet (FAI) se livrent à une guerre commerciale impitoyable pour le plus grand bonheur des particuliers, car on assiste à une envolée des débits et en parallèle à une chute des prix.

Intranet et extranet (ou comment faire du surf chez soi ou chez les autres !)

Nous venons de définir le terme Internet, mais ce terme englobe aussi un concept de logiciels échangeant des documents hypertexte par l'intermédiaire de protocoles réseaux.

Actuellement, ces réseaux peuvent être très restreints tout en utilisant les technologies de l'Internet. Par exemple, au sein des entreprises, il peut exister, voir coexister deux types de réseaux :
  • Les intranets sont des réseaux privés d'entreprises ou d'institutions, non connectés en dehors de la limite physique du réseau de l'institution. Les entreprises permettent à leurs collaborateurs d'utiliser des navigateurs pour obtenir et partager des documents avec leurs collègues. Mais leur donne aussi la possibilité de créer des documents et des bases de contenus s'ils en ont l'autorisation.
  • Les extranets sont des intranets ayant des limites d'accès au niveau de l'Internet et pouvant permettre aux employés de communiquer avec le monde extérieur à l'entreprise, dans la limite des autorisations qui leur sont attribuée (par le biais de serveur proxy).
Serveurs, clients et navigateurs (ou comment comprendre la quadrature de l'Internet !)

Passons maintenant à la définition de notions essentielles à la bonne compréhension des concepts fondamentaux de l'Internet.

Les serveurs sont des machines mettant à disposition des contenus par le biais de documents hypertextes sur le réseau internet et accessibles aux internautes s'ils disposent des droits pour naviguer dessus (parallèle avec les systèmes Unix/Linux et Windows NT4/2000/XP).

Les clients sont des machines avec lesquelles l'utilisateur navigue au sein de l'Internet.

Le côté serveur se dit pour tout processus s'effectuant sur la machine serveur et le côté client pour tout processus s'effectuant sur la machine de l'internaute.

Un processus est un terme équivalent à programme, mais pour faire encore une analogie avec le système Unix, les processus sont des programmes s'exécutant dans le microprocesseur du micro-ordinateur.

Le navigateur (browser) désigne le logiciel permettant de surfer sur le Web.

Le navigateur et l'internaute peuvent être confondus par abus de langage.

Souvent le poste client désigne la machine sur laquelle travaille l'internaute.

Protocoles et requêtes

Les protocoles (ou comment rester dans les règles du savoir-vivre !)

Il existe un grand nombre de protocoles usités dans l'utilisation quotidienne d'Internet :
  • Le protocole HTTP (HyperText Transfert Protocol) est le plus utilisé pour la navigation dans l'Internet et permet d'envoyer des requêtes compréhensibles pour les serveurs. En clair, c'est le protocole qui pilote les interactions sur le Web.
  • Le protocole FTP (File Transfert Protocol) est surtout destiné à échanger des dossiers ou des fichiers entre deux machines directement. Souvent utilisé quand on veut laisser des internautes télécharger des gros fichiers, voir des CD ou des DVD.
  • Le protocole IPv4 (Internet Protocol version 4) permet l'identification des micro-ordinateurs grâce à des adresses IP uniques. Ces dernières sont codées dans un mot binaire de 32 bits, autorisant théoriquement 232 adresses machines (environ 4 milliards d'adresses). Cela peut paraître suffisant pour adresser toutes les machines de la planète, mais en fait, c'est insuffisant, car les machines sont regroupées sous forme de réseau. Prenons un exemple, si l'on affecte 24 bits à la définition d'un réseau (224 machines peuvent former des réseaux), or sur un de ces réseaux on ne peut fournir que 28 adresses (8 bits), les autres composants l'adresse réseau. Ainsi, notre réseau ne peut fournir que 256 adresses machines différentes sur son réseau, ce qui est très faible dans le cadre de réseau d'universités ou de grosses entreprises. Bien sur, dans le cadre d'un particulier ou d'une PME, cela est largement suffisant, puisqu'il n'y aura qu'une à 50 machines. L'IETF (Internet Engineering Task Force) est un organisme de standardisation de l'Internet et s'évertue à définir l'IPv6.
  • Le protocole IPv6 (Internet Protocol version 6), est un projet dont la mise au point a débuté durant l'année 1995. En France, sa mise au point est effectuée par l'intermédiaire du G6. Sa mise en oeuvre devient nécessaire du fait du nombre d'adresses IP limitées dans le protocole IPv4. Ce protocole est beaucoup plus qu'une simple extension du protocole IPv4, il permet :
    • L'autoconfiguration des machines (calcul automatique de la nouvelle adresse si changement de réseau et connaissance de l'environnement immédiat, le voisinage réseau).
    • La mobilité.
    • La sécurité et la confidentialité par des chiffrements (Ipsec).
  • Le protocole TCP (Transfert Control Protocol) est un protocole de contrôle des transmissions.
  • Le protocole TCP/IP (Transfert Control Protocol/Internet Protocol) est l'abréviation des deux protocoles TCP et IP, ils sont tous les deux utilisés lors de l'utilisation d'Internet (voir plus haut les définitions les concernant). La réunion de ces deux protocoles assure la transmission de données, la localisation des clients et des serveurs. Ces deux protocoles utilisent le protocole HTTP pour communiquer entre serveurs et clients.
  • Le protocole SMTP (Simple Mail Transport Protocol) est pris en charge par un serveur s'occupant de la distribution du courrier que vous écrivez et envoyez par le biais de votre logiciel de messagerie.
  • Le protocole POP3 (Post Office Protocol) ou IMAP (Internet Message Access Protocol) prend en charge le courrier que vous recevez.
En pratique sur la toile (ou ne je croyais pas qu'il y ait autant de choses derrière la toile !)

Le processus normal dans une connexion à un serveur mettant à disposition un site HTML est le suivant :

L'internaute va saisir l'adresse URL du site ou de la page Web qu'il veut consulter. Il lance la requête sur le réseau par le biais de son navigateur. Cette requête est réceptionnée par le serveur qui l'analyse et y répond en conséquence.
  • Soit le serveur possède cette page dans ses répertoires et l'internaute détient les droits pour y accéder. Alors, le serveur renvoi la page au navigateur et a fini sa part de travail.
  • Soit le serveur ne possède pas (ou plus) cette page et/ou l'internaute n'a pas l'autorisation pour y accéder. Dans ce cas, le serveur renvoi au navigateur de l'internaute une réponse précisant qu'il ne peut lui renvoyer la page Web (erreur de type 404, Cf. le protocole HTTP).
Alors le navigateur va interpréter le document hypertexte en mettant en forme le contenu de cette page. Pour l'internaute, tout ceci est invisible et il ne soupçonne rien de tout le processus venant de se dérouler sous ses yeux et apparaissant sous la forme d'une barre de chargement de l'adresse en cours.

Nous allons maintenant développer un peu plus les quelques notions indispensables à la compréhension de la navigation sur Internet, car tout le monde l'utilise et navigue de page en page sans vraiment connaître la signification de ce qu'il tape dans le navigateur.

Déjà, toute machine connectée à Internet possède un numéro d'IP (pour Internet Protocol). Ce numéro est unique pour chaque machine connectée au réseau et peut se définir de deux façons :
  • La première est la moins compréhensible pour nous, au contraire des micro-ordinateurs manipulant si aisément les chiffres. Exemple d'IP : 197.173.12.9. Ce numéro est attribué à toute connexion et sert d'identifiant unique pour la machine sur le réseau, ainsi toutes les autres machines voulant se connecter ou échanger des informations avec elle peuvent le faire grâce à ce numéro.
  • La seconde façon de trouver une machine est de connaître son nom, par le biais d'une adresse (ce sont des IP avec nom). Exemple d'adresse IP : www.ratp.fr. Dans le cas où l'on tape une adresse comme précédemment, on remarque qu'il existe des points entre chaque information se rapportant à l'IP de type : domaine.sous-domaine.branche de l'internet, où "www" est le nom de la machine, "Ratp" est le sous-domaine et "fr" est la branche de l'internet. "edu" pour éducation, "gov" pour les institutions gouvernementales, "org" pour les organisations, "com" pour les sites commerciaux, "fr" pour le pays France ou encore ".eu" pour les sites européens, etc.
Ces numéros ou adresses Internet sont stockés sur des serveurs dont le rôle est dédié uniquement à cela et se trouvent dans les IP tables des systèmes d'exploitation. Il existe des serveurs de noms faisant le lien entre les IP et les adresses. Ces noms sont déclarés à l'InterNIC (organisme répertoriant les noms de machines).

A propos des plus des navigateurs (ou comment bien manoeuvrer sa barque (ou plutôt son surf) !)

Les navigateurs proposent des ajouts non recommandés par l'utilisation d'extensions et d'applets Java ou autres ActiveX, ceux-ci permettant l'affichage ou le chargement de contenus non exécutables autrement.

Cela peut-être intéressant, mais est à utiliser avec parcimonie, car il nécessite la connaissance d'autres langages et surtout enlève des informations pour les personnes ne possédant pas ces extensions ou n'ayant pas un navigateur les gérant. Il faut faire bien attention à cela dans le sens où les internautes visitant votre site perdront une part non négligeable des informations et s'ils ne peuvent y accéder, ne reviendront sûrement pas. Dans le cas qui est le nôtre, les environnements actuels de l'Amiga (AmigaOS 4, AmigaOS Classic et MorphOS) n'offrent pas encore de navigateur de dernière génération, sauf Sputnik et OWB. Nous parlerons bien sûr de AWeb, Sputnik et IBrowse dans leur dernière version lors de l'écriture de cet article.

Les balises (ou comment se repérer dans cet océan de code source !)

Les balises (ou marqueurs) sont le fondement du langage HTML. Elles vont encadrer le contenu affiché dans les pages et le mettre en forme par le biais de l'interprétation du code de ces balises par le navigateur. Ainsi, une bonne connaissance des balises permet une bonne maîtrise de la création de pages Web, car comme nous le verrons dans les cours suivants - le HTML est le fondement des pages Web et se retrouvera de toute façon utilisé dans toute page affichée sur le Web, même si elles contiennent des scripts d'autres langages.

Les langages de balises (ou comment parler l'argot marin rapidement !)

Dans la grande famille des langages de balises, il y a pléthore :
  • Le SGML (Standard Generalized Markup Language), l'ancêtre de tous les langages de balises. C'est un langage permettant de tout faire, mais il est très compliqué à appréhender pour le néophyte par rapport à des langages comme (X)HTML et XML.
  • Le HTML (HyperText Markup Language) est le langage le plus restreint au niveau de ses possibilités, mais c'est aussi le plus simple et le plus compréhensible pour les novices. Il est à l'origine de l'explosion de l'Internet chez les particuliers.
  • Le XML (eXtended Markup Language) est un langage plus compliqué par rapport au HTML, mais permettant une grande homogénéité dans son codage et une meilleure structuration des documents hypertexte. Il est utile pour le stockage de données dans le cadre de leur pérennisation.
  • Le XHTML (eXtensible HyperText Markup Language) est une reformulation de HTML dans le langage XML, le rendant ainsi compatible dans le futur avec les navigateurs et l'évolution de l'Internet vers XML. De plus, nous verrons la rigueur caractéristique d'XHTML provenant de XML et palliant aux défauts de jeunesse de HTML où les erreurs étaient souvent tolérées au détriment d'un code propre.
Les spécifications des navigateurs (ou comment faire respecter les plans de construction d'une bonne planche de surf !)

Les spécifications sont des définitions de la syntaxe et de son utilisation dans un langage informatique. Elles sont établies par des comités d'experts universitaires et de l'industrie (le W3C : World Wide Web Consortium dans le cas des langages de balises). Elles devraient toujours être suivies, mais les éditeurs de logiciels de navigation changent les règles du jeu en ignorant purement et simplement certaines parties des spécifications et en implémentant des fonctions supplémentaires à leur navigateur (sans doute pour fidéliser les utilisateurs de leurs navigateurs, Cf. le duel épique de Netscape Navigator vs Internet Explorer).

Les navigateurs (ou comment faire bon surf, aloa !)

Actuellement, la guerre des navigateurs est terminée, car Internet Explorer de Microsoft est utilisé à environ 90-95% par les internautes (chiffres de 2006). Son rival Netscape Navigator de Netscape Communicator (racheté par America Online) n'est donc qu'infiniment peu utilisé et de plus sa version dérive de Mozilla un navigateur sous le couvert de logiciel libre plus avancé que Netscape Navigator.

En 2002, la fondation Mozilla a publié Firefox et Thunderbird (alors nommés Phoenix puis Firebird). Ce sont deux outils complémentaires de la suite du navigateur Mozilla, Firefox est un navigateur Mozilla avec des extensions et des ajouts non négligeables profitant de la communauté fort active des logiciels libres. De son côté, Thunderbird est une application de messagerie s'intégrant dans la suite Mozilla.

Enfin, il faut avoir à l'esprit qu'il existe plus d'une centaine de navigateurs Web, avec une bonne partie dont le développement est arrêté. Parmi les navigateurs utilisés : Opera, Safari, Camino, Konqueror, Galeon, AWeb. Ce sont des navigateurs moins représentés que Internet Explorer et Firefox. Il faut savoir que Opera existe gratuitement pour les trois plates-formes actuelles que sont Windows, Linux et Mac OS X.

Safari est représentatif du système de la pomme Mac OS X, Camino de Konqueror du système d'exploitation Linux sous KDE et Aweb, IBrowse et Sputnik pour les systèmes d'exploitation AmigaOS et MorphOS.

Enfin, il existe des navigateurs en mode texte w3m, Lynx, Links. Ces navigateurs sont essentiellement utilisés par les personnes non ou malvoyantes. Si vous faites un site pour le plus grand nombre, il ne faut pas oublier qu'en France 1,5 million de personnes sont déficients visuels.

Les navigateurs sur le marché utilisent parfois leur propre extension aux langages de balise pouvant plus ou moins devenir des parties intégrantes des spécifications (par exemple : le langage de script JavaScript spécifique de Netscape Navigator au début, car développé par et pour lui-même).

Nous nous contenterons d'utiliser deux des navigateurs parmi les plus courants et un moins connu :
  • Internet Explorer.
  • Mozilla Firefox.
  • Opera.
Mais aussi des navigateurs dédiés à l'Amiga :
  • AWeb.
  • IBrowse.
  • Sputnik.
Les normes (ou comment choisir sa planche de surf !)

Les normes changent et il faut donc se tenir au courant de leur évolution. Dans le cas de HTML, sa dernière version est la 4.01. Normalement, il n'y en aura plus d'autres, car le W3C l'a stabilisée et veux une évolution des langages de balise vers XML par le biais de l'utilisation du XHTML.

Le but de ce cours est de vous faire comprendre le langage HTML et de vous faire réaliser un site internet (web) par le biais de ce langage.

Il ne faut pas oublier que vous devez acquérir de l'expérience dans la conception et la réalisation. Il ne faut pas hésiter à regarder d'autres sites et à naviguer pour voir ce qu'il vous faut et ce qu'il vaut mieux éviter de ne pas faire, ne pas oublier l'internaute naviguant sur votre site pouvant accrocher au niveau du contenu, mais surtout en premier lieu pour l'ergonomie et le style du site.

Car le site créé ne l'est pas pour vous uniquement, mais pour les internautes venant y glaner les informations les intéressant. Tout dépend du site que vous souhaitez concevoir, d'où l'importance de créer en amont un scénarimage (story-board). Ainsi la composition de votre site a de l'importance dans la structure d'un document, mais en allant plus loin, dans la structure entre vos documents et enfin au niveau de l'ensemble des documents, comme le fait un publiciste ou un réalisateur lors de ses créations.

Il faut donc vous approprier ou créer (trouver !) votre propre style. Ceci est déjà bien, mais il faut aussi être efficace. La maîtrise de HTML se fait par la connaissance de la syntaxe, de la sémantique et des éléments de style et liés à l'esthétique.

Les versions des langages (ou le pourquoi du comment des langues !)

Les versions décrites dans ce cours sont les versions des spécifications les plus récentes :
  • Pour HTML la version 4.01 (du 24/12/1999).
  • Pour XHTML la version 2.0 (du 31/01/2003).
  • Ancienne version ou en langue française XHTML la version 1.1 (du 31/05/2001) et 1.0 (du xx/xx/xxxx).
  • XHTML Basic (du 19/12/2000).
  • XML la version 1.0 Second Edition (du 06/09/2000).
Matériel nécessaire pour programmer en HTML :
  • Un micro-ordinateur (Amiga, PC...).
  • Un système d'exploitation (AmigaOS, Mac OS X, Windows, Linux, Unix...).
  • Un éditeur de texte ASCII (SimpleText ou TextEdit sous Mac OS, bloc-notes (ou Notepad) sous Windows, Gedit, Glimmer ou vi sous Linux, Unix, CygnusEd ou NoWinEd sous AmigaOS...).
  • Un navigateur, si possible la version la plus récente (Safari, Internet Explorer, Mozilla Firefox, Opera, AWeb, IBrowse, Sputnik...).
Attention, selon le système d'exploitation et le navigateur disponible sur la machine, la visualisation des documents HTML peut être différente. Donc, ne pas hésiter dans les phases de test à le faire sur différents systèmes d'exploitation et avec différents navigateurs.

Pour aborder le langage HTML, les principes régissant Internet doivent être connus et la connaissance des navigateurs Web est indispensable.

C'est le moment de passer à l'étude des notions basiques régissant le langage HTML.

Voilà, c'est tout pour cette introduction, si vous voulez des éclaircissements, pas de problème, posez-moi les questions qui vous titillent cette adresse (pour les corrections, je suis aussi preneur ;-)).


[Retour en haut] / [Retour aux articles]