Dictionnaire Ajouter Rediger Corriger
  • ASCII et ISO
  • format d'image
  • Tkinter
  • compression video
  • Compression musique
  • format vectoriel
  • Projet
  • Cahier de spécifications
  • UTF8
  • compilation
  • Scrum master
  • trie selection
  • méthode agile
  • reseau
  • licence
  • Sciences agricole
  • UTF8

    Rappel : La norme ISO 8859-1, qui est souvent appelée Latin-1 ou Europe occidental, est une norme de l'Organisation internationale de normalisation pour le codage des caractères en informatique.
    Il s'agit d'une extension d'ASCII qui comporte 128 caractères imprimables. Elle permet d'écrire la plupart des langues d'Europe de l'Ouest et presque tout les caractères du français à part le œ.
    Elle définit ce qu'elle appelle l'alphabet latin numéro 1, qui consiste en 191 caractères de l'alphabet latin, chacun d'entre eux étant codé par un octet (soit 8 bits) contrairement à ASCII(7bits).

    Cette norme est donc utilisée sur tous les continents, en Europe de l’Ouest, en Amérique, et dans une grande partie de l'Afrique ou de l’Océanie ainsi que certains pays d’Asie du Sud-Est.

    Sa propre extension ISO-8859-15 le modifie légèrement. Pour le français, on notera surtout l’ajout du caractère œ et du symbole monétaire € (Euro).


    Les 128 caractères d’ASCII restent cependant la base d’une partie des codages modernes, créés comme des extensions d’ASCII et compatibles avec celui-ci.

    La norme utf8

    UTF-8 (abréviation de l’anglais Universal Character Set Transformation Format - 8 bits) est un codage de caractères informatiques conçu pour coder l’ensemble des caractères du « répertoire universel de caractères codés », initialement développé par l’ISO dans la norme internationale ISO/CEI 10646, aujourd’hui totalement compatible avec le standard Unicode, en restant compatible avec la norme ASCII limitée à l’anglais de base (et quelques autres langues beaucoup moins fréquentes), mais très largement répandue depuis des décennies.

    L’UTF-8 est utilisé par 82,2 % des sites web en décembre 20141. De par sa nature, UTF-8 est d’un usage de plus en plus courant sur Internet, et dans les systèmes devant échanger de l'information. Il s’agit également du codage le plus utilisé dans les systèmes GNU, Linux et compatibles pour gérer le plus simplement possible des textes et leurs traductions dans tous les systèmes d’écritures et tous les alphabets du monde.

    La principale caractéristique d’UTF-8 est qu’elle est rétro-compatible avec la norme ASCII, c’est-à-dire que tout caractère ASCII se code en UTF-8 sous forme d’un unique octet, identique au code ASCII. Par exemple « A » (A majuscule) a pour code ASCII 65 et se code en UTF-8 par l'octet 65. Chaque caractère dont le point de code est supérieur à 127 (caractère non ASCII) se code sur 2 à 4 octets. Le caractère « € » (euro) se code par exemple sur 3 octets : 226, 130, et 172.