logo

Introduction

Codage numérique du texte : Charset et Encoding

En télécommunications et en informatique, un jeu de caractères codés (charset encoding en anglais) est un code qui associe un jeu de caractères d’un alphabet avec une représentation numérique pour chaque caractère de ce jeu.

Le jeu de caractère est nommé charset (character set) et le code qui relie le chaque caractère à un nombre est nommé encoding.

Par exemple, le code Morse (qui associe l’alphabet latin à une série de pressions longues et de pressions courtes sur le manipulateur morse du télégraphe) est un des premier jeux de caractères codés.

Le code ASCII ([askiː]) s’est imposé au début de l’ère informatique pour coder 128 lettres, chiffres et autres symboles.

Activité – Taille d’un texte

Quelle est la taille (en octets) de la phrase :
Enfin ! Je viens de comprendre ce qui s’est produit.
(attention, il faut compter les espaces, et signes de ponctuation…) ?

Vérifier en tapant cette phrase avec un éditeur de texte quelconque (bloc-notes de Windows, …). Il suffit d’écrire le texte, puis de l’enregistrer en tant que « texte brut » (le plus souvent avec une extension .txt) et ensuite de vérifier la taille en octets du fichier obtenu (ce qui peut se faire en cliquant d’abord avec le bouton droit sur l’icône du fichier puis sur « Propriétés »).