Le protocole SMTP
09/02/2005
 Christian CALECA 
Liste des cours

Les bases

Accueil ] [ Les bases ] [ les Profondeurs ] [ Un SMTP "perso" ] [ Installation de Postfix ] [ Config avancée ] [ Conclusions ]


Dans cette partie de l'exposé, nous allons voir en détail ce que tout internaute gagnerait à savoir, concernant la façon dont les e-mails voyagent, Quel est leur contenu exact, comment les informations sont codées...

Cette partie est donc divisée en trois paragraphes:

Itinéraire d'un message électronique

Supposons un cas simple (et cependant courant).

1 2 3 4 5 6 itinéraire

  1. Fred compose le message avec son outil de messagerie préféré, disons outlook express. Il a des avantages: Il est gratuit et il est fait par Microsoft.
    Une fois le message composé, Fred clique sur le bouton "envoyer". Comme il a correctement configuré son outil, le message est envoyé sur le serveur smtp.truc.fr  flèche
  2. Le serveur smtp.truc.fr reçoit le message, constate que le destinataire n'est pas dans son domaine. Il cherche alors un serveur de messagerie dans le domaine machin.com et le trouve. Il envoie le message à smtp.machin.com  flèche
  3. Le serveur smtp.machin.com reçoit le message, constate que le destinataire est bien dans son domaine. Il range alors le message dans la boîte aux lettres de Marc. Il y restera aussi longtemps qu'il le faudra, sans rien dire à personne.  flèche
  4. Un jour, Marc décide de regarder s'il n'a pas de messages. Il envoie donc une requête à son serveur pop.machin.com, au moyen de son outil de messagerie préféré, par exemple eudora. Il a des avantages: il en existe une version gratuite et il n'est pas fait par Microsoft.  flèche
  5. Le serveur pop consulte alors la boîte aux lettres de Marc, constate qu'il y a un message dedans.  flèche
  6. Il l'envoie alors à l'outil de messagerie de Marc qui, par défaut, demandera à pop.machin.com de le supprimer de la boîte aux lettres. Mais c'est un comportement par défaut, il est possible de demander à ne pas effacer les messages. Cette fonction est utile lorsque l'on désire consulter sa messagerie de divers endroits sans avoir à se renvoyer un message si on veut le relire ailleurs.  flèche

POP3 est un protocole de relève de courrier. Sans pour l'instant entrer dans les détails, il en existe un autre appelé IMAP.

Mécanismes mis en jeu

SMTP (Simple Message Transfert Protocol)

C'est le protocole applicatif qui permet de transporter les messages sur l'Internet. Il sait acheminer un message jusqu'à une boîte aux lettres, mais ne va pas plus loin.

Pour y arriver, il analyse dans un premier temps la partie de l'adresse située à droite du @ (à prononcer dans ce cas "at"), pour trouver le domaine du destinataire. Si ce domaine le concerne, il cherche alors la boîte aux lettres du destinataire en regardant la partie de l'adresse située à gauche du @. Si le domaine du destinataire ne le concerne pas, il va chercher le serveur SMTP qui gère ce domaine, au moyen des champs MX du DNS du domaine destinataire et transmet le message à ce serveur.

 POP3 (Post Office Protocol 3)

Ce protocole est exclusivement utilisé pour le dialogue entre le client de messagerie et la boîte aux lettres. Il ne fait pas de transport sur l'Internet, il permet juste à l'utilisateur de gérer son courrier. IMAP4 (Internet (ou Interactive ?) Mail (ou Message ?) Access Protocol version 4) en est une alternative.

MUA, MTA, MDA et cetera

Un peu de jargon :

Récapitulons

Lorsque l'on rédige un courrier et qu'on le poste, on le fait avec le MUA qui le transmet au MTA qu'on lui a signalé dans la configuration (pour nous, abonnés Wanadoo, c'est normalement smtp.wanadoo.fr). C'est l'étape 1 du petit schéma.

De MTA en MTA, le message voyage jusque sur le MTA qui a en charge la messagerie du domaine du destinataire (étape 2). Il le passe alors (avec tous les autres messages entrant pour ce domaine) au MDA qui distribue ce courrier entrant dans les boîtes aux lettres concernées (étape 3). 

Les étapes 4, 5 et 6 concernent le serveur POP (ou IMAP)

Dans les entrailles de l'e-mail

D'abord, en français on ne dit pas "e-mail", ni "mail"; on dit "mèl" (je t'envoie un mèl, tu m'envoies un mèl, on s'envoie des mèls), on peut dire également "courriel". Mais, pour la bonne compréhension du texte, je continuerai à écrire "e-mail".

Lorsque vous recevez un e-mail, votre MUA (maintenant qu'on sait ce que c'est) vous montre:

Mais votre e-mail contient toute une partie "cachée" qui nous permet de savoir quel chemin cet e-mail a suivi pour arriver dans votre boîte aux lettres.

Cette partie, appelée l'en-tête, n'est pas "top secret", bien que non visible par défaut. Vous pouvez toujours la consulter avec votre MUA. Pour Outlook Express: Ouvrez le message, puis "Fichier/Détails/Source du message".

Prenons un exemple :

Return-Path: <christian.caleca@wanadoo.fr>
Received: from alisier.w-n-doo.fr (smtp-rt-9.w-n-doo.fr [193.252.19.55])
          by mail.monaco.net (Pro-8.9.3/Pro-8.9.3) with ESMTP id SAA07439
for <eme13@enprovence.com>; Thu, 11 May 2000 18:20:10 +0200
Received: from mahonia.w-n-doo.fr (193.252.19.58) 
          by alisier.w-n-doo.fr; 11 May 2000 18:20:08 +0200
Received: from CHRIS (62.161.101.240) 
          by mahonia.w-n-doo.fr; 11 May 2000 18:19:51 +0200
Message-ID: <000501bfbb64$afc796c0$0a00a8c0@maison.mrs>
From: "Christian CALECA" <christian.caleca@w-n-doo.fr>
To: <eme13@enprovence.com>
Subject: test itineraire
Date: Thu, 11 May 2000 18:19:24 +0200
MIME-Version: 1.0
Content-Type: text/plain;
charset="iso-8859-1"
Content-Transfer-Encoding: 8bit
X-Priority: 3
X-MSMail-Priority: Normal
X-Mailer: Microsoft Outlook Express 5.00.2919.6600
X-MimeOLE: Produced By Microsoft MimeOLE V5.00.2919.6600
Status: 

Juste pour analyser l'en-tête

Toute la partie en gras constitue ce que l'on appelle l'en-tête, alors que la dernière ligne, le message lui-même, s'appelle le corps.

Note :
Pour éviter de faire la partie trop belle aux robots renifleurs d'adresses e-mails, certains noms de domaines ont été volontairement dégradés.

Détail de l'en-tête

Tous les mots finis par ":" sont des champs qui ont une signification particulière, soit pour les MTA, soit pour les MUA. Nous allons détailler leur signification.

Return-Path:

C'est l'adresse qui sera utilisée:
  • Pour la réponse (la fonction répondre à l'expéditeur)
  • Le renvoi du message s'il ne peut arriver au destinataire.

Received:

Cette ligne est un peu particulière. Chaque MTA qui reçoit le message y incrit le nom du MTA qui le lui a envoyé, ainsi que le sien. Il est ainsi possible de retracer complètement la route qu'a suivi le message de l'expéditeur jusqu'au destinataire.

Message-ID:

C'est un identifiant unique du message. Il est attribué par le premier MTA qui reçoit le message (Protocole ESMTP: Extended SMTP).

From:

C'est l'adresse de l'expéditeur. Elle est par défaut recopiée dans le "return path", sauf configuration différente du MUA de l'expéditeur.

To:

C'est l'adresse du (ou des) destinataire(s)

Subject:

L'objet du message

Date:

La date d'émission écrite par le MUA de l'émetteur

MIME-Version:

Version du mode de codage des données. Cette information a tellement d'importance que nous allons y consacrer toute une page.

Content-Type:

Type de codage utilisé.

charset=

Jeu de caractères utilisé.

Content-Transfer-Encoding: 

Codage sur 7 ou 8 bits.

X-...

Tous les champs commençant par X ne sont pas des champs "officiels". CHaque MUA est libre d'en ajouter autant qu'il veut. Leur contenu n'est pas pris en compte par les MTA. Ainsi, il est illusoire de croire que le champ X-Priority ait une quelconque importance dans la vitesse de transport du message.
Cette liste de champs n'est pas complète. Il y en aurait pour  trois pages à les énoncer tous... 

Utilité de l'en-tête

L'en-tête contient donc toutes les informations nécessaires pour:


Vertus et défauts de SMTP

Ce protocole a la vertu d'être particulièrement "solide", mais il est un peu ancien et il lui manque quelques fonctionnalités qui seraient bien utiles aujourd'hui:

Ces deux limites peuvent être contournées:

Nous allons tout de même faire deux où trois observations utiles, pour comprendre mieux comment il faut configurer son MUA pour être lu correctement.

Les divers codages utilisant MIME

Bien que le codage des données soit traité plus en détail ailleurs sur ce site, voyons tout de même rapidement quelques points importants.

Pour illustrer ceci, nous allons envoyer des messages avec Outlook Express et nous allons les lire avec un outil rustique sous Linux : l'outil "mail". Cet outil fonctionne en mode texte. Plus rustique, vous n'aurez que Telnet.

Codage "Aucun" ou "plain/text"

C'est-à-dire pas de codage particulier pour le texte. On envoie ce message:

iso

Et l'on récupère ceci :

konsole

C'est correct. L'en-tête indique que le contenu est du texte de type "plain text" encodé sur 8 bits, avec un jeu de caractères "iso-8859-1". Comme vous pouvez le constater, le texte est parfaitement lisible. Il y a cependant un problème potentiel en voie de disparition: La plupart des MTA utilisent un protocole ESMTP qui gère l'ASCII sur 8 bits, mais il peut encore exister çà et là des vieux MTA qui mettront systématiquement le bit7 à 0. Le problème devrait aujourd'hui être rarissime. Dans ce cas, la seule solution est d'utiliser des caractères du code ASCII US, sans aucune lettre accentuée.

Codage: "quoted printable"

Outlook express propose ce mode en "texte brut". Essayons pour voir...

quoted

Ben c'est pas terrible; les lettres accentuées sont curieusement codées...

konsole

En fait, dans ce mode de codage,  les caractères qui peuvent être codés sur 7 bits sont transmis normalement, ceux qui ne le peuvent pas (bit 7 à 1) sont remplacés par "=" et la valeur du code ASCII sur 8 bits exprimé en hexadécimal.

A ne pas utiliser donc, si le destinataire ne dispose pas d'outil sachant décoder du "quoted printable".

Codage "base 64"

Outlook Express propose également ce mode de codage, lorsque l'on choisit le "texte brut". On essaye...

codage

C'est catastrophique. Mail ne sait pas du tout décoder le message...

konsole

Aucun caractère n'est lisible.

Le codage HTML

Enfin, le meilleur pour la fin, le message en HTML.

Je ne voudrais pas ici déclencher une polémique inextinguible sur ce sujet brûlant... Mais rappelons les faits.

Le texte pur, c'est bien, mais c'est de la génération de "edit", "notepad" et autres "vi". Autrement dit, aucun enrichissement possible du texte. Il peut pourtant être utile de rédiger ses messages avec quelques possibilités des traitements de texte, comme les notions de gras, italique, souligné, mise en sur brillance etc. D'où l'idée d'écrire ses messages en HTML qui sait faire tout çà.

Mais voyons ce que cela donne :

html

Ici, pas de copie d'écran, tellement le résultat est long:

From christian.caleca@w-n-doo.fr  Thu May 11 09:00:46 2000
Return-Path: <christian.caleca@w-n-doo.fr>
Delivered-To: chris@gateway2.maison.mrs
Received: from chris (chris.maison.mrs [192.168.0.10])
	by gateway2.maison.mrs (Postfix) with SMTP id DB2D51BAAF
	for <chris@gateway2.maison.mrs>; Thu, 11 May 2000 09:00:46 +0200 (CEST)
Message-ID: <003501bfbb16$8a226dd0$0a00a8c0@maison.mrs>
From: "Christian CALECA" <christian.caleca@w-n-doo.fr>
To: <chris@gateway2.maison.mrs>
Subject: codage HTML
Date: Thu, 11 May 2000 09:00:06 +0200
MIME-Version: 1.0
Content-Type: multipart/alternative;
L'extension MIME indique ici que le message va être codé en deux parties,
de manière différente pour les deux parties...
	boundary="----=_NextPart_000_0031_01BFBB27.4D9A74F0"
Avec une balise que l'on aura du mal à confondre 
avec le texte du message, quel qu'il soit.
X-Priority: 3
X-MSMail-Priority: Normal
X-Mailer: Microsoft Outlook Express 5.00.2919.6600
X-MimeOLE: Produced By Microsoft MimeOLE V5.00.2919.6600
C'est un message de format MIME en plusieurs parties.
------=_NextPart_000_0031_01BFBB27.4D9A74F0  Première balise
Content-Type: text/plain;
	charset="iso-8859-1"
Content-Transfer-Encoding: 8bit
Ici, c'est ce qu'on fait de mieux:
éèàçùî
Cette première partie a été codée  de façon basique, 
celle qui, normalement, doit fonctioner avec n'importe quel MUA, nous l'avons vu.
------=_NextPart_000_0031_01BFBB27.4D9A74F0  Deuxième balise
Content-Type: text/html;
	charset="iso-8859-1"
Content-Transfer-Encoding: quoted-printable Mais, ce n'est pas un bon choix...
Le "plain text" est à utiliser, même dans le codage HTML"
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML><HEAD>
<META content=3D"text/html; charset=3Diso-8859-1" =
http-equiv=3DContent-Type>
<META content=3D"MSHTML 5.00.2919.6307" name=3DGENERATOR>
<STYLE></STYLE>
</HEAD>
<BODY bgColor=3D#ffffff>
<DIV><FONT face=3DArial size=3D2>Ici, c'est ce qu'on fait de =
mieux:</FONT></DIV>
<DIV><FONT face=3DArial size=3D2>=E9=E8=E0=E7=F9=EE</FONT></DIV>
<DIV>&nbsp;</DIV></BODY></HTML>
Tout ceci est du jargon HTML. Simple ici, parce qu'il n'y a aucune fioriture!
Ce paragraphe aurait été beaucoup plus long, si l'on avait mis des couleurs,
Des tailles de polices différentes, et surtout un fond de papier.
------=_NextPart_000_0031_01BFBB27.4D9A74F0--  Dernière balise.
Notez qu'Outlook Express, malgré tout le mal que l'on peut en dire ici où là , a la politesse de créer un paragraphe qui sera lisible par tout MUA.

Alors, pourquoi le HTML est-il proscrit par la netiquette ? 

Conclusions

Voilà. Vous ne pourrez plus dire maintenant que vous ne saviez pas pourquoi il fallait  faire attention au codage de vos messages :-)


Accueil ] [ Suivante ]