(Text från stordia till föredrag på Sunet-möte
1994-09-28.)
Peter Svanberg, NADA, KTH
<psv@nada.kth.se>
MIME och ESMTP
Utvecklingsstegen
Kort introduktion
Konsekvenser av övergång Situationen i Sverige
"Internet News"
Framtiden
Först: Brevformatet RFC 822 och kommunikationsprotokollet SMTP (RFC
821)
Behov av icke-ASCII-tecken i brev framfördes
Andra behov: program, dokument, ljud, bild, video
En IETF-arbetsgrupp bildades
Uppdelning på två grupper
Standardförslag: MIME del 1 och 2, utökning av RFC 822;
ESMTP, utökning av SMTP
"News"-världen: ännu inget färdigt förslag
Utökning av standarden för ett datorbrevs format (RFC 822)
Innehållstypmärkning, typer:
Text, med teckenkodsangivelse; liten mängd teckenkoder att välja
bland
Flerdelat (multi-part), varje del har valfri typ
Alternativa delar - olika representationer av samma data
Delbrev - uppdelning av långa brev på flera, med automatisk
hopsättning hos mottagaren
Externt brevinnehåll - innehållet finns någon
annanstans, t.ex. FTP-hämtbart
Brev, dvs. ett brev inuti ett brev
Bilddata
Ljuddata
Videodata
Andra binära data - program, ODA, PostScript m.m. Kanske
också
Text med modernare texthantering (Text/enriched), fetstil, kursiv stil,
styckeshantering osv.
Behövs vid transport av "åttabitstext" på sjubitsledning och
alltid vi transport av binärdata
"Quoted-printable "-kodning: Alla höga oktetter kodas med
treteckensekvens: "=" <hex><hex>.
Exempel: Olle J=E4rnefors
"Base-64 "-kodning: Kodning av binärdata med hjälp av en
begränsad teckenrepertoar (ungefär som uuencode). Exempel:
Pj9DREhXb+vQv7y7uby/w
Date: Fri, 23 Sep 1994 09:15:47 +0200 (MET DST)
From: Peter Svanberg <psv@nada.kth.se>
To: =?ISO-8859-1?Q?Olle J=E4rnefors?= <ojarnef@admin.kth.se>
Cc: Peter Svanberg <psv@nada.kth.se>
Subject: MIME-exempelbrev
Mime-Version: 1.0
Content-Type: Multipart/Mixed;
boundary=":---------------:"
--:---------------:
Content-Type: TEXT/PLAIN; charset=ISO-8859-1
Content-Transfer-Encoding: quoted-printable
Detta =E5r ett meddelande, med =C5, =C4 samt =D6 inuti.=
Dessutom har jag skickat med
en fil.
--:---------------:
Content-Type: TEXT/PLAIN; charset=US-ASCII; name=".login"
Content-Transfer-Encoding: BASE64
Content-ID: <Pine.SUN.3.90.940923091547.351C@staff.nada.kth.se>
Content-Description: Min .login-fil
Iw0KZWNobyAiQm9yamFuIHBhIC5sb2dpbjogdGVybT0kdGVybS4iDQojDQpp
ZiAoIC1lIC91c3IvbG9jYWwvZXRjL25hZGFza2VsLy5sb2dpbiApIHRoZW4N
:
:
LnNoDQpjYWxlbmRhciAtYyBudW1lcm8gMyB8IGNtLWZpbHRlci5zaA0K
--:---------------:--
Utökning av transportprotokollet för datorbrev (RFC 821):
Avsändarparten kan få information om mottagarpartens kompetens
via kommandot "EHLO" (istället för "HELO")
Viktigast för oss: "8BITMIME"-kompetens = MIME-brev med
transportkodning "8bit" kan skickas
Gamla SMTP-hanterare ska svara "okänt kommando"
Saknar mottagarparten "8BITMIME"-kompetens måste avsändarparten
utföra transportkodning Skickning av höga oktetter utan
ESMTP-koll är förbjudet men förekommer flitigt ändå.
Gäller främst namn och "subject"
Åttabitsdata alltid transportkodade
Krångligt format - eftergift för bakåtkompatibilitet vad
gäller tillåtna tecken i brevhuvudfält Exempel:
From: =?ISO-8859-1?Q?Olle_J=E4rnefors?= <ojarnef@admin.kth.se>
Brevtexten kunde tidigare visas orörd; måste nu tolkas .
Engelskspråkiga användare och andra som klarar sig med ASCII:
helt bakåtkompatibel förändring.
Vi som "illegalt" använt icke-ASCII: bakåtinkompatibelt.
Först: bara svensk sjubitskod
Senare: Ibland PC- och Mac-teckenkoder
Nu: Ofta Latin-1-teckenkoden
Får omärkta eller MIME-märkta åttabitsbrev utan
transportkodning och ser EDV edv istället för ÅÄÖ
åäö
Får MIME-märkta brev med "Quoted-Printable"-transportkodning
och ser =E5=E4=F6 =C5=C4=D6 istället för ÅÄÖ
åäö
Får omärkta svenska brev och ser ][/ }{| istället för
ÅÄÖ åäö
Får klagomål om oläslighet från personer de skickat
brev till
Problemen är ungefär desamma som för datorpost.
Standardförslag saknas, utkast till utökning av textformatet
finns.
MIME har börjat användas ändå, utan transportkodning
- EDV-problem i Sverige.
Utökning av protokollet NNTP ej aktuellt.
Kan vi lätt se till att "åttabitstext" kan skickas
oförstörd i News-världen? (Diskussion i MIME-brevlista september
-94.)
Då folk börjar använda mer exotiska tecken än
ÅÄÖ räcker Latin-1-koden inte långt. Exempelvis
saknas samiska tecken.
Experiment med teckenkoden UCS (ISO 10646/Unicode) pågår. Politiska
problem.
Kataloguppslagning med nya Internet-protokollet "whois++".
RFC 1521: N. Borenstein, N. Freed, MIME (Multipurpose Internet Mail
Extensions) Part One: Mechanisms for Specifying and Describing the Format of
Internet Message Bodies , 1993-09-23.
RFC 1522: K. Moore, MIME (Multipurpose Internet Mail Extensions) Part Two:
Message Header Extensions for Non-ASCII Text , 1993-09-23.
RFC 1651: J. Klensin, N. Freed, M. Rose, E. Stefferud, D. Crocker, SMTP
Service Extensions , 1994-07-18.
RFC 1652: J. Klensin, N. Freed, M. Rose, E. Stefferud, D. Crocker, SMTP
Service Extension for 8bit-MIMEtransport , 1994-07-18.
(sunet-mime-intro Ar1 940929 PSv),
<psv@nada.kth.se>