KTH-NADA-bild

Internet - utveckling och användning

Kai­Mikael Jää­Aro
Interaktions­ och Presentationslaboratoriet
Institutionen för Numerisk Analys och Datalogi
Kungliga Tekniska Högskolan



Timesharing

I begynnelsen var en dator en stor och dyr koloss som bara kunde användas av en person i taget.

Med tidsdelningstekniker kunde flera användare sitta vid varsin terminal och dela på en och samma dator.



Elektronisk post

I och med att flera användare, som kanske var geografiskt vitt spridda, befann sig på samma dator, uppstod behovet att kommunicera, utnyttjande datorn.

Man kom snabbt på idén att lagra filer på en speciell plats och använda speciella program för att placera filerna där och låta de avsedda mottagarna hämta dem därifrån.

Detta kallades "datorpost" (computer mail) eller bara "post" (mail). I en senare tid har det av någon anledning kommit att kallas "elektronisk post", epost eller email.



ARPANET

Med tiden uppstod allt fler datorer i världen (= USA) och det blev alltmer intressant att förbinda dessa. Försvaret, som då liksom nu betalade stora andelar av hi-techforskningen genom ARPA (Advanced Research Projects Agency), var intresserade av att förbinda sina datorer inom SAGE m fl system, så för att forska i det såg man till att förbinda ett stort antal datorer på olika forskningsinstitut. Detta var det ursprungliga ARPANET.

Hypertext

Nu går vi tillbaka lite i historien...

As We May Think

1945 skrev presidentens vetenskaplige rådgivare Vannevar Bush en artikel om hur vi i framtiden skulle kunna samla ihop allt vi läst, korsreferera dem och bygga upp vårt eget kunskapsbibliotek och utbyta denna information med andra med en apparat han kallade memex.

Xanadu

Något senare på 1960-talet fick Ted Nelson idén att faktiskt bygga en memex med den nya fantastiska maskinen datorn. All litteratur i hela världen skulle kunna förbindas med korsreferenser. Han kallade sitt system Xanadu och dokumentstrukturen för hypertext. Han ägnade sedan resten av tiden fram till nu åt att försöka komma på den perfekta utformningen av Xanadu.

Intermedia

Andra som inte hade lika storslagna planer försökte sig på att faktiskt göra hypertextsystem och prova sig fram till hur man bäst skulle organisera dem. Intermedia var ett system som utvecklades vid Brown University. Det utnyttjade idén att själva dokumentet var skilt från länkarna, som utgjorde en egen datastruktur, en web.

Hypermedia

Hypertext handlar om att koppla samman linjär text. Man kan tänka sig att inkludera många andra typer av media i ett dokument, bilder, ljud, animationer, etc. Detta brukar kallas hypermedia.

Internet

Åter till datanäten... Med tiden blev datornäten många och mångahanda. Olika datortyper och kommunikationsprotokoll användes i de olika näten.

Två hopkopplade nät kallas ett internet. Summan av alla de hopkopplade näten, EARN, Fidonet, NSFNET, NORDUnet, osv, i hela världen kallas Internet. Från de första två maskinerna på ARPANET i slutet av 60-talet har Internet vuxit ut till hundratusentals maskiner med uppemot 50 miljoner användare - fast egentligen vet ingen hur många...

Det finns ingen som bestämmer över Internet, allt samarbete är på frivillig bas. Vissa är utsedda att organisera och se till att t ex adresser inte krockar - dessa kallas Network Information Centers och finns på olika nivåer, från det svenska SUNIC till högsta nivåns InterNIC.



Domänadresser

Om man har ett nät med kanske bara ett hundratal maskiner på går det bra att bara ange deras namn om man vill kommunicera med den maskinen. Om man vill skicka brev till en person MATSD på datorn OMEGA, anger man adressen OMEGA::MATSD, varefter ens egen dator får slå upp i en lista som talar om hur den ska nå datorn OMEGA, t ex genom att skicka via en tredje dator, som skickar vidare via en fjärde, etc..

Datorer som använde uucp-protokollet kunde utnyttja sig av !-adresser, dvs man angav helt enkelt hela den väg ens meddelande skulla ta sig, så från mig på draken till UD0PALDUNDSUVM1 kunde det bli draken!sunic!tut!santra!mcsun!uunet!aplcen!uakari.primate.wisc.edu!brutus.cs.uiuc.edu!psuvax1!psuvm!ndsuvm1.bitnet!ud0paldu.

Inga av dessa metoder var hållbara när Nätet började växa över alla bräddar. I stället utvecklades domänadresser, där alla datorer organiserades hierarkiskt enligt de organisationer de tillhörde. En adress kunde då se ut som kai@nada.kth.se. där

se
innebär att adressaten finns i Sverige
kth
innebär att den organisation adressaten tillhör har registrerat domänen kth vid sitt nationella NIC
nada
är delorganisationen, subdomänen, inom domänen kth
@
markerar att adressdelen är slut
kai
är adressatens användarnamn.
Eftersom de flesta väljer ett så självklart domännamn som möjligt (som t ex kth för KTH) så går det ofta att med några få försök luska ut vad en person har för datorpostadress om man vet var denne arbetar.

USA är som bekant = Universum, så trots att det finns en toppnivådomän us, så befinner sig de flesta organisationer i USA i domänerna edu (EDUcational = högskola), com (COMmercial = företag), org (ORGanisation = ideell organisation), m fl.

Egentligen är det här med adressering betydligt mer komplicerat än så, sinsemellan använder datorer IP-adresser, vilka ibland måste kopplas till Ethernet-adresser. Domäner delas inte ut hur som helst heller, de finns som A-, B-, och C-adresser - ingen vill ha C-adresser, ingen får A-adresser och B-adresserna håller på att ta slut. Sedan finns X.400-adresser som är jättefiffiga och officiell internationell standard och helt oanvändbara utan en X.500-databas som kan hålla reda på adressaterna åt en. Men sånt är för guruna att meditera över, för användarna räcker det att känna igen domänadresser.



Nu går vi tillbaka i tiden lite igen och ser vad Nätet använts och används till.

Mailing lists

Så fort man hade uppfunnit elektronisk post så insåg man att man ofta behövde skicka meddelanden till flera personer på en gång. Man införde då pseudoadresser som såg ut som vanliga postadresser, men som i själva verket skickade brevet till en lista med verkliga personer, som t ex FRAC-L@GITVM1.BITNET. Dessa listor utnyttjas flitigt för diskussioner om mångahanda ämnen från psykologi till fraktaler. Vadå?

Net news

Problemet med mailing-listor är att samma meddelande ofta skickas samma väg upprepade gånger om många användare i samma område tillhör mailinglistan. Dessutom kan det vara svårt att hålla reda på vilka mailinglistor som finns samtidigt som de flesta program för att läsa elektronisk post har dåligt stöd för att motta några hundra brev om dygnet.

Istället utvecklades i början på 80-talet news-protokollet. En mailinglista motsvarades här av en newsgroup. Meddelanden till en nyhetsgrupp skickas till en central plats i varje organisation där de sedan kan läsas eller hoppas över av alla som är intresserade. Alla nyhetsgrupper finns tillgängliga för bläddring så att man lätt kan välja ut dem man är intresserad av. Vid NADA finns för tillfället tillgängligt nästan 4000 nyhetsgrupper inom alla upptänkliga områden från Maraton-spel till proggpop.



FTP

Något man tidigt insåg var behovet att skicka program, datafiler, mm mellan datorer. Elektronisk post var inte riktigt lämpat för detta ändamål, utan istället använde man ftp (File Transfer Protocol). På olika ställen började man lägga upp arkiv med allmänt tillgänglig mjukvara för anonym ftp, dvs vem som helst som fanns på nätet kunde hämta filer därifrån. Dessa arkiv kan växa till gigantisk storlek men bekostas av värdarna som en service till allmänheten, eftersom de i sin tur kan dra nytta av andra arkiv. SUNET Mac-prylar PC-tjoss

Archie

Numera finns det tusentals ftp-arkiv över världen med miljontals filer. Nånstans där ute finns lösningen på mina problem, men hur hittar jag den? En grupp vid McGill University utvecklade archie. På ett antal utvalda platser finns meta-arkiv, som samlar listor över alla filer som finns på alla ftp-arkiv de känner till och med jämna mellanrum uppdaterar dessa listor. Med archie kan man sedan söka efter filer som heter något intressant och få en lista på alla kända ftp-arkiv där filer med liknande namn finns.

Wide Area Information Server

Archie söker bara på filnamnen, WAIS å sin sida indexerar innehållet i alla de filer den känner till (detta begränsar den i praktiken till enbart textfiler) och man kan alltså söka på godtyckligt nyckelord.

Gopher

Gopher utvecklades vid University of Minnesota som en enkel menybaserad metod att hitta hierarkiskt ordnade filer på nätet.

World Wide Web

Nu har vi noterat att det finns en stor mängd olika metoder att organisera, lagra och hämta information på Nätet. Alla använder de olika kommunikationsprotokoll, olika gränssnitt, ofta kommandospråksbaserade som är svåra att komma ihåg om man inte använt dem på ett tag. I början på 90-talet började folk tröttna och utvecklade olika grafiska gränssnitt till de olika verktygen, men de flesta hann aldrig få riktig spridning, för nu kom CERN in på scenen.

CERN är ett enormt forskningscenter med hundratals forskare utspridda både över själva platsen nära Genève och på deras olika heminstitutioner över hela Europa. För att lösa informationsspridningsproblemen utvecklades World Wide Web, som dels är ett protokoll för att föra över information, dels ett sätt att beskriva hypermediadokument, dels ett sätt att binda ihop alla de övriga existerande kommunikationsprotokollen med ett gemensamt gränssnitt.

Idén var god och på något år exploderade WWW-användningen. Plötsligt var nästan all information som finns i datorlagrad form tillgänglig, bara några musklick bort.



Browsers

Hur fungerar då WWW? Ja, sett ur användarens synvinkel har ni det framför er: Ett fönster med text och bilder som man kan bläddra i. Somliga element är markerade i blått och markerar länkar till något annat dokument, någon annanstans på Nätet. (Ibland är de urblekta, det betyder att man redan tittat på det dokumentet.)

Flera olika tillverkare framställer browsers. Den ursprungliga var Mosaic, den kanske mest avancerade idag är Netscape. För dem som inte har grafiska arbetsstationer finns ändå möjligheten att använda Lynx, som är ett helt textbaserat gränssnitt mot WWW.

Browsern ger i allmänhet möjlighet att titta på text och olika sorters bilder, medan mer avancerade dokumenttyper, som t ex video eller audio kan kräva att man har ytterligare andra tillämpningar och talar om för browserna att dessa ska användas för att titta på dessa andra dokumenttyper.



URLar och HTML

Alla dokument refereras till genom en Universal Resource Locator, ett generellt sätt att beskriva hur dokument hämtas, var de hämtas ifrån och hur de ska tolkas. En URL ser typiskt ut som http://www.nada.kth.se/~d90-mst/index.html.
http:
anger överföringsprotokollet, i det här fallet Hyper Text Transfer Protocol. Det kan också vara ftp: för dokument som hämtas med ftp, gopher: för gopher-dokument, news: för nyhetsgrupper, osv.
//
är en separator för att ange att det som kommer härnäst är en datoradress.
www.nada.kth.se
är den dator som lämnar ut dokumentet
~d90-mst
dokumentet finns hos användaren d90-mst
index.html
dokumentet heter index och är ett Hyper Text Markup Language-dokument.
HTML är det format i vilket vi beskriver hur våra hypermediadokument är organiserade - inte hur de ser ut eftersom vi inte kan veta vad den slutliga läsaren har för utrustning, utan precis just bara dokumentets struktur. Detta är baserat på det mer generella Standard Generalized Markup Language.

Länksamlingar

Återigen är det så att det finns miljontals WWW-sidor ute på Nätet och man behöver hjälp att hitta det man är intresserad av. För detta ändamål finns det olika söksystem, som t ex Web Crawler, program som söker på nätet efter WWW-sidor som innehåller det man är intresserad av. Open Text Corporation har indexerat till synes hela nätet...

Det finns också hierarkiskt ordnade samlingar av länkar till alla upptänkliga ämnesområden. Några av de mest populära är Planet Earth Home Page och Yahoo.

En plats jag själv ofta besöker är Unified Computer Science Technical Report Index, men det är ju inte givet att just det intresserar alla :-)

Framtiden är snart här

Utvidgningar och nya påhitt till WWW är hela tiden på väg.

HotJava är ett språk och en browser för att skicka över exekverbara objekt, program m a o, som då kan göra i princip vad som helst (icke-destruktivt) på ens skärm.

Något som fullkomligen exploderat de senaste veckorna är Virtual Reality Modelling Language som låter en hämta hela 3D-miljöer och i viss utsträckning interagera med dessa.



MBone

Det finns andra gotter på Nätet, som möjlighet till video- och/eller telefonkonferenser. CU-SeeMe 158.36.33.3 Dessa utnyttjar en del av Internet som kallas MBone (Multicast Backbone).

Alex och AFS

Informationen blir alltmer distribuerad. Med hjälp av funktioner som Alex och Andrew File System kan man hantera filer på maskiner över världen som om de fanns på ens egen.

Att själv komma ut på Nätet

Det finns gott om Internet service providers,företag som säljer förbindelser ut på nätet.

Elektroniska affärer

Flitiga innovatörer har uppfunnit digitala pengar att användas i digitala butiker.

Internet bortom lagen

Internet bryter sönder status quo på ett högst oroväckande sätt. Det finns inte längre några nationsgränser; data, och det enda som finns på Nätet är data, kan kopieras hur som hur som helst, utan hänsyn till upphovsrätt och royalties; vem som helst kan påstå vad som helst inför vilka som helst; meddelanden kan förfalskas, förvanskas och förnekas.

En del försök att åtgärda delar av detta finns. Ibland försöker sig olika organisationer på att lagföra brott mot upphovsrättslagar, tryckfrihetslagar, m m. Det är ofta tråkigt för de berörda och laglig tveksamt ibland i de fall olika lagar gäller på förövarens hemort och dataägarens hemort.

För någorlunda säker kommunikation kan man använda Pretty Good Privacy, funktioner för publik-nyckel-kryptografi.

I övrigt gäller att inte tro på allt som står i tidningen, inte ens om den är elektronisk.