Kort introduktion till GATE/SVENSK

Fredrik Olsson
fredriko@sics.se

Parsrarna som ni ska använda på laborationen i parsning (lab 2) är delar av något som kallas ParserBox. ParserBox är en samling parsrar skrivna för att illustrera olika tekniker inom parsning i undervisningssyfte. Parsrarna, som är skrivna i SICStus Prolog, kan antingen köras "som vanligt" i prologinterpretatorn eller via ett fönsterbaserat gränssnitt som utgörs av GATE (General Architecture for Text Engineering). ParserBox ingår som en del i ett projekt kallat SVENSK som genomförs på SICS och syftar till att samla språkteknologisk mjukvara under ett och samma tak. Det här dokumentet innehåller information om hur du använder ParserBox i GATE/SVENSK.


Extern information

Det mesta av informationen om GATE finns på väven, varav en del listas nedan;


Innan du startar GATE första gången

Innan du startar GATE första gången behöver du kopiera en fil som heter .gate.props och som finns i katalogen

   /afs/nada.kth.se/info/spraktek98/GATE/parserbox/.gate.props
till roten din hemkatalog.

Observera att om du har använt GATE tidigare så är det säkrast att spara eventuella andra versioner av .gate.props under nytt namn för att undvika att förlora information om andra GATE-baserade system.


Att använda ParserBox i GATE

Ställ dig i roten av din hemkatalog och starta GATE genom att köra skriptet mygate:
    % /afs/nada.kth.se/info/spraktek98/GATE/mygate &
Fönstret du får upp ser ut någonting så här:



Välj sedan foldern SVENSK följd av ParserBox. Ett nytt fönster dyker upp, det ser ut ungefär så här:



Välj Open i File-menyn. Dialogrutan som kommer fram ser ut ungefär så här:



Välj den samling du vill använda genom att markera den i den övre rutan. Välj sedan det dokument som parsrarna ska ha som indata i den nedre rutan. Klicka på Open Single Document. Parsrarna i ParserBox är nu klara att användas.

Om du inte fick fram några samlingar i dialogrutan ovan så måste du skapa en egen samling, information om hur man gör det finns i GATE User's Guide i avsnittet om "Creating Collections". Källtexterna som du ska använda till din samling finns i katalogen /afs/nada.kth.se/info/spraktek98/GATE/parserbox/pbox-collection-source.



En ikon kan vara orange, grön, vit eller röd. Den är

I figuren ovan har Toknizer exekverats, ParserBox: Top-Down kan köras men användaren har valt ParserBox: Bottom-Up istället. Som du kan se i figuren så har ParserBox: Bottom-Up en fylligare ram än de två andra ikonerna; när en ikon har valts (som du ser på att den har fylligare ram) så kan du i menyn Options välja alternativet Module Parameters. I dialogrutan som dyker upp (och som är inklippt i figuren) kan du ge alternativa argument till den valda modulen (om några sådana finns specificerade). I fallet med parsrarna i exemplet kan du välja mellan att spåra (trace) eller inte spåra parserns processande av indata.

Om du väljer att spåra parsern kommer ett xterm-fönster upp med SICStus Prolog laddad och klar. Spårningen går således till som vanligt i Prolog. Observera att ingen information kommer att bli sparad om hur parsningen av indata gick om spårningsalternativet är valt. Programmet som startar parsern använder findall/3 för att hitta samtliga analyser av indata, detta medför att inte alla delar av spårningen av en parser är relevant. Den relevanta delen av spårningen är den mellan det första anropet till findall och uthoppen ur det på samma nivå.

Om du väljer att inte spåra parsern kan du, efter att parsern har processat indata klart, vänsterklicka på modulen för att få en meny där du kan välja att titta på utdata genom att välja ParserBox-Analys. Alla exekverade moduler har en mängd sätt att visa utdata och för att hitta dem kan du antingen vänsterklicka på modulen och välja ett alternativ ur menyn, eller också kan du välja något av alternativen under menyn View i övre delen av fönstret.



En modul kan nollställas genom att du högerklickar på den och väljer Yes i dialogrutan som dyker upp.

Egna samlingar

Information om hur du kan skapa egna samlingar till parsrarna finns i användarhandledningen till GATE. Dessa saker bör du iaktta när du gör samlingar och dokument till ParserBox:


^ Till instruktionerna för lab 2.

Sidansvarig: Fredrik Olsson <fredriko@sics.se>