Wanwisa Khanaraksombat

Utvärdering av ett automatgenererat svensk-thailändskt elektroniskt lexikon

Sammanfattning


Att byta land och lära sig ett nytt språk är en genomgripande process, där ålder, utbildning och modersmål spelar stor roll. En viktig och självklar del av lärandet av ett nytt språk är ordinlärning. Det finns många tänkbara teknologiska hjälpmedel som stöder språkinlärning, men vid inlärning av ett nytt språk spelar lexikon en stor roll. För många thailändare som bosätter sig i Sverige blir det särskilt svårt för dem att lära sig svenska, eftersom det inte finns något bra lexikon som stöd. För att förstå svenska ord är de tvungen att gå omvägen via engelska vilket är tidskrävande. Att på ett effektivt sätt använda lexikon kräver stor språklig medvetenhet, det vill säga medvetenhet om hur ett språk är uppbyggt och kunskap om de vanligaste grammatiska termerna. Detta bidrar till att lexikonanvändningen av många språkinlärare upplevs som svår.

Språkteknologi är en teknologi som har stor potential att hjälpa människor vid språkinlärning och med hjälp av språkteknologi kan man utveckla elektroniska lexikon som stöd för andraspråksinlärare. På KTH CSC har man utvecklat en prototyp (testversion) för ett svensk–thailändskt elektroniskt lexikon. Lexikonet omfattar över 20 000 ord och är automatgenererat från ett svensk-engelskt lexikon och ett thailändskt engelskt lexikon. Det går att söka på både svenska och thailändska och även de engelska översättningarna.

Syftet med detta examensarbete har varit att utvärdera användbarheten hos det svensk-thailändska lexikonet och studera på vilket sätt lexikon kan hjälpa och underlätta för andraspråksinlärare vid inlärning av språket, samt att hitta alternativa lösningar för att kunna utveckla ett användarcentrerat användargränssitt för lexikonet. Utvärderingen genomfördes genom empirisk testning med användare, observationer och gruppintervju. Inspelningar av samtal gjordes under användartesten och gruppintervjuerna.

Resultatet av denna undersökning visar att det som diskuteras mest under testuppgifter är lexikala ämnen. Det vill säga att lexikonet användes mycket av deltagarna under testet. Detta är en indikation på hur viktigt det är att ha ett lexikon som hjälpmedel för andraspråksinlärare vid språkinlärning.

Gällande lexikonets användbarhet så finns det en del brister såsom gränssnitt, antal träffar, översättningar och exempelmeningar som behöver åtgärdas.

När det gäller informationen som visas i lexikonet bör förbättringar i gränssnittet göras. Informationen måste visas tydligare, t.ex. information som om ett substantiv är utrum eller neutrum. Ordförklaringar och exempelmeningar måste finnas tillgängliga och förklaras på ett enkelt sätt för språkinlärare. I lexikonet finns det olika exempelmeningar på de två språken. Detta hjälper inte nybörjare så mycket när det gäller inlärning. Kvalitén på översättningarna måste förbättras. Just nu översätter lexikonet fel ibland. Dessutom föreslår lexikonet ibland många förslag till ett visst ord. Detta gör det svårt för språkinlärare att veta vilket ord som är rätt att använda.

Slutligen ges några rekommendationer för hur lexikonet skall kunna vidareutvecklas för att bli mer användbart och lättanvänt.

 

Evaluation of an automatically generated Swedish-Thai Electronic Lexicon

Abstract

To relocate to another country and learn a new language is a difficult process in which age, education and mother tongue are very important. Vocabulary learning is obviously an important part of learning the new language. Although there are many innovative technologies to aid in learning a new language, a lexicon is still an essential tool. For Thai people who live in Sweden, learning Swedish is difficult since a good Swedish-Thai lexicon does not exist. In order to understand Swedish vocabulary, an English dictionary has to be used as an alternative tool that is a time consuming process. To use a lexicon effectively some knowledge of the language, such as the general grammatical structure of the language and grammar terms, is necessary to have. These conditions may cause difficulties for a learner who wants to use a lexicon.

Language technology has the potential to aid people in learning languages. With the support of language technology, an electronic lexicon can be developed as a tool for a second-language learner. At the Royal Institute of Technology (KTH), the School of Computer Science and Communication (CSC), a prototype (test version) of a Swedish-Thai electronic lexicon has been developed. This lexicon contains more than 20,000 words, and it is automatically generated from a Swedish-English lexicon and a Thai-English lexicon. It is possible to search the lexicon by using Swedish, Thai or even English words.

The main objective of this thesis is to evaluate the usability of the Swedish-Thai lexicon and to investigate how a lexicon can help second-language learners learning the language. This study also aims at investigating new alternative solutions to improve and make the interface of the lexicon more user-centered. The evaluation was carried out through empirical testing with users, observations and group interviews. Recordings of conversations have also been conducted during the usability tests and group interviews.

The results show that the subject being discussed most during this investigation is lexical episodes. This implies that the lexicon has been used heavily during the test, and that a lexicon is an important tool for second-language learners. On the other hand, the usability of the lexicon still contains some problems: the interface, the quality of the translations, the number of search results, the information presented for search results and the example sentences need to be improved.

Interface improvements include the information that is shown on the side of the main information. The information needs to be made clearer, for example if a noun is in non-neuter or neuter gender. Word explanations and example sentences need to be available and explained in an easy way for a language learner. The example sentences do not help the beginner much in language learning because the lexicon has different example sentences for the two languages. The quality of the translations needs to be improved. Presently, the lexicon translations are sometimes erroneous. Furthermore, the lexicon sometimes suggests many different translations of a word. This makes it hard for second-language learners to know which one is appropriate to use.

Finally a few recommendations are presented, as to how the lexicon could be further developed in order to become more useful and easier to use.