Antonyms in Context : A Corpus-Based Semantic Analysis of Swedish Descriptive Adjectives

Sammanfattning: Popular Abstract in Swedish Antonymer är motsatsord, t.ex. stor-liten, kort-lång, och varm-kall. Den här avhandlingen handlar om antonymer och om vilken typ av lexikal information som man kan lagra i ett elektroniskt lexikon (Svenskt Ordnät) samt hur man kan få fram lexikal information ur stora textmassor med datorns hjälp. Baserat på hur vanliga ord är kan man beräkna hur ofta man kan förvänta sig att finna två ord i samma mening under antagandet att alla ord i en textmassa är slumpmässigt fördelade. Antonymer förekommer ofta i samma mening, oftare än förväntat under nyss nämna antagande. Det har tidigare visats för engelska, och motsvarande resultat för svenska presenteras i denna bok. Men det finns många anledningar till att ord samförekommer, det är ju naturligt att använda ord som är närbesläktade när man pratar om ett visst ämne. I en text som handlar om svensk husmanskost hittar man ord som är relaterade till mat, råvaror och tillagningsmetoder och man skulle bli förvånad om man råkade på t.ex. ordet dieselaggregat. På samma vis förväntar man sig inte att hitta ordet kroppkakor i en bilmanual. Ord som ligger nära varandra i betydelse samförekommer också oftare än förväntat under antagandet att alla ord i en textmassa är slumpmässigt fördelade. Motsatsord som inte är riktiga antonymer, t.ex. slapp-kraftfull, samförekommer i samma mening i genomsnitt 1.45 gånger oftare än förväntat. Dock visar det sig att antonyma ordpar samförekommer betydligt oftare, i genomsnitt 3.12 gånger oftare än förväntat. Vad innebär nu detta? Varför samförekommer antonymer? Det har föreslagits att samförekomst av antonymer är en förutsättning för inlärning av antonyma relationer mellan ord. Resultaten i denna bok varken bevisar eller motbevisar detta, men det finns andra särdrag som effektivare framhäver den starka relationen mellan antonymer. I de flesta meningar där antonymer samförekommer står orden i parallella grammatiska konstruktioner, t.ex. den snabbaste användaren-den långsammaste användaren. I boken föreslås att intonationen utgör en starkare markör: att de samförekommande orden är särskilt framhävda med intonationens hjälp, så kallad fokal accent. Om man räknar ut hur många gånger oftare än förväntat alla adjektivpar samförekommer och sorterar dem fallande, så visar det sig att bland det första 100 ordparen är majoriteten antonymer. De ordpar bland dessa 100 som inte är antonymer har andra starka betydelserelationer, t.ex. synonymi. Detta är användbar information för till exempel en lexikograf. Adjektiv kännetecknas av att de bestämmer substantiv, dvs. ger ytterligare information om ett substantiv, t.ex. ny bil. Vanligtvis bestämmer ett adjektiv bara vissa typer av substantiv; ett ord som storvuxen bestämmer oftast levande väsen som människor och djur, t.ex. en storvuxen karl, en storvuxen katt. I ett traditionellt lexikon anges endast betydelsen av ett ord, men i ett datorbaserat lexikon kan man lagra betydligt mer information, t.ex. vilka typer av substantiv ett adjektiv bestämmer och till och med specifika substantiv som ofta bestäms av ett specifikt adjektiv. De typer av substantiv ett adjektiv bestämmer utgör dess semantiska räckvidd. Semantisk räckvidd kan användas då man vill avgöra om två ord har samma betydelse eller ej. För att två ord ska vara synonymer måste deras semantiska räckvidd stämma överens; detsamma gäller för antonymer. I en fallstudie av full och tom beskrivs och jämförs ordens semantiska räckvidd baserat på material från textkorpusen Parole. Det visar sig att full har mycket vidare semantisk räckvidd än tom, och att de överlappar endast i de fall då full modifierar olika typer av behållare, t.ex. en korg full med frukt. Men full används också i konstruktioner som full poäng och full sysselsättning, där full bestämmer substantiv som tom inte kan bestämma. I dessa fall finns det ingen behållare vare sig i konkret eller abstrakt bemärkelse utan snarare en sorts "måttstock" eller "mätsticka" där motsatsen till full snarare är ingen eller låg. Man kan också uttrycka motsatsen till full i "måttstocksbetydelsen" med suffixen -fri och -lös, t.ex. poänglös och benfri. Full och tom är alltså antonymer i en betydelse, "behållarbetydelsen", medan full även används i betydelsen "mycket" på en mätsticka. Ytterligare en fallstudie visar hur man kan använda semantisk räckvidd för att gruppera synonymer efter betydelse. Stor och 28 synonymer till stor grupperades med denna metod. Det visar sig att stor används i fyra olika betydelser: (1) om konkret storlek, t.ex. ett stort hus, (2) om viktiga personer eller händelser, t.ex. den store arkitekten, den stora nyheten, (3) om mätbara kvantiteter, t.ex. de stora barnkullarna, ett stort avstånd, och (4) om icke mätbara kvantiteter, t.ex. stort allvar, det stora äventyret. Man brukar anta att den vanligaste användningen av ett ord och det första man lär sig är dess kärnbetydelse, i detta fall betydelse (1) om konkret storlek. Oväntat visade materialet att stor oftast användes om mätbara och icke mätbara kvantiteter. En studie av barns tidiga användning av stor visar dock att de uteslutande använder stor i betydelse (1); den högfrekventa användningen av stor i betydelse (3) och (4) beror förmodligen på att materialet inte är riktigt representativt för det svenska språket. De 28 synonymerna till stor grupperades sedan runt ovanstående fyra betydelser baserat på respektive semantisk räckvidd. Orden kodades i Svenskt Ordnät baserat på resultaten. Avhandlingen beskriver vilken typ av information som man kan koda i ett datorbaserat lexikon samt hur man kan utvinna denna information ur stora textmassor. Genom de olika fallstudierna får man också inblick i olika ords beteende, t.ex. att de samförekommer oväntat ofta med andra specifika ord och framför allt med substantiv från olika semantiska kategorier. Detta är nyttig information då man vill skapa ett lexikon eller analysera en text. Vissa delar av avhandlingen är även intressant ur ett språkinlärningsperspektiv.

  KLICKA HÄR FÖR ATT SE AVHANDLINGEN I FULLTEXT. (PDF-format)