Academic journal article Literator: Journal of Literary Criticism, comparative linguistics and literary studies

Development of an Afrikaans Wordnet: Methodology and integration/Ontwikkeling Van 'N Afrikaanse Woordnet: Metodologie En Integrasie

Academic journal article Literator: Journal of Literary Criticism, comparative linguistics and literary studies

Development of an Afrikaans Wordnet: Methodology and integration/Ontwikkeling Van 'N Afrikaanse Woordnet: Metodologie En Integrasie

Article excerpt

Abstract

The Afrikaans wordnet is a lexical-conceptual network in the form of an electronic lexical database, developed at the North-West University. In this article, a methodology for a semi-automatic construction of the entries--so-called synonym sets--is investigated. Firstly, a background is given on the nature of a wordnet, as well as "WordNet", on which it is based. Other wordnets, as well as applications of wordnets, are also discussed here. Next, the macrostructure of a wordnet in terms of its integration and compatibility with other wordnets is investigated, arter which the proposed methodology is presented with a discussion of the results. Finally, a projection is made to the integration of the Afrikaans wordnet with other resources, which include "WordNet" and an Afrikaans lexical database, called ALEXANDER.

Key concepts:

Afrikaans WordNet ALEXANDER database wordnet construction wordnet integration

Opsomming

Die Afrikaanse woordnet is 'n leksikaal-konseptuele netwerk in die vorta van 'n elektroniese leksikale databasis wat aan die Noordwes-Universiteit ontwikkel is. In hierdie artikel word 'n metodologie vit 'n semi-outomatiese konstruksie ran die inskrywings--sogenaamde sinoniemstelle--bekyk. Daar word eers 'n agtergrond gegee oor wat 'n woordnet is, sowel as oor "Word Net" waarop dit gebaseer is. Ander woordnette, sowel as toe passings van woordnette, word ook bespreek. Daar word voorts gekyk na die makrostruktuur van 'n woordnet in terme van sy integrasie en verenigbaarheid met ander woordnette, waarna die voorgestelde metodologie voorgele en die resultate bespreek word. Laastens is daar 'n vooruitskouing van die integrasie van die Afrikaanse woordnet met ander bronne, waaronder "WordNet" en 'n Afrikaanse leksikale databasis genaamd ALEXANDER.

Kernbegrippe:

Afrikaanse woordnet ALEXANDER-databasis woordnetintegrasie woordnetkonstruksie

1. Inleiding

Die Afrikaanse woordnet is 'n leksikale databasis, befonds deur die Departement van Wetenskap en Tegnologie en ontwikkel aan die Noordwes-Universiteit. Hierdie artikel is gebaseer op 'n deel van die databasis wat voorlopig afgehandel is en wat bestaan uit 5 041 inskrywings. Figuur 1 vertoon 'n paar addisionele statistieke. Tydens die skrywe hiervan is die woordnet in die proses om uitgebrei te word na 10 068 inskrywings. In hierdie artikel word 'n metodologie vir 'n semi-outomatiese konstruksie van die inskrywings, sogenaamde sinoniemstelle, bekyk waarna 'n vooruitskouing volg op die integrasie van die Afrikaanse woordnet met ander bronne. In die volgende afdeling word eers besin oor wat 'n woordnet is, raet verwysing na WordNet waarop dit gebaseer is, ander woordnette en enkele toepassings.

2. WordNet/woordnet--wat is dit?

'n Woordnet is 'n leksikaal-konseptuele netwerk in die vorm van 'n elektroniese databasis. Die prototipe is WordNet (Fellbaum, 1998), wat in die vroee negentigerjare aan die Princeton universiteit (VSA) as 'n psigolinguistiese model van die mentale leksikon ontwikkel is. WordNet is 'n nuttige verwysingsbron, en blyk ook nuttig vir tegnieke in natuurliketaalprosessering soos byvoorbeeld woordbetekenisvereenduidiging (Morato et al., 2004:273-274). Tydens die skryf van hierdie artikel bevat die nuutste weergawe van WordNet, WordNet 3.0, reeds 117 659 inskrywings.

2.1 Struktuur van WordNet

WordNet is deels gebaseer op teoriee uit die relasionele leksikale semantiek (vgl. Mel'cuk, 1996 en Evens, 1988), waar betekenis verteenwoordig word deur netwerke van nodusse wat bestaan uit woorde of woordgroepe wat aan mekaar verbind is. In WordNet, en by uitbreiding natuurlik die Afrikaanse woordnet, word so 'n nodus verteenwoordig deur 'n sogenaamde sinoniemstel (Engels: synonym set, of kortweg, synset). 'n Sinoniernstel is dus 'n groep sinonieme wat saam een konsep verteenwoordig. Hierdie sinoniemstelle word dan deur semantiese verhoudings verbind om een groot netwerk te vorm. …

Search by... Author
Show... All Results Primary Sources Peer-reviewed

Oops!

An unknown error has occurred. Please click the button below to reload the page. If the problem persists, please try again in a little while.