|
|
Sobre a WordNet.PT
A WordNet.PT é uma base de dados de conhecimento linguístico do Português, desenvolvida
no Centro de Linguística da Universidade de Lisboa pelo CLG-Grupo de
Computação do Conhecimento Léxico-Gramatical, sob a direcção
e a coordenação científica de
Palmira Marrafa e contando com o apoio científico do coordenador da
EuroWordNet,
Piek Vossen, bem como de Christiane Fellbaum,
responsável, juntamente com George Miller,
pela WordNet de Princeton, a "mãe"
de todas as wordnets.
A base de dados, que é susceptível de ser utilizada em várias áreas
da Linguística Computacional e da Engenharia da Linguagem, tais como tradução automática, sistemas de busca e de extracção de informação, sistemas periciais, aplicações para o ensino do Português, entre outras, está organizada de acordo com o modelo geral da EuroWordNet, uma base de dados multilingue que integra wordnets de várias línguas europeias.
Uma wordnet é uma rede léxico-conceptual estruturada em torno de um conjunto de relações que a investigação tem vindo a demonstrar corresponder à organização mental do significado lexical.
O significado de uma dada unidade é deduzido da sua posição relativa na rede, de acordo com o complexo de relações especificadas, sendo a restante informação - glosas e etiquetas, nomeadamente - de carácter complementar.
A unidade básica de uma wordnet é o conceito. Cada conceito corresponde a um nó da rede e é representado pelo conjunto das expressões lexicais que lhe correspondem, sejam elas atómicas ou complexas.
A actual versão da WordNet.PT contém cerca de 19000 expressões,
repartidas por vários campos semânticos. O fragmento agora disponibilizado inclui
expressões relativas a vários subdomínios, tais como arte,
geografia, instituições, saúde, seres vivos,
transportes e vestuário.
|
|