WordNet.PT
sobre a WordNet.PT
consultar a WordNet.PT
publicações
ficha técnica
contactos
 

Sobre a WordNet.PT

A WordNet.PT é uma base de dados de conhecimento linguístico do Português, desenvolvida no Centro de Linguística da Universidade de Lisboa pelo CLG-Grupo de Computação do Conhecimento Léxico-Gramatical, sob a direcção e a coordenação científica de Palmira Marrafa e contando com o apoio científico do coordenador da EuroWordNet, Piek Vossen, bem como de Christiane Fellbaum, responsável, juntamente com George Miller, pela WordNet de Princeton, a "mãe" de todas as wordnets.

A base de dados, que é susceptível de ser utilizada em várias áreas da Linguística Computacional e da Engenharia da Linguagem, tais como tradução automática, sistemas de busca e de extracção de informação, sistemas periciais, aplicações para o ensino do Português, entre outras, está organizada de acordo com o modelo geral da EuroWordNet, uma base de dados multilingue que integra wordnets de várias línguas europeias.

Uma wordnet é uma rede léxico-conceptual estruturada em torno de um conjunto de relações que a investigação tem vindo a demonstrar corresponder à organização mental do significado lexical.

O significado de uma dada unidade é deduzido da sua posição relativa na rede, de acordo com o complexo de relações especificadas, sendo a restante informação - glosas e etiquetas, nomeadamente - de carácter complementar.

A unidade básica de uma wordnet é o conceito. Cada conceito corresponde a um nó da rede e é representado pelo conjunto das expressões lexicais que lhe correspondem, sejam elas atómicas ou complexas.

A actual versão da WordNet.PT contém cerca de 19000 expressões, repartidas por vários campos semânticos. O fragmento agora disponibilizado inclui expressões relativas a vários subdomínios, tais como arte, geografia, instituições, saúde, seres vivos, transportes e vestuário.

© CLG