| |
COMBINATÓRIAS LEXICAIS DO PORTUGUÊS
Manual do Utilizador
1. Que tipo de expressões constam da base de dados?
-
Os resultados que se apresentam não têm como objectivo serem uma listagem de expressões fixas funcionalmente equivalentes a uma palavra, isto é, não foram aqui exclusivamente tratadas as locuções de várias categorias morfo-sintácticas, aforismos ou outras expressões fixas do português. Pelo contrário, interessou-nos recolher diversos tipos de expressões, com diversos tipos de composição e diversos graus de fixidez (desde a fixidez total encontrada, por exemplo, nas expressões aforísticas, até expressões semi-fixas e, ainda, expressões não composicionais e não lexicalizadas que apontam para associações lexicais preferenciais). Deste modo, o termo combinatória é, aqui, utilizado em sentido lato, na medida em que engloba diferentes tipos de associações de palavras.
-
Os resultados obtidos apresentam, assim, expressões de diversos tipos:
a) expressões aforísticas, que são geralmente consideradas como totalmente fixas, mas que no corpus podem ocorrer com grande variação (no poupar é que está o ganho; no prejuízo é que está o ganho; no atacar é que está o ganho; no economizar é que está o ganho; etc.);
b) expressões idiomáticas sintacticamente fixas, mas com possível variação flexional de um ou mais elementos (esfregar as mãos de contentamento; esfregou as mãos de contentamento; esfregavam as mãos de contentamento; esfrega-se as mãos de contentamento);
c) expressões idiomáticas ou composionais que admitem alguma variação lexical (onda/vaga/maré de assaltos; fazer/desenvolver/estabelecer/encetar contactos);
d) casos de locuções prepositivas (ao abrigo de; em consequência de), conjuntivas (a fim de que; da mesma forma que), adverbiais (por acaso) ou, ainda, de regência verbal (abdicar de; abater-se sobre);
e) associações lexicais preferenciais, i.e., semanticamente composicionais e sem fixidez sintáctica, mas com valores estatísticos combinatoriais muito significativos, bem como uma frequência muito alta, que podem indicar não só uma preferência associativa, mas também uma possível lexicalização progressiva do grupo de palavras (instaurar um processo; cessar funções; erros e imprecisões; absolutamente indispensável);
f) expressões sintagmáticas ou frásicas ao nível do discurso, com uso frequente (francamente não sei; para ser franco; as consequências estão à vista; uma coisa garanto).
-
As combinatórias apresentadas correspondem às combinatórias existentes no corpus estudado. É por este motivo que se pode observar a existência de grupos como "assim se vê a força do PC", que apenas ocorre 2 vezes no corpus, enquanto "assim se vê a força do PSD" ocorre 6 vezes, devido à cobertura jornalística de um comício em que foi usada a expressão em relação ao PSD. Estes dados contrariam, assim, o conhecimento dos falantes do Português sobre esta expressão política.
-
Foram seleccionadas 48.154 combinatórias e criados 14.153 lemas de grupo e 1202 lemas principais.
2. De que modo foram organizadas as combinatórias?
A lematização dos grupos fez-se em dois níveis:
(i) num primeiro nível, é identificada uma forma abstracta que permite reunir possíveis variantes flexionais dos grupos sob um mesmo identificador. As combinatórias lexicais, sendo co-ocorrências preferenciais ou sequências (semi-)fixas, mostram tendência para ocorrer apenas nalgumas das formas possíveis de um lema. Daí que este processo não corresponda inteiramente ao processo conhecido como lematização, uma vez que se respeitou as combinatórias nas formas em que ocorrem;
(ii) num segundo nível, é identificado o lema principal da combinatória. A combinatória é lematizada de acordo com o lema a partir do qual é trabalhada, não estando, assim, associada a todos os lemas das formas que nele ocorrem.
Por exemplo, posto de abastecimento e postos de abastecimento estão ambos associados ao lema de grupo POSTO DE ABASTECIMENTO. Por sua vez, este lema de grupo está associado ao lema ABASTECIMENTO, mas não ao lema POSTO, dado ter sido tratada a forma abastecimento e não posto. Apresenta-se, abaixo, um exemplo da organização dos lemas principais, dos lemas de grupo e das suas concordâncias (contextos extraídos do corpus).
LEMA PRINCIPAL
CONCORDÂNCIAS
num "Honda Civic", assaltaram o posto de abastecimento "Galp", i
riação, com carácter urgente, do posto de abastecimento. Há dez d
comercial portuguesa. Num outro posto de abastecimento local, os
, disse ao JN um dos clientes do posto de abastecimento. Mais far
carem-se propositadamente ao seu posto de abastecimento. Mas já h
ssaltaram, anteontem à noite, um posto de abastecimento "Mobil",
assim, o funcionário de um outro posto de abastecimento na zona d
Vilar Formoso, que dispõe de um posto de abastecimento, o gasóle
e abrigo que não têm telefone, o posto de abastecimento, o que po
, afectado significativamente os postos de abastecimento localiza
de adição decorrer nos próprios postos de abastecimento, mas à r
das autoridades em controlar os postos de abastecimento. Mas que
igando ao encerramento de alguns postos de abastecimento. Nas Ast
onível na esmagadora maioria dos postos de abastecimento, pelo me
o. As entidades exploradoras dos postos de abastecimento que, à d
Para mais informações sobre a constituição do corpus e o método de extracção e de selecção das combinatórias, por favor consulte a página principal do projecto.
3. Quais foram os critérios de lematização utilizados?
-
As formas verbais que ocorrem numa combinatória são lematizadas no infinitivo, mesmo se a combinatória apenas ocorrer numa forma verbal (vai abaixo --> ir abaixo). É feita uma excepção para as situações em que a combinatória ocorre num tempo ou modo verbal específicos, como acontece com as indicações das receitas culinárias (leve ao forno; bata as gemas com o açúcar) ou com outras recomendações (consulte o seu médico).
-
No que respeita a combinatórias que contenham particípios passados, estes mantêm-se como particípios, na forma em que ocorreram (questões abordadas --> questões abordadas). Contudo, sempre que haja variação em género, será escolhido o masculino (comandadas pelo general; comandados pelo general --> comandados pelo general) e sempre que haja variação em número, será escolhido o singular (assunto abordado; assuntos abordados --> assunto abordado). Se houver variação em género e número, será escohido o masculino singular.
-
Quando uma combinatória apresenta variação nos determinantes que ocorrem, opta-se, sempre que possível, pela forma menos específica (abandono dos animais; abandono de animais --> abandono de animais).
-
Em combinatórias de tipo nominal, normalmente, omite-se o artigo (o ar abafado --> ar abafado), exceptuando-se as situações em que tal não é natural (o absurdo da situação --> o absurdo da situação).
-
Num grupo nominal com variação em género e/ou número, as forma nominais e adjectivais no lema de grupo serão o masculino singular (conselheira de consumo; conselheiro de consumo; conselheiros de consumo --> conselheiro de consumo ; valor absoluto; valores absolutos --> valor absoluto). Caso não haja variação mantém-se a forma que ocorreu.
-
No caso de ocorrer alguma variação lexical significativa que não é recuperável através de duas combinatórias diferentes, as variantes são registadas no lema de grupo, através de barras (sessão/reunião plenária; fazer/desenvolver/estabelecer/encetar contactos ).
-
Quando uma das posições da combinatória é de preenchimento livre, são utilizados elementos lexicais indefinidos no lema de grupo, em maiúsculas (abandonar ALGUÉM à sua sorte).
-
No caso de ocorrerem palavras homónimas, de classes morfo-sintácticas diferentes, são estabelecidos diferentes lemas principais, com diferente numeração (conjunto1: conjunto alargado vs. conjunto2: esforço conjunto).
-
Quando a combinatória ocorre em duas ordens diferentes, essa informação é mantida em dois lemas de grupo distintos (tema abordado --> tema abordado; abordado o tema --> abordado o tema ).
-
Quando uma combinatória ocorre quer contiguamente quer separada por um elemento (possessivos, advérbios), é, normalmente, estabelecido um só lema, que corresponderá ao grupo contíguo (conhecimento aprofundado; conhecimento muito aprofundado --> conhecimento aprofundado). Contudo, se os dois grupos forem muito frequentes ou se o advérbio for lexicalmente significativo, pode justificar-se a criação de dois lemas de grupo (estar em consonância --> estar em consonância; estar em perfeita consonância --> estar em perfeita consonância).
-
Foram tidos em conta os Índices de Combinatória (IC) e a frequência de ocorrência dos grupos como critérios de selecção e de exclusão. Deste modo, foram seleccionadas somente as combinatórias com IC igual ou superior a 5, a não ser que tivessem uma frequência igual ou superior a 10.
-
Na apresentação dos resultados, não é dada informação sobre o grau de fixidez da combinatória. Isto deve-se ao facto de ser extremamente difícil e moroso estabelecer o grau de fixidez destes grupos por estarem a ser tratadas essencialmente combinatórias lexicais, isto é, associações de palavras em vias de lexicalização.
-
Esta é uma primeira versão. Os resultados online serão progressivamente actualizados.
4. Como é que se podem consultar os resultados?
-
Os resultados são apresentados em vários ficheiros html, por ordem alfabética.
-
Cada linha do ficheiro contém informação sobre uma combinatória e o lema a partir
do qual foi tratada. (Na linha, aparece em primeiro lugar o lema principal e
depois o lema do grupo da combinatória.)
-
Ao cliquar sobre uma linha, abre-se uma janela com as concordâncias da combinatória,
isto é, com os contextos em que esta ocorreu no corpus.
Clique nas letras seguintes para pesquisar as combinatórias:
Contactos
Pode enviar sugestões e comentários para o seguinte endereço: combinatorias AT clul.ul.pt
|
|