Como consultar o corpus?
O programa CONCOR, de consulta do corpus, permite ao utilizador definir vários parâmetros na sua consulta:
"Palavras a procurar"^
O CONCOR permite pesquisar uma forma lexical ou uma lista de formas lexicais que ocorrem no corpus. Para tal, as formas a pesquisar devem ser introduzidas na caixa "Palavras a procurar".
Azul
ou
Azul
Amarelo
Verde
ou
Azul Amarelo Verde
O CONCOR permite também pesquisar todas as formas flexionadas de um vocábulo (lemas) que ocorrem no corpus. É necessário para tal: 1) introduzir na caixa a forma canónica (correspondente à entrada de dicionário - infinitivo dos verbos, masculino singular dos substantivos e adjectivos, etc.) e 2) activar a opção "Palavras são consideradas como lemas".
Assim, a introdução da palavra "bonito" na caixa respectiva, com a opção de pesquisa de lema activada, permite obter concordâncias ou frequências das formas "bonito", "bonita", "bonitos", "bonitas", "bonitinho", etc. Pelo contrário, caso a opção de pesquisa de lemas não seja seleccionada, o CONCOR apenas fornece resultados para a forma "bonito".
É possível pesquisar ao mesmo tempo formas e lemas, incluídos numa lista. Para tal, utilize o sinal _ antes das palavras para as quais quer ver negada a opção seleccionada.
Neste caso, serão obtidas concordâncias ou frequências de todas as formas dos lemas ler e bonito e apenas da forma escreva.
Caso disponha de um ficheiro com a lista de palavras que pretende procurar, pode copiar essa lista e colá-la na caixa respectiva.
Nota: É possível que, ao pesquisar um lema, os resultados obtidos não incluam algumas formas desse lema (nomeadamente, formas verbais com clíticos, diminutivos, etc.), uma vez que o lematizador está em aperfeiçoamento.
Concordâncias ou frequências^
O CONCOR permite obter dois tipos de resultados:
- concordâncias: conjunto dos contextos em que as formas lexicais ocorrem no corpus. Essas formas são sempre apresentadas no centro do contexto.
- frequências: informação sobre a frequência com que as formas lexicais ocorrem no corpus. Os resultados podem ser apresentados por ordem alfabética ou por ordem numérica decrescente das frequências.
Ordenação ^
As concordâncias podem ser ordenadas alfabeticamente pelas formas do lema que se procura ou pelas palavras que ocorrem à sua esquerda ou à sua direita. As opções de ordenação são expressas por algarismos, por exemplo:
0
ordenação pela palavra a procurar
1
ordenação pela 1ª palavra à direita
2
ordenação pela 2ª palavra à direita
-1
ordenação pela 1ª palavra à esquerda
-2
ordenação pela 2ª palavra à esquerda
etc.
É possível utilizar combinações, como por exemplo:
1, -2 ordenação pela primeira palavra à direita e, em segundo nível, pela segunda palavra à esquerda
Antecedem a ordem alfabética todos os algarismos, sinais de pontuação e outros diacríticos, separados, por espaço, da forma pedida.
Nº de linhas do contexto^
Por defeito, o CONCOR fornece um contexto com uma linha antes e uma linha depois da palavra a pesquisar. No entanto, a dimensão do contexto pode ser definida pelo utilizador:
0
uma linha de contexto com a palavra a pesquisar centrada
1
uma linha antes e uma linha depois da palavra a pesquisar
etc
até 5 linhas antes e depois da palavra a pesquisar.
Excepto na opção 0, é fornecida informação sobre: a frequência da forma/lema pedida; o número de ordem de ocorrência no corpus, de acordo com a ordenação seleccionada; o código da referência bibliográfica.
Nº de colunas (caracteres) do contexto^
Na opção 0, a linha de contexto tem por defeito 80 caracteres. Pode, no entanto, definir-se uma linha maior, dando indicação do número de caracteres pretendido: 100, 124, etc...
Nº de colunas (caracteres) da referência ^
Quando, para "Nº de linhas do contexto", se escolhe um contexto de uma linha (0), é necessário preencher esta opção para obter informação sobre o código da referência bibliográfica.