Pesquisa

Início :: Projectos
Pesquisa do corpus - Programa CONCOR

Corpus a consultar:

Palavras a procurar (separadas por espaço ou linha, tudo à frente de # é ignorado):
Ajuda
Palavras são consideradas como lemas (menos as que começam por _ )

Concordâncias Frequências por ordem alfabética Frequências por ordem numéricaAjuda

Ordenação (ex: 0,1,-2): Ajuda

Nº de linhas do contexto (0 dá uma linha por contexto): Ajuda

Nº de colunas do contexto: Ajuda     Nº de colunas da referência: Ajuda


Pesquisa do corpus anotado - Programa CONCOR_ANOT

Corpus a consultar:

Palavras a procurar (separadas por espaço ou linha, tudo à frente de # é ignorado):
Ajuda
Palavras são consideradas como lemas (menos as que começam por _ )

Concordâncias Frequências por ordem alfabética Frequências por ordem numéricaAjuda

Ordenação (ex: 0,1,-2): Ajuda

Nº de linhas do contexto (0 dá uma linha por contexto): Ajuda

Nº de colunas do contexto: Ajuda     Nº de colunas da referência: Ajuda


Como consultar o corpus?
O programa CONCOR, de consulta do corpus, permite ao utilizador definir vários parâmetros na sua consulta:

"Palavras a procurar"  ^
O CONCOR permite pesquisar uma forma lexical ou uma lista de formas lexicais que ocorrem no corpus. Para tal, as formas a pesquisar devem ser introduzidas na caixa "Palavras a procurar".

Azul
  ou  
Azul
Amarelo
Verde
  ou  
Azul  Amarelo  Verde


O CONCOR permite também pesquisar todas as formas flexionadas de um vocábulo (lemas) que ocorrem no corpus. É necessário para tal:
1) introduzir na caixa a forma canónica (correspondente à entrada de dicionário - infinitivo dos verbos, masculino singular dos substantivos e adjectivos, etc.) e
2) activar a opção "Palavras são consideradas como lemas".
exemplo
Assim, a introdução da palavra "bonito" na caixa respectiva, com a opção de pesquisa de lema activada, permite obter concordâncias ou frequências das formas "bonito", "bonita", "bonitos", "bonitas", "bonitinho", etc. Pelo contrário, caso a opção de pesquisa de lemas não seja seleccionada, o CONCOR apenas fornece resultados para a forma "bonito". É possível pesquisar ao mesmo tempo formas e lemas, incluídos numa lista. Para tal, utilize o sinal _ antes das palavras para as quais quer ver negada a opção seleccionada.
exemplo
Neste caso, serão obtidas concordâncias ou frequências de todas as formas dos lemas ler e bonito e apenas da forma escreva. Caso disponha de um ficheiro com a lista de palavras que pretende procurar, pode copiar essa lista e colá-la na caixa respectiva.

Nota: É possível que, ao pesquisar um lema, os resultados obtidos não incluam algumas formas desse lema (nomeadamente, formas verbais com clíticos, diminutivos, etc.), uma vez que o lematizador está em aperfeiçoamento.

Concordâncias ou frequências  ^
O CONCOR permite obter dois tipos de resultados:
- concordâncias: conjunto dos contextos em que as formas lexicais ocorrem no corpus. Essas formas são sempre apresentadas no centro do contexto.
- frequências: informação sobre a frequência com que as formas lexicais ocorrem no corpus. Os resultados podem ser apresentados por ordem alfabética ou por ordem numérica decrescente das frequências.

Ordenação   ^
As concordâncias podem ser ordenadas alfabeticamente pelas formas do lema que se procura ou pelas palavras que ocorrem à sua esquerda ou à sua direita. As opções de ordenação são expressas por algarismos, por exemplo:

0
ordenação pela palavra a procurar
1
ordenação pela 1ª palavra à direita
2
ordenação pela 2ª palavra à direita
-1
ordenação pela 1ª palavra à esquerda
-2
ordenação pela 2ª palavra à esquerda
etc.
É possível utilizar combinações, como por exemplo:
1, -2 ordenação pela primeira palavra à direita e, em segundo nível, pela segunda palavra à esquerda

Antecedem a ordem alfabética todos os algarismos, sinais de pontuação e outros diacríticos, separados, por espaço, da forma pedida.

Nº de linhas do contexto  ^
Por defeito, o CONCOR fornece um contexto com uma linha antes e uma linha depois da palavra a pesquisar. No entanto, a dimensão do contexto pode ser definida pelo utilizador:

0
uma linha de contexto com a palavra a pesquisar centrada
1
uma linha antes e uma linha depois da palavra a pesquisar
etc
até 5 linhas antes e depois da palavra a pesquisar.
Excepto na opção 0, é fornecida informação sobre: a frequência da forma/lema pedida; o número de ordem de ocorrência no corpus, de acordo com a ordenação seleccionada; o código da referência bibliográfica.

Nº de colunas (caracteres) do contexto  ^
Na opção 0, a linha de contexto tem por defeito 80 caracteres. Pode, no entanto, definir-se uma linha maior, dando indicação do número de caracteres pretendido: 100, 124, etc...

Nº de colunas (caracteres) da referência  ^
Quando, para "Nº de linhas do contexto", se escolhe um contexto de uma linha (0), é necessário preencher esta opção para obter informação sobre o código da referência bibliográfica.


[topo]



Imprimir

  2012  •  CLUL - Centro de Linguística da Universidade de Lisboa  •   Copyright   •  Webmaster  •   Contactos   •  Design: Plasma