Consulta on-line a subcorpora do CRPC - programa CONCOR

E-mail Imprimir PDF

Estão disponíveis para consulta on-line os seguintes subcorpora do CRPC, na sua totalidade e também parcialmente, de acordo com a sua constituição interna.
Para pesquisar o corpus de Português Europeu clique aqui
Para pesquisar o corpus Africa clique aqui

Corpora de Português Europeu

1) ELAN Corpus : 2.840.552 palavras

ELAN Corpus (ELAN - European Language Activity Network)

corpus_ELAN

Nº de palavras

 (jornal_ELAN)

1.878.156

 (livrotec_ELAN)

510.562

(revista_ELAN)

262.465

 (varia_ELAN)

189.356

  Total

2.840.552

2) RL Corpus: 8.670.438 palavras

 

Corpus não anotado RL (Recursos Linguísticos para o Português: um corpus e instrumentos para a sua consulta e análise)

Corpus

Nº de palavras

  (corpus_oral_RL)

105.964

 (corpus_escrito_RL)

8.564.474

  (jornal RL)

4.097.868

 (livrolit RL)

1.792.590

 (livrotec RL)

1.440.625

(revista RL)

420.792

  (varia RL)

812.599

Total (oral + escrito)

8.670.438

3) ELAN + RL Corpora: 11.405.026 palavras

 

Corpus ELAN (ELAN - European Language Activity Network) + Corpus não anotado RL (Recursos Linguísticos para o Português: um corpus e instrumentos para a sua consulta e análise)

Corpus Anotado de Português Europeu

corpus_RL_ELAN

Nº de palavras

 (jornal_RL_ELAN)

5.976.024

 (livrotec_RL_ELAN)

1.951.187

 (revista_RL_ELAN)

683.257

 (varia_RL_ELAN)

1.001.955

4) Corpus RL anotado: 501.042 palavras (manual de anotação)

Corpus anotado RL (Recursos Linguísticos para o Português: um corpus e instrumentos para a sua consulta e análise)

Corpus de Variedades Africanas do Português

 (corpus_anotado_RL)

Nº de palavras

 (jornal_anotado_RL)

336.151

 (revista_anotado_RL)

25.908

 (livro_anotado_RL)

125.434

 (varia_anotado_RL)

13.549

 Total

501.042



Anotação manual

Também é possível consultar separadamente os ficheiros que foram codificados automaticamente, sem revisão manual (Ex.: jornal_anot_auto_RL) e os ficheiros que foram revisados manualmente (ex.: jornal_anot_rev_man_RL):

 (jornal_anot_auto_RL)

184.418

 (livro_anot_auto_RL)

60.344

 (revista_anot_auto_RL)

18.914

 (varia_anot_auto_RL)

8.273

 

 (jornal_anot_rev_man_RL)

184.131

 (livro_anot_rev_man_RL)

63.264

 (revista_anot_rev_man_RL)

15.328

 (varia_anot_rev_man_RL)

8.319

Para consultar uma palavra no corpus etiquetado, pedir o lema ou lexis e tag, (Ex conta/nc; conta/vpi)

5) AFRICA Corpus: 3.000.000 palavras 

AFRICA Corpus (Linguistic Resources for the Study of African Varieties of Portuguese)

Países

Corpus Oral

Corus Escrito

Angola

27.363

613.495

Cape Verde

25.413

612.120

Guinea-Bissau

25.016

615.404

Mozambique

26.166

615.297

Sao Tome e Principe

25.287

614.563

Total

129.245

3.070.879

Total dos dois corpora

 

3.070.879

 


Para pesquisar os corpora de português europeu :

 


Para pesquisar o corpus ÁFRICA:


Última atualização em Qua, 13 de Outubro de 2010 11:58  


Formulário de Login