Estão disponíveis para consulta on-line os seguintes subcorpora do CRPC, na sua totalidade e também parcialmente, de acordo com a sua constituição interna.
Para pesquisar o corpus de Português Europeu clique aqui.
Para pesquisar o corpus Africa clique aqui.
Corpora de Português Europeu
1) ELAN Corpus : 2.840.552 palavras
ELAN Corpus (ELAN - European Language Activity Network)
|
corpus_ELAN |
Nº de palavras |
|
(jornal_ELAN) |
1.878.156 |
|
(livrotec_ELAN) |
510.562 |
|
(revista_ELAN) |
262.465 |
|
(varia_ELAN) |
189.356 |
|
Total |
2.840.552 |
2) RL Corpus: 8.670.438 palavras
Corpus não anotado RL (Recursos Linguísticos para o Português: um corpus e instrumentos para a sua consulta e análise)
| Corpus |
Nº de palavras |
|
(corpus_oral_RL) |
105.964 |
|
(corpus_escrito_RL) |
8.564.474 |
|
(jornal RL) |
4.097.868 |
|
(livrolit RL) |
1.792.590 |
|
(livrotec RL) |
1.440.625 |
|
(revista RL) |
420.792 |
|
(varia RL) |
812.599 |
|
Total (oral + escrito) |
8.670.438 |
3) ELAN + RL Corpora: 11.405.026 palavras
Corpus ELAN (ELAN - European Language Activity Network) + Corpus não anotado RL (Recursos Linguísticos para o Português: um corpus e instrumentos para a sua consulta e análise)
Corpus Anotado de Português Europeu
|
corpus_RL_ELAN |
Nº de palavras |
|
(jornal_RL_ELAN) |
5.976.024 |
|
(livrotec_RL_ELAN) |
1.951.187 |
|
(revista_RL_ELAN) |
683.257 |
|
(varia_RL_ELAN) |
1.001.955 |
4) Corpus RL anotado: 501.042 palavras (manual de anotação)
Corpus anotado RL (Recursos Linguísticos para o Português: um corpus e instrumentos para a sua consulta e análise)
Corpus de Variedades Africanas do Português
|
(corpus_anotado_RL) |
Nº de palavras |
|
(jornal_anotado_RL) |
336.151 |
|
(revista_anotado_RL) |
25.908 |
|
(livro_anotado_RL) |
125.434 |
|
(varia_anotado_RL) |
13.549 |
|
Total |
501.042 |
Anotação manual
Também é possível consultar separadamente os ficheiros que foram codificados automaticamente, sem revisão manual (Ex.: jornal_anot_auto_RL) e os ficheiros que foram revisados manualmente (ex.: jornal_anot_rev_man_RL):
|
(jornal_anot_auto_RL) |
184.418 |
|
(livro_anot_auto_RL) |
60.344 |
|
(revista_anot_auto_RL) |
18.914 |
|
(varia_anot_auto_RL) |
8.273 |
|
(jornal_anot_rev_man_RL) |
184.131 |
|
(livro_anot_rev_man_RL) |
63.264 |
|
(revista_anot_rev_man_RL) |
15.328 |
|
(varia_anot_rev_man_RL) |
8.319 |
Para consultar uma palavra no corpus etiquetado, pedir o lema ou lexis e tag, (Ex conta/nc; conta/vpi)
5) AFRICA Corpus: 3.000.000 palavras
AFRICA Corpus (Linguistic Resources for the Study of African Varieties of Portuguese)
|
Países |
Corpus Oral |
Corus Escrito |
|
Angola |
27.363 |
613.495 |
|
Cape Verde |
25.413 |
612.120 |
|
Guinea-Bissau |
25.016 |
615.404 |
|
Mozambique |
26.166 |
615.297 |
|
Sao Tome e Principe |
25.287 |
614.563 |
|
Total |
129.245 |
3.070.879 |
|
Total dos dois corpora |
|
3.070.879 |
Para pesquisar os corpora de português europeu :
Para pesquisar o corpus ÁFRICA:




