A face quantitativa da linguagem: um dicionário de freqüências do português
O Dicionário de Freqüências do léxico do português brasileirocontemporâneo baseou-se num corpus de língua escrita, variedade brasileirade 5 milhões de palavras (1950 a 1990). Alguns resultados quantitativos:apenas 42.212 unidades léxicas diferentes totalizaram os 5 milhões de ocorrênciasdo corpus, e...
Autor principal: | |
---|---|
Formato: | info:eu-repo/semantics/article |
Lenguaje: | Portugués |
Publicado: |
UNESP
2001
|
Materias: | |
Acceso en línea: | https://periodicos.fclar.unesp.br/alfa/article/view/4049 http://biblioteca-repositorio.clacso.edu.ar/handle/CLACSO/64492 |
_version_ | 1782336951596089344 |
---|---|
author | Biderman, Maria Tereza Camargo |
author_facet | Biderman, Maria Tereza Camargo |
author_sort | Biderman, Maria Tereza Camargo |
collection | Repositorio |
description | O Dicionário de Freqüências do léxico do português brasileirocontemporâneo baseou-se num corpus de língua escrita, variedade brasileirade 5 milhões de palavras (1950 a 1990). Alguns resultados quantitativos:apenas 42.212 unidades léxicas diferentes totalizaram os 5 milhões de ocorrênciasdo corpus, excluídos topónimos e antropônimos. Os dados estatísticosdo dicionário registram altíssima freqüência das palavras instrumentais(artigos, preposições, pronomes, conjunções etc.) bem como de verbos auxiliarese modalizadores. O mesmo ocorre com palavras de significação muito geral, arquilexemas, altamente polissêmicos. Na vertente oposta estão as palavras de baixa freqüência sobretudo os hapax legomena, que contribuemmaciçamente para o total de 42.212 lexias registradas neste corpus. De fato,as palavras de baixa freqüência totalizam grande parte desse index verborum;caso contrário, o repertório vocabular seria muito menor. A categoria substantivo contribui com a maioria de vocábulos que ocorreram apenas uma vez no corpus, assim como os tecnicismos da linguagem científica. O vocabulário jornalístico é o mais neutro e o menos temático, constituindo uma espéciede média entre os outros gêneros de linguagem. |
format | info:eu-repo/semantics/article |
id | clacso-CLACSO64492 |
institution | CLACSO, Repositorio Digital |
language | Portugués |
publishDate | 2001 |
publisher | UNESP |
record_format | greenstone |
spelling | clacso-CLACSO644922022-03-18T19:04:04Z A face quantitativa da linguagem: um dicionário de freqüências do português Biderman, Maria Tereza Camargo Lexicoestatística dicionário de freqüências hapax legomena index verborum vocabulário multiuso O Dicionário de Freqüências do léxico do português brasileirocontemporâneo baseou-se num corpus de língua escrita, variedade brasileirade 5 milhões de palavras (1950 a 1990). Alguns resultados quantitativos:apenas 42.212 unidades léxicas diferentes totalizaram os 5 milhões de ocorrênciasdo corpus, excluídos topónimos e antropônimos. Os dados estatísticosdo dicionário registram altíssima freqüência das palavras instrumentais(artigos, preposições, pronomes, conjunções etc.) bem como de verbos auxiliarese modalizadores. O mesmo ocorre com palavras de significação muito geral, arquilexemas, altamente polissêmicos. Na vertente oposta estão as palavras de baixa freqüência sobretudo os hapax legomena, que contribuemmaciçamente para o total de 42.212 lexias registradas neste corpus. De fato,as palavras de baixa freqüência totalizam grande parte desse index verborum;caso contrário, o repertório vocabular seria muito menor. A categoria substantivo contribui com a maioria de vocábulos que ocorreram apenas uma vez no corpus, assim como os tecnicismos da linguagem científica. O vocabulário jornalístico é o mais neutro e o menos temático, constituindo uma espéciede média entre os outros gêneros de linguagem. 2001-02-12 2022-03-18T19:04:04Z 2022-03-18T19:04:04Z info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion https://periodicos.fclar.unesp.br/alfa/article/view/4049 http://biblioteca-repositorio.clacso.edu.ar/handle/CLACSO/64492 por https://periodicos.fclar.unesp.br/alfa/article/view/4049/3713 Copyright (c) 2001 ALFA: Revista de Linguística application/pdf UNESP ALFA: Revista de Linguística; v. 42 - Especial (1998): O estado da arte nas ciências do léxico: lexicologia, lexicografia e terminologia 1981-5794 |
spellingShingle | Lexicoestatística dicionário de freqüências hapax legomena index verborum vocabulário multiuso Biderman, Maria Tereza Camargo A face quantitativa da linguagem: um dicionário de freqüências do português |
title | A face quantitativa da linguagem: um dicionário de freqüências do português |
title_full | A face quantitativa da linguagem: um dicionário de freqüências do português |
title_fullStr | A face quantitativa da linguagem: um dicionário de freqüências do português |
title_full_unstemmed | A face quantitativa da linguagem: um dicionário de freqüências do português |
title_short | A face quantitativa da linguagem: um dicionário de freqüências do português |
title_sort | face quantitativa da linguagem: um dicionário de freqüências do português |
topic | Lexicoestatística dicionário de freqüências hapax legomena index verborum vocabulário multiuso |
url | https://periodicos.fclar.unesp.br/alfa/article/view/4049 http://biblioteca-repositorio.clacso.edu.ar/handle/CLACSO/64492 |