A face quantitativa da linguagem: um dicionário de freqüências do português

O Dicionário de Freqüências do léxico do português brasileirocontemporâneo baseou-se num corpus de língua escrita, variedade brasileirade 5 milhões de palavras (1950 a 1990). Alguns resultados quantitativos:apenas 42.212 unidades léxicas diferentes totalizaram os 5 milhões de ocorrênciasdo corpus, e...

Descripción completa

Detalles Bibliográficos
Autor principal: Biderman, Maria Tereza Camargo
Formato: info:eu-repo/semantics/article
Lenguaje:Portugués
Publicado: UNESP 2001
Materias:
Acceso en línea:https://periodicos.fclar.unesp.br/alfa/article/view/4049
http://biblioteca-repositorio.clacso.edu.ar/handle/CLACSO/64492
_version_ 1782336951596089344
author Biderman, Maria Tereza Camargo
author_facet Biderman, Maria Tereza Camargo
author_sort Biderman, Maria Tereza Camargo
collection Repositorio
description O Dicionário de Freqüências do léxico do português brasileirocontemporâneo baseou-se num corpus de língua escrita, variedade brasileirade 5 milhões de palavras (1950 a 1990). Alguns resultados quantitativos:apenas 42.212 unidades léxicas diferentes totalizaram os 5 milhões de ocorrênciasdo corpus, excluídos topónimos e antropônimos. Os dados estatísticosdo dicionário registram altíssima freqüência das palavras instrumentais(artigos, preposições, pronomes, conjunções etc.) bem como de verbos auxiliarese modalizadores. O mesmo ocorre com palavras de significação muito geral, arquilexemas, altamente polissêmicos. Na vertente oposta estão as palavras de baixa freqüência sobretudo os hapax legomena, que contribuemmaciçamente para o total de 42.212 lexias registradas neste corpus. De fato,as palavras de baixa freqüência totalizam grande parte desse index verborum;caso contrário, o repertório vocabular seria muito menor. A categoria substantivo contribui com a maioria de vocábulos que ocorreram apenas uma vez no corpus, assim como os tecnicismos da linguagem científica. O vocabulário jornalístico é o mais neutro e o menos temático, constituindo uma espéciede média entre os outros gêneros de linguagem.
format info:eu-repo/semantics/article
id clacso-CLACSO64492
institution CLACSO, Repositorio Digital
language Portugués
publishDate 2001
publisher UNESP
record_format greenstone
spelling clacso-CLACSO644922022-03-18T19:04:04Z A face quantitativa da linguagem: um dicionário de freqüências do português Biderman, Maria Tereza Camargo Lexicoestatística dicionário de freqüências hapax legomena index verborum vocabulário multiuso O Dicionário de Freqüências do léxico do português brasileirocontemporâneo baseou-se num corpus de língua escrita, variedade brasileirade 5 milhões de palavras (1950 a 1990). Alguns resultados quantitativos:apenas 42.212 unidades léxicas diferentes totalizaram os 5 milhões de ocorrênciasdo corpus, excluídos topónimos e antropônimos. Os dados estatísticosdo dicionário registram altíssima freqüência das palavras instrumentais(artigos, preposições, pronomes, conjunções etc.) bem como de verbos auxiliarese modalizadores. O mesmo ocorre com palavras de significação muito geral, arquilexemas, altamente polissêmicos. Na vertente oposta estão as palavras de baixa freqüência sobretudo os hapax legomena, que contribuemmaciçamente para o total de 42.212 lexias registradas neste corpus. De fato,as palavras de baixa freqüência totalizam grande parte desse index verborum;caso contrário, o repertório vocabular seria muito menor. A categoria substantivo contribui com a maioria de vocábulos que ocorreram apenas uma vez no corpus, assim como os tecnicismos da linguagem científica. O vocabulário jornalístico é o mais neutro e o menos temático, constituindo uma espéciede média entre os outros gêneros de linguagem. 2001-02-12 2022-03-18T19:04:04Z 2022-03-18T19:04:04Z info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion https://periodicos.fclar.unesp.br/alfa/article/view/4049 http://biblioteca-repositorio.clacso.edu.ar/handle/CLACSO/64492 por https://periodicos.fclar.unesp.br/alfa/article/view/4049/3713 Copyright (c) 2001 ALFA: Revista de Linguística application/pdf UNESP ALFA: Revista de Linguística; v. 42 - Especial (1998): O estado da arte nas ciências do léxico: lexicologia, lexicografia e terminologia 1981-5794
spellingShingle Lexicoestatística
dicionário de freqüências
hapax legomena
index verborum
vocabulário multiuso
Biderman, Maria Tereza Camargo
A face quantitativa da linguagem: um dicionário de freqüências do português
title A face quantitativa da linguagem: um dicionário de freqüências do português
title_full A face quantitativa da linguagem: um dicionário de freqüências do português
title_fullStr A face quantitativa da linguagem: um dicionário de freqüências do português
title_full_unstemmed A face quantitativa da linguagem: um dicionário de freqüências do português
title_short A face quantitativa da linguagem: um dicionário de freqüências do português
title_sort face quantitativa da linguagem: um dicionário de freqüências do português
topic Lexicoestatística
dicionário de freqüências
hapax legomena
index verborum
vocabulário multiuso
url https://periodicos.fclar.unesp.br/alfa/article/view/4049
http://biblioteca-repositorio.clacso.edu.ar/handle/CLACSO/64492