Use este identificador para citar ou linkar para este item: http://www.monografias.ufop.br/handle/35400000/8902
Registro completo de metadados
Campo Dublin CoreValorIdioma
dc.contributor.advisorSilva, Pedro Henrique Lopespt_BR
dc.contributor.authorVieira, Matheus Peixoto Ribeiro-
dc.date.accessioned2026-03-24T14:24:48Z-
dc.date.available2026-03-24T14:24:48Z-
dc.date.issued2026pt_BR
dc.identifier.citationVIEIRA, Matheus Peixoto Ribeiro. Plasticidade e rigidez em modelos de embeddings globais e monolíngues para o português brasileiro. 2026. 80 f. Monografia (Graduação em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2026pt_BR
dc.identifier.urihttp://www.monografias.ufop.br/handle/35400000/8902-
dc.description.abstractEste trabalho investiga comparativamente modelos de embeddings globais e monolíngues aplicados ao português brasileiro, analisando o equilíbrio entre plasticidade e rigidez das representações semânticas sob diferentes regimes de uso. São avaliadas sete famílias de modelos em quatro tarefas de processamento de linguagem natural (classificação, clusterização, inferência textual e similaridade semântica textual) considerando tanto o regime de linear probing quanto a adaptação supervisionada via fine-tuning eficiente de parâmetros com LoRA. Os resultados indicam que, embora modelos globais apresentem desempenho competitivo em linear probing, modelos monolíngues tendem a demonstrar maior estabilidade e ganhos mais consistentes após a adaptação, especialmente em tarefas sensíveis à geometria do espaço de embeddings, como STS. Adicionalmente, análises quantitativas e qualitativas de tokenização revelam que somente vocabulários especializados não garantem maior eficiência ou desempenho, evidenciando um dilema entre alinhamento morfológico, robustez a empréstimos linguísticos e compactação das representações. As descobertas contribuem para uma compreensão mais profunda dos trade-offs envolvidos na escolha e adaptação de modelos de embeddings para aplicações em português brasileiro, oferecendo subsídios práticos para decisões em cenários reais de PLN.pt_BR
dc.language.isopt_BRpt_BR
dc.subjectEmbeddingspt_BR
dc.subjectTokenspt_BR
dc.subjectTransformerpt_BR
dc.subjectModelo multilínguept_BR
dc.subjectModelo monolínguept_BR
dc.subjectPlasticidadept_BR
dc.subjectRigidezpt_BR
dc.titlePlasticidade e rigidez em modelos de embeddings globais e monolíngues para o português brasileiro.pt_BR
dc.typeTCC-Graduaçãopt_BR
dc.contributor.refereeCosta, Arthur Negrão de Faria Martins dapt_BR
dc.contributor.refereeGonçalves Júnior, Ederson Naves Fernandespt_BR
dc.contributor.refereeSilva, Pedro Henrique Lopespt_BR
dc.description.abstractenThis work presents a comparative investigation of global and monolingual embedding models applied to Brazilian Portuguese, analyzing the balance between plasticity and rigidity of semantic representations under different usage regimes. Seven families of models are evaluated across four natural language processing tasks (classification, clustering, natural language inference and semantic textual similarity) considering both linear probing and supervised adaptation via parameter-efficient fine-tuning with LoRA. The results indicate that, although global models achieve competitive performance under linear probing, monolingual models tend to exhibit greater stability and more consistent gains after adaptation, particularly in tasks sensitive to the geometry of the embedding space, such as STS. In addition, quantitative and qualitative analyses of tokenization reveal that specialized vocabularies do not inherently guarantee higher efficiency or performance, highlighting a trade-off between morphological alignment, robustness to lexical borrowings, and representation compactness. These findings contribute to a deeper understanding of the trade-offs involved in selecting and adapting embedding models for Brazilian Portuguese, providing practical insights for decision-making in real-world NLP applicationspt_BR
dc.contributor.authorID22.1.4104pt_BR
Aparece nas coleções:Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
MONOGRAFIA_PlasticidadeRigidezModelo.pdf3,74 MBAdobe PDFVisualizar/Abrir


Os itens na BDTCC estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.