Use este identificador para citar ou linkar para este item: http://www.monografias.ufop.br/handle/35400000/5887
Título: Cut the tails : uma abordagem para modelos de regressão com caudas pesadas.
Autor(es): Targa, Vinicius Nascimento
Orientador(es): Silva, Rodrigo César Pedrosa
Felix, Josemar Coelho
Membros da banca: Silva, Rodrigo César Pedrosa
Felix, Josemar Coelho
Moraes, Lauro Ângelo Gonçalves de
Ferreira, Gabriel Bicalho
Palavras-chave: Aprendizado de máquina
Distribuição de caudas pesadas
Estatística
Data do documento: 2023
Referência: TARGA, Vinicius Nascimento. Cut the tails: uma abordagem para modelos de regressão com caudas pesadas. 2023. 40 f. Monografia (Graduação em Ciências da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2023.
Resumo: A presença de dados que apresentam uma distribuição de caudas pesadas é mais comum do que se espera em determinadas áreas, pois um número considerável de casos no mundo real apresenta esse tipo de comportamento. O uso de técnicas de aprendizado de máquina tradicionais nesses tipos de distribuição pode não ser satisfatório o suficiente para gerar um modelo com acurácia considerável. O objetivo deste trabalho é criar uma abordagem que possa ser usada em distribuições de caudas pesadas, e que possa melhorar a acurácia dos modelos de aprendizado de máquina. Portanto, este trabalho propõe um método chamado "Cut the Tails", que, em sua metodologia, separa a distribuição da variável alvo de suas caudas pesadas e produz modelos de aprendizado de máquina separadamente para cada parte da distribuição. Ao comparar essa estratégia com as abordagens tradicionais de aprendizado de máquina, observou-se uma melhoria no erro absoluto médio percentual nos casos particulares que apresentaram curtose e assimetria elevados, sendo o melhor caso uma redução de erro de aproximadamente 48% ao usar a estratégia proposta.
Resumo em outra língua: The presence of data exhibiting heavy-tailed distributions is more common than expected in certain areas, as a considerable number of real-world cases display this type of behavior. The utilization of traditional machine learning techniques on these types of distributions may not yield a satisfactory outcome in generating a model of substantial accuracy. The aim of this study is to formulate an approach applicable to heavy-tailed distributions, which can enhance the accuracy of machine learning models. Hence, this research introduces a method named "Cut the Tails," which, in its methodology, segregates the target variable's distribution from its heavy tails and generates separate machine learning models for each segment of the distribution. By comparing this strategy with conventional machine learning approaches, an improvement in the mean absolute percentage error was observed in specific cases exhibiting high kurtosis and skewness. The most favorable case demonstrated an error reduction of approximately 48% when employing the proposed strategy.
URI: http://www.monografias.ufop.br/handle/35400000/5887
Aparece nas coleções:Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
MONOGRAFIA_CutTailsAbordagem.pdf1,29 MBAdobe PDFVisualizar/Abrir


Os itens na BDTCC estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.