Aplicação de aprendizado de máquina na classificação de ransomwares.

Evangelista, Dione Willy

Use este identificador para citar ou linkar para este item: http://www.monografias.ufop.br/handle/35400000/5456

Título:	Aplicação de aprendizado de máquina na classificação de ransomwares.
Autor(es):	Evangelista, Dione Willy
Orientador(es):	Lima, Helen de Cássia Sousa da Costa
Membros da banca:	Lima, Helen de Cássia Sousa da Costa Lins, Theo Silva Sousa, Alexandre Magno de
Palavras-chave:	Aprendizado do computador Ciberterrorismo - programas de computador Classificação - arquivos de computador Programas de computador - segurança Software - proteção
Data do documento:	2023
Referência:	EVANGELISTA, Dione Willy. Aplicação de aprendizado de máquina na classificação de ransomwares. 2023. 115 f. Monografia (Graduação em Sistemas de Informação) - Instituto de Ciências Exatas e Aplicadas, Universidade Federal de Ouro Preto, João Monlevade, 2023.
Resumo:	Com o crescimento do número de softwares para diferentes dispositivos, o aumento de malwares (softwares maliciosos) tornou-se um problema cada vez mais relevante. Entre os tipos de malwares, um tipo específico denominado ransomware tem ganhado destaque no cenário mundial como uma das ameaças cibernéticas mais rentáveis para os cibercriminosos. Um ransomware busca extorquir digitalmente as vítimas, realizando o bloqueio e/ou criptografia dos dados, solicitando posteriormente o pagamento de uma taxa de resgate específica para reavê-los. A detecção de ransomwares torna-se, portanto, uma tarefa importante para auxiliar na segurança de um ambiente computacional, uma vez que esta ameaça consegue levar indivíduos e organizações a perder toda a sua informação. A aplicação de técnicas de análise juntamente com o apoio de ferramentas automatizadas permitem a obtenção de dados valiosos sobre programas maliciosos. Essas informações podem ser utilizadas como entrada para modelos de aprendizado de máquina, permitindo a classificação de arquivos potencialmente perigosos. Este trabalho tem como objetivo realizar a construção de um conjunto de dados baseado em informações de amostras malignas (ransomwares) e benignas (executáveis comuns), com o intuito de realizar sua classificação via algoritmos de aprendizado de máquina. Deseja-se verificar o desempenho dos algoritmos com diferentes atributos e por fim disponibilizar a base de dados criada para trabalhos futuros. Para este propósito foram obtidas 102 amostras de arquivos executáveis (52 malignas e 50 benignas) que foram submetidas ao sistema analisador Cuckoo Sandbox. Após isso, foi realizado o processamento dos relatórios colhidos, focando na obtenção dos dados dinâmicos gerados pelas amostras durante seu tempo de execução no ambiente simulado. Em posse destas informações foi possível preparar um dataset e realizar a sua classificação com 6 distintos modelos via o software WEKA, que possui uma coleção de algoritmos e ferramentas de mineração de dados. Ao verificar o desempenho dos classificadores foi percebido um maior desempenho dos modelos Random Forest e K-Nearest Neighbors, que atingiram respectivamente 93% e 91% de corretude na predição. Porém, destaca-se a atuação do modelo Logistic Regression, que classificou com uma maior acurácia as classes maliciosas do conjunto. Por fim, o estudo reforça a viabilidade das técnicas de análise e traz resultados de classificação com amostras recentes (conforme a data do presente estudo), buscando contribuir para literatura e futuros trabalhos, disponibilizando a base de dados para acesso público.
Resumo em outra língua:	With the growth of the number of software for different devices, the increase of malware (malicious software) has become an increasingly relevant problem. Among the types of malware, a specific type called ransomware has gained prominence on the world stage as one of the most profitable cyber threats for cybercriminals. A ransomware seeks to digitally extort victims by blocking and/or encrypting data, subsequently requesting payment of a specific ransom fee to retrieve them. The detection of ransomware therefore becomes an important task to aid in the security of a computing environment, since this threat can lead individuals and organizations to lose all their information. The application of analysis techniques together with the support of automated tools allow obtaining valuable data about malicious programs. This information can be used as input to machine learning models, allowing classification of potentially dangerous files. This work aims to build a dataset based on information from malicious (ransomware) and benign (common executables) samples, with the aim of classifying them using machine learning algorithms. We want to verify the performance of algorithms with different attributes and finally make the created database available for future work. For this purpose, 102 samples of executable files (52 malignant and 50 benign) were obtained and submitted to the Cuckoo Sandbox analyzer system. After that, the collected reports were processed, focusing on obtaining the dynamic data generated by the samples during their execution time in the simulated environment. With this information in hand, it was possible to prepare a dataset and perform its classification with 6 different models via the software WEKA, which has a collection of algorithms and data mining tools. When checking the performance of the classifiers, a better performance was observed for the Random Forest and K-Nearest Neighbors models, which reached 93% and 91% of correctness in the prediction, respectively. However, the performance of the Logistic Regression model stands out, which classified the malicious classes in the set with greater accuracy. Finally, the study reinforces the feasibility of the analysis techniques and brings classification results with recent samples (according to the date of the present study), seeking to contribute to the literature and future works, making the database available for public access.
URI:	http://www.monografias.ufop.br/handle/35400000/5456
Aparece nas coleções:	Sistema de Informação - JMV

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
MONOGRAFIA_AplicaçãoAprendizadoMaquina.pdf	Monografia	3,02 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas