Trabalhos de Conclusão de Curso
URI Permanente desta comunidade
Navegar
Navegando Trabalhos de Conclusão de Curso por Autor "ÁVILA, Aparecida de Cássia Rodrigues"
Agora exibindo 1 - 1 de 1
Resultados por página
Opções de Ordenação
Item Comparativo de desempenho dos algoritmos regressão logística e redes neurais artificiais na classificação de imagens utilizando a matriz de confusão na ferramenta Orange Data Mining(Campus Dianópolis, 2024-11-07) ÁVILA, Aparecida de Cássia Rodrigues; NUNES, Robert Mady.O presente trabalho treinou dois modelos de Aprendizado de Máquina, uma Regressão Logística e uma Rede Neural, para classificar imagens de três pintores. Foram utilizadas várias abordagens de Técnicas de Amostragens de Dados como a Validação Cruzada, Estratificação e Amostragem Aleatória. Foi utilizada uma pequena e diversificada quantidade de imagens e mudanças na arquitetura dos modelos durante os testes. O desempenho dos Algoritmos foi medido pela ferramenta Matriz de Confusão e toda a parte prática dos experimentos foram feitas na Ferramenta Orange Data Mining, uma caixa de ferramentas de mineração de dados gratuita própria para análise de dados. A Metodologia foi construída por meio de pesquisas bibliográficas e da leitura da documentação da ferramenta, ambas contribuíram para a geração de um Fluxo de trabalho, no qual os experimentos foram feitos baseados e executados. Foi utilizada uma quantidade mínima de imagens, devido a complexidade do problema e aos resultados alcançados nos testes iniciais. Os Experimentos demonstraram que as Técnicas de Amostragem de Dados, a arquitetura dos algoritmos, a quantidade de treinos e a diversificação das imagens são fatores relevantes para o desempenho dos modelos de aprendizagem de máquina, mesmo que o conjunto de dados seja limitado. A literatura já havia mencionado que o desempenho da Regressão Logística poderia ser superior ao de uma Rede Neural, tendo como base um conjunto de dados de pequena complexidade, fato que foi comprovado neste trabalho. A Matriz de Confusão se mostrou como uma ferramenta capaz de medir o desempenho dos algoritmos, dos modelos e das Técnicas de Amostragens de Dados, conforme também mencionado na literatura. O trabalho também concluiu que a Regressão Logística pode ser uma opção viável para a classificação de imagens em uma situação de pequena complexidade do problema envolvido e de recursos computacionais limitados. Palavras-chave: Machine learning. Matriz de confusão. Orange Data Mining. ABSTRACT The present work trained two Machine Learning models, a Logistic Regression and a Neural Network, to classify images of three painters. Several approaches of Data Sampling Techniques were used, such as Cross Validation, Stratification and Random Sampling. A small and diverse amount of images and changes in the architecture of the models were used during the tests. The performance of the Algorithms was measured by the Confusion Matrix tool and all the practical part of the experiments were done in the Orange Data Mining Tool, a free data mining toolbox for data analysis. The Methodology was built through bibliographical research and reading the tool's documentation, both of which contributed to the generation of a Workflow, on which the experiments were based and executed. A minimal amount of images was used, due to the complexity of the problem and the results achieved in the initial tests. The Experiments demonstrated that the Data Sampling Techniques, the architecture of the algorithms, the amount of training and the diversification of the images are relevant factors for the performance of the machine learning models, even if the data set is limited. The literature had already mentioned that the performance of Logistic Regression could be superior to that of a Neural Network, based on a data set of low complexity, a fact that was proven in this work. The Confusion Matrix proved to be a tool capable of measuring the performance of algorithms, models and Data Sampling Techniques, as also mentioned in the literature. The work also concluded that Logistic Regression can be a viable option for image classification in a situation of low complexity of the problem involved and limited computational resources. Keywords: Machine learning. Confusion matrix. Orange Data Mining.