Estatística e Ciências de Dados

Estatística e Ciências de Dados https://hdl.handle.net/1884/98024 2026-07-25T01:52:03Z 2026-07-25T01:52:03Z O papel da regressão logística na detecção de fraudes em transações online de cartão crédito https://hdl.handle.net/1884/98139 2025-09-03T11:35:11Z 2023-01-01T00:00:00Z

O papel da regressão logística na detecção de fraudes em transações online de cartão crédito Resumo : Neste trabalho, é abordado o aumento significativo das transações com cartão de crédito, impulsionado pelo avanço tecnológico e econômico, resultando em oportunidades crescentes para fraudes e consideráveis perdas financeiras. No ambiente do comércio eletrônico (ecommerce), transações sem a presença física do portador do cartão são percebidas como mais arriscadas, e esta complexidade será explorada ao longo da pesquisa. A Estatística é enfatizada como uma ferramenta crucial na identificação e prevenção de fraudes, com destaque para o papel da regressão logística na análise do comportamento transacional. O objetivo é explorar a fraude em transações online com cartões de crédito, identificando padrões de comportamento que possam esclarecer a ocorrência de fraudes e, assim, contribuir com insights para o desenvolvimento de regras mitigatórias no futuro. A principal proposta do estudo é a comparação da eficácia de modelos estatísticos na previsão de transações fraudulentas, utilizando dados reais. Além da abordagem previamente mencionada da regressão logística, o foco é avaliar como esses modelos se destacam na identificação precisa de transações fraudulentas, promovendo uma compreensão mais abrangente das estratégias de detecção de fraudes. Foi identificado que a seleção do modelo adequado deve considerar diversos elementos, incluindo o leque de variáveis disponíveis, a eficiência computacional e a capacidade de resposta em tempo real Orientador: Prof. Fernando Lucambio Pérez; Monografia (graduação) - Universidade Federal do Paraná, Setor de Ciências Exatas, Curso de Graduação em Estatística; Inclui referências

2023-01-01T00:00:00Z Análise comparativa de modelos de Scoring https://hdl.handle.net/1884/98134 2025-09-03T11:28:52Z 2024-01-01T00:00:00Z

Análise comparativa de modelos de Scoring Resumo : Este estudo analisou a eficácia de três métodos distintos de modelagem estatística — regressão logística, XGBoost e Random Forest — em um conjunto real de dados de crédito para determinar qual técnica apresenta o melhor desempenho na previsão de inadimplência. A metodologia aplicada consistiu em uma análise exploratória das variáveis, uma fase de seleção de variáveis, e a subsequente aplicação dos modelos estatísticos. Esta abordagem permitiu uma compreensão profunda tanto do comportamento da base de dados quanto das variáveis que influenciam a inadimplência neste caso. Os resultados indicaram que o modelo XGBoost superou os demais devido à sua capacidade de manejar grandes volumes de dados e sua eficácia em capturar não-linearidades e complexidades do conjunto de dados. Em contraste, a regressão logística, apesar de ser uma técnica mais tradicional, mostrou robustez e relevância, e o modelo Random Forest, embora menos eficiente que os outros modelos, ainda se mostrou competente. Este trabalho não apenas foca na aplicação prática dessas técnicas de modelagem no setor financeiro, mas também sublinha a importância de uma análise rigorosa de dados antes da modelagem. A análise e seleção cuidadosa de variáveis são essenciais para desenvolver modelos de previsão de crédito mais precisos e confiáveis. Embora o XGBoost tenha apresentado a melhor performance geral, os resultados reforçam a validade de múltiplas abordagens dependendo das necessidades específicas e do contexto de aplicação Orientador: Fernando Lucambio Pérez; Monografia (graduação) - Universidade Federal do Paraná, Setor de Ciências Exatas, Curso de Graduação em Estatística; Inclui referências

2024-01-01T00:00:00Z Modelos geoestatísticos multivariados aplicados a dados florestais https://hdl.handle.net/1884/98130 2025-09-03T11:25:14Z 2025-01-01T00:00:00Z

Modelos geoestatísticos multivariados aplicados a dados florestais Resumo : A produção de florestas é uma das principais informações utilizadas para o planejamento da produção. É por meio de estimativas utilizando inventários florestais que são feitas as extrapolações para toda a área plantada. Embora confiáveis, tais estimativas assumem unidades amostrais independentes entre si, ou seja, os valores amostrados em uma parcela de inventário não carregam informação de outras parcelas. Desde o desenvolvimento da Teoria das Variáveis Regionalizadas, diversos trabalhos apontam a existência de correlação entre as parcelas de inventário florestal, o que possibilita o uso de geoestatística para a estimativa da produção. Além disso, é comum nas operações florestais a quantificação indireta do volume utilizando variáveis de mais fácil medição, como o diâmetro das árvores. Nesse contexto, se torna oportuna a utilização de um modelo geoestatístico multivariado, onde se possa contabilizar não só a correlação entre unidades amostrais, bem como a correlação entre variáveis, como diâmetro e volume. Sob essa premissa foram desenvolvidos e avaliados três modelos bivariados com diferentes estruturas de covariância entre as variáveis adotadas. Os dados para o estudo são de plantios de Teca do interior do Mato Grosso. Ao todo foram utilizadas 46 parcelas de inventário florestal, onde se coletaram informações como diâmetro e volume. Foram testadas três especificações de covariância para um modelo geoestatístico bivariado. A primeira especificação de covariância assumiu um processo espacial para cada uma das variáveis, além de um processo espacial comum às duas. A segunda especificação assumiu dependência espacial apenas para a primeira variável, porém com correlação entre variáveis na mesma unidade amostral. A terceira especificação previu apenas covariâncias marginais, em que a covariância cruzada foi derivada implicitamente, sem especificação explícita. As três especificações se ajustaram bem aos dados. Apesar de bom ajuste, uma das especificações não gerou mapas de krigagem adequados, o que reforça a escolha de estruturas de covariância propícias para esse fim. A terceira especificação permitiu a geração de mapas de krigagem e foi parcimoniosa quanto à qualidade da predição e número de parâmetros. O uso de modelos geoestatísticos bivariados permite utilizar os dados de levantamentos florestais, fornecendo melhores ajustes e predições localizadas, auxiliando na quantificação da produção em volume de plantios florestais Orientador: Paulo Justiniano Ribeiro Junior; Monografia (graduação) - Universidade Federal do Paraná, Setor de Ciências Exatas, Curso de Graduação em Estatística; Inclui referências

2025-01-01T00:00:00Z Modelagem estatística para previsão de pontuações no Fantasy Football : uma abordagem baseada em dados históricos da NFL https://hdl.handle.net/1884/98129 2025-09-03T11:23:21Z 2025-01-01T00:00:00Z

Modelagem estatística para previsão de pontuações no Fantasy Football : uma abordagem baseada em dados históricos da NFL Resumo : O objetivo deste estudo é desenvolver e avaliar modelos estatísticos para a previsão das pontuações de jogadores no Fantasy Football, utilizando dados históricos da carreira dos atletas. Para isso, foram empregadas estatísticas de desempenho de jogadores da National Football League e do College Football. Com base nesses dados, aplicaram-se técnicas avançadas de modelagem preditiva, incluindo um modelo em duas etapas para lidar com a inflação de zeros, algoritmos de ensemble baseados em árvores de decisão (Random Forest e XGBoost) para tarefas de classificação e regressão, além de Modelos Lineares Generalizados com distribuição Binomial para classificação e Gamma para regressão. Os modelos foram avaliados para todas as posições ofensivas contempladas no Fantasy Football (Quarterbacks, Running Backs, Wide Receivers e Tight Ends), com distinção entre jogadores calouros e veteranos, a fim de investigar variações de desempenho conforme posição e nível de experiência. Os métodos utilizados foram capazes de alcançar bons resultados tanto em modelos de classificação, lidando adequadamente com a inflação de zeros, quanto em modelos de regressão. Além disso, a segmentação por posição e experiência contribuiu para a melhoria da precisão preditiva, revelando padrões distintos de desempenho. As principais contribuições deste estudo incluem a demonstração da aplicabilidade de técnicas estatísticas e de aprendizado de máquina na previsão de pontuações no Fantasy Football, fornecendo uma base metodológica robusta para o tratamento e análise desses dados Orientadora: Profa. Dra. Amanda Merian Freitas Mendes; Monografia (graduação) - Universidade Federal do Paraná, Setor de Ciências Exatas, Curso de Graduação em Estatística; Inclui referências

2025-01-01T00:00:00Z