Modelagem estatística para gestão de carteira de clientes : aplicação em telecomunicações
Resumo
Resumo: O setor de telecomunicações brasileiro entrou num processo contínuo de expansão após as privatizações que ocorreram na década de 1990. Com esse processo, entraram nesse mercado novos competidores e novas tecnologias. Isso foi benéfico para o consumidor, que atualmente tem mais opções de escolha de prestadoras do serviço. Por outro lado, as empresas que oferecem esse serviço precisam quantificar as probabilidades de esses clientes pagarem pelo serviço prestado. Nesse contexto, este trabalho tem por objetivos mapear as variáveis que podem ser consideradas fatores de risco para inadimplência, construir um modelo preditivo para estimar a probabilidade de pagamento das faturas mensais e avaliar a possibilidade da implantação desse modelo num sistema automático de decisão. Para o desenvolvimento dos modelos, foram considerados 43.339 clientes da empresa em estudo, que contrataram os serviços entre janeiro e dezembro de 2007. Esses clientes foram acompanhados por doze meses para avaliar sua performance quanto ao pagamento de suas faturas mensais. Dessa forma, a amostra foi dividida em dois grupos, denominados bons e maus. Clientes bons são aqueles que, durante os doze meses, atingiram no máximo cinco dias em atraso, no total de 23.095 clientes. Maus são aqueles que atingiram 90 dias ou mais de atraso para pagamento de pelo menos uma fatura no período observado, no total de 20.244 clientes. Os clientes que tiveram atraso maior que cinco dias em alguma das faturas, mas não atingiram noventa dias de atraso foram classificados como indeterminados e não fazem parte da amostra em estudo. Com o objetivo de segmentar a amostra em grupos homogêneos, antes de desenvolver o modelo preditivo, foi aplicada a Análise de Cluster. Por meio dessa metodologia, não foi possível obter agrupamentos de clientes. Isso se deve à homogeneidade do grupo em estudo, que gera alta concentração num único cluster. Para obter os modelos preditivos que estimam a probabilidade de pagamento, foi utilizada a Regressão Logística. As variáveis preditoras foram consideradas no modelo por duas formas: a primeira utilizando variáveis dummies; a segunda, o WOE (Weight of Evidence). Em ambas as formas de ajuste do modelo, foram identificados fatores de risco semelhantes, tais como parcelamento, alertas de fraude, altos valores de fatura e baixos históricos de pagamentos, clientes novos, tipo de produto contratado e perfil de consumo. Além desses, algumas regiões podem ser apontadas como fatores de risco, identificadas por meio de CEP, cidade e estado. Abstract: The Brazilian sector of telecommunications witnessed a streak of continuous expansion after becoming privatized in the 1990's. During this process many new competitors and new forms of technology were introduced to the market. This expansion benefitted the consumer by offering more options and services to choose from. On the other hand, the companies that offer these services need to analyze the possibility that the clients will pay for the service being given. Given this fact, the companies must chart the variables that can be considered factors which indicate risk of default, and construct a predictive model to estimate the probability of monthly payments being made along with assessing the possibility of implementing this model in an automatic decision-making process. 43.339 clients of the company which contracted the services of the company between January and December of 2007 were considered when developing this model. These clients were tracked for twelve months to assess their tendencies related to their monthly payments. This sample was divided into two groups named Good and Bad. Good clients were those who during the twelve months had a maximum of five late days in making their payments. The number of clients in this group was 23.095. Bad clients were those who had total of 90 late days in making their payments. The number of clients in this group was 20.244. A Cluster Analysis was used with the purpose of segmenting the sample before developing the predictive model. By using this methodology it was not possible to group these clients. This was due to the group homogeneity in the study that created a high concentration while using only one cluster. Logistic Regression was used to obtain predictive models that estimate the possibility of payment. The predictable variables were considered in the model by using two forms. The first form used dummies variables and the second form used WOE (Weight of Evidence) variables. In both forms for the model, similar risk factors were identified, such as division of payments, fraud alert, high and low payment values, new clients, the type of product purchased, and the costumer profile. Besides these factors, some geographic regions can be seen as contributing to risk. These regions can be identified by tracking area codes, cities and states.
Collections
- Teses & Dissertações [9522]