Como usar Análise de Dados para conhecer melhor o seu cliente? P Zero Pt. 2

Otávio Costa
7 min readJan 12, 2022

--

Essa é Parte 2 da análise. Para entender a história desde o começo, vá para: Introdução ao Case Study — Project Zero.

Conhecer o seu cliente se torna cada vez mais vital na era digital. O custo de aquisição vai aumentando a medida que mais pessoas querem vender online. Então, quanto mais você sabe sobre seus compradores, mais certeira é a sua busca, consequentemente menos você paga para chegar até eles.

Photo by Markus Winkler on Unsplash

Recap

Estamos tralhando para a Cyclistic, uma startup de compartilhamento de bicicletas e outros meios de locomoção individual. Até agora, a Cyclistic operou estratégias de marketing para conquistar a atenção de dois segmentos de cliente: casuais e membros.

Os usuários casuais são os que fazem uma corrida ou compram um daypass. Enquanto os membros são usuários que optam pelo programa de anuidades.

O departamento financeiro identificou que os membros são mais lucrativos que os usuários casuais. Sendo assim, a diretora de Marketing Lily Moreno acredita que os membros serão chave para o crescimento do negócio. Então ela estabelece uma meta: desenhar estratégias de marketing para converter usuários casuais em membros.

Nesse texto, vamos responder três perguntas de negócio para o futuro programa de marketing.

1- Como os membros e os ciclistas casuais usam as bicicletas de maneira diferente?

2- Por que os passageiros casuais comprariam as assinaturas anuais da Cyclistic?

3- Como a Cyclistic pode usar a mídia digital para influenciar os passageiros casuais a se tornarem membros?

Preparar para explorar

Photo by Markus Spiske on Unsplash

Os dados estão localizados no endereço: https://divvy-tripdata.s3.amazonaws.com/index.html. Nesse diretório há vários conjuntos de dados coletados pela própria empresa, organizados em planilhas divididas por meses.

O conteúdo é integro. Já que o conjunto de dados é de fonte primária, ou seja, coletado e disponibilizado pela própria empresa cliente, evitando perda de informações por compartilhamento. Não há erros com vieses, pois os dados foram coletados em intervalo de tempo completo e englobando toda a população de eventos.

Por questões de privacidade, eles me proíbem de usar informações de identificação pessoal dos passageiros.

Há alguns dados faltantes, especialmente nas variáveis: start_station_name, start_station_id, end_station_name e end_station_id, mas para essa primeira análise, não afetará.

Processar para explorar

O cliente pede que analisemos os últimos 12 meses de registros. Sendo assim, baixamos o material, fizemos a primeira inspeção, e descobrimos ter mais de 5 milhões de observações(linhas). De cara, percebo que o Excel não vai suportar fazer essa análise, opto por continuar o projeto usando a linguagem R.

  • Para a análise, vou partir com 3 padrões a serem analisados:

1) Qual é o duração de uso mais comum entre os usuários;

2) Qual é o dia da semana que os usuários mais viajam de bicicleta;

3) Quais são os tipos de bicicleta mais usados entre eles.

Para garantir a integridade dos dados, eu junto todos os meses em só um conjunto de dados usando a função rbind. E a partir disso, sigo limpando os dados, usando a função remove_empty, que remove linhas e colunas que são completamente vazias e depois uso a função ymd_hms para converter as strings started_at e ended_at para o formato data/horário.

Agora, extraindo somente as colunas que vou usar nessa primeira análise, são elas: started_at(quando começou a viagem); ended_at(quando terminou); member_casual(o tipo do cliente) e rideable_type(qual tipo de bicicleta o usuário escolheu).

Agora que temos o conjunto mais limpo, eu crio a variável: minutes, subtraindo ended_at por started_at. Ela vai ser usada pra medir a frequência de duração de uso dos equipamentos. E finalizamos a parte de processamento, criando a variável: weekday, usando o started_at para descobrir qual dia da semana a bike foi alugada.

Fase de Análise

1º Padrão— Qual é o duração de uso mais comum dos usuários;

Para diferenciar o tempos de uso de cada usuário vamos comparar suas médias e medianas. Esse tipo de dado apresenta uma distribuição enviesada à direita, já que as pessoas tendem a alugar as bikes para necessidades instantâneas e similares.

É possível perceber que os usuários casuais usam as bicicletas por mais tempo, talvez mais do que precisariam, porém perderão o direito de usar, caso devolvam antes. E os membros usam o equipamento em intervalos menores, evidenciando suas necessidades reais.

Para usuários casuais, temos: média de 24 minutos de uso e mediana(indica qual é o valor que está exatamente no meio do conjunto de dado) de 16 minutos.

E para membros: média de 13 minutos de uso e mediana de 9 minutos.

2º Padrão— Qual é o dia da semana que os usuários mais viajam de bicicleta;

Nesse gráfico podemos confirmar um dado fornecido pelo cliente: os usuários da Cyclistic são mais propensos a pedalar por lazer, e isso reflete no grande número de aluguéis durante o fim de semana, principalmente pelos usuários casuais.

Gráfico mostra a frequência de uso das bicicletas durante a semana, por tipo de usuário. Sendo o vermelho, os casuais, e o verde, os membros. Percebemos a distinção do uso de cada situação.

Enquanto isso, há um declínio no uso pelos membros, já que cerca de 30% dos clientes, as usam para ir ao trabalho.

3º Padrão— Quais são os tipos de bicicleta mais usados entre eles.

Esse painel mostra que a preferência dos usuários casuais é bem equilibrada, e há algum uso das bikes estacionadas nas estações, e em contrapartida os membros preferem usar as bicicletas clássicas, ao invés das modelos elétricas.

O comportamento dos membros é o mais interessante de entender, por que ele vai revelar quais tipos de desejos podemos despertar nos usuários casuais.

Descobertas

Há alguns comportamentos que podemos destacar quando percebemos os gráficos acima e aproveitarmos para responder nossas perguntas de negócio.

1- Como os membros e os ciclistas casuais usam as bicicletas de maneira diferente?

Os Casuais

Assim como já foi falado antes, as bicicletas da Cyclistic são bastante usadas para lazer, e isso reflete nos números. Há grande pico de demanda durante os finais de semana, e o tempo médio de uso é 84% maior no uso do cliente casual, em relação aos membros. Há interesse por bikes “ancoradas” em estações, o que nos permite correlacionar com menor urgência, visto que precisa se locomover até uma estação.

Os Membros

Como pode ser imaginado, e visto nos números, o interesse dos membros é ligado à mobilidade diária. Dependem das bicicletas para se locomover no dia a dia. A frequência de uso constante no decorrer da semana, aliada ao tempo médio de uso próximo a 10 minutos, confirmam essa hipótese. Isso sem falar na preferência por bicicletas clássicas e elétricas, indicando praticidade.

Recomendações

Photo by Kaleidico on Unsplash

Para resolver as outras duas tarefas de negócios, vale lembrar alguns pontos importantes do briefing.

  • Apesar dos usuários serem mais propensos a pedalar por lazer, cerca de 30% usam para ir ao trabalho todos os dias.
  • Em vez de criar uma campanha de marketing voltada para novos clientes, a ideia é converter passageiros casuais em membros.
  • Os ciclistas casuais já conhecem o programa Cyclistic e escolheram o Cyclistic para suas necessidades de mobilidade.

2- Por que os passageiros casuais comprariam as assinaturas anuais da Cyclistic?

O último ponto apresentado acima, influencia bastante as recomendações, visto que os usuários casuais já conhecem o plano da Cyclistic e ainda assim não optaram pela anuidade.

Então, precisamos agir de uma maneira diferente.

Você decide comprar um produto/serviço, pesando o valor que ele te gera, pelo tanto que você vai gastar para alcançá-lo. Os membros optaram pelo plano da Cyclistic por causa dos benefícios ligados a praticidade no dia a dia, então precisamos despertar esse mesmo desejo nos usuários casuais.

Os ciclistas casuais tem que sentir a liberdade de usar a bike diariamente para comprar assinaturas anuais!

  • Cyclistic é lazer, mas também é dia a dia. Além do final de semana, Cyclistic também é ir para o trabalho de bike;
  • Cyclistic é sobre ir ao mercado, à padaria. É sobre ir à farmácia e não se preocupar em estacionar;
  • Cyclistic é pra tudo que está ao seu redor.

Essa abordagem generalista e LOCAL, vai mostrar para os usuários casuais que é possível usar a bike pra tudo, além de lazer. E isso fará com que enxerguem essa possibilidade, antes despercebida.

3- Como a Cyclistic pode usar a mídia digital para influenciar os passageiros casuais a se tornarem membros?

A Cyclistic já descobriu que os hábitos dos passageiros casuais estão alinhados a viagens mais longas e passeios no final de semana. Então, o time de marketing deve aproveitar essa imagem formada e apresentar a micro mobilidade também como uma alternativa ao trânsito, ao metrô ou ônibus lotado, durante a semana. Despertando a mesma liberdade que sentem nos finais de semana.

Além disso, como a mídia digital é altamente customizável, as campanhas de marketing podem ser programadas para começar depois que o horário de expediente acaba — pegando a volta pra casa — e terminar logo quando o horário de expediente começar — pegando a ida para o trabalho.

Conclusões

Trabalhar com ciclistas que já estão na base de clientes tende a ser mais barato e o impacto pode ser maior do que trabalhar com novos clientes. Portanto, é importante continuar coletando informações dos hábitos desses usuários, e entregar soluções que resolvam o problema que estão passando.

Como próximo passo, existem dados adicionais que podem ser usados para entender melhor como os ciclista casuais resolvem suas necessidades de mobilidade quando não estão de bicicleta, por exemplo:

  • Com qual objetivo os membros usam as bikes da Cyclistic?
  • Qual tarefa de rotina pode ser agilizada usando uma bicicleta?

Obrigado por ler e por favor comente abaixo sobre suas ideias em como conhecer melhor os clientes usando Análise de Dados. Para ver mais posts sobre esse, inscreva-se no Medium e no LinkedIn.
O arquivo .R usado nessa análise pode ser encontrado no meu GitHub.

--

--

Otávio Costa

Engenheiro entusiasmado com Venture Capital e Inovação.