Estatística

A estatística é o campo da matemática responsável pela coleta, organização, análise, interpretação e representação de dados. A ciência, por exemplo, é uma área que utiliza muito a estatística, sendo ela a principal ferramenta para análise de dados. 

Mas não é só o cientista que precisa saber de estatística, pois ela é fundamental para que possamos entender e interpretar (corretamente), através de dados, o mundo em que vivemos, evitando, dessa forma, cair em “pegadinhas” ou notícias falsas por aí. Sendo assim, vamos estudar sobre esse campo tão importante.

Medidas de tendência central

As medidas de tendência central são ferramentas muito importantes para o tratamento de dados estatísticos, pois podemos, a partir delas, descobrir algumas informações sobre nossos dados, como a média, moda e mediana. Mas o que significa cada uma delas? Vamos descobrir!

– Média simples

A média simples, ou simplesmente, média, consiste em um valor que “representa” um determinado conjunto de dados. Para obter a média, devemos somar todos os valores do conjunto de dados e dividi-los pela quantidade de dados desse conjunto. A fórmula da média é:

\[ M = \frac{n1 + n2 + n3 + … + nn}{n} \]

Sendo que n1, n2, n3 e nn são os valores de um conjunto de dados, e n é a quantidade total de dados.

Vamos fazer um exemplo? Para isso, iremos utilizar o seguinte conjunto de dados: {2, 5, 3, 5, 7, 3, 4, 6, 6, 5}. Utilizando a fórmula anterior, temos que:

\[ M = \frac{2 + 5 + 3 + 5 + 7 + 3 + 4 + 6 + 6 + 5}{10} = \frac{46}{10} = 4,6 \]

– Média ponderada

A média ponderada, assim como a simples, consiste em um valor que “representa” um determinado conjunto de dados. No entanto, a média ponderada é utilizada quando cada elemento do conjunto de dados possui pesos (ou importâncias) diferentes. Sendo assim, para calcular a média ponderada, devemos multiplicar os valores pelos seus respectivos pesos, e dividir pela soma dos pesos.

Por exemplo, em uma pesquisa de satisfação, foi utilizada uma escala que ia de 0 a 5. Supondo que 10 pessoas responderam essa escala, como podemos saber a média das respostas? A tabela a seguir contém as respostas das 10 pessoas.

Itens da escala012345
Respostas110323

Note que não há como tirar uma média simples aqui, pois cada resposta tem um peso diferente (0, 1, 2, 3, 4 e 5). Sendo assim, temos que calcular a média ponderada, e para fazer isso temos que multiplicar cada item da escala pelas suas respectivas quantidades de resposta, e dividir pelo total de respostas (10).

\[ M = \frac{0*1 + 1*1 + 2*0 + 3*3 + 4*2 + 5*3}{10} = \frac{33}{10} = 3,3 \]

O interessante da média ponderada é que qualquer mudança nos pesos já faz toda a diferença. Vamos tirar a resposta do 0 e colocá-la no 5, por exemplo.

\[ M = \frac{0*0 + 1*1 + 2*0 + 3*3 + 4*2 + 5*4}{10} = \frac{38}{10} = 3,8 \]

Viu só? Uma mudança mínima, mas que jogou para cima a média.


– Mediana

A mediana consiste no valor central de um conjunto de dados. Para obter a mediana, devemos organizar os dados em ordem crescente e verificar qual é o valor que se encontra na posição central. Caso a quantidade de dados seja um número par, a mediana será a média dos dois valores centrais. Exemplos:

Ex. 1: Calcular a mediana do conjunto de dados {3, 6, 2, 5, 4, 3, 2, 8, 5}

a) Primeiro devemos organizar os números em ordem crescente: 2, 2, 3, 3, 4, 5, 5, 6, 8

b) Feito isso, como temos nove valores, devemos verificar qual está na posição central desse conjunto ordenado. Neste caso, a mediana será o valor da quinta posição. Observando a sequência, vemos então que a mediana é o número 4.


Ex. 2: Calcular a mediana do conjunto de dados {5, 1, 6, 3, 5, 2, 3, 7, 1, 4}

a) Primeiro devemos organizar os números em ordem crescente: 1, 1, 2, 3, 3, 4, 5, 5, 6, 7

b) Como temos dez valores, não há como encontrarmos o valor central da sequência apenas observando-a. Sendo assim, temos que calcular a média dos dois valores centrais, que neste caso estão na sexta e sétima posições (3 e 4).

\[ M = \frac{3 + 4}{2} = 3,5 \]

Ou seja, a mediana é 3,5.


– Moda

A moda consiste no valor que mais aparece (o mais frequente) em um conjunto de dados. Sendo assim, devemos contar quantas vezes um mesmo elemento aparece no nosso conjunto de dados. O que mais aparece, portanto, é a moda. E se dois ou mais elementos aparecerem a mesma quantidade de vezes? Nesse caso, temos várias modas 🙂 . Exemplos:

Ex. 1: Calcular a moda do conjunto de dados {3, 2, 7, 2, 8, 4, 2, 5, 3}

Neste conjunto de dados, vemos que o 2 aparece três vezes, o 3 duas vezes, e 4, 5, 7 e 8 aparecem apenas uma vez. Sendo assim, a moda do nosso conjunto é o 2.


Ex. 2: Calcular a moda do conjunto de dados {9, 4, 5, 1, 0, 4, 9, 3, 2}

Fazendo a mesma coisa do exemplo anterior, vemos que 4 e 9 aparecem duas vezes e 0, 1, 2, 3 e 5 aparecem uma vez. Sendo assim, temos duas modas neste conjunto, 4 e 9.


Agora que já temos uma ideia do que são as medidas de tendência central, vamos utilizá-las em um exemplo real? Dê uma olhada neste gráfico sobre a temperatura da região de Campinas entre os anos de 1990 e 2020. Vamos construir um gráfico com as temperaturas máximas (arredondadas) entre os meses de Janeiro e Dezembro.

MêsJanFevMarAbrMaiJunJulAgoSetOutNovDez
Temperatura343433323029293234353434

a) Considerando os dados da tabela, qual é a temperatura média em Campinas entre 1990 e 2020?

\[ M = \frac{34 + 34 + 33 + 32 + 30 + 29 + 29 + 32 + 34 + 35 + 34 + 34}{12} = \frac{390}{12} = 32,5°C \]

b) Qual é a mediana?

Para descobrir, precisamos organizar os valores em ordem crescente: 29, 29, 30, 32, 32, 33, 34, 34, 34, 34, 34, 35

Como temos doze valores, então a mediana será a média dos dois valores centrais. Neste caso: 33 e 34.

\[ M = \frac{33 + 34}{2} = 33,5 \]

Portanto, a mediana é 33,5.

c) Qual é a moda?

Olhando o item b), onde ordenamos os valores, fica fácil identificar qual é o que mais aparece, né? Sendo assim, a moda é o 34, que aparece cinco vezes.

Bem tranquilo, né? Vamos para o próximo tópico?


Pular para o conteúdo