Última atualização em 09/07/2023
O sistema métrico de medição é a maneira padrão de medir distâncias, calcular a altura e a maioria dos outros itens do dia-a-dia.
Por exemplo, vamos considerar um jarro de leite. Usamos litros para encontrar o volume de leite e metros (ou centímetros) para encontrar a altura do frasco.
Isso ocorre porque essas unidades métricas são seguidas na maioria dos lugares em todo o mundo e são chamadas de unidades SI (Sistema Internacional de Unidades).
Vamos começar e aprender mais sobre o sistema métrico.
Você vai encontrar neste artigo:
ToggleO que é métrica?
Como cientista de dados, você provavelmente teria encontrado diferentes tipos de métricas de distância.
Na PNL, você pode usar a métrica de distância do cosseno para obter palavras semelhantes; na Visão por Computador, você pode usar a métrica de distância L2 para obter imagens semelhantes; também há uma métrica de produto interna na Filtragem Colaborativa.
Usamos muito o termo ‘métrica’, mas o que significa?
Definição de métrica
Antes de começar com a definição, vamos direto aos termos primeiro.
Geralmente, ‘métrica’ significa distância, o termo que usamos muito na vida diária, por exemplo:
- Qual é a distância entre Jakarta e Bandung?
- Mantenha uma distância segura ao dirigir.
A definição adequada de métrica vem originalmente da matemática.
Pode parecer difícil aprender no início, mas na verdade é natural e reflete o termo distância que conhecemos.
Afinal, os matemáticos não definiriam algo simplesmente do nada.
Para começar, vamos definir d (x, y) como uma métrica (ou uma distância) entre x e y.
Pense em x e y como quaisquer pontos aleatórios. Existem 4 condições a serem satisfeitas como uma métrica.
Vamos discutir um por um. Observe que, neste artigo, usarei o termo métrica e distância alternadamente.
1. Não negatividade
Em matemática, esta condição é definida como:
d (x, y) ≥ 0, para todos os x e y.
Tal como o nome indica, esta condição é muito óbvia. Uma métrica não pode ser negativa.
Análogo à distância, é bem claro entender por que devemos ter essa condição para uma métrica, uma vez que não podemos ter distância negativa, afinal.
A distância entre duas cidades nunca é negativa!
Na verdade, essa condição não é necessária. Se as outras três condições forem atendidas, essa condição também será satisfeita.
2. Identidade dos indiscerníveis
Em matemática, esta condição é definida como:
Se d (x, y) = 0, então x = y.
Indiscernível significa “não pode ser distinguido”. Isso também é muito óbvio.
Se a distância entre duas cidades for 0, então elas devem ser a mesma cidade, não são?
Bem, a menos que haja algum tipo de buraco de minhoca ou tele transporte.
3. Simetria
Em matemática, esta condição é definida como:
d (x, y) = d (y, x) para todos os xe y.
Em outras palavras, a distância entre x e y é igual à distância entre y e x. Isso não é necessariamente verdadeiro como uma distância de viagem.
A distância da cidade A a B pode ser diferente da distância da cidade B a A, dependendo da estrada ou do traçado da cidade.
No entanto, eles são os mesmos se medirmos coordenadamente, ou se usarmos um helicóptero.
4. Desigualdade triangular
Em matemática, esta condição é definida como:
d (x, y) ≤ d (x, z) + d (y, z), para todos os x, y e z.
A última condição não é tão óbvia quanto as três primeiras.
Primeiro, vamos discutir por que isso é chamado de desigualdade triangular. Todo triângulo tem esta propriedade:
Pegue quaisquer dois lados de um triângulo; o comprimento do outro lado é menor que a soma desses dois lados.
Em nossa equação acima, temos três pontos (x, y e z) nessa equação três pontos formam um triângulo. É por isso que está relacionado.
Em seguida, o que significa desigualdade de triângulo em nossa definição de métrica? Vamos ilustrar com um exemplo.
Desenhe dois pontos em uma folha de papel e chame-os de xe y. Se você precisar medir a distância entre esses 2 pontos, o que você faria?
Você desenharia um segmento de linha de x a y e, em seguida, mediria o comprimento do segmento de linha.
Parece óbvio, não é? No entanto, por que não desenhamos outro ponto (chamado ponto z) e, em seguida, desenhamos dois segmentos de linha (de x a z, ez a y) e medimos os comprimentos?
O motivo é simples:
A distância deve ser calculada como o caminho mais curto entre 2 pontos.
Você não faz um desvio para calcular a distância, que é obviamente mais longa.
Portanto, a condição de desigualdade do triângulo significa que a métrica deve ser calculada da maneira mais curta.
Exemplos de métricas
Vamos discutir alguns exemplos de distância e se isso satisfaz a definição de uma métrica “verdadeira”.
1. Distância euclidiana
Distância euclidiana (também conhecida como distância L2) é a definição de distância que você normalmente usa em sua vida diária, por exemplo, ao medir os pontos de distância que discuto acima.
Obviamente, satisfaz a definição de métrica “verdadeira”.
2. Distância cosseno
Distância de cosseno (ou similaridade de 1 cosseno) é a distância que você pode ter encontrado ao trabalhar com vetores.
Infelizmente, a distância do cosseno não é uma métrica “verdadeira”.
Primeiro, não satisfaz a condição indiscernível. A distância cosseno de [1,1] e [2,2] é 0, mas [1,1] ≠ [2,2].
Além disso, não satisfaz a desigualdade do triângulo. Suponha que d é a distância do cosseno ex = [1,0], y = [0,1], z = [1,1]. É fácil ver que d (x, y) = 1 e d (x, z) = d (y, z) ~ 0,3, então d (x, y)> d (x, z) + d (y, z) não satisfaz a desigualdade do triângulo.
É por isso que a distância cosseno realmente não faz sentido: a distância é menor se você fizer um desvio (para z), em vez de direto de x para y.
3. Métrica do produto interno
O produto interno (ou produto escalar) é comumente usado no modelo de Filtragem Colaborativa.
O conceito é semelhante à similaridade de cosseno sem normalizar o vetor.
Na verdade, não é nem mesmo uma “distância”, já que está diminuindo quando está mais longe, em comparação com o entendimento comum de distância: está aumentando quando está mais longe.
Existe uma alternativa para definir a distância como produto interno negativo, ou seja, basta multiplicar o produto interno por -1.
Faz mais sentido como distância, mas só satisfaz a condição de simetria, então definitivamente não é uma métrica.
Distância euclidiana vs distância cosseno
Recomenda-se escolher a distância euclidiana como uma métrica de distância, uma vez que é uma métrica ‘verdadeira’, em vez da distância cosseno.
Normalmente, a distância do cosseno é preferível, uma vez que varia de -1 a 1, em comparação com a distância euclidiana que é ilimitada, por isso é mais fácil definir um limite (digamos 0,7) na distância do cosseno.
Na verdade, você pode encontrar o limite com a distância euclidiana explorando a faixa de distância nos dados, semelhante à distância do cosseno.
O que é o sistema métrico?
Tudo ao nosso redor, desde a quantidade de açúcar que você coloca em um bolo até o comprimento de um campo de futebol, tem um valor medido.
Medimos cada objeto de acordo com seu comprimento, peso, volume ou tempo de maneira diferente.
O conceito de “Sistema Métrico” é introduzido com essas medições.
Por definição, o sistema métrico de medida em matemática é o conjunto de unidades padrão definidas para medir comprimento, peso e capacidade.
Exemplos de sistema métrico
Existem vários lugares onde usamos unidades métricas em nossa vida diária.
Este sistema métrico é implementado e seguido em vários campos, como ciência, medicina, governança, defesa e assim por diante.
Alguns dos exemplos de sistemas métricos podem ser listados conforme a seguir.
- John e Lisa correm um quilômetro.
- Esta melancia pesa 4 quilos.
- Asher leva 10 mililitros de tônica.
Origem do Sistema Métrico
Metricação é o processo de implementação do sistema internacional de unidades (unidades SI).
Foi seguido por quase todos os países, exceto Estados Unidos, Mianmar e Libéria.
Os Estados Unidos, então, introduziram suas próprias unidades habituais, amplamente utilizadas em vários campos, como o USCS.
Assim, as unidades métricas seguidas nos Estados Unidos são chamadas de unidades consuetudinárias dos Estados Unidos (USCS).
Diferença entre unidades USCS e SI
O sistema USCS evoluiu a partir do sistema imperial britânico. As unidades métricas dos Estados Unidos também são chamadas de “unidades imperiais”.
A principal diferença entre as unidades SI e as unidades métricas americanas são os termos e o tipo de unidades usadas.
Por exemplo, o comprimento é medido usando o metro em unidades do SI, enquanto o pé é usado nas unidades métricas dos Estados Unidos.
A tabela a seguir mostra as diferenças entre as unidades SI e USCS.
Comprimento, peso, capacidade e tempo
Vejamos rapidamente as unidades métricas que usamos, junto com alguns exemplos:
Comprimento
O comprimento da unidade é usado para medir o tamanho de um objeto ou a distância de uma extremidade à outra.
Existem várias unidades, como metro, quilômetro, milímetro, pés, polegadas e assim por diante.
A unidade padrão para medição de comprimento é metro. A ferramenta padrão que usamos para medir o comprimento é uma régua.
Estes são alguns exemplos que mostram onde as medidas de comprimento são normalmente usadas:
- Isso indica que há uma escola a 1 km de distância.
- A altura desta porta é de cerca de 6 pés.
- Este clipe de papel tem 1 polegada de comprimento.
Comprimento: Conversão Métrica
O quilômetro é a maior unidade e o milímetro é a menor unidade de comprimento de medição.
A tabela abaixo mostra várias unidades de medida de comprimento com suas respectivas conversões no sistema métrico.
A tabela abaixo mostra várias unidades de medida de comprimento com suas opções avaliadas no sistema métrico.
- O peso de duas fatias de pão é de cerca de 100 gramas.
- O peso de um pão é de cerca de um quilograma (kg).
- Um elefante pesa aprox. cerca de 5 toneladas.
Peso: Conversão Métrica
Capacidade
O termo capacidade é usado para medir o volume ou o espaço ocupado por um objeto. A unidade padrão para medição de capacidade é o litro.
A ferramenta padrão que usamos para medir o comprimento é o copo medidor. Por exemplo
- Um litro de leite.
- 500 ml de óleo.
- Um copo de café.
Capacidade: Conversão Métrica
Um litro de água líquida tem uma massa quase exatamente igual a um quilograma na pressão padrão.
Tempo
Não precisamos de muita introdução à palavra “tempo”, pois a usamos com frequência.
A medição do tempo é comum nas unidades SI e nas unidades métricas dos Estados Unidos. Por exemplo,
- Amiley respondeu à pergunta em uma fração de segundo.
- Julie levou uma hora para fazer o dever de casa.
Observações importantes sobre o sistema métrico
Abaixo estão algumas notas importantes sobre o sistema métrico de tópicos que o ajudarão a compreender melhor e mais rapidamente o tópico.
- O sistema métrico consiste em um conjunto de unidades para medir comprimento, peso, capacidade, temperatura, etc.
- Seguimos o Sistema Internacional de Unidades (unidades SI).
- A unidade padrão para medição de comprimento é metro.
- A unidade padrão para medição de peso é um quilograma.
- A unidade padrão para medição de capacidade é o litro.
- O tempo é medido em horas, minutos e segundos.
Distância euclidiana vs distância cosseno
Recomenda-se escolher a distância euclidiana como uma métrica de distância, uma vez que é uma métrica ‘verdadeira’, em vez da distância cosseno.
Normalmente, a distância do cosseno é preferível, uma vez que varia de -1 a 1, em comparação com a distância euclidiana que é ilimitada, por isso é mais fácil definir um limite (digamos 0,7) na distância do cosseno.
Na verdade, você pode encontrar o limite com a distância euclidiana explorando a faixa de distância nos dados, semelhante à distância do cosseno.
Conclusão
Para concluir, as métricas de distância são ferramentas para resolver seu problema.
Se você precisar usar a distância de cosseno e o produto interno, sinta-se à vontade para usá-lo.
Afinal, o objetivo da ciência de dados é resolver problemas e você é livre para escolher suas ferramentas. Espero que este artigo ajude você a entender as ferramentas
Gostou do artigo? Deixe seu feedback!
Leia também – O que é Growth Marketing como funciona e como fazer
Relatório de Vendas: O que é, Como Fazer e Modelos