O que é métrica noções básicas sobre métricas para cientistas de dados

Tempo de leitura estimado: 8 minutos

Última atualização em 09/07/2023

O sistema métrico de medição é a maneira padrão de medir distâncias, calcular a altura e a maioria dos outros itens do dia-a-dia.

Por exemplo, vamos considerar um jarro de leite. Usamos litros para encontrar o volume de leite e metros (ou centímetros) para encontrar a altura do frasco.

Isso ocorre porque essas unidades métricas são seguidas na maioria dos lugares em todo o mundo e são chamadas de unidades SI (Sistema Internacional de Unidades).

Vamos começar e aprender mais sobre o sistema métrico.

Como Definir O Que E Metrica 1

O que é métrica?

Como cientista de dados, você provavelmente teria encontrado diferentes tipos de métricas de distância.

Na PNL, você pode usar a métrica de distância do cosseno para obter palavras semelhantes; na Visão por Computador, você pode usar a métrica de distância L2 para obter imagens semelhantes; também há uma métrica de produto interna na Filtragem Colaborativa.

Usamos muito o termo ‘métrica’, mas o que significa?

Definição de métrica

Antes de começar com a definição, vamos direto aos termos primeiro.

Geralmente, ‘métrica’ significa distância, o termo que usamos muito na vida diária, por exemplo:

  • Qual é a distância entre Jakarta e Bandung?
  • Mantenha uma distância segura ao dirigir.

A definição adequada de métrica vem originalmente da matemática.

Pode parecer difícil aprender no início, mas na verdade é natural e reflete o termo distância que conhecemos.

Afinal, os matemáticos não definiriam algo simplesmente do nada.

Para começar, vamos definir d (x, y) como uma métrica (ou uma distância) entre x e y.

Pense em x e y como quaisquer pontos aleatórios. Existem 4 condições a serem satisfeitas como uma métrica.

Vamos discutir um por um. Observe que, neste artigo, usarei o termo métrica e distância alternadamente.

1. Não negatividade

Em matemática, esta condição é definida como:

d (x, y) ≥ 0, para todos os x e y.

Tal como o nome indica, esta condição é muito óbvia. Uma métrica não pode ser negativa.

Análogo à distância, é bem claro entender por que devemos ter essa condição para uma métrica, uma vez que não podemos ter distância negativa, afinal.

A distância entre duas cidades nunca é negativa!

Na verdade, essa condição não é necessária. Se as outras três condições forem atendidas, essa condição também será satisfeita.

2. Identidade dos indiscerníveis

Em matemática, esta condição é definida como:

Se d (x, y) = 0, então x = y.

Indiscernível significa “não pode ser distinguido”. Isso também é muito óbvio.

Se a distância entre duas cidades for 0, então elas devem ser a mesma cidade, não são?

Bem, a menos que haja algum tipo de buraco de minhoca ou tele transporte.

3. Simetria

Em matemática, esta condição é definida como:

d (x, y) = d (y, x) para todos os xe y.

Em outras palavras, a distância entre x e y é igual à distância entre y e x. Isso não é necessariamente verdadeiro como uma distância de viagem.

A distância da cidade A a B pode ser diferente da distância da cidade B a A, dependendo da estrada ou do traçado da cidade.

No entanto, eles são os mesmos se medirmos coordenadamente, ou se usarmos um helicóptero.

4. Desigualdade triangular

Em matemática, esta condição é definida como:

d (x, y) ≤ d (x, z) + d (y, z), para todos os x, y e z.

A última condição não é tão óbvia quanto as três primeiras.

Primeiro, vamos discutir por que isso é chamado de desigualdade triangular. Todo triângulo tem esta propriedade:

Pegue quaisquer dois lados de um triângulo; o comprimento do outro lado é menor que a soma desses dois lados.

O Que E Metrica

Em nossa equação acima, temos três pontos (x, y e z) nessa equação três pontos formam um triângulo. É por isso que está relacionado.

Em seguida, o que significa desigualdade de triângulo em nossa definição de métrica? Vamos ilustrar com um exemplo.

Desenhe dois pontos em uma folha de papel e chame-os de xe y. Se você precisar medir a distância entre esses 2 pontos, o que você faria?

Você desenharia um segmento de linha de x a y e, em seguida, mediria o comprimento do segmento de linha.

Parece óbvio, não é? No entanto, por que não desenhamos outro ponto (chamado ponto z) e, em seguida, desenhamos dois segmentos de linha (de x a z, ez a y) e medimos os comprimentos?

O motivo é simples:

A distância deve ser calculada como o caminho mais curto entre 2 pontos.

Você não faz um desvio para calcular a distância, que é obviamente mais longa.

Portanto, a condição de desigualdade do triângulo significa que a métrica deve ser calculada da maneira mais curta.

 

Exemplos de métricas

Vamos discutir alguns exemplos de distância e se isso satisfaz a definição de uma métrica “verdadeira”.

1. Distância euclidiana

Distância euclidiana (também conhecida como distância L2) é a definição de distância que você normalmente usa em sua vida diária, por exemplo, ao medir os pontos de distância que discuto acima.

Obviamente, satisfaz a definição de métrica “verdadeira”.

2. Distância cosseno

Distância de cosseno (ou similaridade de 1 cosseno) é a distância que você pode ter encontrado ao trabalhar com vetores.

Infelizmente, a distância do cosseno não é uma métrica “verdadeira”.

Primeiro, não satisfaz a condição indiscernível. A distância cosseno de [1,1] e [2,2] é 0, mas [1,1] ≠ [2,2].

Além disso, não satisfaz a desigualdade do triângulo. Suponha que d é a distância do cosseno ex = [1,0], y = [0,1], z = [1,1]. É fácil ver que d (x, y) = 1 e d (x, z) = d (y, z) ~ 0,3, então d (x, y)> d (x, z) + d (y, z) não satisfaz a desigualdade do triângulo.

É por isso que a distância cosseno realmente não faz sentido: a distância é menor se você fizer um desvio (para z), em vez de direto de x para y.

3. Métrica do produto interno

O produto interno (ou produto escalar) é comumente usado no modelo de Filtragem Colaborativa.

O conceito é semelhante à similaridade de cosseno sem normalizar o vetor.

Na verdade, não é nem mesmo uma “distância”, já que está diminuindo quando está mais longe, em comparação com o entendimento comum de distância: está aumentando quando está mais longe.

Existe uma alternativa para definir a distância como produto interno negativo, ou seja, basta multiplicar o produto interno por -1.

Faz mais sentido como distância, mas só satisfaz a condição de simetria, então definitivamente não é uma métrica.

 

Distância euclidiana vs distância cosseno

Recomenda-se escolher a distância euclidiana como uma métrica de distância, uma vez que é uma métrica ‘verdadeira’, em vez da distância cosseno.

Normalmente, a distância do cosseno é preferível, uma vez que varia de -1 a 1, em comparação com a distância euclidiana que é ilimitada, por isso é mais fácil definir um limite (digamos 0,7) na distância do cosseno.

Na verdade, você pode encontrar o limite com a distância euclidiana explorando a faixa de distância nos dados, semelhante à distância do cosseno.

O Que E O Sistema Metrico

O que é o sistema métrico?

Tudo ao nosso redor, desde a quantidade de açúcar que você coloca em um bolo até o comprimento de um campo de futebol, tem um valor medido.

Medimos cada objeto de acordo com seu comprimento, peso, volume ou tempo de maneira diferente.

O conceito de “Sistema Métrico” é introduzido com essas medições.

Por definição, o sistema métrico de medida em matemática é o conjunto de unidades padrão definidas para medir comprimento, peso e capacidade.

 

Exemplos de sistema métrico

Existem vários lugares onde usamos unidades métricas em nossa vida diária.

Este sistema métrico é implementado e seguido em vários campos, como ciência, medicina, governança, defesa e assim por diante.

Alguns dos exemplos de sistemas métricos podem ser listados conforme a seguir.

  • John e Lisa correm um quilômetro.
  • Esta melancia pesa 4 quilos.
  • Asher leva 10 mililitros de tônica.

Origem do Sistema Métrico

Metricação é o processo de implementação do sistema internacional de unidades (unidades SI).

Foi seguido por quase todos os países, exceto Estados Unidos, Mianmar e Libéria.

Os Estados Unidos, então, introduziram suas próprias unidades habituais, amplamente utilizadas em vários campos, como o USCS.

Assim, as unidades métricas seguidas nos Estados Unidos são chamadas de unidades consuetudinárias dos Estados Unidos (USCS).

Diferença entre unidades USCS e SI

O sistema USCS evoluiu a partir do sistema imperial britânico. As unidades métricas dos Estados Unidos também são chamadas de “unidades imperiais”.

A principal diferença entre as unidades SI e as unidades métricas americanas são os termos e o tipo de unidades usadas.

Por exemplo, o comprimento é medido usando o metro em unidades do SI, enquanto o pé é usado nas unidades métricas dos Estados Unidos.

A tabela a seguir mostra as diferenças entre as unidades SI e USCS.

Comprimento, peso, capacidade e tempo
Vejamos rapidamente as unidades métricas que usamos, junto com alguns exemplos:

Comprimento

O comprimento da unidade é usado para medir o tamanho de um objeto ou a distância de uma extremidade à outra.

Existem várias unidades, como metro, quilômetro, milímetro, pés, polegadas e assim por diante.

A unidade padrão para medição de comprimento é metro. A ferramenta padrão que usamos para medir o comprimento é uma régua.

Estes são alguns exemplos que mostram onde as medidas de comprimento são normalmente usadas:

  • Isso indica que há uma escola a 1 km de distância.
  • A altura desta porta é de cerca de 6 pés.
  • Este clipe de papel tem 1 polegada de comprimento.

Comprimento: Conversão Métrica

O quilômetro é a maior unidade e o milímetro é a menor unidade de comprimento de medição.

A tabela abaixo mostra várias unidades de medida de comprimento com suas respectivas conversões no sistema métrico.

A tabela abaixo mostra várias unidades de medida de comprimento com suas opções avaliadas no sistema métrico.

  • O peso de duas fatias de pão é de cerca de 100 gramas.
  • O peso de um pão é de cerca de um quilograma (kg).
  • Um elefante pesa aprox. cerca de 5 toneladas.

Peso: Conversão Métrica

Capacidade
O termo capacidade é usado para medir o volume ou o espaço ocupado por um objeto. A unidade padrão para medição de capacidade é o litro.

A ferramenta padrão que usamos para medir o comprimento é o copo medidor. Por exemplo

  • Um litro de leite.
  • 500 ml de óleo.
  • Um copo de café.

Capacidade: Conversão Métrica

Um litro de água líquida tem uma massa quase exatamente igual a um quilograma na pressão padrão.

Tempo
Não precisamos de muita introdução à palavra “tempo”, pois a usamos com frequência.

A medição do tempo é comum nas unidades SI e nas unidades métricas dos Estados Unidos. Por exemplo,

  • Amiley respondeu à pergunta em uma fração de segundo.
  • Julie levou uma hora para fazer o dever de casa.

Observações importantes sobre o sistema métrico

Abaixo estão algumas notas importantes sobre o sistema métrico de tópicos que o ajudarão a compreender melhor e mais rapidamente o tópico.

  • O sistema métrico consiste em um conjunto de unidades para medir comprimento, peso, capacidade, temperatura, etc.
  • Seguimos o Sistema Internacional de Unidades (unidades SI).
  • A unidade padrão para medição de comprimento é metro.
  • A unidade padrão para medição de peso é um quilograma.
  • A unidade padrão para medição de capacidade é o litro.
  • O tempo é medido em horas, minutos e segundos.

Distância euclidiana vs distância cosseno

Recomenda-se escolher a distância euclidiana como uma métrica de distância, uma vez que é uma métrica ‘verdadeira’, em vez da distância cosseno.

Normalmente, a distância do cosseno é preferível, uma vez que varia de -1 a 1, em comparação com a distância euclidiana que é ilimitada, por isso é mais fácil definir um limite (digamos 0,7) na distância do cosseno.

Na verdade, você pode encontrar o limite com a distância euclidiana explorando a faixa de distância nos dados, semelhante à distância do cosseno.

 

Conclusão

Para concluir, as métricas de distância são ferramentas para resolver seu problema.

Se você precisar usar a distância de cosseno e o produto interno, sinta-se à vontade para usá-lo.

Afinal, o objetivo da ciência de dados é resolver problemas e você é livre para escolher suas ferramentas. Espero que este artigo ajude você a entender as ferramentas

Gostou do artigo? Deixe seu feedback!

Leia também – O que é Growth Marketing como funciona e como fazer

Relatório de Vendas: O que é, Como Fazer e Modelos

Avalie esta página
error: Conteúdo protegido