Glossário

K-Nearest Neighbors (KNN)

Explore o K-Nearest Neighbors (KNN). Saiba como esse algoritmo de aprendizagem supervisionada funciona para classificação e regressão, sua utilização na pesquisa visual e integração com Ultralytics .

K-Nearest Neighbors (KNN) é um algoritmo robusto e intuitivo usado no campo da aprendizagem supervisionada para tarefas de classificação e regressão. Distinguido pela sua simplicidade, o KNN é frequentemente categorizado como um "aprendiz preguiçoso" porque não constrói um modelo nem aprende parâmetros durante a fase de treino. Em vez disso, ele memoriza todo o conjunto de dados de treino e realiza cálculos apenas quando uma previsão é solicitada. O princípio central do algoritmo baseia-se na similaridade de características: ele assume que pontos de dados com atributos semelhantes existem próximos uns dos outros dentro de um espaço de características multidimensional.

Como funciona o algoritmo

O mecanismo do K-Nearest Neighbors é impulsionado por cálculos de distância. Quando um novo ponto de consulta é introduzido, o algoritmo pesquisa o conjunto de dados armazenado para encontrar o número 'K' de amostras de treino mais próximas da nova entrada.

Medição de distância: O sistema calcula a distância entre o ponto de consulta e todos os outros pontos na base de dados. A métrica mais comum é a distância euclidiana, que mede a distância em linha reta entre pontos. Outras métricas, como a distância de Manhattan (geometria de táxi) ou a distância de Minkowski, podem ser usadas dependendo do tipo de dados .
Seleção de vizinhos: Após calcular as distâncias, o algoritmo classifica-as e identifica as 'K' entradas mais próximas.
Tomada de decisões:
- Para classificação: O algoritmo utiliza um sistema de «votação por maioria». O rótulo de classe que aparece com mais frequência entre os K vizinhos é atribuído ao ponto de consulta. Isto é amplamente utilizado em tarefas básicas de classificação de imagens.
- Para regressão: a previsão é calculada pela média dos valores dos K vizinhos mais próximos para estimar uma variável contínua.

Escolhendo o 'K' certo

Selecionar o valor ideal para 'K' é uma etapa crítica no ajuste de hiperparâmetros. A escolha de K influencia significativamente o desempenho do modelo e sua capacidade de generalizar para novos dados.

Valor K baixo: Um K pequeno (por exemplo, K=1) torna o modelo altamente sensível a ruídos e valores atípicos nos dados, o que pode levar ao sobreajuste.
Valor K elevado: Um K elevado suaviza os limites de decisão, reduzindo o efeito do ruído, mas potencialmente desfocando padrões distintos, o que resulta em subajuste.

Aplicações no Mundo Real

Apesar da sua simplicidade em comparação com as redes neurais profundas, o KNN continua a ser altamente relevante na IA moderna, particularmente quando combinado com técnicas avançadas de extração de características.

Sistemas de recomendação: O KNN facilita a filtragem colaborativa em streaming de mídia e comércio eletrónico. Ao identificar utilizadores com históricos de visualização ou comportamentos de compra semelhantes (vizinhos), as plataformas podem sugerir produtos que um utilizador provavelmente irá gostar com base nas preferências dos seus «vizinhos mais próximos».
Detecção de anomalias: Em cibersegurança e finanças, o KNN é usado para detecção de anomalias. Transações ou atividades de rede são mapeadas num espaço de recursos; qualquer novo ponto de dados que fique longe dos densos agrupamentos de atividade "normal" é sinalizado como potencial fraude ou violação de segurança.
Pesquisa visual: Os modernos mecanismos de pesquisa vetorial geralmente dependem de algoritmos de vizinho mais próximo aproximado (ANN) — uma variação otimizada do KNN — para recuperar rapidamente imagens semelhantes com base em incorporações de alta dimensão geradas por modelos como o YOLO26.

Desafios e Considerações

Embora eficaz, o KNN enfrenta a maldição da dimensionalidade. À medida que o número de características (dimensões) aumenta, os pontos de dados tornam-se esparsos e as métricas de distância perdem a sua eficácia. Além disso, como armazena todos os dados de treino, o KNN pode consumir muita memória e sofrer de alta latência de inferência em grandes conjuntos de dados. Para resolver isso, os profissionais costumam pré-processar os dados usando técnicas de redução de dimensionalidade, como Análise de Componentes Principais (PCA), ou usar estruturas de dados especializadas, como KD-Trees, para acelerar a pesquisa. Para dimensionamento de conjuntos de dados e treinamento de modelos em nível empresarial, a utilização da Ultralytics pode ajudar a gerenciar os recursos de computação necessários para o pré-processamento de dados complexos.

Distinguindo KNN de K-Means

É importante diferenciar K-Nearest Neighbors (K-Vizinhos Mais Próximos) de K-Means clustering(Agrupamento K-Means), pois os seus nomes semelhantes muitas vezes causam confusão.

KNN é um algoritmo de aprendizagem supervisionada que utiliza dados rotulados para fazer previsões.
K-Means é uma algoritmo de aprendizagem não supervisionada usado para agrupar dados não rotulados em clusters com base em semelhanças estruturais.

Exemplo de implementação

O seguinte trecho de código demonstra um fluxo de trabalho simples de classificação KNN usando a popular biblioteca Scikit-learn. Num contexto de visão computacional, as "características" de entrada seriam normalmente extraídas por um modelo de aprendizagem profunda como o YOLO26 antes de serem passadas para o classificador KNN.

from sklearn.neighbors import KNeighborsClassifier

# Simulated feature vectors (e.g., extracted from YOLO26) and labels
# Features: [Size, Redness], Labels: 0=Apple, 1=Orange
features = [[0.8, 0.9], [0.9, 0.8], [0.2, 0.3], [0.3, 0.2]]
labels = [0, 0, 1, 1]

# Initialize KNN with 3 neighbors
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(features, labels)

# Predict the class of a new object [Size=0.85, Redness=0.85]
prediction = knn.predict([[0.85, 0.85]])
print(f"Predicted Class: {prediction[0]} (0=Apple, 1=Orange)")

K-Nearest Neighbors (KNN)

Treine os modelosYOLO Ultralytics para simplificar os fluxos de trabalho em todos os sectores

Solução de licenciamento empresarial flexível para impulsionar sua inovação

Treine modelos de IA em segundos com o Ultralytics YOLO

Como funciona o algoritmo

Escolhendo o 'K' certo

Aplicações no Mundo Real

Desafios e Considerações

Distinguindo KNN de K-Means

Exemplo de implementação

Leia mais nesta categoria

12 casos de uso de imagens aéreas com tecnologia de visão computacional

O que é a estimativa de profundidade monocular? Uma visão geral

Uma análise sobre o usoYOLO Ultralytics para deteção de ameaças por IA

Junte-se à comunidade Ultralytics