Yolo Vision Shenzhen
Шэньчжэнь
Присоединиться сейчас
Глоссарий

Нейронная сеть (NN)

Изучите основы нейронных сетей. Узнайте, как они питают ИИ, чем отличаются от глубокого обучения и как управляют современными моделями, такими как Ultralytics .

Нейронная сеть (NN) — это вычислительная модель, лежащая в основе искусственного интеллекта (ИИ), предназначенная для распознавания паттернов, интерпретации сенсорных данных и кластеризации информации. Вдохновленные биологической структурой человеческого мозга, эти сети состоят из взаимосвязанных узлов, или «нейронов», организованных в слои. В то время как биологический мозг использует химические сигналы для связи между синапсами, цифровая нейронная сеть использует математические операции для передачи информации. Эти системы являются основополагающей технологией современного машинного обучения (МО), позволяющей компьютерам решать сложные задачи, такие как распознавание лиц, перевод языков и управление автономными транспортными средствами, без явно запрограммированных для каждого конкретного правила.

Нейронные сети против глубокого обучения

Хотя эти термины часто используются как синонимы, важно различать базовую нейронную сеть и глубокое обучение (DL). Основное различие заключается в глубине и сложности. Стандартная или «неглубокая» нейронная сеть может иметь только один или два скрытых слоя между входом и выходом. В отличие от этого, глубокое обучение предполагает использование «глубоких» нейронных сетей с десятками или даже сотнями слоев. Такая глубина позволяет автоматически извлекать признаки, благодаря чему модель может понимать иерархические паттерны — простые края становятся фигурами, а фигуры — узнаваемыми объектами. Более подробную техническую информацию можно найти в MIT News, где объясняется глубокое обучение и его эволюция от базовых сетей.

Как обучаются нейронные сети

Процесс «обучения» в нейронной сети включает в себя настройку внутренних параметров для минимизации ошибок. Данные поступают через входной слой, проходят через один или несколько скрытых слоев, где происходят вычисления, и выходят через выходной слой в виде прогноза.

  • Weights and Biases: каждое соединение между нейронами имеет «вес», который определяет силу сигнала. Во время обучения сеть корректирует эти веса на основе учебных данных.
  • Функции активации: чтобы решить, должен ли нейрон «сработать» или активироваться, сеть использует функцию активации, такую как ReLU или Sigmoid. Это вводит нелинейность, позволяя сети обучаться сложным границам.
  • Обратное распространение: когда сеть делает прогноз, она сравнивает результат с фактически правильным ответом. Если есть ошибка, алгоритм, называемый обратным распространением, посылает сигнал назад через сеть, чтобы точно настроить веса, улучшая точность с течением времени.
  • Оптимизация: алгоритмы, такие как стохастический градиентный спуск (SGD), помогают найти оптимальный набор весов для минимизации функции потерь. Вы можете узнать больше об алгоритмах оптимизации на AWS.

Применение в реальном мире

Нейронные сети являются движущей силой многих технологий, определяющих современную эпоху.

  1. Компьютерное зрение: В области компьютерного зрения (CV) для анализа визуальных данных используются специализированные сети, называемые сверточными нейронными сетями (CNN). Передовые модели, такие как Ultralytics , используют архитектуры глубоких нейронных сетей для обнаружения объектов в реальном времени. Эти системы имеют решающее значение для искусственного интеллекта в сельском хозяйстве, где они контролируют состояние урожая, а также в системах безопасности для обнаружения аномалий.
  2. Обработка естественного языка: для задач, связанных с текстом, такие архитектуры, как рекуррентные нейронные сети (RNN) и трансформеры, революционизировали способ, которым машины понимают человеческий язык. Эти сети лежат в основе инструментов машинного перевода и виртуальных помощников. Вы можете увидеть влияние этих технологий в сфере искусственного интеллекта в здравоохранении, где они помогают в транскрибировании медицинских записей и анализе карт пациентов.
  3. Прогнозная аналитика: компании используют нейронные сети для анализа временных рядов с целью прогнозирования цен на акции или потребностей в запасах. IBM предоставляет отличный обзор нейронных сетей в бизнес-аналитике.

Практическая реализация

Современные программные библиотеки позволяют развертывать нейронные сети без необходимости писать математические операции с нуля. Такие инструменты, как Платформа Ultralytics позволяют пользователям легко обучать эти сети на пользовательских наборах данных. Следующий Python демонстрирует, как загрузить предварительно обученную нейронную сеть (в частности, современную модель YOLO26) и выполнить инференцию на изображении с помощью ultralytics пакет.

from ultralytics import YOLO

# Load a pretrained YOLO26 neural network model
model = YOLO("yolo26n.pt")

# Run inference on an image to detect objects
# The model processes the image through its layers to predict bounding boxes
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

Проблемы и соображения

Несмотря на свою мощность, нейронные сети представляют собой определенные проблемы. Как правило, для обучения с учителем им требуются большие объемы помеченных данных. Без достаточного разнообразия данных сеть подвержена переобучению, когда она запоминает примеры обучения, а не учится обобщать. Кроме того, глубокие нейронные сети часто называют «черными ящиками», потому что точно интерпретировать, как они пришли к конкретному решению, может быть сложно, что вызвало интерес к исследованиям в области объяснимой искусственной интеллекта (XAI). Такие организации, как Ассоциация стандартов IEEE, активно работают над стандартами, чтобы обеспечить этичные и безопасные условия использования этих мощных сетей.

Присоединяйтесь к сообществу Ultralytics

Присоединяйтесь к будущему ИИ. Общайтесь, сотрудничайте и развивайтесь вместе с мировыми новаторами

Присоединиться сейчас