Встречай YOLO26: ИИ компьютерного зрения нового поколения.
Ultralytics
Назад к глоссарию Ultralytics

Semantic Chunking

Узнай, как семантическое сегментирование сохраняет контекст данных для повышения точности ИИ и RAG. Узнай, как извлекать визуальные сегменты с помощью Ultralytics YOLO26.

Семантическая нарезка — это передовой метод предварительной обработки данных, используемый в машинном обучении (ML) и искусственном интеллекте (AI) для разделения больших наборов данных на более мелкие, значимые сегменты. Если тебе интересно, «что такое нарезка» (chunking) в контексте AI, то это процесс разбиения длинных последовательностей неструктурированных данных, таких как документы, видео или аудио, на управляемые фрагменты или сегменты. Стандартное определение нарезки часто подразумевает разбиение данных по фиксированному количеству символов или временному интервалу. Однако «смысловая нарезка», или семантическая нарезка, идет дальше, анализируя контекст и группируя связанную информацию вместе. Это гарантирует, что основной смысл остается нетронутым, предотвращая потерю контекста, которая часто встречается при произвольных методах разделения.

Link to this sectionКак работает семантическая нарезка?#

Чтобы понять, как выполнять семантическую нарезку, полезно рассмотреть её роль в современных генеративных конвейерах. Итак, что такое семантическая нарезка в RAG? При подготовке данных для векторной базы данных модель эмбеддингов анализирует соседние предложения или визуальные элементы и вычисляет их взаимосвязь. Используя статистические метрики, такие как косинусное сходство, система определяет точки, где меняется тема — их часто называют точками разрыва — и разделяет данные именно там. Это гарантирует, что фрагменты данных, извлекаемые большой языковой моделью (LLM) во время запроса, содержат полные, связные мысли, что значительно повышает точность сгенерированного ответа. Недавние исследования RAPTOR и адаптивной кластеризации графов подчеркивают, как эта стратегия, учитывающая контекст, превосходит разделение на фиксированные размеры.

Link to this sectionСемантическая нарезка в компьютерном зрении#

Хотя семантическая нарезка традиционно ассоциируется с обработкой естественного языка (NLP), она крайне актуальна в компьютерном зрении и мультимодальном AI. Например, в анализе документов визуальный семантический фрагмент может объединять график и его пояснительную подпись, вместо того чтобы разделять их на основе строгих границ страницы. Передовые облачные провайдеры и API-инструменты предоставляют специализированные конфигурации семантической нарезки для управления такими сложными типами данных.

Разработчики могут использовать модель Ultralytics YOLO26 для автоматизации извлечения таких визуальных фрагментов. Обнаруживая объекты внутри изображения или видео, ты можешь создавать локализованные сегменты смысла, которые представляют основное содержание сцены.

from ultralytics import YOLO

# Load an Ultralytics YOLO26 model to extract visual semantics
model = YOLO("yolo26n.pt")

# Run inference to detect objects within a visual scene
results = model("scene.jpg")

# Group detected object classes to form a semantic visual chunk
visual_chunk = [model.names[int(cls)] for cls in results[0].boxes.cls]
print(f"Semantic visual chunk elements: {visual_chunk}")

Link to this sectionРеальные приложения#

Семантическая нарезка решает критические задачи в различных рабочих процессах AI. Вот два конкретных примера:

  • Мультимодальный RAG для анализа документов: При разборе сложных PDF-файлов, например финансовых отчетов, визуальная нарезка гарантирует, что ограничивающие рамки (bounding boxes) вокруг таблиц сгруппированы с соответствующими текстовыми резюме. Это позволяет AI-помощникам точно отвечать на узкоспециализированные вопросы, не теряя числовой контекст.
  • Автоматизированное создание резюме видео: В системах безопасности и наблюдения непрерывные видеопотоки семантически нарезаются на основе обнаруженных событий — например, когда человек входит в запретную зону. Используя отслеживание объектов, система группирует соответствующие кадры в значимый видеоклип, вместо того чтобы выдавать случайный 10-секундный отрезок. Команды, управляющие такими огромными наборами данных, часто полагаются на платформу Ultralytics для беспрепятственной разметки, обучения и развертывания таких сложных конвейеров, управляемых событиями.

Link to this sectionСвязанные концепции#

Важно отличать этот метод от схожих терминов в AI:

  • Нарезка действий (Action Chunking): В то время как семантическая нарезка группирует данные по смыслу для оптимального извлечения, нарезка действий группирует последовательности физических движений (например, траекторию робототехнического манипулятора) в единые исполняемые действия в робототехнике.
  • Семантический поиск: Семантическая нарезка — это жизненно важный этап подготовки данных, который делает точное извлечение информации возможным, тогда как семантический поиск — это сам процесс запроса, который извлекает эти подготовленные фрагменты на основе намерения пользователя.

Explore solutions

Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше
Real-time AI that works with your team

ИИ в робототехнике

Делай свои машины умнее с помощью моделей Ultralytics YOLO. ИИ машинного зрения в робототехнике обеспечивает автономную навигацию, восприятие, отслеживание объектов и управление в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в логистике

Оптимизируй логистику с помощью моделей Ultralytics YOLO. Vision AI позволяет инспектировать посылки, сортировать их, отслеживать транспортные средства и контролировать безопасность на складе в реальном времени.

Узнать больше
Real-time AI that works with your team

ИИ в розничной торговле

Переосмысли ритейл с помощью моделей Ultralytics YOLO. Vision AI расширяет возможности отслеживания запасов, мониторинга полок, управления очередями и более глубокого понимания клиентов.

Узнать больше
Real-time AI that works with your team

ИИ в здравоохранении

Создавай решения для здравоохранения с помощью моделей Ultralytics YOLO. ИИ для зрения в медицине ускоряет анализ медицинских изображений, делает диагностику более точной, а мониторинг пациентов — эффективнее.

Узнать больше
Real-time AI that works with your team

ИИ в производстве

Оптимизируй производство с помощью моделей Ultralytics YOLO. Vision AI управляет контролем качества, обнаружением дефектов, соблюдением СИЗ и автоматизацией сборочных линий.

Узнать больше
Real-time AI that works with your operation

ИИ в автомобильной отрасли

Применяй компьютерное зрение в автомобильной отрасли с моделями Ultralytics YOLO. ИИ для зрения повышает безопасность дорожного движения, помогает водителю и способствует автоматизации транспортных средств для создания более «умных» дорог.

Узнать больше
Real-time AI tailored to your operation

ИИ в сельском хозяйстве

Внедряй ИИ в «умное» сельское хозяйство с помощью моделей Ultralytics YOLO. Оптимизируй мониторинг посевов, отслеживание скота и точное земледелие для получения более высоких и «умных» урожаев.

Узнать больше

Давай строить будущее ИИ вместе!

Начни свой путь в будущее машинного обучения