Yolo فيجن شنتشن
شنتشن
انضم الآن
مسرد المصطلحات

تجزئة الصور

اكتشف قوة تجزئة الصور مع Ultralytics YOLO. استكشف الدقة على مستوى البكسل وأنواعها وتطبيقاتها وحالات استخدام الذكاء الاصطناعي في العالم الحقيقي.

تجزئة الصور هي تقنية أساسية في الرؤية الحاسوبية (CV) التي تتضمن تقسيم صورة رقمية إلى مجموعات فرعية متعددة من البكسلات، والتي يشار إليها عادةً باسم قطاعات الصورة. الهدف الأساسي هو تبسيط تمثيل الصورة إلى شيء أكثر وضوحًا وأسهل في التحليل. على عكس الكشف عن الأجسام، والذي يحدد موقع الأجسام داخل مستطيل الشكل، فإن تجزئة الصورة توفر خريطة دقيقة على مستوى البكسل لشكل الجسم. تقوم هذه العملية بتعيين تسمية لكل بيكسل في الصورة، مما يسمح لنماذج الذكاء الاصطناعي لنماذج الذكاء الاصطناعي (AI) فهم الحدود والخطوط الدقيقة للكيانات داخل المشهد.

أهمية الدقة على مستوى البكسل

في العديد من عمليات سير عمل التعلم الآلي الحديثة (ML), معرفة الموقع التقريبي للكائن غير كافٍ. تتطلب التطبيقات التي تتطلب التفاعل مع الفيزيائية - مثل الروبوت الذي يمسك بحزمة أو سيارة تتنقل في طريق متعرج - تتطلب فهمًا دقيقًا الهندسة. يعمل تجزئة الصور على سد هذه الفجوة من خلال تحويل البيانات المرئية الأولية إلى مجموعة من المناطق المصنفة. هذه القدرة هذه القدرة مدعومة ببنى المتقدمة (DL) ، ولا سيما الشبكات العصبية التلافيفية (CNNs)، التي تستخرج السمات المكانية للتمييز بين الأجسام الأمامية والخلفية.

أنواع تجزئة الصور

إن فهم مهمة التجزئة المحددة أمر بالغ الأهمية لاختيار بنية النموذج الصحيح. الفئات الثلاث الأساسية الأساسية الثلاثة هي:

  • التجزئة الدلالية: تعامل هذه الطريقة كائنات متعددة من نفس الفئة ككيان واحد. على سبيل المثال، في مشهد الشارع، كل وحدات البكسل البكسل التي تنتمي إلى "طريق" باللون الرمادي، وجميع البكسلات التي تنتمي إلى "سيارة" باللون الأزرق. لا يميز هذا الأسلوب بين سيارتين مختلفتين؛ فهو ببساطة يحدد أن كلاهما سيارتان. هذا النهج غالبًا ما يتم تنفيذه باستخدام بنيات مثل U-Net, التي تم تطويرها في الأصل لتجزئة الصور الطبية الحيوية.
  • تجزئة المثيل: تذهب هذه التقنية إلى أبعد من ذلك من خلال تحديد الأجسام الفردية المميزة. إذا كانت هناك خمس سيارات في الصورة, سيؤدي تجزئة المثيل إلى إنشاء خمسة أقنعة منفصلة، مما يسمح للنظام بحساب track كل سيارة بشكل مستقل. هذه هي المهمة الأساسية التي يقوم بها Ultralytics YOLO11 نماذج التجزئة، والتي توازن بين السرعة والدقة للتطبيقات في الوقت الحقيقي.
  • التجزئة الشاملة: A نهج هجين يجمع بين التجزئة الدلالية وتجزئة المثيل. يوفر فهمًا شاملاً للمشهد من خلال بتعيين تسمية فئة لكل بكسل (أشياء في الخلفية مثل السماء والطريق) مع تحديد الأشياء التي يمكن عدها بشكل فريد (أشياء مثل الأشخاص والسيارات).

تطبيقات واقعية

إن القدرة على ترسيم الحدود الدقيقة تجعل التجزئة أمرًا لا غنى عنه في مختلف الصناعات:

  • تحليل الصور الطبية: يعد التجزئة أمرًا بالغ الأهمية في مجال الرعاية الصحية لتحليل فحوصات مثل التصوير بالرنين المغناطيسي أو التصوير المقطعي المحوسب أو التصوير المقطعي المحوسب. من خلال تحديد الأورام أو الأعضاء أو الآفات بدقة، تساعد نماذج الذكاء الاصطناعي أطباء الأشعة في التشخيص والتخطيط الجراحي والتخطيط الجراحي. على سبيل المثال، يتيح تحديد الحجم الدقيق لورم الدماغ تحديداً دقيقاً العلاج الإشعاعي الأكثر استهدافاً, وتقليل الضرر الذي يلحق بالأنسجة السليمة.
  • السيارات ذاتية القيادة: تعتمد السيارات ذاتية القيادة بشكل كبير على التجزئة للتنقل بأمان. حيث تقوم النماذج بمعالجة موجزات الفيديو لتحديد الممرات والأرصفة والمشاة والعقبات. تقوم منظمات مثل SAE الدولية تحديد مستويات القيادة الذاتية التي تتطلب هذا التصور البيئي المفصل الإدراك البيئي التفصيلي لاتخاذ قرارات في جزء من الثانية.
  • الزراعة الدقيقة: في الذكاء الاصطناعي في الزراعة، يساعد التجزئة في مراقبة صحة المحاصيل. يمكن للطائرات بدون طيار المزودة بكاميرات متعددة الأطياف segment الحقول لتحديد الإصابة بالأعشاب الضارة أو نقص المغذيات على أساس كل ورقة على حدة، مما يتيح استخدام مبيدات الأعشاب المستهدفة.

التنفيذ التقني مع YOLO

قامت الأطر الحديثة بتبسيط تنفيذ مهام التجزئة. بينما كانت أجهزة الكشف القديمة ذات المرحلتين مثل Mask R-CNN دقيقة ولكن بطيئة، فقد أحدثت النماذج أحادية المرحلة ثورة في هذا المجال من خلال تقديم الاستدلال في الوقت الحقيقي. إن Ultralytics YOLO11 على سبيل المثال، يدعم تجزئة المثيل أصلاً. استشرافًا للمستقبل, يجري تطوير نموذج YOLO26 لتحسين هذه مع المعالجة الشاملة.

يمكن للمطورين استخدام مكتبات قياسية مثل OpenCV للمعالجة المسبقة والتصور، بينما يستخدمون PyTorch أطر العمل القائمة على PyTorch من أجل رفع الأحمال الثقيلة استدلال النموذج.

فيما يلي مثال موجز لكيفية إجراء تجزئة النماذج باستخدام نموذج YOLO11 المدرب مسبقًا في Python:

from ultralytics import YOLO

# Load a pre-trained YOLO11 segmentation model
model = YOLO("yolo11n-seg.pt")

# Run inference on an image (can be a local path or URL)
results = model("https://ultralytics.com/images/bus.jpg")

# Display the resulting image with segmentation masks overlaid
results[0].show()

يتعامل هذا المقتطف البرمجي تلقائيًا مع المهام المعقدة لاستخراج الميزات، وانحدار المربع المحدود، وإنشاء القناع مما يسمح للمطوّرين بالتركيز على دمج نتائج نتائج التجزئة في تطبيقاتهم الأكبر.

انضم إلى مجتمع Ultralytics

انضم إلى مستقبل الذكاء الاصطناعي. تواصل وتعاون وانمو مع المبتكرين العالميين

انضم الآن