Gặp gỡ YOLO26: AI tầm nhìn thế hệ tiếp theo.
Ultralytics
Thị giác AI

Perceptron và mạng thần kinh: Các nguyên lý cơ bản của thị giác máy tính

Tìm hiểu cách mạng thần kinh đang chuyển đổi công nghệ hiện đại, từ kiểm soát chất lượng trong chuỗi cung ứng đến kiểm tra cơ sở hạ tầng tự động sử dụng drone.

ABAbirami Vina
5 min read
Perceptron và mạng thần kinh trong thị giác máy tính

Trong vài thập kỷ qua, mạng thần kinh đã trở thành nền tảng của nhiều đổi mới đột phá trong trí tuệ nhân tạo (AI). Mạng thần kinh là các mô hình tính toán cố gắng mô phỏng các chức năng phức tạp của não người. Chúng giúp máy móc học hỏi từ dữ liệu và nhận dạng các mẫu để đưa ra quyết định sáng suốt. Nhờ đó, chúng tạo điều kiện cho các lĩnh vực con của AI như thị giác máy tínhhọc sâu phát triển trong các ngành như y tế, tài chínhxe tự lái.

Hiểu cách thức hoạt động của một mạng thần kinh sẽ giúp bạn có cái nhìn rõ hơn về "hộp đen" AI, qua đó giải mã cách công nghệ tiên tiến được tích hợp vào đời sống hàng ngày của chúng ta. Trong bài viết này, chúng ta sẽ khám phá mạng thần kinh là gì, cách chúng vận hành và sự phát triển của chúng qua các năm. Chúng ta cũng sẽ xem xét vai trò của chúng trong các ứng dụng thị giác máy tính. Hãy cùng bắt đầu!

Link to this sectionPerceptron trong AI là gì?#

Trước khi đi sâu vào mạng thần kinh, hãy cùng tìm hiểu về perceptron. Đây là loại mạng thần kinh cơ bản nhất và là nền tảng để xây dựng các mô hình phức tạp hơn.

Perceptron là một thuật toán học máy tuyến tính được sử dụng cho học có giám sát (học từ dữ liệu huấn luyện được gán nhãn). Nó còn được gọi là mạng thần kinh đơn lớp và thường được dùng cho các tác vụ phân loại nhị phân để phân biệt giữa hai lớp dữ liệu. Nếu muốn hình dung về perceptron, bạn có thể coi nó như một neuron nhân tạo đơn lẻ.

Perceptron là một nơ-ron nhân tạo đơn lẻ

Hình 1. Perceptron là một neuron nhân tạo đơn lẻ.

Link to this sectionHiểu cách thức hoạt động của perceptron#

Một perceptron có thể tiếp nhận nhiều đầu vào, kết hợp chúng với các trọng số, quyết định loại dữ liệu mà chúng thuộc về và đóng vai trò như một bộ ra quyết định đơn giản. Nó bao gồm bốn tham số chính: giá trị đầu vào (còn gọi là các nút), trọng số và bias, tổng mạng và hàm kích hoạt.

Cách thức hoạt động như sau:

  • Đầu vào và trọng số: Giả sử bạn có nhiều thông tin (đầu vào) và mỗi thông tin có một trọng số cho biết tầm quan trọng của nó. Bên cạnh đó, bias giúp perceptron linh hoạt hơn khi đưa ra quyết định.
  • Tính tổng có trọng số: Perceptron nhân từng đầu vào với trọng số tương ứng, sau đó cộng tất cả lại, bao gồm cả bias, để thu được một tổng có trọng số.
  • Ra quyết định: Sau đó, perceptron sử dụng hàm kích hoạt để xác định đầu ra cuối cùng. Nó lấy tổng có trọng số và quyết định xem perceptron có kích hoạt hay không. Trong trường hợp đơn giản nhất, hàm kích hoạt là hàm bước, cho đầu ra là một nếu tổng có trọng số vượt quá một ngưỡng nhất định và bằng không nếu không đạt. Như vậy, đầu vào có trọng số được chuyển đổi thành quyết định có hoặc không.
  • Học tập và cải thiện: Nếu perceptron đưa ra dự đoán sai, nó sẽ điều chỉnh các trọng số để cố gắng cải thiện kết quả trong lần tiếp theo. Quá trình này giúp model học hỏi từ những sai sót của mình.

Tổng quan về một perceptron

Hình 2. Tổng quan về Perceptron. nguồn: indiantechwarrior.com

Link to this sectionVai trò của perceptron trong thị giác máy tính#

Perceptron đóng vai trò quan trọng trong việc giúp chúng ta hiểu những kiến thức cơ bản về computer vision. Chúng là nền tảng của các neural network tiên tiến. Không giống như perceptron, neural network không bị giới hạn ở một lớp duy nhất. Chúng được cấu tạo từ nhiều lớp perceptron kết nối với nhau, cho phép chúng học các mẫu phi tuyến tính phức tạp. Neural network có thể xử lý các tác vụ nâng cao hơn và tạo ra các kết quả đầu ra nhị phân hoặc liên tục. Ví dụ, neural network có thể được sử dụng cho các tác vụ computer vision nâng cao như instance segmentationpose estimation.

Link to this sectionSự phát triển của công nghệ thị giác máy tính từ mạng thần kinh#

Lịch sử của mạng thần kinh đã kéo dài nhiều thập kỷ và đầy ắp các nghiên cứu cũng như khám phá thú vị. Hãy cùng xem xét kỹ hơn một số cột mốc quan trọng này.

Dưới đây là cái nhìn nhanh về các cột mốc đầu tiên:

  • Thập niên 1940: Warren McCulloch và Walter Pitts đã phát triển một mạch đơn giản để mô phỏng cách não bộ hoạt động.
  • 1958: Rosenblatt giới thiệu perceptron.
  • Thập niên 1970: Paul Werbos đưa ra khái niệm lan truyền ngược (phương pháp huấn luyện giúp mạng thần kinh học bằng cách giảm thiểu sự khác biệt giữa đầu ra dự đoán và thực tế). Lan truyền ngược đã giúp việc huấn luyện các mạng thần kinh đa lớp trở nên khả thi và mở đường cho học sâu.
  • Thập niên 1980: Các nhà nghiên cứu như Geoffrey Hinton và Yann LeCun đã nghiên cứu về chủ nghĩa kết nối (connectionism), tìm hiểu cách các mạng lưới gồm những đơn vị liên kết tạo nên các tiến trình nhận thức. Công trình của họ đã đặt nền móng cho các mạng thần kinh hiện đại.
  • Thập niên 1990: Jürgen Schmidhuber và Sepp Hochreiter đề xuất mạng bộ nhớ ngắn hạn dài hạn (LSTM), trở thành yếu tố thiết yếu cho các tác vụ liên quan đến dự đoán trình tự.

Sự phát triển của mạng thần kinh

Hình 3. Sự phát triển của mạng thần kinh.

Bước sang thế kỷ 21, nghiên cứu về mạng thần kinh bùng nổ, dẫn đến những tiến bộ lớn hơn nữa. Trong những năm 2000, công trình của Hinton về máy Boltzmann hạn chế - một loại mạng thần kinh tìm kiếm các mẫu trong dữ liệu - đã đóng vai trò then chốt trong việc thúc đẩy học sâu. Nó giúp việc huấn luyện các mạng sâu trở nên dễ dàng hơn, giải quyết các thách thức với các mô hình phức tạp và làm cho học sâu trở nên thiết thực và hiệu quả hơn.

Sau đó, vào những năm 2010, nghiên cứu đã tăng tốc nhanh chóng nhờ sự trỗi dậy của big dataparallel computing. Một điểm nhấn trong thời gian này là chiến thắng của AlexNet trong cuộc thi ImageNet (năm 2012). AlexNet, một convolutional neural network sâu, là một bước đột phá quan trọng vì nó cho thấy deep learning có thể mạnh mẽ như thế nào đối với các tác vụ computer vision, chẳng hạn như nhận diện hình ảnh chính xác. Nó đã giúp thúc đẩy sự phát triển nhanh chóng của AI trong lĩnh vực nhận diện hình ảnh.

Ngày nay, mạng thần kinh đang phát triển với những đổi mới như transformer, rất hiệu quả trong việc hiểu các trình tự, và mạng thần kinh đồ thị, hoạt động tốt với các mối quan hệ phức tạp trong dữ liệu. Các kỹ thuật như học chuyển đổi - sử dụng mô hình đã huấn luyện cho tác vụ này để áp dụng cho tác vụ khác - và học tự giám sát, nơi các mô hình học mà không cần dữ liệu được gán nhãn, cũng đang mở rộng khả năng của mạng thần kinh.

Link to this sectionHiểu về mạng thần kinh: Những kiến thức cơ bản#

Bây giờ chúng ta đã nắm vững kiến thức nền tảng, hãy tìm hiểu xem mạng thần kinh chính xác là gì. Mạng thần kinh là một loại mô hình học máy sử dụng các nút hoặc neuron kết nối với nhau theo cấu trúc phân lớp giống như não người. Các nút hoặc neuron này xử lý và học hỏi từ dữ liệu, cho phép chúng thực hiện các tác vụ như nhận dạng mẫu. Ngoài ra, mạng thần kinh có tính thích nghi, do đó chúng có thể học từ những sai lầm và cải thiện theo thời gian. Điều này mang lại cho chúng khả năng giải quyết các vấn đề phức tạp, chẳng hạn như nhận diện khuôn mặt, một cách chính xác hơn.

Một mạng thần kinh

Hình 4. Mạng thần kinh.

Mạng thần kinh bao gồm nhiều bộ xử lý hoạt động song song, được tổ chức thành các lớp. Chúng bao gồm lớp đầu vào, lớp đầu ra và một số lớp ẩn ở giữa. Lớp đầu vào nhận dữ liệu thô, tương tự như cách các dây thần kinh thị giác tiếp nhận thông tin hình ảnh.

Mỗi lớp sau đó truyền đầu ra của mình sang lớp tiếp theo thay vì làm việc trực tiếp với đầu vào ban đầu, giống như cách các neuron trong não truyền tín hiệu cho nhau. Lớp cuối cùng tạo ra đầu ra của mạng. Sử dụng quy trình này, một mạng thần kinh nhân tạo (ANN) có thể học cách thực hiện các tác vụ thị giác máy tính như phân loại hình ảnh.

Link to this sectionMột ứng dụng công nghiệp của mạng thần kinh trong thị giác máy tính#

Sau khi đã hiểu mạng thần kinh là gì và cách chúng hoạt động, hãy cùng xem xét một ứng dụng cho thấy tiềm năng của mạng thần kinh trong thị giác máy tính.

Link to this sectionKiểm tra đường dây điện trong ngành năng lượng#

Mạng thần kinh tạo thành cơ sở cho các mô hình thị giác máy tính như Ultralytics YOLO11 và có thể được sử dụng để kiểm tra trực quan đường dây điện bằng drone. Ngành công nghiệp tiện ích đối mặt với những thách thức về mặt hậu cần khi kiểm tra và bảo trì mạng lưới đường dây điện rộng lớn. Những đường dây này thường trải dài qua mọi nơi, từ các khu vực đô thị đông đúc đến những cảnh quan gồ ghề, hẻo lánh. Theo truyền thống, các cuộc kiểm tra này được thực hiện bởi đội ngũ nhân công mặt đất. Mặc dù hiệu quả, các phương pháp thủ công này rất tốn kém, mất thời gian và có thể khiến công nhân tiếp xúc với các mối nguy hiểm về môi trường và điện. Nghiên cứu cho thấy công việc liên quan đến đường dây điện nằm trong số mười nghề nguy hiểm nhất ở Mỹ, với tỷ lệ tử vong hàng năm là từ 30 đến 50 công nhân trên 100.000 người.

Tuy nhiên, công nghệ kiểm tra bằng drone có thể biến kiểm tra trên không thành một lựa chọn thực tế và hiệu quả về chi phí hơn. Công nghệ tiên tiến cho phép drone bay quãng đường dài hơn mà không cần thay pin thường xuyên trong quá trình kiểm tra. Nhiều drone hiện nay được tích hợp AI và có các tính năng tự động tránh vật cản cũng như khả năng phát hiện lỗi tốt hơn. Những tính năng này cho phép chúng kiểm tra các khu vực đông đúc với nhiều đường dây điện và chụp ảnh chất lượng cao từ khoảng cách xa hơn. Nhiều quốc gia đang áp dụng sử dụng drone và thị giác máy tính cho các tác vụ kiểm tra đường dây điện. Ví dụ, tại Estonia, 100% các cuộc kiểm tra đường dây điện đều được thực hiện bởi các loại drone như vậy.

Kỹ thuật viên sử dụng máy bay không người lái và các công cụ AI để kiểm tra đường dây điện

Hình 5. Một kỹ thuật viên sử dụng drone và các công cụ AI để kiểm tra đường dây điện (ảnh bên trái) và drone mà anh ấy đang vận hành (ảnh bên phải) (suasnews).

Link to this sectionCác điểm chính cần lưu ý#

Mạng thần kinh đã trải qua một chặng đường dài từ nghiên cứu đến ứng dụng và trở thành một phần quan trọng của những tiến bộ công nghệ hiện đại. Chúng cho phép máy móc học hỏi, nhận dạng các mẫu và đưa ra quyết định sáng suốt dựa trên những gì đã học. Từ y tế, tài chính đến các phương tiện tự hành và sản xuất, các mạng này đang thúc đẩy đổi mới và chuyển đổi các ngành công nghiệp. Khi chúng ta tiếp tục khám phá và tinh chỉnh các mô hình mạng thần kinh, tiềm năng của chúng trong việc định nghĩa lại nhiều khía cạnh hơn nữa trong cuộc sống hàng ngày và hoạt động kinh doanh của chúng ta trở nên rõ ràng hơn bao giờ hết.

Để khám phá thêm, hãy truy cập GitHub repository của chúng tôi và tham gia cùng cộng đồng của chúng tôi. Khám phá các ứng dụng AI trong sản xuấtnông nghiệp trên các trang giải pháp của chúng tôi. 🚀

Explore solutions

Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Robot

Tăng cường sức mạnh cho các cỗ máy thông minh hơn với các model Ultralytics YOLO. AI thị giác trong lĩnh vực robot thúc đẩy khả năng điều hướng tự hành, nhận thức, theo dõi đối tượng và điều khiển thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong Logistics

Tối ưu hóa logistics với các model Ultralytics YOLO. Vision AI hỗ trợ kiểm tra hàng hóa, phân loại, theo dõi phương tiện và giám sát an toàn kho bãi trong thời gian thực.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong ngành Bán lẻ

Tái định hình bán lẻ với các model Ultralytics YOLO. Vision AI thúc đẩy theo dõi hàng tồn kho, giám sát kệ hàng, quản lý hàng đợi và thông tin chi tiết thông minh hơn về khách hàng.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong chăm sóc sức khỏe

Xây dựng các giải pháp y tế với các model Ultralytics YOLO. AI thị giác trong y tế hỗ trợ chẩn đoán hình ảnh y khoa nhanh hơn, chẩn đoán thông minh hơn và theo dõi bệnh nhân.

Tìm hiểu thêm
Real-time AI that works with your team

AI trong sản xuất

Tối ưu hóa sản xuất với các model Ultralytics YOLO. Vision AI thúc đẩy kiểm soát chất lượng, phát hiện lỗi, tuân thủ PPE và tự động hóa dây chuyền lắp ráp.

Tìm hiểu thêm
Real-time AI that works with your operation

AI trong Ô tô

Áp dụng thị giác máy tính trong ô tô với các model Ultralytics YOLO. AI thị giác nâng cao an toàn đường bộ, hỗ trợ người lái và tự động hóa phương tiện cho những con đường thông minh hơn.

Tìm hiểu thêm
Real-time AI tailored to your operation

AI trong Nông nghiệp

Mang AI thị giác vào nông nghiệp thông minh với các model Ultralytics YOLO. Tăng cường giám sát mùa màng, theo dõi vật nuôi và canh tác chính xác để đạt năng suất cao hơn, thông minh hơn.

Tìm hiểu thêm

Hãy cùng nhau xây dựng tương lai của AI!

Bắt đầu hành trình của bạn với tương lai của machine learning