Lĩnh vực AI thần kinh biểu tượng mới nổi: Giới thiệu

Ngày nay, nhờ sự phát triển nhanh chóng của trí tuệ nhân tạo (AI) và sức mạnh tính toán ngày càng tăng, các mô hình AI tiên tiến đang được phát hành nhanh hơn bao giờ hết. Trên thực tế, lĩnh vực AI đang thúc đẩy sự đổi mới có ý nghĩa trong nhiều ngành công nghiệp.

Ví dụ, trong lĩnh vực chăm sóc sức khỏe, các hệ thống AI đang được sử dụng để hỗ trợ các nhiệm vụ như phân tích hình ảnh y tế nhằm chẩn đoán sớm. Tuy nhiên, giống như bất kỳ công nghệ nào, AI cũng có những hạn chế riêng.

Một mối quan tâm lớn là tính minh bạch. Ví dụ, một mô hình phát hiện vật thể có thể định vị chính xác khối u trong ảnh chụp não MRI, nhưng rất khó để hiểu được cách mô hình này đưa ra kết luận đó. Việc thiếu khả năng giải thích này khiến các bác sĩ và nhà nghiên cứu khó có thể hoàn toàn tin tưởng hoặc xác thực kết quả AI.

Đó chính xác là lý do tại sao lĩnh vực AI thần kinh-biểu tượng mới nổi đang ngày càng được quan tâm. AI thần kinh-biểu tượng kết hợp thế mạnh nhận dạng mẫu của học sâu với khả năng lập luận có cấu trúc, dựa trên quy tắc của AI biểu tượng . Mục tiêu là tạo ra các hệ thống đưa ra dự đoán chính xác, đồng thời có thể giải thích lập luận của chúng theo cách con người có thể hiểu được.

Trong bài viết này, chúng ta sẽ khám phá cách thức hoạt động của trí tuệ nhân tạo thần kinh biểu tượng và cách nó kết hợp việc học và lý luận để xây dựng các hệ thống minh bạch hơn, nhận thức được ngữ cảnh. Hãy cùng bắt đầu!

Hai mặt của AI thần kinh biểu tượng: Học tập và lý luận

Trước khi đi sâu vào AI thần kinh biểu tượng, chúng ta hãy xem xét kỹ hơn hai lĩnh vực phụ mà nó kết hợp lại: học sâu và AI biểu tượng.

Học sâu tập trung vào việc nhận dạng các mẫu hình trong dữ liệu, trong khi AI biểu tượng sử dụng các quy tắc, logic hoặc lẽ thường để lý giải vấn đề. Mỗi loại đều có điểm mạnh nhưng cũng có hạn chế. Bằng cách kết hợp chúng, AI biểu tượng thần kinh tạo ra các hệ thống có thể vừa học hỏi từ dữ liệu vừa giải thích các quyết định của mình rõ ràng hơn.

Tổng quan về học sâu

Học sâu là một nhánh của học máy sử dụng mạng nơ-ron nhân tạo, lấy cảm hứng từ cách não bộ xử lý thông tin. Các mạng này học bằng cách phân tích lượng lớn dữ liệu và điều chỉnh các kết nối nội bộ để cải thiện hiệu suất.

Điều này cho phép chúng nhận dạng các mẫu hình trong hình ảnh, âm thanh và văn bản mà không cần các quy tắc thủ công cho mọi tình huống. Nhờ đó, học sâu rất hiệu quả đối với các tác vụ tập trung vào nhận thức như nhận dạng hình ảnh, xử lý giọng nói và dịch ngôn ngữ.

Một ví dụ tốt là mô hình thị giác máy tính được đào tạo để segment Các đối tượng trong hình ảnh. Với đủ ví dụ được gắn nhãn, nó có thể học cách phân biệt đường, phương tiện và người đi bộ trong cảnh quay giao thông thời gian thực.

Tuy nhiên, bất chấp độ chính xác của chúng, các mô hình học sâu thường gặp khó khăn trong việc giải thích rõ ràng cách chúng đạt được một kết quả cụ thể. Thách thức này, thường được gọi là vấn đề hộp đen, khiến người dùng khó diễn giải hoặc xác minh các quyết định của mô hình, đặc biệt là trong các lĩnh vực nhạy cảm như chăm sóc sức khỏe hoặc tài chính. Điều này rất quan trọng vì AI có trách nhiệm đòi hỏi sự minh bạch, tin cậy và khả năng hiểu lý do tại sao một mô hình đưa ra một dự đoán nhất định.

Khám phá AI biểu tượng

Trí tuệ nhân tạo biểu tượng có cách tiếp cận có cấu trúc hơn đối với trí tuệ và việc ra quyết định. Nó biểu diễn kiến thức bằng các ký hiệu và áp dụng các quy tắc logic để xử lý kiến thức đó, tương tự như cách chúng ta sử dụng lý luận và ngôn ngữ để giải quyết vấn đề. Mỗi bước trong quy trình lý luận đều được định nghĩa rõ ràng, giúp các quyết định của AI biểu tượng trở nên minh bạch và dễ giải thích hơn.

Kiến thức biểu tượng đặc biệt hiệu quả trong các nhiệm vụ tuân theo các quy tắc rõ ràng và được xác định rõ ràng, chẳng hạn như lập kế hoạch, lên lịch hoặc quản lý kiến thức có cấu trúc. Tuy nhiên, AI biểu tượng gặp khó khăn với dữ liệu phi cấu trúc hoặc các tình huống không phù hợp với các danh mục được xác định trước.

Một ví dụ phổ biến về cách tiếp cận mang tính biểu tượng trong thực tế là các chương trình cờ vua thời kỳ đầu. Họ tuân theo các quy tắc thủ công và chiến lược cố định thay vì học hỏi từ các ván cờ trước hoặc thích nghi với các đối thủ khác nhau. Kết quả là, lối chơi của họ có xu hướng cứng nhắc và dễ đoán.

Hình 1. Sơ lược về cấu trúc của AI và các lĩnh vực con của nó. (Hình ảnh của tác giả)

‍

Trí tuệ nhân tạo thần kinh biểu tượng là gì?

Vào những năm 2010, khi học sâu được áp dụng rộng rãi hơn, các nhà nghiên cứu bắt đầu tìm kiếm những cách thức vượt ra ngoài nhận dạng mẫu đơn giản và hướng tới việc hiểu các mối quan hệ và bối cảnh. Sự thay đổi này giúp các mô hình AI không chỉ detect các vật thể trong một cảnh, như một con mèo và một tấm thảm, mà còn để diễn giải mối quan hệ giữa các vật thể đó, chẳng hạn như nhận ra rằng con mèo đang ngồi trên tấm thảm.

Tuy nhiên, tiến bộ này cũng làm nổi bật một hạn chế cốt lõi. Các mô hình học sâu có thể nhận dạng các mẫu cực kỳ tốt, nhưng chúng thường gặp khó khăn trong việc giải thích lập luận hoặc xử lý các tình huống không quen thuộc. Sự chú ý mới mẻ này đã đưa các nhà nghiên cứu trở lại một lĩnh vực đã tồn tại từ những năm 1980: AI thần kinh biểu tượng.

Trí tuệ nhân tạo thần kinh-biểu tượng tích hợp học sâu và trí tuệ nhân tạo biểu tượng. Nó cho phép các mô hình học hỏi từ các ví dụ theo cách tương tự như học sâu, đồng thời áp dụng logic và lập luận như trí tuệ nhân tạo biểu tượng.

Nói một cách đơn giản, AI thần kinh biểu tượng có thể nhận dạng thông tin, hiểu bối cảnh và đưa ra lời giải thích rõ ràng hơn cho các quyết định của mình. Cách tiếp cận này đưa chúng ta đến gần hơn với việc phát triển các hệ thống AI hoạt động đáng tin cậy và giống con người hơn.

Hình 2. Hiểu về AI biểu tượng thần kinh (Hình ảnh của tác giả)

‍

Những điều cơ bản về cách thức hoạt động của AI thần kinh biểu tượng

Kiến trúc thần kinh biểu tượng kết hợp việc học và lý luận trong một khuôn khổ duy nhất. Nó thường bao gồm ba phần chính: lớp nhận thức thần kinh diễn giải dữ liệu thô, lớp lý luận biểu tượng áp dụng logic, và lớp tích hợp kết nối cả hai. Tiếp theo, chúng ta sẽ xem xét kỹ hơn từng lớp.

Lớp nhận thức thần kinh

Thành phần nhận thức thần kinh xử lý dữ liệu phi cấu trúc, chẳng hạn như hình ảnh, video, văn bản hoặc âm thanh, và chuyển đổi chúng thành các biểu diễn nội bộ mà hệ thống có thể xử lý. Nó thường sử dụng các mô hình học sâu để detect Các mẫu và xác định các đối tượng hoặc đặc điểm trong dữ liệu đầu vào. Ở giai đoạn này, hệ thống nhận diện được những gì có trong dữ liệu, nhưng chưa suy luận được ý nghĩa, mối quan hệ hoặc bối cảnh.

Sau đây là một số loại mô hình học sâu phổ biến được sử dụng trong lớp này:

Mạng nơ-ron tích chập (CNN) : Đây là một loại mạng nơ-ron được thiết kế để xử lý dữ liệu dạng lưới như hình ảnh. CNN sử dụng các bộ lọc tích chập để quét qua hình ảnh và detect Các mẫu như cạnh, họa tiết và hình dạng. Bằng cách xếp chồng các mẫu này, trẻ học cách nhận biết các vật thể như ô tô, trái cây và con người.
‍
Bộ chuyển đổi : Bộ chuyển đổi là các mô hình được thiết kế để hiểu cách các phần khác nhau của một dữ liệu đầu vào liên quan với nhau. Thay vì đọc thông tin theo thứ tự nghiêm ngặt, chúng có thể xem xét nhiều phần dữ liệu cùng lúc và quyết định phần nào quan trọng nhất. Điều này giúp chúng hiểu ngữ cảnh trong văn bản, hình ảnh hoặc cả hai. Nhờ tính linh hoạt này, bộ chuyển đổi là kiến trúc cốt lõi đằng sau hầu hết các mô hình ngôn ngữ hiện đại và nhiều hệ thống ngôn ngữ thị giác.
‍
Mạng nơ-ron hồi quy (RNN) : Loại mô hình này được thiết kế để phân tích dữ liệu tuần tự, chẳng hạn như tín hiệu giọng nói hoặc tín hiệu chuỗi thời gian. Nó lưu giữ dữ liệu đầu vào trước đó, nghĩa là các dự đoán của nó có thể tính đến bối cảnh theo thời gian.

Cuối cùng, các mô hình nơ-ron này trích xuất và biểu diễn các đặc điểm có ý nghĩa từ dữ liệu thô. Đầu ra này sau đó trở thành đầu vào cho lớp suy luận tượng trưng, nơi diễn giải và lập luận về những gì hệ thống đã phát hiện.

Lớp lý luận tượng trưng

Lớp suy luận biểu tượng tiếp nhận thông tin do lớp nhận thức thần kinh tạo ra và xử lý chúng bằng logic. Thay vì chỉ dựa trên các mẫu, lớp này dựa trên các yếu tố như quy tắc, biểu đồ kiến thức, cơ sở kiến thức và các thuật ngữ (mô tả có tổ chức các khái niệm và cách chúng liên quan với nhau). Những yếu tố này giúp hệ thống hiểu cách các yếu tố khác nhau kết hợp với nhau và hành động nào có ý nghĩa trong một tình huống nhất định.

Ví dụ, trong xe tự lái, lớp nhận thức thần kinh có thể nhận diện đèn giao thông màu đỏ trong dữ liệu camera. Lớp suy luận biểu tượng sau đó có thể áp dụng một quy tắc như: "Nếu đèn đỏ, xe phải dừng lại". Vì lý luận dựa trên các quy tắc rõ ràng, các quyết định của hệ thống dễ giải thích và xác minh hơn, điều này đặc biệt quan trọng trong các tình huống mà sự an toàn và trách nhiệm giải trình là quan trọng.

Lớp tích hợp

Lớp tích hợp kết nối lớp nhận thức thần kinh và lớp lý luận biểu tượng, đảm bảo quá trình học tập và lý luận hoạt động cùng nhau. Theo một hướng, nó chuyển đổi đầu ra từ các mô hình thần kinh (chẳng hạn như phát hiện người đi bộ) thành các biểu diễn biểu tượng mô tả đối tượng và các thuộc tính của nó.

Ngược lại, nó sử dụng các quy tắc biểu tượng (ví dụ: "xe phải dừng lại nếu người đi bộ đang ở vạch kẻ đường dành cho người đi bộ") và chuyển đổi chúng thành các tín hiệu dẫn dắt các mô hình thần kinh. Điều này có thể bao gồm việc làm nổi bật các khu vực liên quan của hình ảnh, tác động đến sự chú ý hoặc định hình các đường dẫn quyết định của mô hình.

Sự trao đổi hai chiều này tạo thành một vòng phản hồi. Phía nơ-ron có được cấu trúc và khả năng diễn giải từ các quy tắc biểu tượng, trong khi phía biểu tượng có thể thích ứng hiệu quả hơn dựa trên dữ liệu thực tế. Các kỹ thuật như mạng nơ-ron logic (LNN) giúp tạo điều kiện cho tương tác này bằng cách nhúng các ràng buộc logic trực tiếp vào kiến trúc nơ-ron.

Bằng cách liên kết nhận thức và lý luận theo cách này, AI thần kinh biểu tượng có thể đưa ra những quyết định vừa chính xác vừa dễ diễn giải hơn. Nhiều nhà nghiên cứu coi cách tiếp cận này là một bước tiến đầy hứa hẹn hướng tới AI đáng tin cậy hơn và phù hợp với con người hơn, và có tiềm năng là nền tảng cho sự tiến bộ trong tương lai hướng tới trí tuệ nhân tạo tổng quát (AGI) .

Ứng dụng của AI thần kinh biểu tượng

Bây giờ chúng ta đã hiểu rõ hơn về AI biểu tượng thần kinh là gì và cách thức hoạt động của nó, hãy cùng xem xét một số trường hợp sử dụng thực tế của nó.

Lái xe an toàn hơn: Từ việc quan sát người đi bộ đến việc hiểu họ

Xe tự hành cần hiểu môi trường xung quanh để vận hành an toàn. Chúng sử dụng các công nghệ như thị giác máy tính để detect người đi bộ, phương tiện, vạch kẻ đường và biển báo giao thông.

Mặc dù các mô hình học sâu có thể nhận dạng chính xác các đối tượng này, nhưng chúng không phải lúc nào cũng hiểu được ý nghĩa của chúng trong ngữ cảnh hoặc cách chúng liên quan đến nhau trong tình huống thực tế. Ví dụ, một mô hình nơ-ron có thể nhận ra một người đi bộ trên vạch kẻ đường dành cho người đi bộ nhưng không thể biết liệu họ sắp sang đường hay chỉ đang đứng chờ.

Trí tuệ nhân tạo thần kinh-biểu tượng cố gắng thu hẹp khoảng cách này bằng cách cho phép xe tự lái kết hợp nhận dạng hình ảnh với tư duy logic, để chúng có thể diễn giải tình huống thay vì chỉ nhận dạng vật thể. Nghiên cứu AI gần đây đã chỉ ra rằng các hệ thống kết hợp nhận thức thần kinh với các quy tắc biểu tượng có thể cải thiện khả năng dự đoán hành vi của người đi bộ .

Trong các hệ thống này, thành phần thần kinh phân tích các tín hiệu thị giác như tư thế, chuyển động và vị trí của người đi bộ. Thành phần biểu tượng sau đó áp dụng các quy tắc logic, xem xét các yếu tố như người đó có gần vạch kẻ đường dành cho người đi bộ hay tín hiệu giao thông hiện tại cho biết điều gì.

Bằng cách kết hợp hai quan điểm này, hệ thống thần kinh biểu tượng có thể làm được nhiều hơn là chỉ đơn giản detect Người đi bộ. Nó có thể đưa ra dự đoán hợp lý về việc liệu người đi bộ có khả năng băng qua đường hay không, và có thể giải thích lý do tại sao nó đưa ra quyết định đó. Điều này dẫn đến hành vi an toàn và minh bạch hơn trên xe tự hành.

Hình 3. Đưa ra dự đoán dựa trên hành vi quan sát được của người đi bộ bằng AI biểu tượng thần kinh. ( Nguồn )

‍

Diễn giải logic trong trả lời câu hỏi trực quan

Một ứng dụng quan trọng khác của AI thần kinh biểu tượng là trả lời câu hỏi trực quan (VQA) . Hệ thống VQA được thiết kế để trả lời các câu hỏi về hình ảnh.

Nó kết hợp các mô hình ngôn ngữ lớn (LLM) và mô hình trực quan để thực hiện suy luận đa phương thức, kết hợp những gì hệ thống nhìn thấy với những gì nó hiểu. Ví dụ, nếu hệ thống VQA được hiển thị một hình ảnh và được hỏi: "Cái cốc có ở trên bàn không?", nó phải nhận dạng các vật thể nhưng cũng phải hiểu mối quan hệ giữa chúng. Nó cần xác định xem cái cốc có thực sự nằm trên mặt bàn trong cảnh hay không.

Một nghiên cứu gần đây đã chứng minh AI thần kinh-biểu tượng có thể nâng cao VQA bằng cách tích hợp nhận thức thần kinh với tư duy biểu tượng. Trong hệ thống được đề xuất, mạng lưới thần kinh trước tiên sẽ phân tích hình ảnh để nhận dạng vật thể và các thuộc tính của chúng, chẳng hạn như màu sắc, hình dạng hoặc kích thước.

Thành phần lý luận biểu tượng sau đó áp dụng các quy tắc logic để diễn giải mối quan hệ giữa các đối tượng này và trả lời câu hỏi. Nếu được hỏi "Có bao nhiêu hình trụ màu xám trong cảnh?", phần thần kinh sẽ xác định tất cả các hình trụ và màu sắc của chúng, còn phần biểu tượng sẽ lọc chúng dựa trên các tiêu chí và đếm những hình trụ đúng.

Hình 4. Ví dụ về các tình huống VQA trong đó cần có kiến thức trừu tượng và logic. ( Nguồn )

‍

Nghiên cứu này cho thấy VQA thần kinh biểu tượng có thể vượt ra ngoài phạm vi chỉ cung cấp câu trả lời. Bởi vì mô hình có thể hiển thị các bước cần thiết để đi đến kết luận, nó hỗ trợ AI có thể giải thích được , trong đó các hệ thống đưa ra dự đoán và biện minh cho lập luận của chúng theo cách mà con người có thể hiểu được.

Ưu và nhược điểm của AI thần kinh biểu tượng

Sau đây là một số lợi ích chính của việc sử dụng AI thần kinh biểu tượng:

Khả năng suy luận mạnh mẽ hơn: Không giống như các mô hình học sâu thuần túy, AI thần kinh tượng trưng có thể thực hiện các nhiệm vụ đòi hỏi suy luận nhiều bước, lập kế hoạch, tuân theo quy tắc và xử lý các lĩnh vực kiến thức có cấu trúc, trong khi AI tượng trưng thường vượt trội hơn.
‍
Khả năng thích ứng: Các hệ thống này hoạt động tốt với các nhiệm vụ mới hoặc chưa từng được biết đến vì chúng có khả năng suy luận logic vượt xa những gì chúng được đào tạo. Thay vì chỉ ghi nhớ dữ liệu, chúng hiểu được các mối quan hệ và mô hình.
‍
Khả năng chống nhiễu và mơ hồ: Các ràng buộc logic có thể giúp ngăn ngừa lỗi khi dữ liệu bị nhiễu, không đầy đủ hoặc mơ hồ. Lớp suy luận có thể áp dụng các quy tắc hướng dẫn hoặc hiệu chỉnh các dự đoán của nơ-ron.

Mặc dù có tiềm năng, AI thần kinh biểu tượng vẫn đang trong quá trình phát triển và đi kèm với một số thách thức thực tế nhất định. Dưới đây là một số hạn chế chính của nó:

Tích hợp phức tạp: Mặc dù khuôn khổ kết hợp này mang lại khả năng diễn giải mạnh mẽ, nhưng việc thiết kế các thuật toán kết hợp nhận thức và lý luận vẫn còn là một thách thức.
‍
Khả năng mở rộng: Suy luận tượng trưng có thể trở nên chậm hoặc tốn kém về mặt tính toán khi xử lý đồ thị tri thức lớn hoặc bộ quy tắc phức tạp. Điều này có thể khiến các ứng dụng thời gian thực, chẳng hạn như lái xe tự động, xử lý video hoặc suy luận tri thức quy mô lớn, trở nên khó triển khai hiệu quả hơn.
‍
Tính mạnh mẽ của lập luận: Nếu các quy tắc biểu tượng quá cứng nhắc, hệ thống có thể gặp khó khăn trong các tình huống thực tế mơ hồ hoặc khó lường. Việc cân bằng giữa học tập linh hoạt và lập luận đáng tin cậy vẫn là một thách thức đang tiếp diễn.

Những điều cần nhớ

Trí tuệ nhân tạo thần kinh-biểu tượng là một bước tiến quan trọng hướng tới việc xây dựng các hệ thống AI không chỉ có khả năng nhận thức thế giới mà còn có thể suy luận về nó và giải thích các quyết định của mình. Không giống như các hệ thống học sâu truyền thống, vốn chủ yếu dựa vào các mẫu hình học được từ dữ liệu, trí tuệ nhân tạo thần kinh-biểu tượng kết hợp học thống kê với logic và kiến thức có cấu trúc. Thay vì thay thế học sâu, nó được xây dựng dựa trên nền tảng đó, đưa chúng ta tiến gần hơn một chút đến việc phát triển AI có khả năng hiểu và suy luận theo cách giống con người hơn.

Tham gia cộng đồng của chúng tôi và khám phá kho lưu trữ GitHub . Xem các trang giải pháp của chúng tôi để khám phá các ứng dụng đa dạng của AI trong nông nghiệp và thị giác máy tính trong chăm sóc sức khỏe . Khám phá các tùy chọn cấp phép của chúng tôi và bắt đầu xây dựng dự án Vision AI của bạn!

Giới thiệu về lĩnh vực AI thần kinh biểu tượng mới nổi