Giới thiệu về lĩnh vực mới nổi neuro-symbolic AI
Khám phá cách neuro-symbolic AI kết hợp học tập và logic để xây dựng các hệ thống hiểu được bối cảnh và đưa ra các quyết định minh bạch, dễ giải thích hơn.

Ngày nay, nhờ sự phát triển nhanh chóng của trí tuệ nhân tạo (AI) và sự phổ biến ngày càng tăng của sức mạnh tính toán, các mô hình AI tiên tiến đang được phát hành nhanh hơn bao giờ hết. Trên thực tế, không gian AI đang thúc đẩy sự đổi mới có ý nghĩa trên nhiều ngành công nghiệp.
Ví dụ, trong lĩnh vực chăm sóc sức khỏe, các hệ thống AI đang được sử dụng để hỗ trợ các nhiệm vụ như phân tích hình ảnh y tế nhằm chẩn đoán sớm. Tuy nhiên, giống như bất kỳ công nghệ nào, AI vẫn có những hạn chế của nó.
Một mối quan tâm lớn là tính minh bạch. Ví dụ, một mô hình phát hiện đối tượng có thể định vị chính xác khối u trong bản quét MRI não, nhưng lại rất khó để hiểu cách mô hình đưa ra kết luận đó. Sự thiếu khả năng giải thích này khiến các bác sĩ và nhà nghiên cứu khó tin tưởng hoặc xác thực hoàn toàn các kết quả của AI.
Đó chính xác là lý do tại sao sự quan tâm ngày càng tăng đối với lĩnh vực mới nổi của AI thần kinh-biểu tượng. AI thần kinh-biểu tượng kết hợp thế mạnh nhận dạng mẫu của deep learning với lập luận có cấu trúc, dựa trên quy tắc có trong symbolic AI. Mục tiêu là tạo ra các hệ thống đưa ra dự đoán chính xác, nhưng đồng thời có thể giải thích lập luận của chúng theo cách con người có thể hiểu được.
Trong bài viết này, chúng ta sẽ khám phá cách trí tuệ nhân tạo thần kinh-biểu tượng hoạt động và cách nó kết hợp việc học tập với lập luận để xây dựng các hệ thống minh bạch hơn, nhận thức được ngữ cảnh. Hãy bắt đầu nào!
Link to this sectionHai khía cạnh của AI thần kinh-biểu tượng: Học tập và lập luận#
Trước khi đi sâu vào AI thần kinh-biểu tượng, hãy xem xét kỹ hơn hai phân ngành mà nó kết hợp: deep learning và symbolic AI.
Deep learning tập trung vào việc nhận dạng các mẫu trong dữ liệu, trong khi symbolic AI sử dụng các quy tắc, logic hoặc tư duy thông thường để giải quyết vấn đề. Mỗi loại đều có thế mạnh, nhưng cũng có những hạn chế. Bằng cách kết hợp chúng, AI thần kinh-biểu tượng tạo ra các hệ thống có thể vừa học từ dữ liệu vừa giải thích các quyết định của mình một cách rõ ràng hơn.
Link to this sectionTổng quan về deep learning#
Deep learning là một nhánh của học máy sử dụng các mạng thần kinh nhân tạo, được lấy cảm hứng một cách lỏng lẻo từ cách não bộ xử lý thông tin. Các mạng này học bằng cách phân tích lượng dữ liệu lớn và điều chỉnh các kết nối bên trong để cải thiện hiệu suất.
Điều này cho phép chúng nhận dạng các mẫu trong hình ảnh, âm thanh và văn bản mà không cần các quy tắc thủ công cho mọi tình huống. Nhờ đó, deep learning cực kỳ hiệu quả đối với các tác vụ tập trung vào nhận thức như nhận dạng hình ảnh, xử lý giọng nói và dịch ngôn ngữ.
Một ví dụ điển hình là mô hình thị giác máy tính được huấn luyện để phân đoạn các đối tượng trong hình ảnh. Với đủ các ví dụ được gán nhãn, nó có thể học cách phân tách đường xá, phương tiện và người đi bộ trong cảnh quay giao thông thời gian thực.
Tuy nhiên, bất chấp độ chính xác của chúng, các mô hình deep learning thường gặp khó khăn trong việc giải thích rõ ràng cách chúng đạt được một kết quả cụ thể. Thách thức này, thường được gọi là vấn đề hộp đen, khiến người dùng khó diễn giải hoặc xác minh các quyết định của mô hình, đặc biệt là trong các lĩnh vực nhạy cảm như chăm sóc sức khỏe hoặc tài chính. Điều này rất quan trọng vì AI có trách nhiệm đòi hỏi sự minh bạch, tin cậy và khả năng hiểu lý do tại sao mô hình đưa ra một dự đoán nhất định.
Link to this sectionKhám phá symbolic AI#
Symbolic AI áp dụng cách tiếp cận có cấu trúc hơn đối với trí thông minh và việc ra quyết định. Nó biểu diễn kiến thức bằng cách sử dụng các ký hiệu và áp dụng các quy tắc logic để làm việc với kiến thức đó, tương tự như cách chúng ta sử dụng lập luận và ngôn ngữ để giải quyết vấn đề. Mỗi bước trong quá trình lập luận đều được xác định rõ ràng, điều này làm cho các quyết định của symbolic AI trở nên minh bạch và dễ giải thích hơn.
Kiến thức biểu tượng hoạt động đặc biệt tốt trong các tác vụ tuân theo các quy tắc rõ ràng và được xác định kỹ lưỡng, chẳng hạn như lập kế hoạch, lên lịch hoặc quản lý kiến thức có cấu trúc. Tuy nhiên, symbolic AI lại gặp khó khăn với dữ liệu phi cấu trúc hoặc các tình huống không hoàn toàn khớp với các danh mục được xác định trước.
Một ví dụ phổ biến về các phương pháp tiếp cận biểu tượng trong thực tế là các chương trình cờ vua thời kỳ đầu. Chúng tuân theo các quy tắc thủ công và chiến lược cố định thay vì học hỏi từ các ván đấu trước hoặc thích nghi với các đối thủ khác nhau. Kết quả là, cách chơi của chúng có xu hướng cứng nhắc và dễ dự đoán.

Hình 1. Cái nhìn về cấu trúc của AI và các phân ngành của nó. (Ảnh của tác giả)
Link to this sectionAI thần kinh-biểu tượng là gì?#
Trong những năm 2010, khi deep learning trở nên phổ biến hơn, các nhà nghiên cứu bắt đầu tìm cách vượt ra ngoài việc nhận dạng mẫu đơn giản để hướng tới việc hiểu các mối quan hệ và ngữ cảnh. Sự thay đổi này giúp các mô hình AI không chỉ phát hiện đối tượng trong một khung cảnh, như con mèo và tấm thảm, mà còn diễn giải cách các đối tượng đó liên quan với nhau, ví dụ như nhận ra rằng con mèo đang ngồi trên tấm thảm.
Tuy nhiên, tiến trình này cũng làm nổi bật một hạn chế cốt lõi. Các mô hình deep learning có thể nhận dạng các mẫu cực kỳ tốt, nhưng chúng thường gặp khó khăn trong việc giải thích lập luận hoặc xử lý các tình huống lạ. Sự quan tâm trở lại đối với việc lập luận này đã dẫn các nhà nghiên cứu quay trở lại với một lĩnh vực tồn tại từ những năm 1980: AI thần kinh-biểu tượng.
AI thần kinh-biểu tượng tích hợp deep learning và symbolic AI. Nó cho phép các mô hình học hỏi từ các ví dụ theo cùng cách mà deep learning thực hiện, đồng thời áp dụng logic và lập luận như cách symbolic AI làm.
Nói một cách đơn giản, AI thần kinh-biểu tượng có thể nhận dạng thông tin, hiểu ngữ cảnh và cung cấp các giải thích rõ ràng hơn cho các quyết định của nó. Cách tiếp cận này đưa chúng ta đến gần hơn với việc phát triển các hệ thống AI hoạt động theo cách đáng tin cậy và giống con người hơn.

Hình 2. Hiểu về AI thần kinh-biểu tượng (Ảnh của tác giả)
Link to this sectionNhững điều cơ bản về cách AI thần kinh-biểu tượng hoạt động#
Một kiến trúc thần kinh-biểu tượng kết hợp việc học tập và lập luận lại với nhau trong một khuôn khổ duy nhất. Nó thường bao gồm ba phần chính: một lớp nhận thức thần kinh diễn giải dữ liệu thô, một lớp lập luận biểu tượng áp dụng logic và một lớp tích hợp kết nối cả hai. Tiếp theo, chúng ta sẽ xem xét kỹ hơn từng lớp.
Link to this sectionLớp nhận thức thần kinh#
Thành phần nhận thức thần kinh xử lý dữ liệu phi cấu trúc, chẳng hạn như hình ảnh, video, văn bản hoặc âm thanh, và chuyển đổi nó thành các biểu diễn nội bộ mà hệ thống có thể làm việc cùng. Nó thường sử dụng các mô hình deep learning để phát hiện các mẫu và nhận diện đối tượng hoặc đặc điểm trong đầu vào. Ở giai đoạn này, hệ thống nhận ra những gì có trong dữ liệu, nhưng nó chưa lập luận về ý nghĩa, các mối quan hệ hoặc ngữ cảnh.
Dưới đây là một số loại mô hình deep learning phổ biến được sử dụng trong lớp này:
- Mạng thần kinh tích chập (CNNs): Chúng là một loại mạng thần kinh được thiết kế để xử lý dữ liệu dạng lưới như hình ảnh. CNN sử dụng các bộ lọc tích chập để quét qua một hình ảnh và phát hiện các mẫu như cạnh, kết cấu và hình dạng. Bằng cách chồng các mẫu này lên nhau, chúng học cách nhận diện các đối tượng như ô tô, trái cây và con người.
- Transformers: Transformers là các mô hình được thiết kế để hiểu cách các phần khác nhau của một đầu vào liên quan đến nhau như thế nào. Thay vì đọc thông tin theo thứ tự nghiêm ngặt, chúng có thể nhìn vào nhiều phần của dữ liệu cùng một lúc và quyết định phần nào là quan trọng nhất. Điều này giúp chúng hiểu ngữ cảnh trong văn bản, hình ảnh hoặc cả hai. Nhờ sự linh hoạt này, transformers là kiến trúc cốt lõi đằng sau hầu hết các mô hình ngôn ngữ hiện đại và nhiều hệ thống thị giác-ngôn ngữ.
- Mạng thần kinh tái phát (RNNs): Loại mô hình này được thiết kế để phân tích dữ liệu tuần tự, chẳng hạn như giọng nói hoặc tín hiệu chuỗi thời gian. Nó duy trì bộ nhớ của các đầu vào trước đó, nghĩa là các dự đoán của nó có thể tính đến ngữ cảnh theo thời gian.
Cuối cùng, các mô hình thần kinh này trích xuất và biểu diễn các đặc điểm có ý nghĩa từ dữ liệu thô. Đầu ra này sau đó trở thành đầu vào cho lớp lập luận biểu tượng, lớp này diễn giải và lập luận về những gì hệ thống đã phát hiện.
Link to this sectionLớp lập luận biểu tượng#
Lớp lập luận biểu tượng lấy thông tin do lớp nhận thức thần kinh tạo ra và hiểu chúng bằng logic. Thay vì chỉ làm việc dựa trên các mẫu, nó dựa vào những thứ như quy tắc, đồ thị tri thức, cơ sở tri thức và bản thể luận (các mô tả có tổ chức về các khái niệm và cách chúng liên quan với nhau). Những thứ này giúp hệ thống hiểu cách các yếu tố khác nhau khớp với nhau và hành động nào là hợp lý trong một tình huống nhất định.
Ví dụ, trong một chiếc xe tự lái, lớp nhận thức thần kinh có thể nhận diện đèn giao thông màu đỏ trong luồng dữ liệu camera. Lớp lập luận biểu tượng sau đó có thể áp dụng một quy tắc như: “Nếu đèn màu đỏ, phương tiện phải dừng lại.” Vì việc lập luận dựa trên các quy tắc rõ ràng, các quyết định của hệ thống dễ giải thích và xác minh hơn, điều này đặc biệt quan trọng trong các tình huống mà sự an toàn và trách nhiệm giải trình là vấn đề cốt yếu.
Link to this sectionLớp tích hợp#
Lớp tích hợp kết nối lớp nhận thức thần kinh và lớp lập luận biểu tượng, đảm bảo rằng việc học tập và lập luận hoạt động cùng nhau. Theo một hướng, nó chuyển đổi đầu ra từ các mô hình thần kinh (chẳng hạn như phát hiện người đi bộ) thành các biểu diễn biểu tượng mô tả đối tượng và các thuộc tính của nó.
Theo hướng khác, nó lấy các quy tắc biểu tượng (ví dụ: “một phương tiện phải dừng lại nếu có người đi bộ trên lối qua đường”) và chuyển chúng thành các tín hiệu hướng dẫn các mô hình thần kinh. Điều này có thể bao gồm việc làm nổi bật các vùng liên quan của hình ảnh, gây ảnh hưởng đến sự chú ý hoặc định hình các con đường quyết định của mô hình.
Sự trao đổi hai chiều này tạo thành một vòng lặp phản hồi. Phía thần kinh đạt được cấu trúc và khả năng diễn giải từ các quy tắc biểu tượng, trong khi phía biểu tượng có thể thích nghi hiệu quả hơn dựa trên dữ liệu thực tế. Các kỹ thuật như mạng thần kinh logic (LNNs) giúp kích hoạt tương tác này bằng cách nhúng trực tiếp các ràng buộc logic vào các kiến trúc thần kinh.
Bằng cách liên kết nhận thức và lập luận theo cách này, AI thần kinh-biểu tượng có thể tạo ra các quyết định vừa chính xác vừa dễ diễn giải hơn. Nhiều nhà nghiên cứu coi cách tiếp cận này là một bước tiến hứa hẹn hướng tới AI đáng tin cậy và phù hợp với con người hơn, và có khả năng trở thành nền tảng cho sự tiến bộ trong tương lai hướng tới trí tuệ nhân tạo tổng quát (AGI).
Link to this sectionCác ứng dụng của AI thần kinh-biểu tượng#
Bây giờ chúng ta đã hiểu rõ hơn về AI thần kinh-biểu tượng là gì và cách nó hoạt động, hãy cùng xem xét một số trường hợp sử dụng trong thực tế của nó.
Link to this sectionLái xe an toàn hơn: Từ việc nhìn thấy người đi bộ đến việc thấu hiểu họ#
Các phương tiện tự hành cần hiểu môi trường xung quanh để vận hành an toàn. Chúng sử dụng các công nghệ như thị giác máy tính để phát hiện người đi bộ, phương tiện, vạch kẻ làn đường và biển báo giao thông.
Mặc dù các mô hình deep learning có thể nhận diện các đối tượng này một cách chính xác, chúng không phải lúc nào cũng hiểu ý nghĩa của các đối tượng đó trong ngữ cảnh hoặc cách chúng liên quan với nhau trong tình huống thực tế. Ví dụ, một mô hình thần kinh có thể nhận ra người đi bộ trên lối qua đường nhưng không thể biết liệu họ sắp sang đường hay chỉ đang đứng chờ.
AI thần kinh-biểu tượng cố gắng thu hẹp khoảng cách này bằng cách cho phép các phương tiện tự lái kết hợp nhận dạng hình ảnh với lập luận logic, để chúng có thể diễn giải các tình huống thay vì chỉ nhận diện đối tượng. Nghiên cứu AI gần đây đã chỉ ra rằng các hệ thống kết hợp nhận thức thần kinh với các quy tắc biểu tượng có thể cải thiện dự đoán hành vi người đi bộ.
Trong các hệ thống này, thành phần thần kinh phân tích các dấu hiệu trực quan như tư thế, chuyển động và vị trí của người đi bộ. Thành phần biểu tượng sau đó áp dụng các quy tắc logic, cân nhắc các yếu tố như liệu người đó có đang ở gần lối qua đường hay không hoặc tín hiệu giao thông hiện tại cho thấy điều gì.
Bằng cách kết hợp hai góc nhìn này, hệ thống thần kinh-biểu tượng có thể làm được nhiều hơn là chỉ đơn giản phát hiện người đi bộ. Nó có thể đưa ra dự đoán hợp lý về việc liệu người đi bộ có khả năng sang đường hay không và có thể giải thích lý do tại sao nó đưa ra quyết định đó. Điều này dẫn đến hành vi an toàn và minh bạch hơn ở các phương tiện tự hành.

Hình 3. Đưa ra dự đoán dựa trên hành vi người đi bộ được quan sát bằng cách sử dụng AI thần kinh-biểu tượng. (Nguồn)
Link to this sectionDiễn giải logic trong trả lời câu hỏi trực quan#
Một ứng dụng quan trọng khác của AI thần kinh-biểu tượng là trả lời câu hỏi trực quan (VQA). Các hệ thống VQA được thiết kế để trả lời các câu hỏi về hình ảnh.
Nó tập hợp các mô hình ngôn ngữ lớn (LLMs) và các mô hình thị giác để thực hiện lập luận đa phương thức, kết hợp những gì hệ thống nhìn thấy với những gì nó hiểu. Ví dụ, nếu một hệ thống VQA được hiển thị một hình ảnh và được hỏi, “Cái cốc có ở trên bàn không?”, nó phải nhận diện các đối tượng nhưng cũng phải hiểu mối quan hệ giữa chúng. Nó cần xác định xem cái cốc có thực sự nằm trên bàn trong khung cảnh đó hay không.
Một nghiên cứu gần đây đã chứng minh cách AI thần kinh-biểu tượng có thể nâng cao VQA bằng cách tích hợp nhận thức thần kinh với lập luận biểu tượng. Trong hệ thống được đề xuất, mạng thần kinh trước tiên phân tích hình ảnh để nhận diện các đối tượng và các thuộc tính của chúng, chẳng hạn như màu sắc, hình dạng hoặc kích thước.
Thành phần lập luận biểu tượng sau đó áp dụng các quy tắc logic để diễn giải cách các đối tượng này liên quan đến nhau và để trả lời câu hỏi. Nếu được hỏi “Có bao nhiêu hình trụ màu xám trong cảnh?”, phần thần kinh xác định tất cả các hình trụ và màu sắc của chúng, còn phần biểu tượng lọc chúng dựa trên các tiêu chí và đếm những cái chính xác.

Hình 4. Các ví dụ về kịch bản VQA nơi cần có kiến thức trừu tượng và logic. (Nguồn)
Nghiên cứu như vậy cho thấy cách VQA thần kinh-biểu tượng có thể vượt xa việc chỉ đưa ra câu trả lời. Vì mô hình có thể hiển thị các bước nó thực hiện để đi đến kết luận, nó hỗ trợ AI có khả năng giải thích, nơi các hệ thống đưa ra dự đoán và biện minh cho lập luận của chúng theo cách con người có thể hiểu được.
Link to this sectionƯu điểm và nhược điểm của AI thần kinh-biểu tượng#
Dưới đây là một số lợi ích chính của việc sử dụng AI thần kinh-biểu tượng:
- Khả năng lập luận mạnh mẽ hơn: Không giống như các mô hình deep learning thuần túy, AI thần kinh-biểu tượng có thể thực hiện các tác vụ đòi hỏi lập luận nhiều bước, lập kế hoạch, tuân thủ quy tắc và xử lý các lĩnh vực kiến thức có cấu trúc, nơi mà symbolic AI thường vượt trội.
- Khả năng thích ứng: Các hệ thống này hoạt động tốt trên các tác vụ mới hoặc chưa từng thấy vì chúng có thể lập luận logic vượt ra ngoài những gì chúng được huấn luyện. Thay vì chỉ ghi nhớ dữ liệu, chúng hiểu các mối quan hệ và các mẫu.
- Tính bền vững với nhiễu và sự mơ hồ: Các ràng buộc logic có thể giúp ngăn ngừa lỗi khi dữ liệu bị nhiễu, không đầy đủ hoặc mơ hồ. Lớp lập luận có thể thực thi các quy tắc hướng dẫn hoặc sửa chữa các dự đoán thần kinh.
Bất chấp tiềm năng của nó, AI thần kinh-biểu tượng vẫn đang phát triển và đi kèm với những thách thức thực tế nhất định. Dưới đây là một số hạn chế chính của nó:
- Tích hợp phức tạp: Mặc dù khuôn khổ lai này cung cấp khả năng diễn giải mạnh mẽ, việc thiết kế các thuật toán hợp nhất nhận thức và lập luận vẫn còn là một thách thức.
- Khả năng mở rộng: Lập luận biểu tượng có thể trở nên chậm hoặc tốn kém về mặt tính toán khi xử lý các đồ thị tri thức lớn hoặc các tập quy tắc phức tạp. Điều này có thể khiến các ứng dụng thời gian thực, chẳng hạn như lái xe tự hành, xử lý video hoặc lập luận kiến thức quy mô lớn, khó triển khai hiệu quả hơn.
- Độ bền vững của lập luận: Nếu các quy tắc biểu tượng quá cứng nhắc, các hệ thống có thể gặp khó khăn trong các kịch bản thực tế mơ hồ hoặc khó đoán. Cân bằng giữa việc học linh hoạt với lập luận đáng tin cậy vẫn là một thách thức đang diễn ra.
Link to this sectionCác điểm chính cần lưu ý#
AI thần kinh-biểu tượng đại diện cho một bước tiến quan trọng hướng tới việc xây dựng các hệ thống AI không chỉ có thể nhận thức thế giới mà còn có thể lập luận về nó và giải thích các quyết định của mình. Không giống như các hệ thống deep learning truyền thống, vốn dựa chủ yếu vào các mẫu được học từ dữ liệu, AI thần kinh-biểu tượng kết hợp học tập thống kê với logic và kiến thức có cấu trúc. Thay vì thay thế deep learning, nó xây dựng dựa trên nền tảng đó, đưa chúng ta tiến gần hơn một chút tới việc phát triển AI có thể hiểu và lập luận theo cách giống con người hơn.
Hãy tham gia cộng đồng của chúng tôi và khám phá kho lưu trữ GitHub của chúng tôi. Xem các trang giải pháp của chúng tôi để khám phá các ứng dụng đa dạng của AI trong nông nghiệp và thị giác máy tính trong chăm sóc sức khỏe. Khám phá các tùy chọn cấp phép của chúng tôi và bắt đầu xây dựng dự án AI thị giác của bạn!






