Phân loại bệnh tim dựa trên biểu diễn ECG 2D sử dụng cơ chế chú ý chéo trong các mô hình CNN và ViT
DOI:
https://doi.org/10.65153/44f8j261Từ khóa:
mạng nơ-ron tích chập, cơ chế chú ý liên kênh, điện tâm đồ, trường góc Gramian, biểu đồ hồi quy, trường chuyển tiếp Markov, transformer thị giácTóm tắt
Phân tích tín hiệu điện tâm đồ (ECG) đóng vai trò then chốt trong chẩn đoán sớm các bệnh tim mạch. Tuy nhiên, sự phức tạp và đa dạng của dạng sóng ECG khiến việc phát hiện và phân loại tự động các rối loạn tim trở nên thách thức. Nghiên cứu này đề xuất mô hình học sâu sử dụng hai kiến trúc Convolutional Neural Network (CNN) và Vision Transformer (ViT), trong đó tín hiệu ECG 1D được chuyển đổi thành ba biểu diễn ảnh 2D gồm Gramian Angular Field (GAF), Recurrence Plot (RP) và Markov Transition Field (MTF). Các ảnh này được xử lý song song qua các nhánh CNN/ViT nhằm khai thác đồng thời đặc trưng cục bộ và toàn cục của tín hiệu. Đặc biệt, mô hình tích hợp cơ chế Cross Channel Attention (CCA) giúp học mối tương quan giữa các nhánh đặc trưng và khuếch đại thông tin quan trọng giữa các kênh. Thực nghiệm trên cơ sở dữ liệu PTB-XL cho thấy mô hình ViT-B/16 và CCA đạt độ nhạy 87.31% và độ đặc hiệu 75.35%, vượt trội so với ResNet50 và CCA (84.81%, 73.62%) và phương pháp trong [16] đạt (72.3%, 73.9%). Kết quả chứng minh rằng việc kết hợp biểu diễn ECG 2D với cơ chế CCA giúp cải thiện đáng kể độ chính xác và khả năng khái quát hóa của mô hình, đồng thời duy trì sự cân bằng giữa độ nhạy và độ đặc hiệu là yếu tố quan trọng trong các ứng dụng chẩn đoán y sinh.


