Xây dựng một kiến trúc mới cho mô hình đếm đám đông
DOI:
https://doi.org/10.65153/g2qxfw28Từ khóa:
Đếm đám đông, mạng nơ-ron tích chập đa lớp, Hình ảnh, học sâuTóm tắt
Đếm đám đông là nhiệm vụ đếm số người trong một hình ảnh. Mỗi hình ảnh huấn luyện chứa nhiều người được đánh dấu bằng một dấu chấm. Các phương pháp đếm đám đông hiện có phải làm mịn mỗi điểm rơi được chú thích bằng hàm Gauss hoặc ước tính khả năng xảy ra của mỗi pixel cho điểm được chú thích. Trong bài báo này, chúng tôi đề xuất một kiến trúc đếm đám đông mới có thể xử lý biến dạng phối cảnh bằng cách sử dụng thông minh nhiều đặc trưng được tạo ra trong quá trình mã hóa. Không giống như các phương pháp trước đây, phương pháp của chúng tôi tránh trích xuất các đặc trưng đa tỷ lệ bổ sung, giúp giảm đáng kể tổng khối lượng tính toán. Để đạt được mục đích này, chúng tôi cũng đã cải tiến cơ chế hợp nhất đa tỷ lệ hiện có và đưa ra một khối giảm kênh mới. Các thí nghiệm trên cơ sở dữ liệu ShanghaiTech đã chứng minh rằng phương pháp của chúng tôi có thể vượt trội hơn các phương pháp tiên tiến có độ phức tạp tính toán tương tự


