In this paper, we present a method of camera-based document image retrieval for heterogeneous-content documents using different types of features from different layers of information. We use two kinds of features in this paper (Locally Likely Arrangement Hashing - LLAH - and SIFT reduced dimensions using PCA). Then, a single hash table method is used for indexing these multiple kinds of feature vectors. In addition, we employ a technique for reducing the memory required for indexing the key points in hash table. Experimental results show that the multilayer hashing gives a high accuracy and outperforms classical methods on single layer.
Đặng Quốc Bảo, Đỗ Thanh Nghị, Trần Huỳnh Lê, 2011. PHÂN LOẠI DỮ LIỆU GIEN VỚI GIẢI THUẬT MÁY HỌC ARCX4-RODT. Tạp chí Khoa học Trường Đại học Cần Thơ. 19b: 30-38
Tạp chí khoa học Trường Đại học Cần Thơ
Lầu 4, Nhà Điều Hành, Khu II, đường 3/2, P. Xuân Khánh, Q. Ninh Kiều, TP. Cần Thơ
Điện thoại: (0292) 3 872 157; Email: tapchidhct@ctu.edu.vn
Chương trình chạy tốt nhất trên trình duyệt IE 9+ & FF 16+, độ phân giải màn hình 1024x768 trở lên