In this paper, we present a method of camera-based document image retrieval for heterogeneous-content document using a multi-layer separating approach. We use Locally Likely Arrangement Hashing (LLAH) extracting text features on the layer which contains text. In addition, we employ a technique of reducing the memory required for storing the hash table. Experiment result show that our approach is efficient in term of accuracy result and real-time retrieval for heterogeneous-content document camera-based retrieval.
Đặng Quốc Bảo, Đỗ Thanh Nghị, Trần Huỳnh Lê, 2011. PHÂN LOẠI DỮ LIỆU GIEN VỚI GIẢI THUẬT MÁY HỌC ARCX4-RODT. Tạp chí Khoa học Trường Đại học Cần Thơ. 19b: 30-38
Tạp chí khoa học Trường Đại học Cần Thơ
Lầu 4, Nhà Điều Hành, Khu II, đường 3/2, P. Xuân Khánh, Q. Ninh Kiều, TP. Cần Thơ
Điện thoại: (0292) 3 872 157; Email: tapchidhct@ctu.edu.vn
Chương trình chạy tốt nhất trên trình duyệt IE 9+ & FF 16+, độ phân giải màn hình 1024x768 trở lên