Thông tin chung: Ngày nhận: 14/09/2012 Ngày chấp nhận: 25/03/2013 Title: Images Filtering With Bag-of-Visual-Words and ArcX4-RMNB Từ khóa: SIFT, BoVW, Arcx4-rMNB, SVM, C4.5 Keywords: SIFT, BoVW, Arcx4-rMNB, SVM, C4.5 | Abstract In this paper, we paper presents a novel approach to detect pornographic images based on the combination of the Scale-invariant feature transform method (SIFT), the bag-of-visual-words (BoVW) and the Arcx4 of random multinomial naive Bayes (Arcx4-rMNB). At the preprocessing step, we propose to use the Scale-invariant feature transform method (SIFT) which is locally based on the appearance of the object at particular interest points, invariant to image scale, rotation and also robust to changes in illumination, noise, occlusion. And then, the representation of the image that we use for classification is the bag-of-visual-words (BoVW), which is constructed from the local descriptors and the counting of the occurrence of visual words in a histogram like fashion. The pre-processing step brings out datasets with a very large num-ber of dimensions. And then, we propose a new algorithm called Arcx4 of random multinomial naive Bayes (Arcx4-rMNB) that is suited for classifying very-high-dimensional datasets. We do setup experiment with two real datasets to evaluate performances. Our approach has achieved an accuracy of 91.75% for a small dataset and 87.93% for other large one. Tóm tắt Trong bài này, chúng tôi giới thiệu một phương pháp mới phát hiện những ảnh khiêu dâm dựa trên sự kết hợp giữa phương pháp biểu diễn ảnh bằng các nét đặc trưng không đổi với những biến đổi tỉ lệ (Scale-invariant feature transform ? SIFT), mô hình túi từ trực quan (the bag-of-visual-words (BoVW) và giải thuật ArcX4 của Bayes thơ ngây ngẫu nhiên (the Arcx4 of random multinomial naive Bayes ( Arcx4-rMNB)). ở bước tiền xử lý, chúng tôi sử dụng phương pháp biểu diễn ảnh bằng các nét đặc trưng không đổi được thực hiện dựa trên đặc trưng cục bộ, không bị thay đổi trước những biến đổi tỉ lệ ảnh, tịnh tiến, phép quay, không bị thay đổi một phần đối với phép biến đổi hình học affine (thay đổi góc nhìn) và mạnh với những thay đổi về độ sáng, sự nhiễu và che khuất. Kế tiếp, mô hình túi từ trực quan được sử dụng để biểu diễn nội dung ảnh. Sau bước tiền xử lý, ảnh được biểu diễn bởi một véc-tơ có số chiều rất lớn, chúng tôi đề nghị một giải thuật mới ArcX4 của Bayes thơ ngây ngẫu nhiên cho phép phân lớp hiệu quả dữ liệu có số chiều lớn. Để đánh giá hiệu quả của phương pháp đề xuất, chúng tôi thực nghiệm với tập dữ liệu thực tế và kết quả phương pháp của chúng tôi đạt được chính xác 91.75% cho tập dữ liệu nhỏ và 87.93% cho tập dữ liệu lớn. |