Text classification is an important task which may help human reducing time and effort. This work is aimed to propose an approach for text classification, especially for articles. The proposed method can automatically extract information and categorize articles on suitable topics. The input data were pre-processed, extracted, vectorized and classified using machine learning techniques including Support Vector Machines, Naïve Bayes, and k-Nearest Neighbors. The experiments were carried out on two data sets of articles showed that with the accuracy of over 91%, using natural language processing and support vector machines technique proved its feasibility for developing the automatic classification system of articles.
Trích dẫn: Trần Thanh Điện và Nguyễn Thái Nghe, 2017. Các mô hình e-learning hỗ trợ dạy và học. Tạp chí Khoa học Trường Đại học Cần Thơ. Số chuyên đề: Công nghệ thông tin: 103-111.
Trích dẫn: Trần Thanh Điện, Thái Nhựt Thanh và Nguyễn Thái Nghe, 2019. Giải pháp phân loại bài báo khoa học bằng kĩ thuật máy học. Tạp chí Khoa học Trường Đại học Cần Thơ. 55(4A): 29-37.
Tạp chí khoa học Trường Đại học Cần Thơ
Lầu 4, Nhà Điều Hành, Khu II, đường 3/2, P. Xuân Khánh, Q. Ninh Kiều, TP. Cần Thơ
Điện thoại: (0292) 3 872 157; Email: tapchidhct@ctu.edu.vn
Chương trình chạy tốt nhất trên trình duyệt IE 9+ & FF 16+, độ phân giải màn hình 1024x768 trở lên