Our investigation aims at constructing oblique decision stump forests to classify very large number of twitter messages (tweets). Twitter sentiment analysis is not a trivial task because tweets are short and getting generated at very fast rate. Supervised learning algorithms can thus be useful to automatically detect positive or negative sentiments. The pre-processing step performs the cleaning tasks and the representation of tweets using the bag-of-words model (BoW). And then we propose oblique decision stump forests based on the linear support vector machines (SVM) that is suitable for classifying large amounts of high dimensional datapoints. The experimental results on twittersentiment.appspot.com corpora (with $1,600,000$ tweets) show that our oblique decision stump forests are efficient compared to baseline algorithms.
Tạp chí: Aquaculture and Environment: A focus in the Mekong Delta, Vietnam, Địa điểm: Trường Đại học Cần Thơ, Thời gian tổ chức: Ngày 3-5 tháng 4 năm 2014
Tạp chí: The 5th International Seminar of JSPS Core-to-Core Program: Collaborative Project for Soil and Water Conservation in Southeast Asian Watersheds. 6-7 August, 2014. Kyushu University, Japan
Tạp chí khoa học Trường Đại học Cần Thơ
Lầu 4, Nhà Điều Hành, Khu II, đường 3/2, P. Xuân Khánh, Q. Ninh Kiều, TP. Cần Thơ
Điện thoại: (0292) 3 872 157; Email: tapchidhct@ctu.edu.vn
Chương trình chạy tốt nhất trên trình duyệt IE 9+ & FF 16+, độ phân giải màn hình 1024x768 trở lên