Đăng nhập
 
Tìm kiếm nâng cao
 
Tên bài báo
Tác giả
Năm xuất bản
Tóm tắt
Lĩnh vực
Phân loại
Số tạp chí
 

Bản tin định kỳ
Báo cáo thường niên
Tạp chí khoa học ĐHCT
Tạp chí tiếng anh ĐHCT
Tạp chí trong nước
Tạp chí quốc tế
Kỷ yếu HN trong nước
Kỷ yếu HN quốc tế
Book chapter
Book chapter 2024
Số tạp chí 5(2024) Trang: 765
Tạp chí: Lecture Notes in Computer Science

Nowadays, with the Internet infrastructure and nearly global access, the amount and diversity of data are increasing rapidly. Many tasks require information retrieval and data collection for machine learn- ing, research, and survey reports in various fields such as meteorology, science, geography, literature, and more. However, manual data collection and classification can be time-consuming and prone to errors. Addition- ally, AI assistants used for drafting or writing can sometimes be corrected regarding writing style and inappropriate language for the given con- text. Faced with these needs, In this article, Vietnamese documents are classified using the TF-IDF method, TF-IDF combined with SVD, and FastText at three levels: word level, n-gram level, and character level. For this approach, 15 categories were gathered from various online news sources. The dataset was preprocessed and trained using machine learn- ing models such as SVM, Naive Bayes, Neural Network, and Random Forest to find the most effective method. The Random Forest combined with the FastText method was highly evaluated, achieving a success rate of 82% when measured against essential evaluation criteria of accuracy, precision, and F1 score.

Các bài báo khác
Số tạp chí in Eward Park, Ho Huu Loc, & Dung Duc Tran(2024) Trang: 231 - 259
Tạp chí: The Mekong Delta Environmental Research Guidebook
Số tạp chí Ozgur AkanPaolo BellavistaJiannong CaoGeoffrey CoulsonFalko DresslerDomenico FerrariMario GerlaHisashi KobayashiSergio PalazzoSartaj SahniXuemin ShenMircea StanXiaohua JiaAlbert Y. Zomaya(2024) Trang: 36–51
Tạp chí: Lecture Notes of the Institute for Computer Sciences, Social Informatics and Telecommunications Engineering
Số tạp chí Shamik Chakraborty, Amit Chatterjee, Pankaj Kumar(2024) Trang:
Tạp chí: Urban Water Ecosystems in Africa and Asia
Số tạp chí 28 August 2024(2024) Trang: 69-88
Tạp chí: Climate-Related Human Mobility in Asia and the Pacific
Số tạp chí In: Thai-Nghe, N., Do, TN., Penferhat, S (eds),. Intelligent Systems and Data Science. ISDS 2024(2024) Trang: 59-66
Tạp chí: Communications in Computer and Information Science
Số tạp chí 87(2024) Trang: 94–105
Tạp chí: Lecture Notes on Data Engineering and Communications Technologies
Số tạp chí 14479(2024) Trang: pp 51- 62
Tạp chí: Computational Data and Social Networks
Số tạp chí 214(2024) Trang: 201–212
Tạp chí: Lecture Notes on Data Engineering and Communications Technologies
Số tạp chí 14748(2024) Trang: 323–334
Tạp chí: Lecture Notes in Computer Science
Số tạp chí Ngoc Thanh Nguyen · Bogdan Franczyk · André Ludwig · Manuel Núñez · Jan Treur · Gottfried Vossen · Adrianna Kozierkiewicz(2024) Trang: 157-169
Tạp chí: Lecture Notes in Computer Science
Số tạp chí PGS. TS Nguyễn Chí Ngôn(2024) Trang: 346-369
Tạp chí: Công nghệ kỹ thuật và công nghệ thông tin trong tiến trình công nghiệp hóa - hiện đại hóa Đồng bằng Sông Cửu Long
Số tạp chí Trong Đặng Kiều Nhân và Nguyễn Ánh Minh(2024) Trang: 225-244
Tạp chí: Đặc trưng và đổi mới kinh tế - xã hội - văn hóa của đồng bằng sông Cửu Long trong bối cảnh mới
Số tạp chí In: Leonard Barolli(2024) Trang: 106-118
Tạp chí: Lecture Notes on Data Engineering and Communications Technologies
Số tạp chí Leonard Barolli(2024) Trang: 48-59
Tạp chí: Lecture Notes on Data Engineering and Communications Technologies
Số tạp chí 2191(2024) Trang: 3-14
Tạp chí: Communications in Computer and Information Science
Số tạp chí Thai-Nghe, N., Do, TN., Benferhat, S.(2024) Trang: 33-46
Tạp chí: Communications in Computer and Information Science
Số tạp chí Thai-Nghe, N., Do, TN., Benferhat, S(2024) Trang: 47-58
Tạp chí: Communications in Computer and Information Science
Số tạp chí Nguyen Hoang Phuong Nguyen Thi Huyen Chau Vladik Kreinovich(2024) Trang: 135-147
Tạp chí: Studies in Systems, Decision and Control
Số tạp chí Yann-Henri Chemin(2024) Trang: 73-85
Tác giả: Nguyễn Duy Sang
Tạp chí: Genetic Algorithms Theory, Design and Programming
Số tạp chí Mohamad Zreik(2024) Trang: 314-331
Tạp chí: Soft Power and Diplomatic Strategies in Asia and the Middle East
Số tạp chí Thao Quoc Tran and Tham My Duong(2024) Trang: 1-20
Tạp chí: Addressing Issues of Learner Diversity in English Language Education
Số tạp chí Cheng-Few Lee and Min-Teh Yu(2024) Trang: 287-312
Tác giả: Phan Anh Tú
Tạp chí: Advances in Pacific Basin Business, Economics and Finance


Vietnamese | English






 
 
Vui lòng chờ...