Đăng nhập
 
Tìm kiếm nâng cao
 
Tên bài báo
Tác giả
Năm xuất bản
Tóm tắt
Lĩnh vực
Phân loại
Số tạp chí
 

Bản tin định kỳ
Báo cáo thường niên
Tạp chí khoa học ĐHCT
Tạp chí tiếng anh ĐHCT
Tạp chí trong nước
Tạp chí quốc tế
Kỷ yếu HN trong nước
Kỷ yếu HN quốc tế
Book chapter
Book chapter 2023
Số tạp chí 141(2023) Trang: 489-501
Tạp chí: Lecture Notes on Data Engineering and Communications Technologies

Automatic text summarization tasks play an important role in natural language processing. In this work, we introduce the single-document extractive summarization model based on clustering and word embedding. In the model, we use K-Means clustering to create the clusters on the large-scale dataset by using word embedding as the feature vector, then use these clusters to extract the most relevant sentences on the document to summarize. At first, we collected the articles on the Vietnamese online newspapers, cleaned them and built up the dataset with a total of 1,101,101 articles. After that, we applied our summarization model for the experimentation. The average time cost for summarizing one document in the test set is 6.22 ms, and the best F-Score of this model based on ROUGE-1, ROUGE-2, and ROUGE-L are 51.40, 16.15, and 29.18%.

Các bài báo khác
Số tạp chí Mandal, D., Wermund, U., Phavaphutanon, L., & Cronje, R.(2023) Trang: 161-200
Tạp chí: TROPICAL AND SUBTROPICAL FRUIT CROPS Production, Processing, and Marketing
Số tạp chí 13925(2023) Trang: 145--150
Tạp chí: Lecture Notes in Computer Science
Số tạp chí Nguyen Thai-Nghe, Thanh-Nghi Do, Peter Haddawy(2023) Trang: 243-257
Tạp chí: Communications in Computer and Information Science
Số tạp chí In: Nghia, P.T., Thai, V.D., Thuy, N.T., Son, L.H., Huynh, VN. (eds)(2023) Trang: 3-10
Tạp chí: Lecture Notes in Networks and Systems
Số tạp chí 1(2023) Trang: 23 - 43
Tạp chí: Artificial Intelligence and Environmental Sustainability - Challenges and Solutions in the Era of Industry 4.0
Số tạp chí 178(2023) Trang: 1
Tác giả:
Tạp chí: Advances in Agronomy
Số tạp chí Yong X. Gan(2023) Trang: 33-66
Tạp chí: Research and Developments in Engineering Research Vol. 3
Số tạp chí 1(2023) Trang: 13-23
Tạp chí: Research Highlights in Disease and Health Research
Số tạp chí Debnath Mookherjee, George M. Pomeroy, Le Thi Thu Huong(2023) Trang: 103-115
Tác giả: Phan Trung Hiền
Tạp chí: Urban Transformational Landscapes in the City-Hinterlands of Asia
Số tạp chí Manuel Yáñez and Russell J. Boyd(2023) Trang: 523-567
Tạp chí: Comprehensive Computational Chemistry
Số tạp chí Nguyen Thanh Tien and Ming-Fa Lin(2023) Trang: 573-586
Tạp chí: Chemical Modifications of Graphene-Like Materials
Số tạp chí Nguyen Thanh Tien and Ming-Fa Lin(2023) Trang: 549-572
Tạp chí: Chemical Modifications of Graphene-Like Materials
Số tạp chí Nguyen Thanh Tien and Ming-Fa Lin(2023) Trang: 483-508
Tạp chí: Chemical Modifications of Graphene-Like Materials
Số tạp chí Nguyen Thanh Tien and Ming-Fa Lin(2023) Trang: 9-52
Tạp chí: Chemical Modifications of Graphene-Like Materials
Số tạp chí 563(2023) Trang: 841–856
Tạp chí: Lecture Notes in Networks and Systems book series
Số tạp chí 563(2023) Trang: 59–72
Tạp chí: Lecture Notes in Networks and Systems book series
Số tạp chí Ali Cheshmehzangi, Bao-Jie He, Ayyoob Sharifi, Andreas Matzarakis(2023) Trang: 235-248
Tạp chí: Climate Change and Cooling Cities
Số tạp chí Phan Văn Kiền - Đỗ Anh Đức(2023) Trang: 356-375
Tạp chí: Báo chí Truyền thông - Những vấn đề trọng yếu: Tập 3
Số tạp chí Trong: Võ Khánh Vinh, Đoàn Đức Lương, Nguyễn Duy Phương, Nguyễn Linh Giang(2023) Trang: 410-428
Tạp chí: Pháp luật trong nhà nước pháp quyền xã hội chủ nghĩa Việt Nam những vấn đề lý luận và thực tiễn
Số tạp chí Trong: Đoàn Đức Lương - Nguyễn Ngọc Kiện(2023) Trang: 372-387
Tạp chí: Cải cách tư pháp trong lĩnh vực Tư pháp hình sự
Số tạp chí 176(2023) Trang: 68–79
Tạp chí: Lecture Notes on Data Engineering and Communications Technologies book series
Số tạp chí 1949(2023) Trang: 138--152
Tạp chí: Communications in Computer and Information Science
Số tạp chí 1949(2023) Trang: 227-242
Tạp chí: Communications in Computer and Information Science
Số tạp chí In: Thai-Nghe, N., Do, TN., Haddawy, P. (eds) Intelligent Systems and Data Science. ISDS 2023. Communications in Computer and Information Science, vol 1950. Springer, Singapore.(2023) Trang: 304-312
Tạp chí: Communications in Computer and Information Science
Số tạp chí Nguyen Thai-Nghe, Thanh-Nghi Do, Peter Haddawy(2023) Trang: 81-94
Tạp chí: Communications in Computer and Information Science
Số tạp chí Nguyen Thai-Nghe, Thanh-Nghi Do, Peter Haddawy(2023) Trang: 119-130
Tạp chí: Communications in Computer and Information Science
Số tạp chí Nguyen Thai-Nghe, Thanh-Nghi Do, Peter Haddawy(2023) Trang: 29–40
Tạp chí: Communications in Computer and Information Science


Vietnamese | English






 
 
Vui lòng chờ...