Bản tin định kỳ
Báo cáo thường niên
Tạp chí khoa học ĐHCT
Tạp chí tiếng anh ĐHCT
Tạp chí trong nước
Tạp chí quốc tế
Kỷ yếu HN trong nước
Kỷ yếu HN quốc tế
Book chapter
(2024) Trang: 624-631
Tạp chí: Kỷ yếu Hội nghị Khoa học công nghệ Quốc gia lần thứ XVII về Nghiên cứu cơ bản và ứng dụng Công Nghệ thông tin (FAIR)
Các bệnh về phổi là một trong những nguyên nhân hàng đầu gây tử vong và suy giảm sức khỏe toàn cầu. Chẩn đoán sớm và chính xác đóng vai trò quan trọng để hỗ trợ các bác sĩ trong điều trị kịp thời, giảm biến chứng và cải thiện chất lượng cuộc sống. Ngày nay, với sự phát triển công nghệ thông tin trong y tế đã tạo ra lượng dữ liệu văn bản lâm sàng phong phú từ bệnh án điện tử, cải thiện quản lý thông tin bệnh nhân và cung cấp dữ liệu quý giá cho nghiên cứu y khoa. Trong bài báo này, chúng tôi xây dựng bộ dữ liệu thực tế mới về thông tin lâm sàng được trích xuất từ hồ sơ bệnh án điện tử tại Bệnh viện Đa khoa Khu vực tỉnh An Giang. Quá trình nghiên cứu bao gồm việc tiền xử lý dữ liệu văn bản, sử dụng các phương pháp biểu diễn văn bản gồm BoW, TF-IDF, Word2Vec, GloVe, FastText và BERT và các mô hình máy học khác nhau để thực nghiệm phân loại 12 loại bệnh phổi từ tập dữ liệu mới. Kết quả thực nghiệm cho thấy các phương pháp biểu diễn văn bản truyền thống như BoW và TF-IDF thường đạt hiệu suất cao hơn so với các phương pháp còn lại trong thực nghiệm. Với BoW và TF-IDF, các mô hình như Multi Layer Perceptron, Logistic Regression, và Random Forest đạt kết quả khả quan, với độ chính xác dao động từ 82,61% đến 85,99%. Đáng chú ý, mô hình Extreme Gradient Boosting đạt độ chính xác cao nhất với cả BoW và TF-IDF (đều 89,59%), cho thấy sự mạnh mẽ của mô hình này khi xử lý các đặc trưng từ văn bản y khoa.
Các bài báo khác
2191 (2024) Trang: 55-70
Tạp chí: Communications in Computer and Information Science
Vietnamese | English