RỪNG NGẪU NHIÊN CẢI TIẾN CHO PHÂN LOẠI DỮ LIỆU GIEN

Hướng dẫn

Tìm kiếm nâng cao

Tựa bài viết

Tìm

Tác giả

Năm xuất bản

Tóm tắt

Lĩnh vực

Phân loại

Số tạp chí

Bản tin định kỳ

Báo cáo thường niên

Tạp chí khoa học ĐHCT

Tạp chí tiếng anh ĐHCT

Tạp chí trong nước

Tạp chí quốc tế

Kỷ yếu HN trong nước

Kỷ yếu HN quốc tế

Book chapter

RỪNG NGẪU NHIÊN CẢI TIẾN CHO PHÂN LOẠI DỮ LIỆU GIEN

Số 22b (2012) Trang: 9-17

Tác giả: Huỳnh Phụng Toàn, Đỗ Thanh Nghị, Nguyễn Minh Trung, Nguyễn Vũ Lâm

Tóm tắt

Tải về

Abstract

Our investigation aims to propose random trees to classify gene data which have very small amount of samples in very high dimensions and noise. The random forest algorithm proposed by Breiman is usually suited for classifying very-high-dimensional datasets. However, the classical majority rule of a decision tree degrades the classification accuracy of random forests. We have proposed to improve the classification performance of random forests by using in each leaf of the tree a local class labeling rule instead of the majority rule. The numerical test results on gene datasets from datam.i2r.a-star.edu.sg/datasets/krbd/ showed that that our proposal gives good classification results compared with classical random forests and support vector machine (SVM) in terms of Precision, Recall, F1 and Accuracy.

Keywords: Genes expression classification, Decision trees, Random forests, k nearest neighbors

Title: Improved random forests for classifying gene data

TóM TắT

Trong bài viết này, chúng tôi đề xuất giải thuật rừng ngẫu nhiên cải tiến cho phân lớp dữ liệu gien thường có rất ít các phần tử dữ liệu nhưng số chiều rất lớn và có nhiễu. Trong thực tế, giải thuật rừng ngẫu nhiên của Breiman thường được sử dụng cho phân lớp kiểu dữ liệu như dữ liệu gien. Tuy nhiên, do sử dụng luật bình chọn số đông ở nút lá của cây quyết định làm dự báo của rừng ngẫu nhiên bị giảm. Để cải thiện kết quả dự báo của rừng ngẫu nhiên, chúng tôi đề xuất thay thế luật bình chọn số đông bởi luật gán nhãn cục bộ. Kết quả thử nghiệm trên các tập dữ liệu gien từ site datam.i2r.a-star.edu.sg/datasets/krbd/ cho thấy rằng giải thuật rừng ngẫu nhiên cải tiến do chúng tôi đề xuất cho kết quả phân loại tốt khi so sánh với rừng ngẫu nhiên của cây quyết định C4.5 và máy học véctơ hỗ trợ dựa trên các tiêu chí Precision, Recall, F1, Accuracy.

Từ khóa: Phân loại dữ liệu gien, giải thuật học cây quyết định, rừng ngẫu nhiên, k láng giềng

Các bài báo khác

PHÂN LOẠI THƯ RÁC VỚI GIẢI THUẬT BOOSTING CÂY QUYẾT ĐỊNH NGẪU NHIÊN XIÊN PHÂN ĐƠN GIẢN

Số 19b (2011) Trang: 1-9

Tác giả: Huỳnh Phụng Toàn, Nguyễn Minh Trung, Đỗ Thanh Nghị, Nguyễn Vũ Lâm

Tóm tắt

Tải về

Trích dẫn

Instance Segmentation in Color Images Using an Energy-Based Model Integrating Sigmoid and Softmax

1832 (2026) Trang: 452–462/48

Tác giả: Huỳnh Phụng Toàn, Võ Văn Tài, Huỳnh Xuân Hiệp

Tạp chí: Lecture Notes in Networks and Systems (LNNS)

Tóm tắt

EIS-PoI: An Energy-Driven Approach for Instance Segmentation Using Points of Interest

648 (2025) Trang: 43-53

Tác giả: Huỳnh Phụng Toàn

Tạp chí: Lecture Notes of the Institute for Computer Sciences, Social-Informatics and Telecommunications Engineering, LNICST

Tóm tắt

Towards Robust Semantic Segmentation: A Non-Deep Learning Dominant Approach with Energy Distance and Point of Interest

16355 (2025) Trang: 102–114

Tác giả: Huỳnh Phụng Toàn, Võ Văn Tài, Huỳnh Xuân Hiệp

Tạp chí: Lecture Notes in Computer Science

Tóm tắt

ESS-PoI: Energy-driven Semantic Segmentation with Points of Interest

(2025) Trang:

Tác giả: Huỳnh Phụng Toàn, Huỳnh Xuân Hiệp

Tạp chí: 2025 5th Asia Conference on Information Engineering (ACIE)

Tóm tắt

A Novel Approach to Instance Segmentation: Integrating Mask R-CNN with Energy-Based Modeling and Points of Interest

(2025) Trang: 61-66

Tác giả: Huỳnh Phụng Toàn, Võ Văn Tài, Huỳnh Xuân Hiệp

Tạp chí: 2025 10th International Conference on Intelligent Information Technology (ICIIT 2025)

Tóm tắt

Khoanh vùng ảnh với phương pháp kết hợp Energy Distance và Energy-Based Model

1 (2024) Trang: 330-335

Tác giả: Huỳnh Phụng Toàn, Huỳnh Xuân Hiệp

Tạp chí: Hội thảo quốc gia lần thứ XXVII: Một số vấn đề chọn lọc của Công nghệ thông tin và truyền thông

Tóm tắt

Mô hình trực quan cây quyết định cho dự báo lan truyền dịch rầy nâu

1 (2013) Trang: 248

Tác giả: Huỳnh Phụng Toàn, Võ Hải Đăng, Đỗ Thanh Nghị

Tạp chí: KY Hội nghị Khoa học tự nhiên 2013

Tóm tắt

Phân loại văn bản với giải thuật Bayes thơ ngây

1 (2013) Trang: 275

Tác giả: Huỳnh Phụng Toàn, Võ Hải Đăng, Đỗ Thanh Nghị

Tạp chí: KY Hội nghị Khoa học tự nhiên 2013

Tóm tắt

Vietnamese | English

Tạp chí khoa học Trường Đại học Cần Thơ
Khu II, Đại học Cần Thơ, Đường 3/2, Phường Ninh Kiều, Thành phố Cần Thơ, Việt Nam
Điện thoại: (0292) 3 872 157; Email: tapchidhct@ctu.edu.vn

Chương trình chạy tốt nhất trên trình duyệt IE 9+ & FF 16+, độ phân giải màn hình 1024x768 trở lên

Vui lòng chờ...