Hiện nay các mô hình học sâu (Deep Learning) tiêu biểu như mô hình mạng nơron tích chập (Convolutional Neural Networks - CNNs) được ứng dụng thành công trong bài toán phân lớp ảnh, văn bản, nhận dạng tiếng nói. Ưu điểm của các mô hình học sâu là tự động học các đặc trưng của dữ liệu để thiết lập các đặc trưng mới và phân lớp dữ liệu. Trong bài báo này chúng tôi đề xuất xây dựng mô hình kiến trúc mạng nơron tích chập để phân lớp dữ liệu biểu hiện gen microarray có số chiều lớn. Kết quả thực nghiệm trên 10 tập dữ liệu biểu hiện gen microarray được lấy từ ngân hàng dữ liệu y sinh (Kent Ridge) và cơ sở dữ liệu Gene Expression Omnibus (GEO) của NCBI cho thấy rằng mô hình mạng nơron tích chập có độ chính xác cao hơn các mô hình đơn giản như k láng giềng (k Nearest Neighbors - kNN), cây quyết định (Decision Tree). Mạng nơron tích chập đạt được độ chính xác tương đương với mô hình máy học véctơ hỗ trợ (Support Vector Machines - SVM), rừng ngẫu nhiên (Random Forest) và tốt hơn so với Adaboost và Bagging của cây quyết định.
Tạp chí khoa học Trường Đại học Cần Thơ
Lầu 4, Nhà Điều Hành, Khu II, đường 3/2, P. Xuân Khánh, Q. Ninh Kiều, TP. Cần Thơ
Điện thoại: (0292) 3 872 157; Email: tapchidhct@ctu.edu.vn
Chương trình chạy tốt nhất trên trình duyệt IE 9+ & FF 16+, độ phân giải màn hình 1024x768 trở lên