ABSTRACT - Imbalanced data set is a common problem when one set of classes has a significant advantage over the other. This issue causes the performance of a machine learning model to be skewed toward the majority class. This paper studies the problem of data imbalance and proposes a method of using the Generative Adversarial Network (GAN) to generate additional images for the unbalanced data set. An objective measure is required to evaluate the performance of the GAN model during the training to determine when it is good enough, i.e, determine a good configuration for generating good samples to add to a minority class. For this purpose, we propose a method of using Fréchet Inception Distance (FID) to select a good set of images from those generated from GAN. The experimentation results illustrate that the proposed method works efficiently to improve the dataset in terms of both quantity and quality, increasing the accuracy by 3%.
TÓM TẮT - Tập dữ liệu mất cân bằng là khi một số lớp dữ liệu có số lượng mẫu vượt trội hơn so với các lớp khác. Bài báo này nghiên cứu vấn đề mất cân bằng dữ liệu và đề xuất một phương pháp sử dụng Mạng Đối nghịch tạo sinh (GAN) để tạo ra các hình ảnh bổ sung cho tập dữ liệu không cân bằng. Cách tiếp cận này cần có một độ đo khách quan để đánh giá trong quá trình huấn luyện GAN nhằm xác định khi nào GAN đã đủ tốt, tức là xác định được một mô hình được huấn luyện đủ tốt, có khả năng sinh ra các mẫu giống thật và đa dạng. Độ đo được đề xuất để trả lời cho vấn đề này là độ đo Fréchet Inception Distance (FID) . Thực nghiệm đã chỉ ra rằng, phương pháp lựa chọn mẫu được đề xuất có thể giúp cân bằng dữ liệu và giúp tăng độ chính xác trong nhận dạng lên 3%.
Từ khóa: Mạng Đối nghịch tạo sinh (GAN), dữ liệu không cân bằng, độ đo Fréchet Inception (FID).
Tạp chí: Đầu tư phát triển thị trường nông sản và Du lịch nông thôn ở Đồng bằng sông Cửu Long, Tổ chức tại Khoa kinh tế, Trường Đại học Cần Thơ vào ngày 28 tháng 09 năm 2022
Tạp chí khoa học Trường Đại học Cần Thơ
Lầu 4, Nhà Điều Hành, Khu II, đường 3/2, P. Xuân Khánh, Q. Ninh Kiều, TP. Cần Thơ
Điện thoại: (0292) 3 872 157; Email: tapchidhct@ctu.edu.vn
Chương trình chạy tốt nhất trên trình duyệt IE 9+ & FF 16+, độ phân giải màn hình 1024x768 trở lên