Automatic form recognition is a problem attracting attention and investment of many researchers around the word. It plays an important role in data inputting and processing in practice. The study, “Handwriting scores recognition on transcripts” isderived from the actual need of Department of Academic Affairs and the other faculties at Tay Do University. This research is carried out through many phases such as noise reducing, de-skewing, rebuilding the table, locating columns in table, and recognizing handwrittingby using Gist and SVM. Methodology for researching is to combine theory and practice for commenting and appraising the result. The research has given some highlights: a) positioning and building tables can be implemented without using any learning machines, without knowing about the logical position of the table in the form; b) locating any column as well as cell in the table without marking or color accents on the form is easily;c) the cost for form handling is low. The "Handwriting scores recognition on transcripts" system is developed successfully from the research. It allows loading the transcript from the list of transcripts image, recognizing and exporting the result to any file with the accuracy up to 97.30% on 187 transcripts.
TÓM TẮT
Nhận dạng biểu mẫu tự động đang là bài toán thu hút nhiều sự chú ý và đầu tư nghiên cứu của nhiều người trên thế giới. Sự cần thiết của nhận dạng biểu mẫu đóng vai trò quan trọng trong nhập và xử lý dữ liệu tự động cũng như hiệu quả và lợi ích nó mang lại trong thực tế. Nghiên cứu “Nhận dạng điểm số viết tay trên bảng điểm” được xuất phát từ nhu cầu thực tế của Phòng Đào tạo cũng như các khoa tại Trường Đại học Tây Đô. Bài toán này được nghiên cứu thực hiện qua nhiều công đoạn như khử nhiễu, khử nghiêng, xây dựng lại bảng, định vị cột và cuối cùng là nhận dạng điểm số viết tay trong cột định vị bằng cách sử dụng GIST và SVM. Để giải quyết bài toán này, nghiên cứu thực hiện phương pháp kết hợp lý thuyết và thực nghiệm, sau đó nhận xét và đánh giá chương trình. Phương pháp nghiên cứu đưa ra có một số điểm nổi bật như sau:thứ nhất làđịnh vị và xây dựng bảng không cần dùng bất kỳ máy học nào cũng như không cần biết trước vị trí logic của bảng trong biểu mẫu;thứ hai là dễ dàng định vị cột cũng như ô bất kỳ trong bảng mà không cần đánh dấu hay điểm nhấn màu sắc nào trên biểu mẫu;cuối cùng là chi phí xử lý biểu mẫu là thấp. Sản phẩm cuối cùng nghiên cứu đạt được là xây dựng thành công phần mềm “Nhận dạng điểm số viết tay trên bảng điểm” với phiên bản 1.0. Phần mềm này cho phép tải bảng điểm, sau đó, nhận dạng điểm và xuất kết quả nhận dạng sang file bất kỳvới độ chính xác lên đến 97,30% trên 187 bảng điểm.
Tạp chí khoa học Trường Đại học Cần Thơ
Lầu 4, Nhà Điều Hành, Khu II, đường 3/2, P. Xuân Khánh, Q. Ninh Kiều, TP. Cần Thơ
Điện thoại: (0292) 3 872 157; Email: tapchidhct@ctu.edu.vn
Chương trình chạy tốt nhất trên trình duyệt IE 9+ & FF 16+, độ phân giải màn hình 1024x768 trở lên