Synchronization of subtitles in newsletters or ethnic language programs in videos is essential because of the linguistic isolation of viewers and a problem for broadcasters. Human voice recognition in audio extracted from newsletter videos is an important step in subtitle synchronization to determine the time subtitles appear and detect human voices in the newsletter. This study proposes an approach to detecting human voices in newsletters videos through pre-processing techniques such as Mel-frequency cepstral coefficients and training on deep learning, including a convolutional neural network and a combined network between convolution and Long Short-Term Memory units. In addition, we also examine the effects of selecting hop length in human recognition performances. The proposed method has reached an accuracy of 0.926 in human voice recognition on datasets with Khmer and Vietnamese voices. After training, the model results are expected to predict the appearance of subtitles files that efficiently support subtitle generators.
Trích dẫn: Trần Công Án, Tống Thị Ngọc Mai và Lê Thị Thu Lan, 2017. Xây dựng ontology tự động từ bảng chú giải. Tạp chí Khoa học Trường Đại học Cần Thơ. Số chuyên đề: Công nghệ thông tin: 133-139.
Trích dẫn: Trần Công Án, Lâm Chí Nguyện, Đoàn Hòa Minh, Phan Tấn Tài, Phạm Hữu Tài, Châu Xuân Phương và Sơn Búp Pha, 2016. Hệ thống hỗ trợ cố vấn học tập trên thiết bị di động. Tạp chí Khoa học Trường Đại học Cần Thơ. 47a: 47-58.
Trích dẫn: Trần Công Án, Lữ Minh Phúc, Đỗ Thanh Đức, Ngô Bá Hùng, Lê Đình Chiến, Phạm Thị Xuân Diễm, Sơn Búp Pha và Nguyễn Hữu Vân Long, 2017. Phát hiện té ngã cho người cao tuổi bằng gia tốc kế và mô hình học sâu Long Short-Term Memory. Tạp chí Khoa học Trường Đại học Cần Thơ. Số chuyên đề: Công nghệ thông tin: 65-71.
Tạp chí khoa học Trường Đại học Cần Thơ
Lầu 4, Nhà Điều Hành, Khu II, đường 3/2, P. Xuân Khánh, Q. Ninh Kiều, TP. Cần Thơ
Điện thoại: (0292) 3 872 157; Email: tapchidhct@ctu.edu.vn
Chương trình chạy tốt nhất trên trình duyệt IE 9+ & FF 16+, độ phân giải màn hình 1024x768 trở lên