Ontology is an advanced knowledge representation formalism. It allows reusing and sharing vocabularies between applications and plays an important role in Semantic Web. However, ontology development is complicated and time-consuming. Therefore, in this paper, an approach to constructing lightweight ontology from glossary and the WordNet was proposed. This approach based on linguistics techniques such as regular expression and Link Grammar. The experiment on the Internet Movie Database glossary showed a promising result that the proposed approach produced an ontology with more than 600 concepts and 200 relationships. However, the results still existed some limitations that required further improvements.
TÓM TẮT
Ontology là một hình thức biểu diễn tri thức cho phép chia sẻ giữa các ứng dụng và đóng vai trò rất quan trọng đối với web ngữ nghĩa. Việc xây dựng ontology thủ công tương đối phức tạp và mất thời gian. Do đó, trong nghiên cứu này, chúng tôi đề xuất một phương pháp xây dựng một ontology gọn nhẹ (light-weighted ontology) dựa trên bảng chú giải (glossary) kết hợp với cơ sở dữ liệu từ vựng WordNet và một số kỹ thuật trong xử lý ngôn ngữ tự nhiên như biểu thức chính quy, Link Grammar. Phương pháp này được thực nghiệm trên tập dữ liệu IMDB và đã xây dựng được một ontology với hơn 600 khái niệm và 200 quan hệ giữa các khái niệm. Kết quả cho thấy phương pháp được đề xuất là khả thi, cho phép xác định các khái niệm và một số quan hệ giữa chúng. Tuy nhiên, phương pháp vẫn còn một số hạn chế như phát hiện thiếu một số quan hệ giữa các khái niệm, đòi hỏi phải có thêm một số cải tiến khác để đạt được độ chính xác cao hơn.
Trích dẫn: Trần Công Án, Tống Thị Ngọc Mai và Lê Thị Thu Lan, 2017. Xây dựng ontology tự động từ bảng chú giải. Tạp chí Khoa học Trường Đại học Cần Thơ. Số chuyên đề: Công nghệ thông tin: 133-139.
Trích dẫn: Trần Công Án, Lâm Chí Nguyện, Đoàn Hòa Minh, Phan Tấn Tài, Phạm Hữu Tài, Châu Xuân Phương và Sơn Búp Pha, 2016. Hệ thống hỗ trợ cố vấn học tập trên thiết bị di động. Tạp chí Khoa học Trường Đại học Cần Thơ. 47a: 47-58.
Trích dẫn: Trần Công Án, Lữ Minh Phúc, Đỗ Thanh Đức, Ngô Bá Hùng, Lê Đình Chiến, Phạm Thị Xuân Diễm, Sơn Búp Pha và Nguyễn Hữu Vân Long, 2017. Phát hiện té ngã cho người cao tuổi bằng gia tốc kế và mô hình học sâu Long Short-Term Memory. Tạp chí Khoa học Trường Đại học Cần Thơ. Số chuyên đề: Công nghệ thông tin: 65-71.
Tạp chí khoa học Trường Đại học Cần Thơ
Lầu 4, Nhà Điều Hành, Khu II, đường 3/2, P. Xuân Khánh, Q. Ninh Kiều, TP. Cần Thơ
Điện thoại: (0292) 3 872 157; Email: tapchidhct@ctu.edu.vn
Chương trình chạy tốt nhất trên trình duyệt IE 9+ & FF 16+, độ phân giải màn hình 1024x768 trở lên