Đăng nhập
 
Tìm kiếm nâng cao
 
Tên bài báo
Tác giả
Năm xuất bản
Tóm tắt
Lĩnh vực
Phân loại
Số tạp chí
 

Bản tin định kỳ
Báo cáo thường niên
Tạp chí khoa học ĐHCT
Tạp chí tiếng anh ĐHCT
Tạp chí trong nước
Tạp chí quốc tế
Kỷ yếu HN trong nước
Kỷ yếu HN quốc tế
Book chapter
Bài báo - Tạp chí
(2017) Trang: 38-50
Tạp chí: Hội thảo toàn quốc về Công nghệ thông tin 2017, Trường Đại học Cần Thơ, ngày 03/11/2017
Liên kết:

Trong bài viết này chúng tôi đề xuất giải pháp phát hiện sao chép luận văn dựa trên các kỹ thuật của lĩnh vực tìm kiếm thông tin. Việc kiểm chứng báo cáo luận văn có sao chép hay không được thực hiện dựa trên hai nguồn tài nguyên: cơ sở dữ liệu cục bộ được hệ thống quản lý và các nguồn dữ liệu trực tuyến. Việc kiểm chứng sẽ được thực hiện ở mức câu vì đây là hình thức sao chép phổ biến nhất. Đối với nguồn tài nguyên cục bộ, chúng tôi đề xuất sử dụng hệ quản trị CSDL MongoDB cho việc lưu trữ bộ chỉ mục nghịch đảo với mục tiêu tăng tốc độ truy xuất tập chỉ mục. Để có thể kiểm tra sao chép với nguồn tài nguyên trực tuyến, cũng là nguồn tài nguyên chính cho việc sao chép, chúng tôi thực hiện truy vấn các bộ máy tìm kiếm web (google.com chẳng hạn) để tìm được tập các tài liệu có thể bị sao chép và sau đó dùng độ đo cosine để xác định sự giống nhau giữa hai câu. Hệ thống có khả năng tìm được các câu “tình nghi” sao chép từ nguồn khác đồng thời cũng có khả năng phân biệt được các câu sao chép với các câu trích dẫn. Kết quả thử nghiệm cho thấy giải pháp mà chúng tôi đề xuất mang lại hiệu quả cao trong thực tế.

 


Vietnamese | English






 
 
Vui lòng chờ...