Tạp chí: Hội nghị khoa học quốc gia lần thứ XV về về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR 2022), Học Viện Kỹ Thuật Mật Mã, Hà Nội, Ngày 03-04/11/2022
Fuzzy/Similarity join đã được nghiên cứu rộng rãi và được ứng dụng trong nhiều lĩnh vực thực tế. Chúng tôi nhận thấy rằng có nhiều cách tiếp cận khác nhau đối với vấn đề fuzzy join bằng cách sử dụng MapReduce. Thách thức chung của những nghiên cứu này là tìm thấy những cặp dữ liệu có độ tương đồng lớn hơn hoặc bằng một ngưỡng cho trước trong một khoảng thời gian hợp lý và tiết kiệm tài nguyên nhất có thể. Bài báo này đề xuất một tiếp cận mới ứng dụng mạng nơron, xây dựng mô hình Siamese Recurrent Network để giải quyết câu truy vấn fuzzy join trên tập dữ liệu lớn. Thêm vào đó, nghiên cứu áp dụng bộ lọc Bloom để loại bỏ dữ liệu trung gian dư thừa, nhằm cải tiến một số thuật toán fuzzy Join theo mô hình MapReduce với các độ đo khoảng cách Hamming, Levenshtein, Cosine. Kết quả nghiên cứu được phân tích, đánh giá, chứng minh bằng các thực nghiệm trên các tập dữ liệu lớn trên một cluster Spark.
Tạp chí: Hội nghị khoa học quốc gia lần thứ XVI về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR 2023), Trường Đại học Sư phạm Kỹ thuật - Đại học Đà Nẵng, 28-29/09/2023
Tạp chí: Hội nghị khoa học quốc gia lần thứ XV về về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR 2022), Học Viện Kỹ Thuật Mật Mã, Hà Nội, Ngày 03-04/11/2022
Tạp chí: Hội nghị khoa học quốc gia lần thứ XV về về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR 2022), Học Viện Kỹ Thuật Mật Mã, Hà Nội, Ngày 03-04/11/2022
Tạp chí: 32ème Conférence sur la Gestion de Données - Principes, Technologies et Applications (BDA 2016), Futuroscop - Poitiers - France, 15 au 18 Novembre, 2016
Tạp chí khoa học Trường Đại học Cần Thơ
Lầu 4, Nhà Điều Hành, Khu II, đường 3/2, P. Xuân Khánh, Q. Ninh Kiều, TP. Cần Thơ
Điện thoại: (0292) 3 872 157; Email: tapchidhct@ctu.edu.vn
Chương trình chạy tốt nhất trên trình duyệt IE 9+ & FF 16+, độ phân giải màn hình 1024x768 trở lên