Menu
Toggle navigation
Giới thiệu
Kế hoạch chiến lược
Triết lý giáo dục, Sứ mạng, Tầm nhìn, Mục tiêu, Giá trị cốt lõi
Phòng ĐTSĐH-KHCN
Các ngành Cao học
Ngành mới mở
Cổng thông tin Sau Đại học
Tuyển sinh
Thông báo tuyển sinh
Đào tạo Thạc sĩ
Lịch tuyển sinh hằng năm
Ngành tuyển sinh
Đăng ký dự tuyển
Học trước Thạc sĩ
Học bổ sung kiến thức
Đào tạo Tiến sĩ
Lịch tuyển sinh hằng năm
Cơ sở dữ liệu tuyển sinh
Hoạt động tuyển sinh
Học vụ
Cơ sở dữ liệu người học
Thời khóa biểu
Học trước Thạc sĩ
Bổ sung kiến thức
Các lớp Cao học
Thông báo Học vụ
Công nghệ thông tin
Quản trị kinh doanh
Ngôn ngữ Anh
Thông báo Nghiên cứu sinh
Cơ sở dữ liệu tốt nghiệp
Quy chế - Hướng dẫn
Quy chế cấp Bộ
Quy định cấp Trường
Hướng dẫn giảng viên
Hướng dẫn học viên
Luận văn Tốt nghiệp
Các biểu mẫu - Qui trình
Chương trình đào tạo
Thạc sĩ QTKD
Thạc sĩ CNTT
Thạc sĩ NNA
Tiến sĩ CNTT
Hoạt động ĐT-NCKH
Kế hoạch theo năm
Kế hoạch theo khóa
Quản trị kinh doanh
Công nghệ thông tin
Ngôn ngữ Anh
Kết quả NCKH
Quản trị kinh doanh
Công nghệ thông tin
Ngôn ngữ Anh
Ý kiến bên liên quan
Quản lý dạy - học
Search
Thông tin luận văn
Đào tạo sau đại học
Luận Văn Cao Học
Ngành Công nghệ thông tin
Ngành Quản trị kinh doanh
Biểu Mẫu
Học Bổng
Tra Cứu Văn Bằng
Quản Lý Dạy Và Học
Quy đổi Ngoại ngữ
Trang web liên kết
Website Trường
Khoa Học - Công Nghệ
Hội nghị, Hội thảo Khoa học – Công nghệ
Thư viện
Thông tin luận văn
DMHV
16CH201015
Họ và tên
Nguyễn Quý Tín
Ngày sinh
08/4/1980
Khóa
2016
Điểm TB
7.75
Điểm LV
8.4
Tiêu đề tiếng Việt:
PHƯƠNG PHÁP KHAI THÁC THEO CHIỀU NGANG ĐỂ TRÍCH XUẤT CÁC TẬP PHỔ BIẾN.
Tiêu đề tiếng Anh
Tóm tắt
Khai thác tập phổ biến là một trong những phương pháp khai thác dữ liệu quan trọng nhất được sử dụng rộng rãi để trích xuất các quy tắc kết hợp hiệu quả từ khối lượng lớn dữ liệu. Một số thuật toán đã được đề xuất để khai thác các tập phổ biến như: Apriori, FP-Growth,… được áp dụng trong nhiều lĩnh vực. Vì thuật toán khai thác tập phổ biến truyền thống tạo ra một số lượng lớn các tập phổ biến. Hơn nữa, sự bùng nổ tổ hợp của các tập hợp trong bộ dữ liệu rất lớn làm khó khăn thêm trong khai thác. Trong luận văn này sẽ nghiên cứu cài đặt một thuật toán hiệu quả hơn, để tiến hành khai thác các tập phổ biến trong các tập dữ liệu rất lớn. Thuật toán Mining Row Item Horizontal (MRIH), sử dụng phương pháp khai thác từ dưới lên theo chiều ngang để thiết lập một sự cân bằng giữa kích thước ngang và dọc của cơ sở dữ liệu đầu vào của mỗi cấp khai thác. Với mục đích này, mỗi cơ sở dữ liệu sẽ được sắp xếp theo thứ tự tăng dần độ phổ biến của các hạng mục. Trong thuật toán, cơ sở dữ liệu giao tác chính được chia thành một số cơ sở dữ liệu nhỏ hơn và do đó giảm kích thước của vấn đề khai thác ở mỗi cấp. Kết quả thử nghiệm cho thấy rằng thuật toán đạt được hiệu quả khai thác tốt trên một số các tập dữ liệu đầu vào khác nhau. Hơn nữa, nghiên cứu về hiệu suất cho thấy rằng thuật toán này tốt hơn đáng kể.