Menu
Toggle navigation
Giới thiệu
Kế hoạch chiến lược
Triết lý giáo dục, Sứ mạng, Tầm nhìn, Mục tiêu, Giá trị cốt lõi
Phòng ĐTSĐH-KHCN
Đề án vị trí việc làm
Các ngành Cao học
Ngành mới mở
Cổng thông tin Sau Đại học
Tuyển sinh
Thông báo tuyển sinh
Đào tạo Thạc sĩ
Lịch tuyển sinh hằng năm
Ngành tuyển sinh
Đăng ký dự tuyển
Học trước Thạc sĩ
Học kết nối ĐH - Thạc sĩ
Học bổ sung kiến thức
Đào tạo Tiến sĩ
Lịch tuyển sinh hằng năm
Cơ sở dữ liệu tuyển sinh
Hoạt động tuyển sinh
Học vụ
Cơ sở dữ liệu người học
Thời khóa biểu
Học trước Thạc sĩ
Bổ sung kiến thức
Các lớp Cao học
Thông báo Học vụ
Công nghệ thông tin
Quản trị kinh doanh
Ngôn ngữ Anh
Thông báo Nghiên cứu sinh
Cơ sở dữ liệu tốt nghiệp
Quy chế - Hướng dẫn
Quy chế cấp Bộ
Quy định cấp Trường
Hướng dẫn giảng viên
Hướng dẫn học viên
Báo cáo Tốt nghiệp
Các biểu mẫu - Qui trình
Chương trình đào tạo
Thạc sĩ QTKD
Thạc sĩ CNTT
Thạc sĩ NNA
Tiến sĩ CNTT
Hoạt động ĐT-NCKH
Kế hoạch theo năm
Kế hoạch theo khóa
Quản trị kinh doanh
Công nghệ thông tin
Ngôn ngữ Anh
Kết quả NCKH
Quản trị kinh doanh
Công nghệ thông tin
Ngôn ngữ Anh
Ý kiến bên liên quan
Quản lý dạy - học
Search
Thông tin luận văn
Đào tạo sau đại học
Luận Văn Cao Học
Ngành Công nghệ thông tin
Ngành Quản trị kinh doanh
Ngành Ngôn ngữ Anh
Biểu Mẫu - Qui Trình
Học Bổng
Tra Cứu Văn Bằng
Quản Lý Dạy Và Học
Quy đổi Ngoại ngữ
Hồ sơ đăng ký dự tuyển Cao học
Trang web liên kết
Website Trường
Khoa Học - Công Nghệ
Hội nghị, Hội thảo Khoa học – Công nghệ
Thư viện
Thông tin luận văn
DMHV
16CH201010
Họ và tên
Lê Thanh Phong
Ngày sinh
12/01/1973
Khóa
2016
Điểm TB
8.04
Điểm LV
8.3
Tiêu đề tiếng Việt:
SỬ DỤNG CÂY QUYẾT ĐỊNH PHÂN LỚP DỮ LIỆU MẤT CÂN ĐỐI
Tiêu đề tiếng Anh
Tóm tắt
Cây quyết định đã có nhiều ứng dụng trong thực tế. Tuy nhiên, thách thức của bài toán phân lớp dữ liệu mất cân đối là vấn đề về đối tượng cần quan tâm nghiên cứu lại có rất ít mẫu (mẫu lớp thiểu số - minority class instances) so với các lớp khác trong tập dữ liệu (mẫu lớp đa số - majority class instances). Bài toán phân lớp dữ liệu mất cân đối dựa trên cây quyết định là phương pháp sử dụng học máy để phân lớp, việc nâng cao dự đoán chính xác mẫu lớp thiểu số là một vấn đề rất cần thiết và có ý nghĩa khoa học rất cao. Giúp cho các nhà phân tích có thêm cơ sở để có thể đưa ra những dự đoán chính xác hơn. Luận văn này tập trung nghiên cứu về tiêu chí tách (splitting criteria) và phương pháp cắt tỉa (pruning methods) khi áp dụng trên cây quyết định để dự đoán chính xác mẫu lớp thiểu số, góp phần nâng cao hiệu quả khai thác và phân lớp dữ liệu mất cân đối. - Tìm hiểu được tổng quan về vấn đề phân lớp dữ liệu và các thuận toán liên quan. - Tìm hiểu được tính chất của các độ đo hiệu suất phân lớp. - Giới thiệu khái niệm và độ đo đánh giá hiệu suất phân lớp của tập dữ liệu mất cân đối. - Trình bày phương pháp sử dụng cây quyết định phân lớp dữ liệu mất cân đối dựa trên thuật toán C4.5 và đã cài đặt thuật toán dựa trên tập dữ liệu chuẩn UCI. Chương trình Demo đã minh hoạ tốt cho nội dung nghiên cứu. Luận văn trình bày rõ ràng. Bố cục luận văn hợp lý. Tài liệu tham khảo phù hợp với nội dung của luận văn.