Menu
Toggle navigation
Giới thiệu
Kế hoạch chiến lược
Triết lý giáo dục, Sứ mạng, Tầm nhìn, Mục tiêu, Giá trị cốt lõi
Phòng ĐTSĐH-KHCN
Đề án vị trí việc làm
Các ngành Cao học
Ngành mới mở
Cổng thông tin Sau Đại học
Tuyển sinh
Thông báo tuyển sinh
Đào tạo Thạc sĩ
Lịch tuyển sinh hằng năm
Ngành tuyển sinh
Đăng ký dự tuyển
Học trước Thạc sĩ
Học kết nối ĐH - Thạc sĩ
Học bổ sung kiến thức
Đào tạo Tiến sĩ
Lịch tuyển sinh hằng năm
Cơ sở dữ liệu tuyển sinh
Hoạt động tuyển sinh
Học vụ
Cơ sở dữ liệu người học
Thời khóa biểu
Học trước Thạc sĩ
Bổ sung kiến thức
Các lớp Cao học
Thông báo Học vụ
Công nghệ thông tin
Quản trị kinh doanh
Ngôn ngữ Anh
Thông báo Nghiên cứu sinh
Cơ sở dữ liệu tốt nghiệp
Quy chế - Hướng dẫn
Quy chế cấp Bộ
Quy định cấp Trường
Hướng dẫn giảng viên
Hướng dẫn học viên
Báo cáo Tốt nghiệp
Các biểu mẫu - Qui trình
Chương trình đào tạo
Thạc sĩ QTKD
Thạc sĩ CNTT
Thạc sĩ NNA
Tiến sĩ CNTT
Hoạt động ĐT-NCKH
Kế hoạch theo năm
Kế hoạch theo khóa
Quản trị kinh doanh
Công nghệ thông tin
Ngôn ngữ Anh
Kết quả NCKH
Quản trị kinh doanh
Công nghệ thông tin
Ngôn ngữ Anh
Ý kiến bên liên quan
Quản lý dạy - học
Search
Thông tin luận văn
Đào tạo sau đại học
Luận Văn Cao Học
Ngành Công nghệ thông tin
Ngành Quản trị kinh doanh
Ngành Ngôn ngữ Anh
Biểu Mẫu - Qui Trình
Học Bổng
Tra Cứu Văn Bằng
Quản Lý Dạy Và Học
Quy đổi Ngoại ngữ
Hồ sơ đăng ký dự tuyển Cao học
Trang web liên kết
Website Trường
Khoa Học - Công Nghệ
Hội nghị, Hội thảo Khoa học – Công nghệ
Thư viện
Thông tin luận văn
DMHV
MIT19203
Họ và tên
Đinh Minh Hòa
Ngày sinh
04/11/1993
Khóa
2019
Điểm TB
9.05
Điểm LV
8.5
Tiêu đề tiếng Việt:
Giải quyết vấn đề dữ liệu mất cân bằng trong bài toán dự đoán thuê bao rời bỏ nhà mạng bằng giải thuật Random Forest cải tiến
Tiêu đề tiếng Anh
Tóm tắt
Thị trường viễn thông tại Việt Nam có tốc độ tăng trưởng mạnh mẽ, kèm với đó là sự cạnh tranh vô cùng khốc liệt. Việc xác định được nguy cơ khách hàng rời bỏ nhà mạng dựa trên hành vi sử dụng dịch vụ của họ là vô cùng cần thiết. Thực hiện được điều này giúp các công ty tiết kiệm được chi phí kinh doanh cũng như điều chỉnh chiến lược chăm sóc khách hàng một cách hiệu quả hơn. Các mô hình học máy đã được áp dụng thành công trong việc dự đoán hành vi khách hàng dựa vào dữ liệu trong quá khứ ở nhiều lĩnh vực khác nhau. Trong bài toán “dự đoán thuê bao rời bỏ nhà mạng” chiến lược cơ bản thường được áp dụng là sử dụng một giải thuật phân lớp với mô hình học có giám sát để phân lớp được người dùng rời bỏ hoặc không rời bỏ. Sau đó sử dụng mô hình đã huấn luyện để dự đoán với các khách hàng hiện tại nhằm đánh giá khả năng khách hàng sẽ rời bỏ công ty trong tương lai. Đề tài này đầu tiên tìm hiểu các hướng tiếp cận khác nhau khi làm việc với tập dữ liệu mất cân bằng (imbalanced data). Tiếp đến, tập trung tìm hiểu về phương pháp lấy mẫu SMOTE và hiện thực giải thuật Random Forest cải tiến do Devi và các cộng sự đề xuất. Cuối cùng là tiến hành thực nghiệm và so sánh 2 phương pháp trên đại diện cho từng hướng tiếp cận, để rút ra được chiến lược phù hợp khi làm việc với các tập dữ liệu mất cân bằng của bài toán dự đoán thuê bao rời bỏ nhà mạng.