Menu
Toggle navigation
Giới thiệu
Kế hoạch chiến lược
Triết lý giáo dục, Sứ mạng, Tầm nhìn, Mục tiêu, Giá trị cốt lõi
Phòng ĐTSĐH-KHCN
Đề án vị trí việc làm
Các ngành Cao học
Ngành mới mở
Cổng thông tin Sau Đại học
Tuyển sinh
Thông báo tuyển sinh
Đào tạo Thạc sĩ
Lịch tuyển sinh hằng năm
Ngành tuyển sinh
Đăng ký dự tuyển
Học trước Thạc sĩ
Học kết nối ĐH - Thạc sĩ
Học bổ sung kiến thức
Đào tạo Tiến sĩ
Lịch tuyển sinh hằng năm
Cơ sở dữ liệu tuyển sinh
Hoạt động tuyển sinh
Học vụ
Cơ sở dữ liệu người học
Thời khóa biểu
Học trước Thạc sĩ
Bổ sung kiến thức
Các lớp Cao học
Thông báo Học vụ
Công nghệ thông tin
Quản trị kinh doanh
Ngôn ngữ Anh
Thông báo Nghiên cứu sinh
Cơ sở dữ liệu tốt nghiệp
Quy chế - Hướng dẫn
Quy chế cấp Bộ
Quy định cấp Trường
Hướng dẫn giảng viên
Hướng dẫn học viên
Báo cáo Tốt nghiệp
Các biểu mẫu - Qui trình
Chương trình đào tạo
Thạc sĩ QTKD
Thạc sĩ CNTT
Thạc sĩ NNA
Tiến sĩ CNTT
Hoạt động ĐT-NCKH
Kế hoạch theo năm
Kế hoạch theo khóa
Quản trị kinh doanh
Công nghệ thông tin
Ngôn ngữ Anh
Kết quả NCKH
Quản trị kinh doanh
Công nghệ thông tin
Ngôn ngữ Anh
Ý kiến bên liên quan
Quản lý dạy - học
Search
Thông tin luận văn
Đào tạo sau đại học
Luận Văn Cao Học
Ngành Công nghệ thông tin
Ngành Quản trị kinh doanh
Ngành Ngôn ngữ Anh
Biểu Mẫu - Qui Trình
Học Bổng
Tra Cứu Văn Bằng
Quản Lý Dạy Và Học
Quy đổi Ngoại ngữ
Hồ sơ đăng ký dự tuyển Cao học
Trang web liên kết
Website Trường
Khoa Học - Công Nghệ
Hội nghị, Hội thảo Khoa học – Công nghệ
Thư viện
Thông tin luận văn
DMHV
MIT22108
Họ và tên
Nguyễn Nhựt Tấn
Ngày sinh
03/5/1989
Khóa
2021
Điểm TB
7.02
Điểm LV
6.5
Tiêu đề tiếng Việt:
Phân lớp dữ liệu chuỗi thời gian dựa vào thông tin Motif và giải thuật Random Forest
Tiêu đề tiếng Anh
Tóm tắt
NỘI DUNG NGHIÊN CỨU: Trong đề tài này, các vấn đề chính được tập trung nghiên cứu như sau: • Nghiên cứu về vấn đề phân lớp dữ liệu, dữ liệu chuỗi thời gian và các khái niệm liên quan. • Nghiên cứu giải thuật tìm kiếm motif EP-C và EP-MK và các vấn đề liên quan trong quá trình tìm kiếm motif trong công trình • Nghiên cứu về vấn đề phân lớp dữ liệu chuỗi thời gian dựa trên thông tin motif • Hiện thực hệ thống phân lớp dữ liệu chuỗi thời gian dựa trên thông tin motif sử dụng giải thuật Random Forest. • Thực nghiệm hệ thống phân lớp đề xuất với các bộ dữ liệu mẫu và đánh giá kết quả của giải thuật Random Forest với các phương pháp : Decision Tree, 1NN+DTW, Naïve Bayes, SAX-VSM. 2. PHƯƠNG PHÁP: · Mô hình phân lớp · Chuẩn hóa dữ liệu · Tìm kiếm Motif · Phép vị tự · Khoảng cách Euclid tối thiểu · Tìm kiếm Motif bằng giải thuật EP-C · Tìm kiếm bằng giải thuật EP-MK · Biểu diễn chuỗi thời gian dưới dạng vector đặc trưng · Phân lớp chuỗi thời gian dựa trên thông tin Motif và giải thuật Rừng ngẫu nhiên 3. KẾT QUẢ: Với hướng tiếp cận dựa trên việc tìm kiếm motif bằng giải thuật EP-C và EP-MK, đề tài đã xây dựng một hệ thống phân lớp dữ liệu chuỗi thời gian bằng giải thuật Random Forest dựa trên thông tin motif. Phân đoạn chuỗi thời gian thành các chuỗi con dựa trên các điểm cực trị quan trọng trong các giải thuật tìm kiếm motif cũng như trong quá trình so trùng chuỗi con giúp cải thiện đáng kể thời gian xử lý cũng như có thể loại bỏ được dữ liệu nhiễu. Việc phân lớp dữ liệu chuỗi thời gian dựa trên thông tin motif khi áp dụng giải thuật Rừng Ngẫu Nhiên (Random Forest) mang lại hiệu quả tốt hơn. Về kết quả phân lớp, dùng giải thuật Rừng Ngẫu Nhiên (Random Forest) phân lớp dữ liệu chuỗi thời gian dựa trên thông tin motif đem lại độ chính xác cao hơn so với phân lớp bằng giải thuật 1NN + DTW (giải thuật chuẩn vàng) trên tất cả các bộ dữ liệu thực nghiệm. Về kết quả đạt được khi thực nghiệm trên các bộ dữ liệu mẫu, việc áp dụng Rừng Ngẫu Nhiên vào dữ liệu chuỗi thời gian đã được biến đổi dựa vào thông tin motif mang lại hiệu quả phân lớp cao hơn và thời gian tốt hơn 4 phương pháp còn lại là: Decision Tree, 1NN+DTW, NaiveBayes, SAX-VSM.