Please use this identifier to cite or link to this item:
https://elib.vku.udn.vn/handle/123456789/978
Title: | Phân loại tên hồ sơ tiếng Việt theo thời hạn bảo quản |
Authors: | Tôn, Nữ Thị Sáu Đặng, Văn Thìn Nguyễn, Lưu Thùy Ngân |
Keywords: | Phân loại tài liệu Support Vector Machines (SVM) Random Forest (RF) |
Issue Date: | 2019 |
Publisher: | Nhà xuất bản Đà Nẵng |
Abstract: | Trong bài báo này, chúng tôi trình bày nghiên cứu về phương pháp phân loại tên hồ sơ tiếng Việt theo thời hạn bảo quản. Chúng tôi thu thập dữ liệu là tên các hồ sơ đã được gán nhãn thời hạn bảo quản bởi những chuyên gia trong ngành lưu trữ. Sau đó, chúng tôi tiến hành thử nghiệm 2 phương pháp Support Vector Machines (SVM) và Random Forest (RF) với các đặc trưng khác nhau. Chúng tôi nhận thấy rằng phương pháp SVM kết hợp với đặc trưng từ loại và n-gram cho kết quả tốt nhất cho bài toán phân loại tên hồ sơ tiếng Việt. Kết quả cho thấy phương pháp có thể ứng dụng và thực tế, góp phần thay đổi phương thức, quy trình tổ chức quản lý tài liệu lưu trữ trong thời đại “Văn thư – lưu trữ 4.0”. |
Description: | Bài báo khoa học; từ trang 198-206 |
URI: | http://elib.vku.udn.vn/handle/123456789/978 |
Appears in Collections: | CITA 2019 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.