Vui lòng dùng định danh này để trích dẫn hoặc liên kết đến tài liệu này:
https://elib.vku.udn.vn/handle/123456789/4142
Nhan đề: | Xây dựng kho ngữ liệu đa ngữ nhờ vào UNL |
Nhan đề khác: | Building a Multilangual Corpus with UNL |
Tác giả: | Võ, Trung Hùng Phan, Thị Lệ Thuyền Ninh, Khánh Chi |
Từ khoá: | UNL Universal networking language Automatic translation Multilingual corpus |
Năm xuất bản: | thá-2023 |
Nhà xuất bản: | Nhà xuất bản Khoa học Tự nhiên và Công nghệ |
Tóm tắt: | Bài báo này trình bày việc xây dựng kho dữ liệu đa ngữ nhờ vào một ngôn ngữ gọi là UNL (Universal Networking Language). UNL được định nghĩa gồm có các thành phần tương ứng như là một ngôn ngữ tự nhiên và nó có thể biểu diễn mọi thông tin của ngôn ngữ ở dạng có cấu trúc mà không gây nhập nhằng về ngữ nghĩa. Với đặc tính này, ngôn ngữ UNL có thể sử dụng như là một ngôn ngữ trung gian (ngôn ngữ trục) để chuyển đổi qua lại giữa các ngôn ngữ tự nhiên thay vì dịch trực tiếp giữa hai ngôn ngữ mà chúng ta thường hay sử dụng. Việc sử dụng ngôn ngữ UNL trong hệ thống dịch đa ngữ có hai ưu điểm lớn: UNL không có sự nhập nhằng về ngữ nghĩa và giảm số lượng cặp dịch từ n*(n-1)/2 xuống 2*n. Chúng tôi thử nghiệm với 106.434 câu, kết quả đầu ra cho thấy dịch qua UNL tốt hơn so với dịch trực tiếp bằng Google Translator (đánh giá dựa trên hai phương pháp NIST và BLEU). |
Mô tả: | Kỷ yếu Hội nghị Khoa học công nghệ Quốc gia lần thứ XVI về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR 2023); trang 608-613. |
Định danh: | http://vap.ac.vn/Portals/0/TuyenTap/2024/2/21/64e13532907845ed9f5a2547dfec276f/77BB_FAIR2023_paper_7338.pdf 10.15625/vap.2023.0090 https://elib.vku.udn.vn/handle/123456789/4142 |
ISBN: | 978-604-357-201-8 |
Bộ sưu tập: | NĂM 2023 |
Khi sử dụng các tài liệu trong Thư viện số phải tuân thủ Luật bản quyền.