Please use this identifier to cite or link to this item: https://elib.vku.udn.vn/handle/123456789/2307
Full metadata record
DC FieldValueLanguage
dc.contributor.authorLa, Quốc Thắng-
dc.contributor.authorĐoàn, Minh Khuê-
dc.contributor.authorNguyễn, Thị Lương-
dc.contributor.authorTrần, Ngô Như Khánh-
dc.contributor.authorHoàng, Minh Tiến-
dc.date.accessioned2022-08-16T07:30:45Z-
dc.date.available2022-08-16T07:30:45Z-
dc.date.issued2022-07-
dc.identifier.issn978-604-84-6711-1-
dc.identifier.urihttp://elib.vku.udn.vn/handle/123456789/2307-
dc.descriptionHội thảo Khoa học Quốc gia về Công nghệ thông tin và Ứng dụng trong các lĩnh vực lần thứ 11 (CITA-2022); Chủ đề: Xử lý ảnh và ngôn ngữ tự nhiên; từ trang 201-210.vi_VN
dc.description.abstractNgữ liệu song ngữ là dữ liệu văn bản của hai ngôn ngữ được dịch tương ứng 1-1 về mặt ngữ nghĩa. Đây là nguồn dữ liệu hữu ích trong xử lý ngôn ngữ tự nhiên, đặc biệt là dịch máy thống kê. Do sự giới hạn của kích thước nguồn dữ liệu từ điển mà cần thiết phải mở rộng được từ điển bằng cách thu thập thêm các nguồn dữ liệu khác. Nghiên cứu này giới thiệu một quy trình xử lý và tổng hợp dữ liệu từ điển Việt - K'Ho từ nhiều nguồn khác nhau sử dụng phương pháp gióng từ trên văn bản song ngữ nhằm trích xuất các cặp từ song ngữ có mối quan hệ dịch. Kết quả thực nghiệm cho thấy chương trình gióng từ dựa trên mô hình IBM hiệu quả hơn chương trình dựa trên mô hình BERT với thời gian thực thi nhanh hơn.vi_VN
dc.language.isovivi_VN
dc.publisherNhà Xuất bản Đà Nẵngvi_VN
dc.subjectGióng câuvi_VN
dc.subjectGióng từvi_VN
dc.subjectMô hình BERTvi_VN
dc.subjectMô hình IBMvi_VN
dc.subjectSong ngữvi_VN
dc.subjectTách câuvi_VN
dc.subjectTách từvi_VN
dc.titleXây dựng ngữ liệu song ngữ Việt - K'Hovi_VN
dc.typeWorking Papervi_VN
Appears in Collections:CITA 2022

Files in This Item:

 Sign in to read



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.