Xây dựng ngữ liệu song ngữ Việt - K'Ho

La, Quốc Thắng; Đoàn, Minh Khuê; Nguyễn, Thị Lương; Trần, Ngô Như Khánh; Hoàng, Minh Tiến

Please use this identifier to cite or link to this item: https://elib.vku.udn.vn/handle/123456789/2307

Full metadata record

DC Field	Value	Language
dc.contributor.author	La, Quốc Thắng	-
dc.contributor.author	Đoàn, Minh Khuê	-
dc.contributor.author	Nguyễn, Thị Lương	-
dc.contributor.author	Trần, Ngô Như Khánh	-
dc.contributor.author	Hoàng, Minh Tiến	-
dc.date.accessioned	2022-08-16T07:30:45Z	-
dc.date.available	2022-08-16T07:30:45Z	-
dc.date.issued	2022-07	-
dc.identifier.issn	978-604-84-6711-1	-
dc.identifier.uri	http://elib.vku.udn.vn/handle/123456789/2307	-
dc.description	Hội thảo Khoa học Quốc gia về Công nghệ thông tin và Ứng dụng trong các lĩnh vực lần thứ 11 (CITA-2022); Chủ đề: Xử lý ảnh và ngôn ngữ tự nhiên; từ trang 201-210.	vi_VN
dc.description.abstract	Ngữ liệu song ngữ là dữ liệu văn bản của hai ngôn ngữ được dịch tương ứng 1-1 về mặt ngữ nghĩa. Đây là nguồn dữ liệu hữu ích trong xử lý ngôn ngữ tự nhiên, đặc biệt là dịch máy thống kê. Do sự giới hạn của kích thước nguồn dữ liệu từ điển mà cần thiết phải mở rộng được từ điển bằng cách thu thập thêm các nguồn dữ liệu khác. Nghiên cứu này giới thiệu một quy trình xử lý và tổng hợp dữ liệu từ điển Việt - K'Ho từ nhiều nguồn khác nhau sử dụng phương pháp gióng từ trên văn bản song ngữ nhằm trích xuất các cặp từ song ngữ có mối quan hệ dịch. Kết quả thực nghiệm cho thấy chương trình gióng từ dựa trên mô hình IBM hiệu quả hơn chương trình dựa trên mô hình BERT với thời gian thực thi nhanh hơn.	vi_VN
dc.language.iso	vi	vi_VN
dc.publisher	Nhà Xuất bản Đà Nẵng	vi_VN
dc.subject	Gióng câu	vi_VN
dc.subject	Gióng từ	vi_VN
dc.subject	Mô hình BERT	vi_VN
dc.subject	Mô hình IBM	vi_VN
dc.subject	Song ngữ	vi_VN
dc.subject	Tách câu	vi_VN
dc.subject	Tách từ	vi_VN
dc.title	Xây dựng ngữ liệu song ngữ Việt - K'Ho	vi_VN
dc.type	Working Paper	vi_VN
Appears in Collections:	CITA 2022

Files in This Item:

Sign in to read

Show simple item record