SỞ KHOA HỌC VÀ CÔNG NGHỆ
THÀNH PHỐ HỒ CHÍ MINH
Tên đề tài Xây dựng công cụ tổng hợp tin tức tiếng Việt và ứng dụng
Năm thực hiện 2018
Chủ nhiệm đề tài

TS. Nghiêm Quốc Minh 

Cơ quan chủ quản

Trường Đại học Khoa học Tự nhiên

Sản phẩm

- Ngữ liệu chuẩn phục vụ nghiên cứu
- Ngữ liệu chuẩn phục vụ nghiên cứu
- Công cụ gộp câu - Công cụ tóm tắt đa văn bản
- Công cụ tổng hợp thông tin tiếng Việt

Kết quả

1. Xây dựng được một bộ ngữ liệu chuẩn phục vụ cho việc đánh giá các kết quả của bài toán tóm tắt văn bản. Điều này cũng góp phần vào việc cải tiến hiệu quả của kết quả tóm tắt văn bản.
2. Đề xuất một mô hình cải tiến cho bài toán nén câu với kết quả độ chính xác vượt qua các mô hình truyền thống.
3. Cải tiến một phương pháp mới trong tóm tắt tóm lược đa văn bản sử dụng nén đa câu.
4. Áp dụng các mô hình học sâu vào bài toán tóm tắt trích xuất
5. Xây dựng các công cụ tóm tắt tin tức đa văn bản tiếng Việt

Tình hình khả năng ứng dụng

Đề xuất phương pháp tóm tắt đa văn bản phù hợp cho tiếng Việt: tập trung vào xây dựng phương pháp tóm tắt văn bản tự động phù hợp với các đặc trưng riêng của tiếng Việt. Tạo ra một bộ ngữ liệu chuẩn để đánh giá các hệ thống tóm tắt đa văn bản tiếng Việt: nghiên cứu các tiêu chuẩn của một bộ ngữ liệu đánh giá hệ thống tóm tắt. 

tiemluc

Bản quyền © 2018 Sở Khoa học và Công nghệ Thành phố Hồ Chí Minh
Thiết kế và phát triển bởi HCMGIS
Tổng số truy cập: 11537353