Ảnh minh họa
Ảnh minh họa

Để triển khai một cách thực chất, hiệu quả việc phát triển nền tảng công nghệ mô hình ngôn ngữ lớn tiếng Việt, Bộ TT&TT mới đây đã ban hành kế hoạch thúc đẩy, với mục tiêu đặt ra là đến năm 2025, Việt Nam có ít nhất 1 nền tảng công nghệ mô hình ngôn ngữ lớn tiếng Việt, có khả năng cung cấp dịch vụ cho các nền tảng ứng dụng trí tuệ nhân tạo khác; 100% cơ quan nhà nước có trợ lý ảo giúp cán bộ, công chức phục vụ hoạt động của mình.

Kế hoạch của Bộ TT&TT, cũng nêu rõ: Việc nghiên cứu, phát triển, đưa vào ứng dụng mô hình ngôn ngữ lớn tiếng Việt là một nhiệm vụ quan trọng, cần thiết và ý nghĩa. Mô hình ngôn ngữ lớn tiếng Việt sử dụng tri thức, dữ liệu huấn luyện đã được sàng lọc của Việt Nam, với chi phí thấp cho người dân, doanh nghiệp, tổ chức tại Việt Nam sử dụng để phát triển các ứng dụng mới.

Việc phát triển mô hình ngôn ngữ lớn tiếng Việt phải giải quyết 2 thách thức chủ yếu: Thu thập, xử lý các nguồn dữ liệu tiếng Việt ở dạng thô để hình thành nên bộ dữ liệu đầy đủ tiếng Việt và bộ dữ liệu chỉ dẫn tiếng Việt; Thiết lập một hạ tầng tính toán cho phép thực hiện huấn luyện mô hình ngôn ngữ lớn.

Tại kế hoạch ban hành cuối tháng 7/2023, Bộ TT&TT cũng đã đưa ra 4 nhóm nhiệm vụ chính để thúc đẩy phát triển nền tảng công nghệ mô hình ngôn ngữ lớn tiếng Việt cùng tiến độ, thời gian gần hoàn thành, bao, gồm: Xây dựng thể chế; xây dựng bộ dữ liệu lớn tiếng Việt để phát triển mô hình ngôn ngữ lớn của Việt Nam; nghiên cứu, thử nghiệm và phát triển mô hình ngôn ngữ lớn tiếng Việt; xây dựng nền tảng trợ lý ảo cho cán bộ, công chức.

Bộ TT&TT giao Cục Chuyển đổi số quốc gia chủ trì, phối hợp với các đơn vị có liên quan triển khai cụ thể từng nội dung của kế hoạch. Các đơn vị thuộc, trực thuộc Bộ TT&TT có trách nhiệm phối hợp thực hiện kế hoạch, xây dựng dữ liệu, triển khai sử dụng, đánh giá, nhận xét hoàn thiện sản phẩm.

Hà Trần