Công bố Bộ công cụ DeepEduBench đánh giá năng lực dạy và học của mô hình AI trong tiếng Việt
Học viện Công nghệ Bưu chính Viễn thông (Bộ Khoa học và công nghệ) vừa cùng các đối tác Công ty Sotatek, DopikAI, và AI for Việt Nam đã triển khai dự án DeepEdu và công bố bộ công cụ DeepEduBench phục vụ đánh giá năng lực dạy và học của mô hình AI trong tiếng Việt.
DeepEdu là dự án về ngôn ngữ lớn được khởi xướng bởi Học viện Công nghệ Bưu chính Viễn thông và các đối tác theo mô hình hợp tác 3 nhà: Công ty Sotatek và Công ty DopikAI với mục tiêu xây dựng bộ dữ liệu mở Tiếng Việt cho giáo dục Việt Nam, phục vụ nghiên cứu, phát triển và ứng dụng trí tuệ nhân tạo. Dự án này đồng hành và kết hợp cùng tổ chức AI for Vietnam nhằm tạo ra bộ dữ liệu Tiếng Việt mã nguồn mở chất lượng cao, giúp các mô hình AI hiểu rõ hơn văn hóa, bối cảnh và cách diễn đạt tiếng Việt. Dự án được kỳ vọng sẽ nâng cao sự hiện diện của tiếng Việt trong quá trình phát triển AI.
DeepEduBench là bộ tiêu chuẩn để đánh giá năng lực dạy và học của mô hình AI trong tiếng Việt. DeepEduBench có khả năng giảng giải rõ ràng theo từng bước, điều chỉnh độ khó theo người học, đưa ví dụ và bài tập phù hợp, đồng thời phản hồi đúng trọng tâm. Để đạt điểm cao, các mô hình AI cần giải thích mạch lạc, ưu tiên tính sư phạm và độ chính xác, và khuyến khích tư duy sâu thay vì chỉ đưa đáp án. Bộ tiêu chuẩn DeepEduBench bao gồm 13.700 mẫu dữ liệu đã được sử dụng đánh giá 52 mô hình AI hàng đầu với nhiều thông tin chi tiết tại https://rank.aiforvietnam.org.

Theo đại diện Học viện Công nghệ Bưu chính Viễn thông, phần lớn các mô hình AI hiện nay được phát triển theo hướng đa ngôn ngữ, trong đó tiếng Anh chiếm ưu thế, dẫn đến những hạn chế khi áp dụng trong bối cảnh giáo dục Việt Nam. Vì vậy, Học viện định hướng phát triển mô hình ngôn ngữ lớn (LLM) tiếng Việt, đặc biệt trong lĩnh vực giáo dục nhằm nâng cao khả năng hiểu ngữ cảnh và phù hợp với hệ thống tri thức trong nước. Trong thời gian tới, Học viện cùng 03 đối tác là Công ty Sotatek, DopikAI, và AI for Việt Nam dự kiến triển khai xây dựng kho dữ liệu tiếng Việt dành cho giáo dục với kích thước lên tới 150B token.
Theo các chuyên gia, việc xây dựng bộ tiêu chuẩn riêng cho AI trong giáo dục là cần thiết để tăng tính minh bạch trong đánh giá và hỗ trợ các cơ sở giáo dục lựa chọn giải pháp phù hợp với nhu cầu thực tiễn.
Tin tức khác
- Thành viên Chính phủ nhiệm kỳ 2026-2031
- Sốt xuất huyết: phát hiện sớm để tránh biến chứng
- Đề xuất mới về vị trí việc làm của viên chức
- Tăng tốc chuyển đổi số trong thực hiện chính quyền địa phương 2 cấp
- Phường Uông Bí cho ý kiến về công tác GPMB dự án mở rộng Bệnh viện Việt Nam – Thuỵ Điển
- Uông Bí giao ban đầu tư công quý I/2026, tập trung tháo gỡ khó khăn, đẩy nhanh tiến độ dự án
- Uông Bí triển khai công tác giải phóng mặt bằng dự án đường sắt tốc độ cao Hà Nội - Quảng Ninh
- 150 dân quân tham gia huấn luyện năm thứ nhất năm 2026 tại phường Uông Bí
- Phường Uông Bí tổ chức lấy ý kiến Nhân dân về việc thành lập thành phố Quảng Ninh
- ĐỀ ÁN THÀNH LẬP THÀNH PHỐ QUẢNG NINH TRÊN CƠ SỞ ĐỊA GIỚI HÀNH CHÍNH TỈNH QUẢNG NINH
- Uông Bí cần tiếp tục chú trọng phát triển Đảng và Đoàn thể trong các doanh nghiệp ngoài khu vực Nhà nước
- Khuyến cáo người dân cảnh giác với hành vi lừa đảo 'nộp phạt nguội'