Công bố Bộ công cụ DeepEduBench đánh giá năng lực dạy và học của mô hình AI trong tiếng Việt
Học viện Công nghệ Bưu chính Viễn thông (Bộ Khoa học và công nghệ) vừa cùng các đối tác Công ty Sotatek, DopikAI, và AI for Việt Nam đã triển khai dự án DeepEdu và công bố bộ công cụ DeepEduBench phục vụ đánh giá năng lực dạy và học của mô hình AI trong tiếng Việt.
DeepEdu là dự án về ngôn ngữ lớn được khởi xướng bởi Học viện Công nghệ Bưu chính Viễn thông và các đối tác theo mô hình hợp tác 3 nhà: Công ty Sotatek và Công ty DopikAI với mục tiêu xây dựng bộ dữ liệu mở Tiếng Việt cho giáo dục Việt Nam, phục vụ nghiên cứu, phát triển và ứng dụng trí tuệ nhân tạo. Dự án này đồng hành và kết hợp cùng tổ chức AI for Vietnam nhằm tạo ra bộ dữ liệu Tiếng Việt mã nguồn mở chất lượng cao, giúp các mô hình AI hiểu rõ hơn văn hóa, bối cảnh và cách diễn đạt tiếng Việt. Dự án được kỳ vọng sẽ nâng cao sự hiện diện của tiếng Việt trong quá trình phát triển AI.
DeepEduBench là bộ tiêu chuẩn để đánh giá năng lực dạy và học của mô hình AI trong tiếng Việt. DeepEduBench có khả năng giảng giải rõ ràng theo từng bước, điều chỉnh độ khó theo người học, đưa ví dụ và bài tập phù hợp, đồng thời phản hồi đúng trọng tâm. Để đạt điểm cao, các mô hình AI cần giải thích mạch lạc, ưu tiên tính sư phạm và độ chính xác, và khuyến khích tư duy sâu thay vì chỉ đưa đáp án. Bộ tiêu chuẩn DeepEduBench bao gồm 13.700 mẫu dữ liệu đã được sử dụng đánh giá 52 mô hình AI hàng đầu với nhiều thông tin chi tiết tại https://rank.aiforvietnam.org.

Theo đại diện Học viện Công nghệ Bưu chính Viễn thông, phần lớn các mô hình AI hiện nay được phát triển theo hướng đa ngôn ngữ, trong đó tiếng Anh chiếm ưu thế, dẫn đến những hạn chế khi áp dụng trong bối cảnh giáo dục Việt Nam. Vì vậy, Học viện định hướng phát triển mô hình ngôn ngữ lớn (LLM) tiếng Việt, đặc biệt trong lĩnh vực giáo dục nhằm nâng cao khả năng hiểu ngữ cảnh và phù hợp với hệ thống tri thức trong nước. Trong thời gian tới, Học viện cùng 03 đối tác là Công ty Sotatek, DopikAI, và AI for Việt Nam dự kiến triển khai xây dựng kho dữ liệu tiếng Việt dành cho giáo dục với kích thước lên tới 150B token.
Theo các chuyên gia, việc xây dựng bộ tiêu chuẩn riêng cho AI trong giáo dục là cần thiết để tăng tính minh bạch trong đánh giá và hỗ trợ các cơ sở giáo dục lựa chọn giải pháp phù hợp với nhu cầu thực tiễn.
Tin tức khác
- TRUNG TÂM CUNG ỨNG DỊCH VỤ PHƯỜNG UÔNG BÍ ĐÓN NHẬN NHIỀU LẴNG HOA CHÚC MỪNG NHÂN KỶ NIỆM 101 NĂM NGÀY BÁO CHÍ CÁCH MẠNG VIỆT NAM
- Đằng sau những bữa cơm ca
- Hội nghị Báo cáo viên quý II/2026
- Khai giảng lớp tập huấn chuyên môn nghiệp vụ hướng dẫn viên bơi và bơi cứu đuối tỉnh Quảng Ninh năm 2036
- Hội nghị đối thoại người đứng đầu cấp ủy, chính quyền với Nhân dân; giao ban giữa Thường trực Đảng ủy với Bí thư cấp ủy các chi, đảng bộ trực thuộc, Khu trưởng, Trưởng ban công tác mặt trận các khu dân cư quý II/2026
- Về việc xử lý cuốn sách “Chuyện với Thanh - Lời kể mới về ánh sáng” của Nhà xuất bản Hội Nhà văn
- HĐND phường Uông Bí rà soát kết quả giải quyết kiến nghị của cử tri
- Công ty Nhiệt Điện Uông Bí diễn tập phương án PCTT - TKCN và ứng phó sự cố tràn dầu 2026
- UÔNG BÍ: CHỦ ĐỘNG ĐƯA CHÍNH SÁCH BHXH TỰ NGUYỆN, BHYT HỘ GIA ĐÌNH ĐẾN GẦN NGƯỜI DÂN
- PHƯỜNG UÔNG BÍ: SẮP XẾP 33 KHU PHỐ THÀNH 24 KHU PHỐ
- Tặng Bằng khen của UBND tỉnh cho các cá nhân, gia đình có nghĩa cử hiến tạng cứu người
- Bốc thăm tái định cư cho các hộ dân thuộc dự án Mở rộng, nâng cấp Bệnh viện Việt Nam – Thụy Điển Uông Bí