Công bố Bộ công cụ DeepEduBench đánh giá năng lực dạy và học của mô hình AI trong tiếng Việt
Học viện Công nghệ Bưu chính Viễn thông (Bộ Khoa học và công nghệ) vừa cùng các đối tác Công ty Sotatek, DopikAI, và AI for Việt Nam đã triển khai dự án DeepEdu và công bố bộ công cụ DeepEduBench phục vụ đánh giá năng lực dạy và học của mô hình AI trong tiếng Việt.
DeepEdu là dự án về ngôn ngữ lớn được khởi xướng bởi Học viện Công nghệ Bưu chính Viễn thông và các đối tác theo mô hình hợp tác 3 nhà: Công ty Sotatek và Công ty DopikAI với mục tiêu xây dựng bộ dữ liệu mở Tiếng Việt cho giáo dục Việt Nam, phục vụ nghiên cứu, phát triển và ứng dụng trí tuệ nhân tạo. Dự án này đồng hành và kết hợp cùng tổ chức AI for Vietnam nhằm tạo ra bộ dữ liệu Tiếng Việt mã nguồn mở chất lượng cao, giúp các mô hình AI hiểu rõ hơn văn hóa, bối cảnh và cách diễn đạt tiếng Việt. Dự án được kỳ vọng sẽ nâng cao sự hiện diện của tiếng Việt trong quá trình phát triển AI.
DeepEduBench là bộ tiêu chuẩn để đánh giá năng lực dạy và học của mô hình AI trong tiếng Việt. DeepEduBench có khả năng giảng giải rõ ràng theo từng bước, điều chỉnh độ khó theo người học, đưa ví dụ và bài tập phù hợp, đồng thời phản hồi đúng trọng tâm. Để đạt điểm cao, các mô hình AI cần giải thích mạch lạc, ưu tiên tính sư phạm và độ chính xác, và khuyến khích tư duy sâu thay vì chỉ đưa đáp án. Bộ tiêu chuẩn DeepEduBench bao gồm 13.700 mẫu dữ liệu đã được sử dụng đánh giá 52 mô hình AI hàng đầu với nhiều thông tin chi tiết tại https://rank.aiforvietnam.org.

Theo đại diện Học viện Công nghệ Bưu chính Viễn thông, phần lớn các mô hình AI hiện nay được phát triển theo hướng đa ngôn ngữ, trong đó tiếng Anh chiếm ưu thế, dẫn đến những hạn chế khi áp dụng trong bối cảnh giáo dục Việt Nam. Vì vậy, Học viện định hướng phát triển mô hình ngôn ngữ lớn (LLM) tiếng Việt, đặc biệt trong lĩnh vực giáo dục nhằm nâng cao khả năng hiểu ngữ cảnh và phù hợp với hệ thống tri thức trong nước. Trong thời gian tới, Học viện cùng 03 đối tác là Công ty Sotatek, DopikAI, và AI for Việt Nam dự kiến triển khai xây dựng kho dữ liệu tiếng Việt dành cho giáo dục với kích thước lên tới 150B token.
Theo các chuyên gia, việc xây dựng bộ tiêu chuẩn riêng cho AI trong giáo dục là cần thiết để tăng tính minh bạch trong đánh giá và hỗ trợ các cơ sở giáo dục lựa chọn giải pháp phù hợp với nhu cầu thực tiễn.
Tin tức khác
- Cảnh giác: Đừng nhận vận chuyển đồ giúp người lạ!
- BHXH cơ sở Uông Bí ra quân tuyên truyền, vận động người dân tham gia BHXH tự nguyện, BHYT hộ gia đình
- Trung tâm chính trị phường Uông Bí: Khai giảng lớp bồi dưỡng nhận thức về Đảng khóa III năm 2026
- THANH TOÁN KHÔNG DÙNG TIỀN MẶT - NỀN TẢNG QUẢN LÝ THUẾ HIỆU QUẢ, MINH BẠCH
- Học sinh khối 9 trường TH - THCS Uông Bí tham quan, trải nghiệm và tham dự ngày hội tư vấn nghề nghiệp tại Trường Cao đẳng than khoáng sản Việt Nam, phân hiệu hữu nghị
- Tập trung ôn tập cho học sinh chuẩn bị vào lớp 10
- Uông Bí đạt giải Nhì toàn đoàn tại Hội thi Tin học trẻ tỉnh Quảng Ninh
- Giao lưu bóng chuyền hơi giữa các cơ sở hội cựu chiến binh trên địa bàn phường Uông Bí
- Phường Uông Bí tổ chức đăng ký nghĩa vụ quân sự lần đầu năm 2026
- Chủ tịch UBND xã, phường, đặc khu chịu trách nhiệm toàn diện trước Chủ tịch UBND tỉnh về công tác bảo đảm an toàn thực phẩm
- Phường Uông Bí tổng kết hội thi giáo viên giỏi, lan tỏa tinh thần đổi mới giáo dục
- Các hộ dân đầu tiên của dự án mở rộng Bệnh viện Việt Nam – Thuỵ Điển Uông Bí nhận tiền bồi thường hỗ trợ tái định cư GPMB