Công bố Bộ công cụ DeepEduBench đánh giá năng lực dạy và học của mô hình AI trong tiếng Việt
Học viện Công nghệ Bưu chính Viễn thông (Bộ Khoa học và công nghệ) vừa cùng các đối tác Công ty Sotatek, DopikAI, và AI for Việt Nam đã triển khai dự án DeepEdu và công bố bộ công cụ DeepEduBench phục vụ đánh giá năng lực dạy và học của mô hình AI trong tiếng Việt.
DeepEdu là dự án về ngôn ngữ lớn được khởi xướng bởi Học viện Công nghệ Bưu chính Viễn thông và các đối tác theo mô hình hợp tác 3 nhà: Công ty Sotatek và Công ty DopikAI với mục tiêu xây dựng bộ dữ liệu mở Tiếng Việt cho giáo dục Việt Nam, phục vụ nghiên cứu, phát triển và ứng dụng trí tuệ nhân tạo. Dự án này đồng hành và kết hợp cùng tổ chức AI for Vietnam nhằm tạo ra bộ dữ liệu Tiếng Việt mã nguồn mở chất lượng cao, giúp các mô hình AI hiểu rõ hơn văn hóa, bối cảnh và cách diễn đạt tiếng Việt. Dự án được kỳ vọng sẽ nâng cao sự hiện diện của tiếng Việt trong quá trình phát triển AI.
DeepEduBench là bộ tiêu chuẩn để đánh giá năng lực dạy và học của mô hình AI trong tiếng Việt. DeepEduBench có khả năng giảng giải rõ ràng theo từng bước, điều chỉnh độ khó theo người học, đưa ví dụ và bài tập phù hợp, đồng thời phản hồi đúng trọng tâm. Để đạt điểm cao, các mô hình AI cần giải thích mạch lạc, ưu tiên tính sư phạm và độ chính xác, và khuyến khích tư duy sâu thay vì chỉ đưa đáp án. Bộ tiêu chuẩn DeepEduBench bao gồm 13.700 mẫu dữ liệu đã được sử dụng đánh giá 52 mô hình AI hàng đầu với nhiều thông tin chi tiết tại https://rank.aiforvietnam.org.

Theo đại diện Học viện Công nghệ Bưu chính Viễn thông, phần lớn các mô hình AI hiện nay được phát triển theo hướng đa ngôn ngữ, trong đó tiếng Anh chiếm ưu thế, dẫn đến những hạn chế khi áp dụng trong bối cảnh giáo dục Việt Nam. Vì vậy, Học viện định hướng phát triển mô hình ngôn ngữ lớn (LLM) tiếng Việt, đặc biệt trong lĩnh vực giáo dục nhằm nâng cao khả năng hiểu ngữ cảnh và phù hợp với hệ thống tri thức trong nước. Trong thời gian tới, Học viện cùng 03 đối tác là Công ty Sotatek, DopikAI, và AI for Việt Nam dự kiến triển khai xây dựng kho dữ liệu tiếng Việt dành cho giáo dục với kích thước lên tới 150B token.
Theo các chuyên gia, việc xây dựng bộ tiêu chuẩn riêng cho AI trong giáo dục là cần thiết để tăng tính minh bạch trong đánh giá và hỗ trợ các cơ sở giáo dục lựa chọn giải pháp phù hợp với nhu cầu thực tiễn.
Tin tức khác
- Bốc thăm tái định cư đợt 4 cho 10 hộ dân thuộc Dự án mở rộng, nâng cấp Bệnh viện Việt Nam – Thụy Điển Uông Bí
- Phường Uông Bí giành giải Nhì toàn đoàn tại giải võ thuật cổ truyền tỉnh Quảng Ninh
- Hội nghị Ban Thường vụ Đảng ủy phường Uông Bí cho ý kiến về điều chỉnh cục bộ các đồ án quy hoạch phân khu
- Hội đồng nghĩa vụ Quân sự phường Uông Bí: Tổng kết công tác tuyển quân năm 2026 và triển khai nhiệm vụ năm 2027
- BHXH cơ sở Uông Bí đẩy mạnh tuyên truyền chính sách BHXH, BHYT tại khu dân cư
- Tháng hành động về an toàn, vệ sinh lao động: Chủ động từ cơ sở, ngăn ngừa từ sớm
- Điện chia buồn về vụ tai nạn đường sắt nghiêm trọng ở Indonesia
- Quy định mới về điều kiện công nhận xã đạt chuẩn nông thôn mới, nông thôn mới hiện đại
- Khát vọng thành phố Quảng Ninh
- Đảm bảo ATGT đợt nghỉ lễ
- Nền tảng cho chuyển đổi toàn diện
- Người dân Quảng Ninh sẽ được khám sàng lọc sức khỏe mỗi năm 1 lần