-
Hà Nội: Hy hữu cảnh con rể nằm trên nắp capo ô tô của bố vợ để ngăn cản đòi xe -
Nâng ngưỡng miễn thuế lên 1 tỷ đồng: "Phao cứu sinh" cho hàng triệu hộ kinh doanh và doanh nghiệp nhỏ -
34 triệu thuê bao di động phải xác thực qua VNeID trước ngày 15/6 -
Huy động vốn ngoại qua trái phiếu Chính phủ dài hạn để đột phá hạ tầng giao thông -
Thủ tướng chỉ đạo hỏa tốc: Tuyệt đối không để thiếu điện, đẩy mạnh nhập khẩu từ Lào và Trung Quốc -
Xác minh clip người đàn ông mở cửa nhảy khỏi ô tô đang chạy sau khi cãi vã với bạn gái -
TP.HCM: Tài xế gắng gượng tấp xe vào lề để tránh gây tai nạn trước khi qua đời vì đột quỵ -
Mẹ chồng buộc con dâu ký giấy chia tài sản, sự thật phía sau khiến ai cũng ngỡ ngàng -
Ám ảnh khoảnh khắc ô tô tông tử vong người phụ nữ đang đi bộ cùng 3 trẻ nhỏ -
Ai được tăng lương hưu, trợ cấp từ ngày 1/7?
Công nghệ
15/05/2025 16:35Chàng sinh viên phát triển bộ gõ tiếng Việt tích hợp AI
v7 là tên gọi của bộ gõ do Trí Đức (sinh năm 2003), sinh viên Đại học Bách khoa TP HCM, phát triển với mục tiêu giúp người dùng gõ tiếng Việt nhanh hơn. Dự án đã được chấp nhận trình bày tại IJCAI 2025 – một trong những hội nghị quốc tế danh giá về trí tuệ nhân tạo, quy tụ nhiều công trình nghiên cứu từ các phòng thí nghiệm và trường đại học hàng đầu thế giới.
Khác với các bộ gõ tiếng Việt phổ biến hiện nay như Telex hay VNI, vốn hoạt động theo nguyên lý bổ sung, tức là gõ đầy đủ ký tự rồi thêm dấu, v7 sử dụng mô hình AI để dự đoán từ cần nhập chỉ dựa trên một phần cấu trúc âm tiết. Ví dụ, người dùng chỉ cần nhập “v7”, hệ thống sẽ gợi ý “Việt”.
Ý tưởng này xuất phát từ thói quen viết tắt của một bộ phận người Việt trong giao tiếp hàng ngày, khi dùng những chứ cái đầu để đại diện cho cả một từ, ví dụ như “hs” là “học sinh”. Theo Đức, nếu con người có thể hiểu cách viết này thì mô hình AI cũng hoàn toàn có khả năng xử lý tương tự nếu được huấn luyện với dữ liệu phù hợp.
Bộ gõ tận dụng đặc điểm âm tiết tiếng Việt – vốn được cấu tạo từ ba thành phần: phụ âm đầu, phần vần và thanh điệu – để giảm số lần gõ phím, đồng thời vẫn đảm bảo tính chính xác trong việc gợi ý từ.
Đức cho biết dự án sử dụng kiến trúc GPT-2, một mô hình thuộc dòng transformers, nổi bật với khả năng hiểu ngữ cảnh và dự đoán ngôn ngữ. Chàng sinh viên đã xây dựng lại toàn bộ tokenizer (bộ mã hóa từ vựng) để phù hợp với tiếng Việt, đảm bảo chỉ sử dụng các từ đúng chính tả, tối ưu hóa khả năng xử lý và dự đoán.
Ngoài ra, mô hình được huấn luyện trên Vietnamese Curated Dataset, bộ dữ liệu gồm hơn 10 tỷ từ do Viettel Solutions phát hành. Nguồn dữ liệu phong phú này giúp hệ thống học được ngữ cảnh sử dụng tiếng Việt trong đa dạng tình huống, từ văn bản hành chính đến hội thoại đời thường.
Về mặt hiệu năng, phiên bản hiện tại có thể đưa ra đúng gần 70% từ người dùng định nhập lên vị trí đầu tiên, với độ trễ trung bình chỉ khoảng 0,03 giây – đủ điều kiện chạy thời gian thực trên cả máy tính và điện thoại.
Khác với quan niệm phổ biến rằng tiếng Việt có 6 thanh điệu, Đức tham khảo nghiên cứu của các nhà ngữ học như Cao Xuân Hạo, Henri Maspero và đề xuất hệ thống 8 thanh điệu để mô hình AI xử lý ngôn ngữ chính xác hơn. Đây cũng là cơ sở hình thành tên gọi "v7", vừa tượng trưng cho “Việt”, vừa thể hiện nguyên lý xây dựng trên nền tảng các yếu tố âm vị học.
Hiện v7 đang được công bố dưới dạng mã nguồn mở trên GitHub để cộng đồng lập trình viên có thể thử nghiệm và đóng góp. Song song đó, Đức đang phát triển phiên bản phần mềm cài đặt cho Windows và macOS, nhắm đến nhóm người dùng phổ thông.
Trong kế hoạch phát triển tiếp theo, Đức ưu tiên xây dựng bàn phím ảo dành cho iPhone, nền tảng phổ biến trong việc nhập liệu cá nhân. Bên cạnh đó, mô hình sẽ được cải thiện độ chính xác bằng cách tiếp tục huấn luyện trên dữ liệu hội thoại tự nhiên.
“Mục tiêu của mình là tạo ra một công cụ nhập liệu tiếng Việt nhanh và thông minh, thân thiện với cả người dùng công nghệ lẫn người dùng phổ thông”, Đức chia sẻ.
Kết quả đánh giá cho thấy v7 giúp giảm hơn 50% số lần nhấn phím so với các bộ gõ truyền thống như Telex và VNI, cải thiện tốc độ nhập liệu đáng kể. Tuy nhiên, vì v7 là một bộ gõ kiểu dự đoán, người dùng sẽ cần một thời gian làm quen. Sau khi quen thuộc với cơ chế hoạt động của AI, tốc độ gõ có thể tăng thêm đến 50%.
v7 không chỉ là một dự án kỹ thuật, mà còn là một trong những nỗ lực cá nhân hiếm hoi từ Việt Nam được ghi nhận tại sân chơi nghiên cứu AI toàn cầu. Trong bối cảnh Việt Nam đang đầu tư mạnh vào hạ tầng trí tuệ nhân tạo, sự xuất hiện của các sản phẩm ứng dụng như v7 được kỳ vọng sẽ góp phần thúc đẩy hệ sinh thái công nghệ nội địa phát triển.
- Màn đối đáp hóm hỉnh giữa Vua Charles III và Tổng thống Trump: Từ chuyện "ngôn ngữ" đến ký ức Nhà Trắng bị đốt (29/04/26 22:57)
- Hà Nội: Hy hữu cảnh con rể nằm trên nắp capo ô tô của bố vợ để ngăn cản đòi xe (29/04/26 22:51)
- Nâng ngưỡng miễn thuế lên 1 tỷ đồng: "Phao cứu sinh" cho hàng triệu hộ kinh doanh và doanh nghiệp nhỏ (29/04/26 22:46)
- 34 triệu thuê bao di động phải xác thực qua VNeID trước ngày 15/6 (29/04/26 22:29)
- Huy động vốn ngoại qua trái phiếu Chính phủ dài hạn để đột phá hạ tầng giao thông (29/04/26 22:16)
- Vị Tổng Bí thư từng "chặn đứng" lạm phát chưa từng có, bí danh lấy từ cuộc vượt ngục của chính mình (29/04/26 20:04)
- Trục vớt xe tăng ở biển Quy Nhơn, phát hiện nhiều hiện vật bất ngờ (29/04/26 19:31)
- Nhà máy nội thất 4.000 m² ở TP.HCM bị thiêu rụi: Hàng trăm công nhân thoát nạn, tài sản cháy sạch (29/04/26 19:24)
- "Đại gia food reviewer" 40 triệu follow bị phong sát: Truy thu thuế 18,9 triệu NDT, khóa sạch nền tảng (29/04/26 19:15)
- Shark Hưng bất ngờ nộp đơn xin từ chức tại Cen Land (29/04/26 18:01)