-
Tử vi thứ 4 ngày 10/6/2026 của 12 con giáp: Tý thị phi, Tị giàu cảm hứng -
Đón 3 cháu nội về quê nghỉ hè, vợ chồng già phải rút tiền dưỡng già nhưng không nỡ nói với con -
Vụ khách hàng tố bị nghi trộm đồ tại Aeon Long Biên: Công an mời nam thanh niên trong clip làm việc -
Dứa có thực sự giúp giảm mỡ máu? Chuyên gia chỉ ra sự thật nhiều người chưa biết -
Tranh cãi người ở "khu nhà giàu" mua nhà ở xã hội: Chủ đầu tư lý giải nơi ở hiện tại không đồng nghĩa với sở hữu nhà ở -
Tình hình sức khỏe Trung tá Công an bị 2 thanh niên ở Phú Thọ đâm nhập viện trong lúc làm nhiệm vụ -
Hiện trường hai mẹ con tử vong trong tư thế treo cổ ở Lào Cai, làm rõ nguyên nhân? -
Bộ Chính trị: Tiếp tục tinh giản biên chế từ 5 - 10% -
Áp thấp xuất hiện trên Biển Đông với gió giật cấp 8, 15 tỉnh thành nhận công điện khẩn -
Cái kết cuối vụ xịt nước vào thợ xây nhà hàng xóm ở Hà Nội, 2 gia đình thống nhất gì?
Công nghệ
15/05/2025 16:35Chàng sinh viên phát triển bộ gõ tiếng Việt tích hợp AI
v7 là tên gọi của bộ gõ do Trí Đức (sinh năm 2003), sinh viên Đại học Bách khoa TP HCM, phát triển với mục tiêu giúp người dùng gõ tiếng Việt nhanh hơn. Dự án đã được chấp nhận trình bày tại IJCAI 2025 – một trong những hội nghị quốc tế danh giá về trí tuệ nhân tạo, quy tụ nhiều công trình nghiên cứu từ các phòng thí nghiệm và trường đại học hàng đầu thế giới.
Khác với các bộ gõ tiếng Việt phổ biến hiện nay như Telex hay VNI, vốn hoạt động theo nguyên lý bổ sung, tức là gõ đầy đủ ký tự rồi thêm dấu, v7 sử dụng mô hình AI để dự đoán từ cần nhập chỉ dựa trên một phần cấu trúc âm tiết. Ví dụ, người dùng chỉ cần nhập “v7”, hệ thống sẽ gợi ý “Việt”.
Ý tưởng này xuất phát từ thói quen viết tắt của một bộ phận người Việt trong giao tiếp hàng ngày, khi dùng những chứ cái đầu để đại diện cho cả một từ, ví dụ như “hs” là “học sinh”. Theo Đức, nếu con người có thể hiểu cách viết này thì mô hình AI cũng hoàn toàn có khả năng xử lý tương tự nếu được huấn luyện với dữ liệu phù hợp.
Bộ gõ tận dụng đặc điểm âm tiết tiếng Việt – vốn được cấu tạo từ ba thành phần: phụ âm đầu, phần vần và thanh điệu – để giảm số lần gõ phím, đồng thời vẫn đảm bảo tính chính xác trong việc gợi ý từ.
Đức cho biết dự án sử dụng kiến trúc GPT-2, một mô hình thuộc dòng transformers, nổi bật với khả năng hiểu ngữ cảnh và dự đoán ngôn ngữ. Chàng sinh viên đã xây dựng lại toàn bộ tokenizer (bộ mã hóa từ vựng) để phù hợp với tiếng Việt, đảm bảo chỉ sử dụng các từ đúng chính tả, tối ưu hóa khả năng xử lý và dự đoán.
Ngoài ra, mô hình được huấn luyện trên Vietnamese Curated Dataset, bộ dữ liệu gồm hơn 10 tỷ từ do Viettel Solutions phát hành. Nguồn dữ liệu phong phú này giúp hệ thống học được ngữ cảnh sử dụng tiếng Việt trong đa dạng tình huống, từ văn bản hành chính đến hội thoại đời thường.
Về mặt hiệu năng, phiên bản hiện tại có thể đưa ra đúng gần 70% từ người dùng định nhập lên vị trí đầu tiên, với độ trễ trung bình chỉ khoảng 0,03 giây – đủ điều kiện chạy thời gian thực trên cả máy tính và điện thoại.
Khác với quan niệm phổ biến rằng tiếng Việt có 6 thanh điệu, Đức tham khảo nghiên cứu của các nhà ngữ học như Cao Xuân Hạo, Henri Maspero và đề xuất hệ thống 8 thanh điệu để mô hình AI xử lý ngôn ngữ chính xác hơn. Đây cũng là cơ sở hình thành tên gọi "v7", vừa tượng trưng cho “Việt”, vừa thể hiện nguyên lý xây dựng trên nền tảng các yếu tố âm vị học.
Hiện v7 đang được công bố dưới dạng mã nguồn mở trên GitHub để cộng đồng lập trình viên có thể thử nghiệm và đóng góp. Song song đó, Đức đang phát triển phiên bản phần mềm cài đặt cho Windows và macOS, nhắm đến nhóm người dùng phổ thông.
Trong kế hoạch phát triển tiếp theo, Đức ưu tiên xây dựng bàn phím ảo dành cho iPhone, nền tảng phổ biến trong việc nhập liệu cá nhân. Bên cạnh đó, mô hình sẽ được cải thiện độ chính xác bằng cách tiếp tục huấn luyện trên dữ liệu hội thoại tự nhiên.
“Mục tiêu của mình là tạo ra một công cụ nhập liệu tiếng Việt nhanh và thông minh, thân thiện với cả người dùng công nghệ lẫn người dùng phổ thông”, Đức chia sẻ.
Kết quả đánh giá cho thấy v7 giúp giảm hơn 50% số lần nhấn phím so với các bộ gõ truyền thống như Telex và VNI, cải thiện tốc độ nhập liệu đáng kể. Tuy nhiên, vì v7 là một bộ gõ kiểu dự đoán, người dùng sẽ cần một thời gian làm quen. Sau khi quen thuộc với cơ chế hoạt động của AI, tốc độ gõ có thể tăng thêm đến 50%.
v7 không chỉ là một dự án kỹ thuật, mà còn là một trong những nỗ lực cá nhân hiếm hoi từ Việt Nam được ghi nhận tại sân chơi nghiên cứu AI toàn cầu. Trong bối cảnh Việt Nam đang đầu tư mạnh vào hạ tầng trí tuệ nhân tạo, sự xuất hiện của các sản phẩm ứng dụng như v7 được kỳ vọng sẽ góp phần thúc đẩy hệ sinh thái công nghệ nội địa phát triển.
- Tổng thống Trump tuyên bố Iran bắn hạ trực thăng Apache của Mỹ, Washington buộc phải đáp trả (06:27)
- Dự án "Nuôi Em" tái xuất: Ra mắt tính năng mới, mở cổng nhận nuôi hơn 7.000 học sinh vùng cao (06:16)
- Dự báo thời tiết ngày 10/6: Hà Nội trở nắng sau chuỗi ngày mát mẻ (06:10)
- Thân thế đặc biệt của Nam Cường, vừa đi dạy vừa học tiến sĩ, có 3 bằng đại học và khối tài sản khủng (06:03)
- Tử vi thứ 4 ngày 10/6/2026 của 12 con giáp: Tý thị phi, Tị giàu cảm hứng (06:00)
- Điện mặt trời mái nhà có thể bán toàn bộ sản lượng dư lên lưới nếu đáp ứng điều kiện (09/06/26 23:13)
- Đi học về, nam sinh chết lặng khi phát hiện cha tử vong trong nhà (09/06/26 23:09)
- Khởi tố người đàn ông dùng dao tấn công tổ công tác, một trung tá công an bị thương nặng (09/06/26 23:03)
- AEON Mall thừa nhận khách hàng hoàn toàn đúng, tiếp tục gửi lời xin lỗi sau vụ việc tại Long Biên (09/06/26 22:32)
- U19 Việt Nam bị loại nghiệt ngã sau màn ngược dòng khó tin của Campuchia trước Australia (09/06/26 22:11)