-
Tai nạn kinh hoàng: Nam công nhân bị máy xay thịt cuốn nát bàn tay -
Suy thận vì thói quen tưởng vô hại: Món gì cũng phải chấm -
Vàng, bạc đồng loạt lập đỉnh lịch sử -
Tình hình đồ hộp Hạ Long tại các siêu thị: Khách hàng đã mua sản phẩm được hoàn tiền tại đây? -
Không chỉ IT, loạt ngành nghề tại Việt Nam đang nhận lương tới 70 triệu đồng/tháng, thị trường lao động biến động mạnh -
800 tấn mì "tẩm" độc chất đã ra thị trường: Hàn the âm thầm tàn phá gan, thận người tiêu dùng -
Trông như cành củi khô, cây mai Yên Tử bất ngờ được trả giá gần 1 tỷ đồng -
Bi kịch bé trai 8 tuổi mắc ung thư đại trực tràng: Cái giá đắt của sự nuông chiều "sai cách" -
Clip những pha cứu thua xuất thần của thủ môn Trung Kiên -
“Bay như TK1, sút như ĐB7”: FIFA phấn khích trước địa chấn của U23 Việt Nam
Công nghệ
21/05/2025 20:44Google ra mắt tính năng dịch giọng nói trực tiếp trong cuộc gọi
Tại sự kiện I/O 2025 diễn ra ngày 21/5, Google chính thức giới thiệu tính năng dịch giọng nói trực tiếp trong cuộc gọi. CEO Sundar Pichai mô tả tính năng này là "công nghệ phá vỡ rào cản ngôn ngữ". Tính năng này được triển khai trên nền tảng Google Meet, cho phép dịch giọng nói gần như theo thời gian thực, đồng thời giữ được giọng nói, ngữ điệu và biểu cảm của người nói.
“Nó có thể khớp giọng và ngữ điệu, thậm chí cả biểu cảm của người nói gần như theo thời gian thực” ông Pichai chia sẻ. “Điều này giúp cuộc trò chuyện giữa các ngôn ngữ trở nên tự nhiên và trôi chảy hơn”.
Video giới thiệu tính năng mới là một cuộc trò chuyện giữa hai người nói tiếng Tây Ban Nha và tiếng Anh, trong đó hệ thống AI dịch và tái tạo giọng nói theo cách tự nhiên, với âm thanh gốc được duy trì ở mức âm lượng thấp hơn. Theo Google, giải pháp mới khắc phục được một số hạn chế của các công cụ dịch hiện tại, như việc sử dụng giọng tổng hợp thiếu tự nhiên hoặc độ trễ lớn trong quá trình xử lý.
| Tính năng dịch cuộc gọi theo thời gian thực trong Google Meet. Video: Google |
Tính năng này hiện mới hỗ trợ dịch giữa tiếng Anh và tiếng Tây Ban Nha, áp dụng với người dùng các gói dịch vụ cao cấp gồm Google AI Pro và Google Ultra. Hãng cho biết sẽ bổ sung thêm ngôn ngữ mới trong thời gian tới và mở rộng thử nghiệm với khách hàng doanh nghiệp sử dụng Google Workspace trong năm nay.
Theo đánh giá từ Google, công nghệ dịch giọng nói thời gian thực có thể được ứng dụng trong nhiều bối cảnh như họp hành quốc tế, hỗ trợ khách hàng, giáo dục từ xa, hay liên lạc giữa các thành viên gia đình sống ở nhiều quốc gia khác nhau.
Dịch giọng nói thời gian thực là một trong những kết quả của dự án Starline công bố năm 2021, với mục tiêu tạo ra trải nghiệm gọi điện gần giống như giao tiếp trực tiếp. Ngoài phần mềm ngôn ngữ, dự án này còn phát triển công nghệ hình ảnh 3D nhằm tái tạo người đối thoại trong không gian thực tế ảo.
Tại Google I/O 2025, công ty cũng giới thiệu thiết bị phần cứng mới mang tên Google Beam, được thiết kế để phục vụ các cuộc gọi trong hệ sinh thái Starline, kết hợp nhiều công nghệ nhằm nâng cao chất lượng trải nghiệm gọi điện trong tương lai.
Theo Thái Sơn (SHTT)
- Ván cược 800 triệu thiết bị AI của Samsung (1 giờ trước)
- Qatar làm trung gian, Venezuela nhận “bằng chứng sự sống” của vợ chồng ông Maduro (2 giờ trước)
- Tai nạn kinh hoàng: Nam công nhân bị máy xay thịt cuốn nát bàn tay (2 giờ trước)
- Ronaldo ghi bàn, Al Nassr thảm bại trong trận cầu 6 điểm (2 giờ trước)
- Dừng đèn đỏ, người đi xe máy bất ngờ "lãnh trọn" chất thải từ xe vượt ẩu (2 giờ trước)
- Á hậu Thu Ngân mang 30 bộ cánh, chính thức lên đường chinh chiến tại Miss Intercontinental (2 giờ trước)
- Phạm nhân trốn trại bị bắt lại sau 3 ngày lẩn trốn (2 giờ trước)
- Bộ Chính trị quyết định lấy ngày 24/11 là "Ngày Văn hóa Việt Nam", được nghỉ lễ, người lao động được hưởng nguyên lương (2 giờ trước)
- Suy thận vì thói quen tưởng vô hại: Món gì cũng phải chấm (2 giờ trước)
- Nga bất ngờ nhắc đến kịch bản Greenland sáp nhập liên bang giữa lúc tham vọng của Mỹ sục sôi (2 giờ trước)