-
Camera ghi lại giây phút xe cứu thương lao vào đuôi xe đầu kéo, 3 người tử vong -
Người đàn ông tử vong trên đường dây trung thế, hé lộ khoảng trống trách nhiệm an toàn lao động tại công trình thi công -
Xe cứu thương bốc cháy dữ dội sau cú tông container, 3 người tử vong -
Vụ nữ sinh lớp 7 bị ép đưa đi "nói chuyện" ở nơi vắng: Nạn nhân hoảng loạn, phải nghỉ học 20 ngày -
Cận cảnh biệt thự 4 tầng sang xịn mịn của Đoàn Văn Hậu - Doãn Hải My: Ai đến nhà cũng tấm tắc khen -
Giảm cân đón Tết bằng ức gà và súp lơ, cô gái suýt chết -
Hiện trường xe tải gây tai nạn liên hoàn tông ô tô con qua dải phân cách, hành động của tài xế gây phẫn nộ -
Góc tối về Long Tổng – Vàng Văn Ánh: 3 năm trốn truy nã vẫn khoe ăn chơi xa hoa, thân thế khó tin -
Trọng tài người Lào nhận "cái kết đắng" sau khi khiến ĐT nữ Việt Nam mất oan bàn thắng -
"Quẹt" trúng bố người yêu cũ trên ứng dụng hẹn hò: Cô chủ shop 28 tuổi rơi vào mối tình "ngang trái"
Công nghệ
13/07/2024 15:35Máy tạo giọng nói AI giống hệt con người, nhưng quá nguy hiểm
Các nhà nghiên cứu của Microsoft cho biết, VALL-E 2 có khả năng tạo ra giọng nói chính xác, tự nhiên, đủ sức thuyết phục để dễ bị nhầm là giọng nói người thật.
Chất lượng vượt trội
Công cụ AI có khả năng thực hiện điều này nhờ tích hợp hai tính năng chính: "Lấy mẫu có nhận thức về sự lặp lại" và "Mô hình mã hóa theo nhóm".
Repetition Aware Sampling cải thiện cách AI chuyển đổi văn bản thành giọng nói bằng cách giải quyết các lần lặp lại của "token" - các đơn vị ngôn ngữ nhỏ, như từ hoặc các phần của từ - ngăn chặn các vòng lặp vô hạn của âm thanh hoặc cụm từ trong quá trình giải mã. Nói cách khác, tính năng này giúp thay đổi mẫu giọng nói của VALL-E 2, khiến giọng nói nghe trôi chảy và tự nhiên hơn.
Trong khi đó, mô hình mã nhóm cải thiện hiệu quả bằng cách giảm độ dài chuỗi - hoặc số lượng mã thông báo riêng lẻ mà mô hình xử lý trong một chuỗi đầu vào duy nhất. Điều này tăng tốc độ VALL-E 2 tạo ra giọng nói và giúp quản lý những khó khăn với việc xử lý chuỗi âm thanh dài.
Các thí nghiệm được tiến hành trên các tập dữ liệu LibriSpeech và VCTK, đã chỉ ra rằng VALL-E 2 vượt trội hơn các hệ thống TTS zero-shot trước đây về độ mạnh mẽ của giọng nói, độ tự nhiên và độ tương đồng của người nói. Đây là hệ thống đầu tiên đạt được sự ngang bằng với con người trên các chuẩn mực này.
Các nhà nghiên cứu viết trong báo cáo rằng, chất lượng đầu ra của VALL-E 2 phụ thuộc vào độ dài và chất lượng của lời nói cũng như các yếu tố môi trường như tiếng ồn xung quanh.
Mặc dù vậy, Microsoft cho rằng, đây hoàn toàn là một dự án nghiên cứu và sẽ không phát hành VALL-E 2 cho công chúng do nguy cơ sử dụng sai mục đích tiềm ẩn. Điều này trùng hợp với mối lo ngại ngày càng tăng về công nghệ sao chép giọng nói Deepfake. Các công ty AI khác như OpenAI đã đặt ra những hạn chế tương tự đối với công nghệ giọng nói của họ để ngăn chặn việc giả mạo nhận dạng giọng nói hoặc mạo danh một người nào đó.
Tuy nhiên, các nhà nghiên cứu đã gợi ý rằng, công nghệ giọng nói AI có thể thấy được những ứng dụng thực tế trong tương lai. VALL-E 2 có thể tổng hợp giọng nói duy trì được danh tính của người nói và có thể được sử dụng cho mục đích học tập giáo dục, giải trí, báo chí, nội dung tự biên soạn, tính năng trợ năng, hệ thống phản hồi bằng giọng nói tương tác, dịch thuật, chatbot…
Theo Hà Thu (Tiền Phong)
- Danh tính trọng tài chung kết U22 Việt Nam – U22 Thái Lan được giấu đến phút chót (10:17)
- Phim mới của Ngu Thư Hân gây sốc vì cảnh 18+ lệch lạc, bị chỉ trích kịch liệt vì tình tiết "anh trai em gái" (10:11)
- Camera ghi lại giây phút xe cứu thương lao vào đuôi xe đầu kéo, 3 người tử vong (10:05)
- Cú bẻ lái lịch sử của Liên minh châu Âu: Ô tô chạy xăng chính thức thoát án "khai tử" vào năm 2035 (10:02)
- Tổng thống Putin: Nga không lùi bước về lãnh thổ, sẵn sàng dùng vũ lực nếu đàm phán bế tắc (10:01)
- Người đàn ông tử vong trên đường dây trung thế, hé lộ khoảng trống trách nhiệm an toàn lao động tại công trình thi công (31 phút trước)
- Sức mạnh của lời nói: Những "món quà" tinh thần giúp con xây dựng tương lai vững chắc (38 phút trước)
- Phong tỏa loạt bất động sản giá trị của cựu Cục trưởng Nguyễn Thanh Phong để thu hồi 44 tỷ đồng trục lợi (43 phút trước)
- Mai Tài Phến chính thức lên tiếng khi lần đầu làm đạo diễn cho Mỹ Tâm (47 phút trước)
- Cập nhật bảng giá xe máy Vario mới nhất tháng 12/2025 (51 phút trước)