-
2025: Năm của những nghịch lý vĩ đại giữa đỉnh cao công nghệ và vực thẳm khí hậu -
Đắk Lắk: Thảm kịch hỏa hoạn lúc rạng sáng, 4 người trong một gia đình tử vong thương tâm -
Lời cảnh tỉnh từ bi kịch của nữ người mẫu 8X: Cái chết tức tưởi sau cuộc "trùng tu" nhan sắc -
Man Utd giải mã "khắc tinh" Newcastle: Đêm thăng hoa của Patrick Dorgu -
Vụ nữ sinh lớp 8 bị đánh hội đồng phải nhập viện: Mẹ chết lặng khi tận mắt xem clip con bị đánh -
Tử vi thứ 2 ngày 27/12/2025 của 12 con giáp: Mão cẩn trọng, Mùi được ghi nhận -
Giang hồ mạng TikTok Được Đất Bắc và những phát ngôn gây sốc trước ngày bị bắt -
Nữ sinh lớp 11 lấy 38 triệu "bao" bạn: Khi nỗi đau của mẹ va vào sự im lặng đáng sợ của con -
Rúng động vụ phát hiện cánh tay người đứt rời trên cao tốc Vĩnh Hảo - Phan Thiết -
Lưu ý quan trọng từ kỳ thuế 2025: Trả lương trên 5 triệu đồng bằng tiền mặt có bị loại khỏi chi phí hợp lệ?
Công nghệ
13/07/2024 15:35Máy tạo giọng nói AI giống hệt con người, nhưng quá nguy hiểm
Các nhà nghiên cứu của Microsoft cho biết, VALL-E 2 có khả năng tạo ra giọng nói chính xác, tự nhiên, đủ sức thuyết phục để dễ bị nhầm là giọng nói người thật.
Chất lượng vượt trội
Công cụ AI có khả năng thực hiện điều này nhờ tích hợp hai tính năng chính: "Lấy mẫu có nhận thức về sự lặp lại" và "Mô hình mã hóa theo nhóm".
Repetition Aware Sampling cải thiện cách AI chuyển đổi văn bản thành giọng nói bằng cách giải quyết các lần lặp lại của "token" - các đơn vị ngôn ngữ nhỏ, như từ hoặc các phần của từ - ngăn chặn các vòng lặp vô hạn của âm thanh hoặc cụm từ trong quá trình giải mã. Nói cách khác, tính năng này giúp thay đổi mẫu giọng nói của VALL-E 2, khiến giọng nói nghe trôi chảy và tự nhiên hơn.
Trong khi đó, mô hình mã nhóm cải thiện hiệu quả bằng cách giảm độ dài chuỗi - hoặc số lượng mã thông báo riêng lẻ mà mô hình xử lý trong một chuỗi đầu vào duy nhất. Điều này tăng tốc độ VALL-E 2 tạo ra giọng nói và giúp quản lý những khó khăn với việc xử lý chuỗi âm thanh dài.
Các thí nghiệm được tiến hành trên các tập dữ liệu LibriSpeech và VCTK, đã chỉ ra rằng VALL-E 2 vượt trội hơn các hệ thống TTS zero-shot trước đây về độ mạnh mẽ của giọng nói, độ tự nhiên và độ tương đồng của người nói. Đây là hệ thống đầu tiên đạt được sự ngang bằng với con người trên các chuẩn mực này.
Các nhà nghiên cứu viết trong báo cáo rằng, chất lượng đầu ra của VALL-E 2 phụ thuộc vào độ dài và chất lượng của lời nói cũng như các yếu tố môi trường như tiếng ồn xung quanh.
Mặc dù vậy, Microsoft cho rằng, đây hoàn toàn là một dự án nghiên cứu và sẽ không phát hành VALL-E 2 cho công chúng do nguy cơ sử dụng sai mục đích tiềm ẩn. Điều này trùng hợp với mối lo ngại ngày càng tăng về công nghệ sao chép giọng nói Deepfake. Các công ty AI khác như OpenAI đã đặt ra những hạn chế tương tự đối với công nghệ giọng nói của họ để ngăn chặn việc giả mạo nhận dạng giọng nói hoặc mạo danh một người nào đó.
Tuy nhiên, các nhà nghiên cứu đã gợi ý rằng, công nghệ giọng nói AI có thể thấy được những ứng dụng thực tế trong tương lai. VALL-E 2 có thể tổng hợp giọng nói duy trì được danh tính của người nói và có thể được sử dụng cho mục đích học tập giáo dục, giải trí, báo chí, nội dung tự biên soạn, tính năng trợ năng, hệ thống phản hồi bằng giọng nói tương tác, dịch thuật, chatbot…
Theo Hà Thu (Tiền Phong)
- Nam NSND đỗ xuất sắc khoa Toán, trúng tuyển phi công nhưng không được nhận vì yếu tố lí lịch (2 giờ trước)
- Tình huống pháp lý vụ pháp lý vụ xua chó dữ lao vào đám đông làm bị thương một phụ nữ (2 giờ trước)
- Tháng 11 âm lịch có 2 con giáp phát tài rực rỡ, 2 con giáp khác lại phải thận trọng đề phòng kẻ xấu (2 giờ trước)
- Cháy nhà 4 người thiệt mạng: Bố ôm chặt che chắn, con 1 tháng tuổi thoát chết kỳ diệu (2 giờ trước)
- Cứu sống bé trai 13 tuổi nghi uống thuốc diệt chuột liên tục 4 ngày (2 giờ trước)
- Minh Tú gây sốc khi tổng kết năm 2025: Nợ ngân hàng nửa tỷ, sức khỏe chạm đáy sau loạt biến cố (2 giờ trước)
- Lật xe chở đoàn từ thiện ở Lào Cai, ít nhất 8 người tử vong (2 giờ trước)
- Honda chính thức mở bán "ông hoàng xe số" 125cc mới giá 35 triệu đồng: Chất hơn Wave Alpha và Future (3 giờ trước)
- Dương Ái Vy xin lỗi sau ồn ào "hát đè" bản quyền ca khúc của đàn chị (3 giờ trước)
- Thật khó hiểu! Đến cả màu Galaxy S26 Ultra cũng 'nhái' lại iPhone 17 Pro Max (3 giờ trước)