-
Tử vi 12 con giáp - Chủ nhật ngày 17/5/2026: Mùng 1 Hợi lắm tiền, Sửu hăng hái -
Cô gái bị nhóm người đi Lexus đánh hội đồng ở Hà Nội kể lại sự tình, tất cả bắt đầu từ 1 câu hỏi? -
Báo động đỏ: Nhiều bạn trẻ đón tuổi 20 với chỉ số huyết áp "chạm ngưỡng tử thần" vì nghiện trà sữa -
Khởi tố người đàn ông lái Jeep đi ngược chiều, truy đuổi và đe dọa tài xế xe ôm công nghệ -
Phó Chủ tịch Hiệp hội Sáng tạo và Bản quyền tác giả Việt Nam Nguyễn Hải Bình bị khởi tố -
Thông tin mới vụ nhóm nam nữ đi Lexus đánh 2 cô gái dã man giữa phố nghi vì trêu ghẹo không được -
Showbiz Việt đầu năm 2026: Hàng loạt bê bối và đổ vỡ gây chấn động dư luận -
Đề xuất đầu tư hơn 261.000 tỷ đồng xây dựng Vành đai 5 vùng Thủ đô -
Công an Hà Nội xác minh vụ hai nhóm thanh niên hỗn chiến trên phố Huế, một cô gái gục xuống vỉa hè -
Giải mã sự thật clip Tổng thống Donald Trump bị đồn "nhìn trộm" tài liệu của ông Tập Cận Bình
Công nghệ
13/07/2024 15:35Máy tạo giọng nói AI giống hệt con người, nhưng quá nguy hiểm
Các nhà nghiên cứu của Microsoft cho biết, VALL-E 2 có khả năng tạo ra giọng nói chính xác, tự nhiên, đủ sức thuyết phục để dễ bị nhầm là giọng nói người thật.
Chất lượng vượt trội
Công cụ AI có khả năng thực hiện điều này nhờ tích hợp hai tính năng chính: "Lấy mẫu có nhận thức về sự lặp lại" và "Mô hình mã hóa theo nhóm".
Repetition Aware Sampling cải thiện cách AI chuyển đổi văn bản thành giọng nói bằng cách giải quyết các lần lặp lại của "token" - các đơn vị ngôn ngữ nhỏ, như từ hoặc các phần của từ - ngăn chặn các vòng lặp vô hạn của âm thanh hoặc cụm từ trong quá trình giải mã. Nói cách khác, tính năng này giúp thay đổi mẫu giọng nói của VALL-E 2, khiến giọng nói nghe trôi chảy và tự nhiên hơn.
Trong khi đó, mô hình mã nhóm cải thiện hiệu quả bằng cách giảm độ dài chuỗi - hoặc số lượng mã thông báo riêng lẻ mà mô hình xử lý trong một chuỗi đầu vào duy nhất. Điều này tăng tốc độ VALL-E 2 tạo ra giọng nói và giúp quản lý những khó khăn với việc xử lý chuỗi âm thanh dài.
Các thí nghiệm được tiến hành trên các tập dữ liệu LibriSpeech và VCTK, đã chỉ ra rằng VALL-E 2 vượt trội hơn các hệ thống TTS zero-shot trước đây về độ mạnh mẽ của giọng nói, độ tự nhiên và độ tương đồng của người nói. Đây là hệ thống đầu tiên đạt được sự ngang bằng với con người trên các chuẩn mực này.
Các nhà nghiên cứu viết trong báo cáo rằng, chất lượng đầu ra của VALL-E 2 phụ thuộc vào độ dài và chất lượng của lời nói cũng như các yếu tố môi trường như tiếng ồn xung quanh.
Mặc dù vậy, Microsoft cho rằng, đây hoàn toàn là một dự án nghiên cứu và sẽ không phát hành VALL-E 2 cho công chúng do nguy cơ sử dụng sai mục đích tiềm ẩn. Điều này trùng hợp với mối lo ngại ngày càng tăng về công nghệ sao chép giọng nói Deepfake. Các công ty AI khác như OpenAI đã đặt ra những hạn chế tương tự đối với công nghệ giọng nói của họ để ngăn chặn việc giả mạo nhận dạng giọng nói hoặc mạo danh một người nào đó.
Tuy nhiên, các nhà nghiên cứu đã gợi ý rằng, công nghệ giọng nói AI có thể thấy được những ứng dụng thực tế trong tương lai. VALL-E 2 có thể tổng hợp giọng nói duy trì được danh tính của người nói và có thể được sử dụng cho mục đích học tập giáo dục, giải trí, báo chí, nội dung tự biên soạn, tính năng trợ năng, hệ thống phản hồi bằng giọng nói tương tác, dịch thuật, chatbot…
Theo Hà Thu (Tiền Phong)
- Đi hơn 100km dự cưới bạn thân, người phụ nữ bàng hoàng vì bị hiểu lầm “mừng cưới quá ít” (11:27)
- Hà Nội hướng tới mô hình siêu đô thị hạnh phúc, dân số dưới 20 triệu người (11:26)
- Tiết lộ mối quan hệ thực sự giữa Hòa Minzy và gia đình chồng sắp cưới (11:22)
- Những thai phụ "ăn dầm ở dề" trong bệnh viện vì nỗi ám ảnh sinh non (11:09)
- Lũ quét trong đêm, xe khách 29 chỗ bị dòng nước dữ vò biến dạng (54 phút trước)
- Mourinho có thể hồi sinh Real Madrid, nhưng Mbappe chính là rào cản (1 giờ trước)
- BTS chính thức đổ bộ chung kết World Cup 2026, cổ phiếu HYBE lập tức "hóa rồng" (1 giờ trước)
- Hành trình ngược dòng của chàng thủ khoa: Từ xuất phát điểm muộn đến cái gật đầu của "gã khổng lồ" công nghệ Mỹ (1 giờ trước)
- Ôm bạc giá đỉnh hơn 1,3 tỷ đồng, nhà đầu tư lỗ gần 200 triệu vẫn chưa dám bán (1 giờ trước)
- Đã tìm thấy thi thể cuối cùng trong vụ 4 học sinh đuối nước khi tắm sông (1 giờ trước)