-
Video: Bí ẩn clip cô gái ngất xỉu tại chợ sau cuộc chạm trán chóng vánh với hai người lạ -
Lời khai gây sốc về "luật 5%" và những túi tiền tỷ chuyển đến tay cựu Bộ trưởng Y tế Nguyễn Thị Kim Tiến -
Vụ ô tô chở xe máy bốc cháy: Tiếng khóc của người tài xế nghèo trước gánh nặng nợ nần khi nuôi 3 con nhỏ và mẹ già đau ốm -
Tường trình của cô giáo bị tố bắt học sinh liếm đất: Bất ngờ nguồn cơn, do học sinh tự đề xuất làm? -
Đô vật 44 tuổi tử vong ở hội làng Sóc Sơn, Hà Nội: Hàng xóm chia sẻ điều bất ngờ về nạn nhân -
5 Thượng tướng Quân đội thôi giữ chức vụ, nghỉ công tác từ ngày 1/3 -
Nóng: Cựu Bộ trưởng Y tế Nguyễn Thị Kim Tiến bị C03 đề nghị truy tố -
Cái kết đắng cho tài xế xe Porsche chạy 141 km/h trên cao tốc Cam Lâm - Vĩnh Hảo -
Diễn biến mới vụ nữ sinh "ngủ nhầm phòng", mặc đồ gia chủ tại Hà Nội: Hai bên lên tiếng sau clip lan truyền -
Danh tính người phụ nữ bị tàu hoả tông tử vong khi đi bộ trên đường ray, gia đình tiết lộ tình trạng sức khoẻ
Công nghệ
22/07/2024 16:20Sợ hãi với AI tạo giọng nói giống hệt con người
Sản phẩm này "đỉnh" đến mức gã khổng lồ công nghệ Mỹ không có ý định tích hợp nó vào sản phẩm hoặc mở rộng quyền truy cập của công chúng, do lo ngại nguy cơ tiềm ẩn về việc sử dụng cho mục đích xấu.
Công cụ có tên VALL-E 2, giúp chuyển văn bản thành giọng nói hoặc bắt chước giọng nói chỉ dựa trên vài giây âm thanh. Hệ thống được đào tạo để nhận dạng các khái niệm mà không cần cung cấp bất kỳ ví dụ nào về các khái niệm đó.
"VALL-E 2 là robot đầu tiên đạt được "sự tương đương với con người", nghĩa là nó đáp ứng hoặc vượt qua các tiêu chuẩn về độ giống con người" - Microsoft tuyên bố.
VALL-E 2 kế thừa hệ thống VALL-E ban đầu được công bố vào tháng 1-2023.
"VALL-E 2 có thể tạo ra giọng nói chính xác, tự nhiên theo đúng giọng của người nói gốc" - các nhà phát triển tại Microsoft Research quả quyết và cho biết công cụ này có thể tổng hợp các câu phức tạp.
Sở dĩ VALL-E 2 này có khả năng "như con người" nhờ tích hợp hai tính năng chính, gồm tính năng lấy mẫu có nhận thức về sự lặp lại và mô hình mã hóa theo nhóm.
Trong đó, tính năng lấy mẫu có nhận thức về sự lặp lại giúp giải quyết được các lần lặp lại của các đơn vị ngôn ngữ nhỏ như từ hoặc thành phần của từ; ngăn chặn các vòng lặp vô hạn của âm thanh hoặc cụm từ trong quá trình giải mã.
Còn mô hình mã nhóm giúp cải thiện hiệu quả bằng cách giảm độ dài chuỗi hoặc số lượng mã thông báo riêng lẻ, mà mô hình xử lý trong một chuỗi đầu vào duy nhất. Qua đó, có thể tạo ra giọng nói và giúp quản lý những khó khăn với việc xử lý chuỗi âm thanh dài.
Các thí nghiệm được tiến hành trên các tập dữ liệu LibriSpeech và VCTK đã chỉ ra rằng VALL-E 2 vượt trội hơn các hệ thống TTS zero-shot trước đây về độ mạnh mẽ của giọng nói, độ tự nhiên và độ tương đồng của người nói.
Các nhà nghiên cứu cho rằng rằng chất lượng đầu ra của VALL-E 2 phụ thuộc vào độ dài và chất lượng của lời nói cũng như các yếu tố môi trường, như tiếng ồn xung quanh.
Các nhà nghiên cứu nhận định trong tương lai, VALL-E 2 có thể tổng hợp giọng nói, duy trì được danh tính của người nói. Hơn nữa, nó có thể được sử dụng cho mục đích học tập, giáo dục, giải trí, báo chí, nội dung tự biên soạn, tính năng trợ năng, hệ thống phản hồi bằng giọng nói tương tác, dịch thuật, chatbot…
Theo Bằng Hưng (Nld.com.vn)
- Cháy tàu du lịch ở Quảng Ninh: Quyết định kịp thời của thuyền trưởng cứu sống toàn bộ 41 người (27/02/26 23:00)
- "Cha đẻ" dầu gội X-men bất ngờ ngồi ghế Tổng giám đốc PNJ: Chân dung nhà điều hành có profile khủng (27/02/26 22:46)
- Hà Nội: 2 vợ chồng thương vong trên đường đi thăm con gái mới sinh, camera ghi lại diễn biến sự việc (27/02/26 22:28)
- Hà Nội sẽ chuyển toàn bộ taxi chạy xăng, dầu sang xe điện trước 2030 (27/02/26 22:15)
- Kiểm tra 2 kho lạnh ở Thanh Hóa: Phát hiện gần 6 tấn đuôi, chân trâu bò bốc mùi khó chịu (27/02/26 22:01)
- Vụ thanh niên đánh mẹ gãy tay ở Nghệ An: Công an tiếp tục triệu tập những người liên quan (27/02/26 21:38)
- Tàu du lịch chở 41 người cháy ngùn ngụt trên vịnh Hạ Long (27/02/26 21:30)
- Phản ứng trái chiều của CĐM về vụ đô vật 44 tuổi tử vong trong lúc thi đấu ở Sóc Sơn, Hà Nội (27/02/26 21:02)
- Galaxy S26 Ultra ra mắt, Xiaomi 15 Ultra xả kho cực rẻ đón đầu "vua AI Phone" (27/02/26 20:43)
- Sau chuỗi xả hàng, khối ngoại bất ngờ rót trăm tỷ vào loạt cổ phiếu lớn (27/02/26 20:32)