-
Lý do lực lượng chức năng phải chờ đến 5/2 mới bắt nghi phạm cuối vụ cướp ngân hàng -
Vụ 3 người trong cùng gia đình tử vong ở Hà Tĩnh: Hé lộ hoàn cảnh nạn nhân rất khó khăn -
Nghi phạm trong vụ cướp ngân hàng ở Gia Lai từng dùng súng AK giết người sẽ bị xử lý thế nào? -
Cái kết cuối cùng vụ cô giáo tự sửa bài thi tiếng Anh của 19 học sinh, nhà trường lên tiếng vụ dạy thêm -
Hà Nội siết chặt phạt nguội vỉa hè bằng camera, hàng trăm quán ăn bất ngờ bị xử lý chỉ trong hai ngày -
Rút tiết kiệm "đu đỉnh" bạc, nhà đầu tư mất hàng trăm triệu đồng chỉ sau một tuần -
Nghẹt thở giải cứu 3 người kẹt trong cơ sở mai táng bốc cháy ngùn ngụt ở TP.HCM -
Video: Trẻ em Hà Nội bắt chước trào lưu "chích kèn", lao ra đường nhảy múa theo tiếng còi xe tải -
Nữ tài xế bị phạt 5 triệu đồng vì đi sai làn trên cao tốc, bị người dân ghi hình gửi CSGT -
Chủ động ứng phó rét đậm, rét hại, có nơi dưới 3 độ C
Công nghệ
22/07/2024 16:20Sợ hãi với AI tạo giọng nói giống hệt con người
Sản phẩm này "đỉnh" đến mức gã khổng lồ công nghệ Mỹ không có ý định tích hợp nó vào sản phẩm hoặc mở rộng quyền truy cập của công chúng, do lo ngại nguy cơ tiềm ẩn về việc sử dụng cho mục đích xấu.
Công cụ có tên VALL-E 2, giúp chuyển văn bản thành giọng nói hoặc bắt chước giọng nói chỉ dựa trên vài giây âm thanh. Hệ thống được đào tạo để nhận dạng các khái niệm mà không cần cung cấp bất kỳ ví dụ nào về các khái niệm đó.
"VALL-E 2 là robot đầu tiên đạt được "sự tương đương với con người", nghĩa là nó đáp ứng hoặc vượt qua các tiêu chuẩn về độ giống con người" - Microsoft tuyên bố.
VALL-E 2 kế thừa hệ thống VALL-E ban đầu được công bố vào tháng 1-2023.
"VALL-E 2 có thể tạo ra giọng nói chính xác, tự nhiên theo đúng giọng của người nói gốc" - các nhà phát triển tại Microsoft Research quả quyết và cho biết công cụ này có thể tổng hợp các câu phức tạp.
Sở dĩ VALL-E 2 này có khả năng "như con người" nhờ tích hợp hai tính năng chính, gồm tính năng lấy mẫu có nhận thức về sự lặp lại và mô hình mã hóa theo nhóm.
Trong đó, tính năng lấy mẫu có nhận thức về sự lặp lại giúp giải quyết được các lần lặp lại của các đơn vị ngôn ngữ nhỏ như từ hoặc thành phần của từ; ngăn chặn các vòng lặp vô hạn của âm thanh hoặc cụm từ trong quá trình giải mã.
Còn mô hình mã nhóm giúp cải thiện hiệu quả bằng cách giảm độ dài chuỗi hoặc số lượng mã thông báo riêng lẻ, mà mô hình xử lý trong một chuỗi đầu vào duy nhất. Qua đó, có thể tạo ra giọng nói và giúp quản lý những khó khăn với việc xử lý chuỗi âm thanh dài.
Các thí nghiệm được tiến hành trên các tập dữ liệu LibriSpeech và VCTK đã chỉ ra rằng VALL-E 2 vượt trội hơn các hệ thống TTS zero-shot trước đây về độ mạnh mẽ của giọng nói, độ tự nhiên và độ tương đồng của người nói.
Các nhà nghiên cứu cho rằng rằng chất lượng đầu ra của VALL-E 2 phụ thuộc vào độ dài và chất lượng của lời nói cũng như các yếu tố môi trường, như tiếng ồn xung quanh.
Các nhà nghiên cứu nhận định trong tương lai, VALL-E 2 có thể tổng hợp giọng nói, duy trì được danh tính của người nói. Hơn nữa, nó có thể được sử dụng cho mục đích học tập, giáo dục, giải trí, báo chí, nội dung tự biên soạn, tính năng trợ năng, hệ thống phản hồi bằng giọng nói tương tác, dịch thuật, chatbot…
Theo Bằng Hưng (Nld.com.vn)
- Sếp lớn bóng đá Indonesia lãnh án phạt nặng chưa từng thấy từ FIFA (06/02/26 22:43)
- Nữ thiếu tá khiến Steven Nguyễn 'rung động' trên phim VTV: Ngoài đời là hot girl trường Sân khấu (06/02/26 22:17)
- Cận cảnh chân dung tân Tổng Giám đốc 9x của FLC vừa nhậm chức sau biến động lớn (06/02/26 22:02)
- Chủ tiệm kim hoàn quét nhà hàng ngày, thu được 1,7kg bột vàng giá hơn 7 tỷ đồng (06/02/26 21:45)
- Khởi tố cô gái livestream video khiêu dâm trong khách sạn (06/02/26 21:33)
- Dự báo thời tiết từ nay đến mùng 6 Tết 2026: Miền Bắc rét đậm rét hại, miền Nam trái ngược hoàn toàn (06/02/26 21:10)
- Diễn biến mới vụ tài xế đánh chết người sau va chạm xe ở Tây Ninh gây phẫn nộ dư luận (06/02/26 20:58)
- 2 tên cướp ngân hàng Gia Lai đóng giả người dân tộc thiểu số để gùi tiền khi lẩn trốn, 2 lần phi tang xe (06/02/26 20:43)
- Hé lộ kịch bản chi tiết chuẩn bị trước 3 tháng vụ cướp ngân hàng ở Gia Lai: Biết bị bắt vẫn muốn làm (06/02/26 20:29)
- Phát hiện cụ ông bị chấn thương sọ não kèm đa chấn thương nằm ven đường, tìm kiếm gấp thân nhân? (06/02/26 20:04)