-
Tử vi 12 con giáp - Chủ nhật ngày 17/5/2026: Mùng 1 Hợi lắm tiền, Sửu hăng hái -
Cô gái bị nhóm người đi Lexus đánh hội đồng ở Hà Nội kể lại sự tình, tất cả bắt đầu từ 1 câu hỏi? -
Báo động đỏ: Nhiều bạn trẻ đón tuổi 20 với chỉ số huyết áp "chạm ngưỡng tử thần" vì nghiện trà sữa -
Khởi tố người đàn ông lái Jeep đi ngược chiều, truy đuổi và đe dọa tài xế xe ôm công nghệ -
Phó Chủ tịch Hiệp hội Sáng tạo và Bản quyền tác giả Việt Nam Nguyễn Hải Bình bị khởi tố -
Thông tin mới vụ nhóm nam nữ đi Lexus đánh 2 cô gái dã man giữa phố nghi vì trêu ghẹo không được -
Showbiz Việt đầu năm 2026: Hàng loạt bê bối và đổ vỡ gây chấn động dư luận -
Đề xuất đầu tư hơn 261.000 tỷ đồng xây dựng Vành đai 5 vùng Thủ đô -
Công an Hà Nội xác minh vụ hai nhóm thanh niên hỗn chiến trên phố Huế, một cô gái gục xuống vỉa hè -
Giải mã sự thật clip Tổng thống Donald Trump bị đồn "nhìn trộm" tài liệu của ông Tập Cận Bình
Công nghệ
30/04/2024 16:07Trung Quốc tung mô hình AI tạo video từ văn bản - đối thủ của OpenAI
Trung Quốc vừa giới thiệu công cụ trí tuệ nhân tạo (AI) chuyển văn bản thành video tương tự ứng dụng gây sốt Sora của OpenAI, mặc dù mô hình mới này chỉ có thể tạo video không quá 16 giây, so với 60 giây của công ty Mỹ.
Theo tờ Bưu điện Hoa Nam Buổi sáng (SCMP), Vidu, niềm hy vọng lớn nhất của đất nước cho đến nay trong việc bắt kịp Sora, đã được ra mắt vào cuối tuần qua bởi công ty khởi nghiệp Shengshu Technology trong nỗ lực hợp tác với Đại học Thanh Hoa danh tiếng ở Bắc Kinh.
Công ty cho biết mô hình này có thể tạo ra video có độ phân giải 1080p dựa trên lời nhắc văn bản đơn giản.
Zhu Jun, nhà khoa học trưởng tại Shengshu, đồng thời là Phó trưởng khoa tại Viện AI thuộc Đại học Thanh Hoa, cho biết: “Vidu là thành tựu mới nhất của sự đổi mới tự lực, với những đột phá trong nhiều lĩnh vực”.
Vidu đạt được những cải tiến đáng kể về hiệu ứng video, chủ yếu thể hiện ở việc mô phỏng thế giới vật lý thực, ngôn ngữ đa ống kính, tính nhất quán cao về không gian-thời gian và sự hiểu biết về các yếu tố Trung Quốc. Theo ông Zhu Jun, Vidu “có trí tưởng tượng”, “có thể mô phỏng thế giới vật chất” và “sản xuất video dài 16 giây với các nhân vật, cảnh và dòng thời gian nhất quán”. Ông nói thêm rằng mô hình trí tuệ nhân tạo này cũng có thể hiểu được “các yếu tố Trung Quốc”.
Trong buổi ra mắt mô hình, Shengshu đã phát hành một số clip demo, bao gồm một clip có cảnh gấu trúc chơi ghi-ta khi ngồi trên bãi cỏ và một clip khác về một chú chó con đang bơi trong hồ, cả hai đều hiển thị các chi tiết sống động.
Sự ra mắt của Vidu đã làm dấy lên hy vọng ở quốc gia đang chạy đua để bắt kịp những công ty AI hàng đầu thế giới, như OpenAI do Microsoft hậu thuẫn.
Không giống như ChatGPT của OpenAI, vốn đã truyền cảm hứng cho một loạt đối thủ cạnh tranh có trụ sở tại Trung Quốc sau khi ra mắt vào tháng 11/2022, các video ấn tượng do Sora tạo ra và được công bố vào tháng 2 năm nay đã không thu hút được mức độ nhiệt tình tương tự từ các công ty khởi nghiệp Big Tech của Trung Quốc.
Các chuyên gia trong ngành cho biết một trong những yếu tố cản trở sự phát triển trong lĩnh vực này của công ty Trung Quốc là thiếu sức mạnh tính toán.
Theo Li Yangwei, một nhà tư vấn kỹ thuật làm việc trong lĩnh vực điện toán thông minh tại Bắc Kinh, để Sora tạo ra một clip dài một phút, nó cần tám bộ xử lý đồ họa (GPU) Nvidia A100 để chạy trong hơn ba giờ. Ông nói: “Sora đòi hỏi rất nhiều sức mạnh tính toán để suy luận”.
Chính phủ Mỹ đã thắt chặt các hạn chế xuất khẩu đối với các chip tiên tiến do Nvidia sản xuất, bao gồm cả GPU A100 và H100, vốn đã trở thành linh kiện được săn đón nhiều nhất để đào tạo hệ thống AI, nhưng lại bị cấm vận chuyển sang Trung Quốc.
Công ty Shengshu có trụ sở tại Bắc Kinh được thành lập vào tháng 3/2023, với đội ngũ nòng cốt chủ yếu bao gồm các thành viên từ Viện AI của Đại học Thanh Hoa, cũng như các thành viên khác từ Tập đoàn Alibaba Group Holding, Tencent Holdings và ByteDance. Tập đoàn Alibaba, chủ sở hữu của tờ Bưu điện Hoa Nam Buổi sáng, cũng đang nghiên cứu các mô hình AI tạo video của riêng mình.
Tháng trước, Shengshu đã huy động được hàng trăm triệu nhân dân tệ từ các nhà đầu tư bao gồm Qiming Ventures, Zhipu AI và Baidu Ventures.
Mô hình chuyển văn bản thành video bằng AI đầu tiên của Trung Quốc được Shengshu giới thiệu khoảng 2 tháng sau khi Sora, một mô hình tương tự do công ty OpenAI có trụ sở tại Mỹ phát hành, gây được tiếng vang lớn trên thế giới.
Hai cường quốc Mỹ và Trung Quốc hiện đang cạnh tranh nhau về nhiều mặt liên quan đến trí tuệ nhân tạo, từ công nghệ để thiết kế phần cứng và phần mềm AI, cho đến nguyên liệu thô cung cấp năng lượng cho hệ thống AI.
AI là một trong những từ khóa được nhắc đến nhiều nhất năm 2023, nhưng từ cách đây 7 năm, Trung Quốc đã đề ra chương trình phát triển đầy tham vọng với mục tiêu trở thành “trung tâm đổi mới AI” toàn cầu vào năm 2030. Trong đó, Trung Quốc đặt mục tiêu đạt "trình độ dẫn đầu thế giới" vào năm 2025 và trở thành "trung tâm đổi mới AI lớn của thế giới" vào năm 2030, ưu tiên biến AI thành động lực chính cho việc nâng cấp công nghiệp và chuyển đổi kinh tế.
Theo Thu Hằng (Báo Tin Tức)
- Đi hơn 100km dự cưới bạn thân, người phụ nữ bàng hoàng vì bị hiểu lầm “mừng cưới quá ít” (1 giờ trước)
- Hà Nội hướng tới mô hình siêu đô thị hạnh phúc, dân số dưới 20 triệu người (1 giờ trước)
- Tiết lộ mối quan hệ thực sự giữa Hòa Minzy và gia đình chồng sắp cưới (1 giờ trước)
- Những thai phụ "ăn dầm ở dề" trong bệnh viện vì nỗi ám ảnh sinh non (1 giờ trước)
- Lũ quét trong đêm, xe khách 29 chỗ bị dòng nước dữ vò biến dạng (1 giờ trước)
- Mourinho có thể hồi sinh Real Madrid, nhưng Mbappe chính là rào cản (2 giờ trước)
- BTS chính thức đổ bộ chung kết World Cup 2026, cổ phiếu HYBE lập tức "hóa rồng" (2 giờ trước)
- Hành trình ngược dòng của chàng thủ khoa: Từ xuất phát điểm muộn đến cái gật đầu của "gã khổng lồ" công nghệ Mỹ (2 giờ trước)
- Ôm bạc giá đỉnh hơn 1,3 tỷ đồng, nhà đầu tư lỗ gần 200 triệu vẫn chưa dám bán (2 giờ trước)
- Đã tìm thấy thi thể cuối cùng trong vụ 4 học sinh đuối nước khi tắm sông (2 giờ trước)