-
Vụ đầu độc 4 người thân bằng xyanua ở Đồng Nai: Hé lộ số tiền nhận được từ bảo hiểm nhân thọ sau cái chết của chồng -
U22 Việt Nam thi đấu tại Rajamangala, bảng đấu "dễ thở" nhờ Singapore "thế chân" Campuchia! -
Cộng đồng quốc tế hỗ trợ Việt Nam gần 16 triệu USD khắc phục hậu quả mưa lũ -
Camera ghi lại cảnh 2 thiếu niên lớp 9 không đội mũ bảo hiểm tông mạnh vào xe ô tô sang ở Hà Nội -
Bộ Ngoại giao thông tin nóng vụ nữ nghi phạm đưa súng giúp nhóm phạm nhân bỏ trốn ở Campuchia -
Nghi vấn về học vấn của Mailisa giữa lúc vướng vòng lao lý, hé lộ hành trình "đổi đời" đầy sóng gió -
Người nhận 500 triệu chuyển nhầm rồi không chịu trả lên tiếng bức xúc, đích thân Thượng tá công an giải đáp -
Vụ chuyển nhầm 500 triệu: Công an 7 lần vận động vẫn không chịu trả, sẽ khởi tố nếu không hợp tác -
Vụ bảo mẫu "lơ đễnh" khiến cháu bé 2 tuổi tử vong thương tâm ở Hải Phòng: Mức án nào phải đối diện? -
Nguyên nhân hiện tượng lạ hàng nghìn con chim én đậu chằng chịt trên dây điện ở Cần Thơ
Công nghệ
05/02/2025 16:30Loạt tên tuổi AI hàng đầu thế giới tranh luận về DeepSeek
Từ CEO OpenAI Sam Altman đến nhà khoa học Google Andrew Ng, những “bộ não” AI xuất chúng nhất thế giới đánh giá cao cách tiếp cận đối với nguồn mở của DeepSeek sau khi startup Trung Quốc ra mắt 2 mô hình AI tiên tiến.
Công ty có trụ sở tại Hàng Châu khiến ngành công nghiệp AI toàn cầu sửng sốt với mô hình lý luận nguồn mở R1.
Phát hành hôm 20/1, mô hình cho thấy năng lực không thua kém các mô hình nguồn đóng từ OpenAI – nhà phát triển ChatGPT – nhưng chi phí đào tạo được cho là thấp hơn nhiều.
DeepSeek V3 – mô hình ngôn ngữ lớn nền tảng – ra đời cách đó vài tuần chỉ mất 5,5 triệu USD đào tạo, theo DeepSeek.
Tuyên bố của công ty đặt ra hoài nghi về việc các hãng công nghệ có đang chi quá tay cho chip đồ họa (GPU) trong đào tạo AI hay không, dẫn đến làn sóng bán tháo cổ phiếu công nghệ liên quan.
Tuần trước, trong mục “Ask Me Anything” trên diễn đàn Reddit, Altman cho rằng OpenAI đã sai lầm và cần tìm ra cách tiếp cận khác biệt đối với nguồn mở.
Từ trước đến nay, công ty luôn áp dụng cách tiếp cận đóng, giữ bí mật các thông tin như phương pháp đào tạo cụ thể và chi phí năng lượng của các mô hình.
“Dù vậy, không phải ai ở OpenAI cũng đồng quan điểm” và “nó không phải ưu tiên cao nhất của chúng tôi lúc này”, CEO OpenAI thừa nhận.
Andrew Ng, nhà sáng lập Google Brain, cựu nhà khoa học trưởng tại Baidu, nhận xét những sản phẩm từ DeepSeek và các hãng đồng hương cho thấy Trung Quốc đang nhanh chóng bắt kịp Mỹ về AI.
“Khi ChatGPT ra mắt tháng 11/2022, Mỹ đi trước Trung Quốc đáng kể về AI tạo sinh... nhưng thực tế, khoảng cách này đang bị xói mòn nhanh chóng trong hai năm qua”, ông viết trên X. “Với các mô hình từ Trung Quốc như Qwen, Kimi, InternVL và DeepSeek, Trung Quốc rõ ràng đang thu hẹp khoảng cách và trong các lĩnh vực như tạo video, đã có những lúc Trung Quốc dường như dẫn trước”.
Mô hình Qwen do Alibaba phát triển, còn Kimi và InternVL là sản phẩm của startup Moonshot AI và Phòng thí nghiệm AI Thượng Hải.
Theo ông Ng, nếu Mỹ tiếp tục cản trở nguồn mở, Trung Quốc sẽ thống trị phần này trong chuỗi cung ứng và nhiều doanh nghiệp cuối cùng sẽ sử dụng các mô hình phản ánh giá trị của Trung Quốc lớn hơn của Mỹ.
Hàng loạt doanh nghiệp Mỹ đang tìm cách ứng dụng mô hình của DeepSeek vào sản phẩm của mình. Chẳng hạn, người dùng dịch vụ NIM của Nvidia có thể tiếp cận mô hình R1 từ tuần trước, còn Microsoft cũng hỗ trợ R1 trên nền tảng đám mây Azure và GitHub. Amazon cho phép khách hàng tạo ra ứng dụng bằng R1 qua AWS.
Tuy nhiên, một số chuyên gia cũng cho rằng, không nên phóng đại thành công của DeepSeek. Nhà khoa học AI trưởng của Meta – Yann LeCun nói suy nghĩ “Trung Quốc sẽ vượt qua Mỹ về AI” vì DeepSeek là sai lầm.
Đúng hơn phải là “các mô hình nguồn mở đang vượt qua các mô hình độc quyền”, ông viết trên Threads.
DeepSeek – startup tách ra từ quỹ đầu cơ High-Flyer của nhà sáng lập Liang Wenfeng tháng 5/2023 – vẫn đối mặt với nhiều hoài nghi về chi phí thực tế và phương pháp đào tạo mô hình AI.
Giáo sư khoa học máy tính Zheng Xiaoqing đến từ đại học Phúc Đán chỉ ra chi phí đào tạo DeepSeek V3 chưa bao gồm chi phí liên quan đến thử nghiệm và nghiên cứu, theo báo cáo kỹ thuật của startup.
Ông cho biết, thành công của DeepSeek xuất phát từ việc “tối ưu hóa kỹ thuật”, do đó không ảnh hưởng lớn đến việc mua sắm hay các lô hàng chip.
Theo Du Lam (VietNamNet)
- Bắt 6 đối tượng xông vào nhà chém người vỡ lún sọ vì tranh chấp bán trà sữa (27/11/25 23:14)
- Người đẹp Colombia đăng quang Miss International 2025 (27/11/25 21:46)
- Thẩm mỹ viện Mailisa tạm ngừng hoạt động toàn hệ thống giữa lúc vợ chồng bà chủ bị bắt (27/11/25 21:07)
- Hai bàn thua cay đắng khiến CLB Nam Định nguy cơ chia tay AFC Champions League Two (27/11/25 20:49)
- Thanh Hóa: Ủng hộ người nghèo 1 triệu đồng, bị cáo được giảm ngay 1/3 án (27/11/25 20:35)
- Vụ đầu độc 4 người thân bằng xyanua ở Đồng Nai: Hé lộ số tiền nhận được từ bảo hiểm nhân thọ sau cái chết của chồng (27/11/25 19:50)
- U22 Việt Nam thi đấu tại Rajamangala, bảng đấu "dễ thở" nhờ Singapore "thế chân" Campuchia! (27/11/25 19:03)
- Cộng đồng quốc tế hỗ trợ Việt Nam gần 16 triệu USD khắc phục hậu quả mưa lũ (27/11/25 18:41)
- Camera ghi lại cảnh 2 thiếu niên lớp 9 không đội mũ bảo hiểm tông mạnh vào xe ô tô sang ở Hà Nội (27/11/25 18:38)
- Bộ Ngoại giao thông tin nóng vụ nữ nghi phạm đưa súng giúp nhóm phạm nhân bỏ trốn ở Campuchia (27/11/25 18:26)