-
Lời khai của đối tượng "thông chốt" đường cấm, tông thẳng vào cảnh sát cơ động
-
Chuyên gia phong thủy chỉ ra điều kiêng kỵ trong tháng 7 âm lịch
-
Vợ của trùm địa ốc Alibaba Nguyễn Thái Luyện làm giả bệnh án tâm thần để được xét xử nhẹ tội?
-
Người phụ nữ trở về quê sau 29 năm lưu lạc gây bão MXH: Khó tin với nguyện vọng về nơi muốn sinh sống của bà Thái Thị Giao
-
Trang bị "nhỏ mà có võ" giúp dàn khí tài hạng nặng của QĐND Việt Nam lướt đi trên các tuyến phố Thủ đô
-
Vụ mất tích bí ẩn ở Đà Nẵng: Gia đình tiếp tục "cầu cứu" sau 4 tháng không tin tức
-
Dùng đũa sai cách có thể làm tăng nguy cơ ung thư
-
Bão số 5 di chuyển rất nhanh, liên tục mạnh lên, điểm tên vùng tâm mưa lớn
-
Dàn dựng cảnh bị bắt cóc, tống tiền mẹ ruột, nam thanh niên lãnh hậu quả
-
Nhan sắc đời thực trái ngược trên phim của cô lái đò gây sốt trong 'Mưa đỏ'
-
Đen Vâu, Hoàng Thuỳ Linh và loạt nghệ sĩ Việt xin được tham gia diễu hành dịp 2/9
-
Người vợ sát hại chồng ở Phú Thọ bật khóc khi nói về nguyên nhân cãi nhau lúc rạng sáng
-
7 người mắc kẹt trong vụ cháy nhà 3 tầng ở Hưng Yên
-
Hiện trường kinh hoàng vụ tai nạn trên cao tốc Hà Nội - Hải Phòng: Xe con bị vò nát, mảnh vỡ la liệt trên đường
-
Khám phá bảo tàng vũ trụ đầu tiên ở Việt Nam
-
Người đàn ông ở Hà Nội tử vong khi đang sửa đường dây trên cột điện
-
MƯA ĐỎ: Bản trường ca của gia đình, tình yêu và Tổ quốc!
-
Hà Nội miễn phí xe buýt, đường sắt đô thị phục vụ người dân dịp Quốc khánh 2/9
-
Gánh khoản lỗ gần 45.000 tỷ đồng của EVN, giá điện có tăng?
-
2 dấu hiệu ngứa ngáy cảnh báo UNG THƯ GAN nhưng nhiều người NHẦM là dị ứng
Công nghệ
09/12/2024 07:45Công nghệ 'nén AI' sẽ cho phép ChatGPT chạy trực tiếp trên điện thoại, laptop: Không còn cần tới hàng trăm nghìn máy chủ khổng lồ?
Các mô hình trí tuệ nhân tạo (AI) mạnh mẽ như ChatGPT vốn đòi hỏi lượng lớn năng lượng và thường được lưu trữ tại các trung tâm dữ liệu khổng lồ. Tuy nhiên, một bước đột phá mới có thể nén các mô hình AI này để chúng hoạt động ngay trên smartphone hoặc laptop.
Thuật toán nén đột phá: CALDERA
Một thuật toán mới, mang tên Calibration Aware Low Precision Decomposition with Low Rank Adaptation (CALDERA), cho phép nén lượng dữ liệu khổng lồ cần thiết để vận hành các mô hình ngôn ngữ lớn (LLM) bằng cách loại bỏ sự dư thừa trong mã và giảm độ chính xác của các lớp thông tin.
Theo nghiên cứu được công bố vào ngày 24/5 trên cơ sở dữ liệu tiền in arXiv, CALDERA giúp các mô hình ngôn ngữ trở nên gọn nhẹ hơn, nhưng vẫn giữ được độ chính xác và tính tinh tế gần tương đương với phiên bản gốc. Thuật toán này sẽ được trình bày tại Hội nghị về Hệ thống Xử lý Thông tin Thần kinh (NeurIPS) vào tháng 12 tới.
Thuật toán này kết hợp hai kỹ thuật chính: Đầu tiên, kĩ thuật "Low-precision" sẽ giảm số lượng bit được sử dụng để lưu trữ thông tin, giúp tăng tốc độ xử lý và cải thiện hiệu quả năng lượng. Trong khi đó, kĩ thuật "Low-rank" sẽ cắt giảm các tham số dư thừa trong quá trình đào tạo mô hình, giúp giảm dung lượng lưu trữ.
Sự kết hợp này cho phép CALDERA đạt mức độ nén vượt trội hơn hẳn so với khi chỉ sử dụng từng kỹ thuật riêng lẻ.
"Chúng tôi phát hiện rằng không chỉ các tập dữ liệu mà cả các mô hình ngày nay cũng đang trở nên khổng lồ. Thuật toán của chúng tôi có thể áp dụng để nén cả hai," Rajarshi Saha, đồng tác giả nghiên cứu và nghiên cứu sinh tại Đại học Stanford, chia sẻ.
Kết quả thử nghiệm đầy triển vọng
Nhóm nghiên cứu đã thử nghiệm CALDERA trên các mô hình mã nguồn mở của Meta như Llama 2 và Llama 3. Kết quả cho thấy thuật toán này cải thiện hiệu suất nén lên đến 5% so với các phương pháp chỉ sử dụng một trong hai kỹ thuật trên.
Việc này mở ra triển vọng cho các mô hình AI lớn có thể được lưu trữ và vận hành trực tiếp trên smartphone hoặc laptop trong tương lai — đặc biệt ở những trường hợp đòi hỏi sự bảo mật cao hoặc khi không cần độ chính xác tối đa.
Dù CALDERA mang lại tiềm năng lớn, các nhà khoa học cũng cảnh báo rằng các mô hình AI hiện tại chưa được tối ưu hóa để hoạt động hiệu quả trên các thiết bị nhỏ như smartphone.
"Nếu bạn chạy một mô hình AI lớn và điện thoại hết pin chỉ trong một giờ, điều đó sẽ không hề lý tưởng," Saha giải thích. "Thuật toán này là một phần trong giải pháp tổng thể, kết hợp với các kỹ thuật khác để làm cho việc sử dụng AI trên thiết bị di động trở nên khả thi và hiệu quả hơn."
Theo Việt Anh (Thanh Niên Việt)








- Bão số 5 cách Nghệ An khoảng 600km giật cấp 15, nguy cơ gây thiệt hại lớn (21 phút trước)
- Zalo có thay đổi mới, người dùng cần biết kẻo mất quyền lợi (33 phút trước)
- Khám xét, bắt khẩn cấp giang hồ “Tuấn trọc” (38 phút trước)
- 5 dấu hiệu “nhà phá tài” khiến gia chủ sa sút, hút cạn tài lộc, sức khỏe và may mắn, ai cũng cần biết để kịp thời thay đổi (46 phút trước)
- Tổng hợp luyện diễu binh lần 2 ở Quảng trường Ba Đình, cấm đường từ trưa nay (54 phút trước)
- Ông chủ Thế giới Di động "phân trần" về việc gần 20.000 nhân sự "bay màu" (56 phút trước)
- Giữa đêm, nhận tin nhắn từ vợ cũ của chồng: Một cái que hai vạch và lời tuyên bố khiến người phụ nữ rối bời (1 giờ trước)
- Người sống thọ 100 tuổi thường có 4 thói quen vào buổi sáng: Làm được 2 điều cũng rất đáng mừng! (1 giờ trước)
- Yamal giúp Barca ngược dòng ngoạn mục (1 giờ trước)
- Ba giây sinh tử khi 2 người lao vào cứu thanh niên phi xe ‘thông chốt’ trước mũi tàu (1 giờ trước)




