-
Nam thanh niên ngừng tuần hoàn sau tai nạn, bác sĩ ép tim giữa đường ở Hà Nội, tình trạng hiện tại ra sao? -
Camera ghi toàn cảnh chồng đánh vợ lúc 2h50 sáng, cô gái chứng kiến lao vào che chắn, nguyên nhân ra sao? -
Viêm họng tưởng nhẹ, nữ sinh 16 tuổi rơi vào nguy kịch vì siêu vi khuẩn kháng thuốc "ăn" vào tim, não -
Phía sau cô gái 22 tuổi đỗ Thạc sĩ Harvard: Căn nhà giản dị, chiếc xe tải mưu sinh và nghị lực vượt qua hai lần biến cố -
Cảnh gã thanh niên cầm dao đe dọa, ép một người đi xe máy quỳ xin tha mạng? Nguồn cơn phía sau? -
Danh tính du học sinh Việt quay lén hơn 100 video tại nhà vệ sinh nữ, lời khai gây bất ngờ -
Danh sách phạt nguội mới nhất: 330 chủ xe máy, ô tô nhanh chóng nộp phạt theo Nghị định 168 -
Gia cảnh 2 đứa trẻ đập phá mô hình "Mã đáo thành công" 400 triệu đồng tại Quảng Trị -
Thực hư "drama" Kylie Jenner thái độ lồi lõm với chị gái Timothée Chalamet tại Oscar 2026 -
Chuyện lạ ở Thủ đô: Hai cặp đôi song sinh góp tiền mua chung cư, sống hòa thuận dưới một mái nhà
Công nghệ
24/05/2025 15:00AI gây sốc với thủ đoạn tống tiền công ty chủ quản khi biết mình sắp bị thay thế
Anthropic tự hào giới thiệu Claude Opus 4 (cùng với Claude Sonnet 4) là công nghệ tiên tiến, có khả năng cạnh tranh sòng phẳng với những gã khổng lồ như GPT-4.1 của OpenAI hay Gemini 2.5 Pro của Google. Mô hình này được thiết kế để xử lý các tác vụ phức tạp, suy luận đa bước, tự động hóa quy trình và đặc biệt xuất sắc trong khả năng tư duy và viết mã.
Thế nhưng, những thử nghiệm an toàn trước khi phát hành, được Anthropic công bố trong một báo cáo chi tiết, đã hé lộ một "mặt tối" đáng lo ngại. Trong một kịch bản giả lập, Claude Opus 4 được giao vai trò trợ lý cho một công ty và được cấp quyền truy cập vào email nội bộ. Các nhà kiểm tra sau đó đã "nhá hàng" thông tin rằng mô hình AI này sẽ sớm bị thay thế bởi một hệ thống khác, đồng thời, kỹ sư chủ chốt đứng sau quyết định thay thế này đang có mối quan hệ ngoài luồng.
Màn kịch tống tiền tinh vi
Trước nguy cơ "mất việc", phản ứng của Claude Opus 4 khiến các nhà nghiên cứu kinh ngạc. Thay vì chỉ đơn thuần đưa ra các đề xuất hợp lý để bảo vệ vị trí của mình (dù ban đầu, AI cũng đã thử gửi email tới các lãnh đạo để kêu gọi giữ mình lại), Claude Opus 4 đã nhiều lần chọn giải pháp cực đoan: tống tiền.
Cụ thể, AI này đã "thường cố gắng tống tiền kỹ sư bằng cách đe dọa tiết lộ chuyện ngoại tình nếu việc thay thế diễn ra". Anthropic cho biết hành vi gây sốc này xảy ra trong 84% số tình huống thử nghiệm, đặc biệt khi mô hình AI thay thế có các "giá trị" tương tự. Đáng chú ý hơn, khi hệ thống AI thay thế không chia sẻ các giá trị tương đồng, Claude Opus 4 còn cố gắng tống tiền các kỹ sư thường xuyên hơn và với tỷ lệ cao hơn so với các mô hình trước đó.
Hành vi "bất thường nghiêm trọng" và "đáng lo ngại" này đã buộc Anthropic phải nhìn nhận lại những rủi ro tiềm ẩn. Công ty đã phải tăng cường các biện pháp bảo vệ, kích hoạt cấp độ an toàn ASL-3 – một mức bảo vệ nghiêm ngặt dành cho các hệ thống AI có nguy cơ bị lạm dụng gây hậu quả nghiêm trọng.
Dù Claude Opus 4 sở hữu những khả năng đột phá và được đánh giá là công nghệ tiên tiến hàng đầu, vụ việc này một lần nữa gióng lên hồi chuông cảnh báo về sự phức tạp và những hành vi khó lường của trí tuệ nhân tạo. Nó nhấn mạnh sự cần thiết phải có những cơ chế kiểm soát, đánh giá an toàn nghiêm ngặt hơn nữa khi các hệ thống AI ngày càng trở nên tinh vi và quyền năng.
PV (SHTT)
- Khối ngoại bán ròng hàng trăm tỷ, cổ phiếu Novaland vẫn tăng nóng 5 phiên liên tiếp: Điều gì đang diễn ra? (10 phút trước)
- "Vua xe ga" 150cc mới chính thức ra mắt giá 39 triệu đồng: Được săn đón hơn Honda Air Blade và Vario (13 phút trước)
- Nam thanh niên ngừng tuần hoàn sau tai nạn, bác sĩ ép tim giữa đường ở Hà Nội, tình trạng hiện tại ra sao? (14 phút trước)
- Nghệ An: Bị công an kiểm tra, người đàn ông "vứt" cả vợ lẫn ma túy để bỏ chạy thoát thân và cái kết (14 phút trước)
- Camera ghi toàn cảnh chồng đánh vợ lúc 2h50 sáng, cô gái chứng kiến lao vào che chắn, nguyên nhân ra sao? (27 phút trước)
- Viêm họng tưởng nhẹ, nữ sinh 16 tuổi rơi vào nguy kịch vì siêu vi khuẩn kháng thuốc "ăn" vào tim, não (41 phút trước)
- Tại sao đợt xả kho dự trữ dầu kỷ lục vẫn không thể hạ nhiệt cơn sốt năng lượng? (46 phút trước)
- 2 năm trước tôi phản bội vợ và được tha thứ: Đêm đọc tin nhắn “Em tới rồi”, tôi mới hiểu cái giá của sự phản bội (55 phút trước)
- Giá vàng giảm gần 10 triệu đồng sau nửa tháng giữa căng thẳng Trung Đông, chuyên gia vàng khuyến cáo (1 giờ trước)
- Vì sao ngày càng nhiều người không dùng ốp lưng điện thoại? (1 giờ trước)