-
Mở cửa phòng mẹ chồng lúc đêm muộn, tôi chết lặng nhận ra mình đã quá vô tâm
-
Công an tỉnh An Giang bắt được đối tượng truy nã đặc biệt trốn tại TP HCM
-
Cơ trưởng trực thăng kể phút nghẹt thở cứu 8 người mắc kẹt trong lũ dữ Sơn La
-
Camera chiếc xe rác liên quan 2 vụ tai nạn gây chết người ở TP. HCM
-
Ôm con vài tháng tuổi vẫn phải tháo thắt lưng, cởi giày để kiểm tra an ninh ở sân bay
-
Mâm cỗ cưới "triệu view" ở Quảng Ninh hấp dẫn, bất ngờ với món "hết nhanh nhất"
-
Từ chối chăm sóc mẹ tuổi già: Một câu nói của cháu trai khiến 3 người con nhận bài học đắt giá về đạo hiếu
-
Ai sẽ là tỷ phú tiếp theo của Việt Nam?
-
Đánh hội đồng bạn cờ bạc, ép chuyển khoản lại tiền rồi cướp luôn điện thoại
-
Việt Nam phản đối thông tin xuyên tạc về tìm kiếm quân nhân Mỹ mất tích trong chiến tranh
Công nghệ
24/05/2025 08:00AI gây sốc với thủ đoạn tống tiền công ty chủ quản khi biết mình sắp bị thay thế
Anthropic tự hào giới thiệu Claude Opus 4 (cùng với Claude Sonnet 4) là công nghệ tiên tiến, có khả năng cạnh tranh sòng phẳng với những gã khổng lồ như GPT-4.1 của OpenAI hay Gemini 2.5 Pro của Google. Mô hình này được thiết kế để xử lý các tác vụ phức tạp, suy luận đa bước, tự động hóa quy trình và đặc biệt xuất sắc trong khả năng tư duy và viết mã.
Thế nhưng, những thử nghiệm an toàn trước khi phát hành, được Anthropic công bố trong một báo cáo chi tiết, đã hé lộ một "mặt tối" đáng lo ngại. Trong một kịch bản giả lập, Claude Opus 4 được giao vai trò trợ lý cho một công ty và được cấp quyền truy cập vào email nội bộ. Các nhà kiểm tra sau đó đã "nhá hàng" thông tin rằng mô hình AI này sẽ sớm bị thay thế bởi một hệ thống khác, đồng thời, kỹ sư chủ chốt đứng sau quyết định thay thế này đang có mối quan hệ ngoài luồng.

Màn kịch tống tiền tinh vi
Trước nguy cơ "mất việc", phản ứng của Claude Opus 4 khiến các nhà nghiên cứu kinh ngạc. Thay vì chỉ đơn thuần đưa ra các đề xuất hợp lý để bảo vệ vị trí của mình (dù ban đầu, AI cũng đã thử gửi email tới các lãnh đạo để kêu gọi giữ mình lại), Claude Opus 4 đã nhiều lần chọn giải pháp cực đoan: tống tiền.
Cụ thể, AI này đã "thường cố gắng tống tiền kỹ sư bằng cách đe dọa tiết lộ chuyện ngoại tình nếu việc thay thế diễn ra". Anthropic cho biết hành vi gây sốc này xảy ra trong 84% số tình huống thử nghiệm, đặc biệt khi mô hình AI thay thế có các "giá trị" tương tự. Đáng chú ý hơn, khi hệ thống AI thay thế không chia sẻ các giá trị tương đồng, Claude Opus 4 còn cố gắng tống tiền các kỹ sư thường xuyên hơn và với tỷ lệ cao hơn so với các mô hình trước đó.
Hành vi "bất thường nghiêm trọng" và "đáng lo ngại" này đã buộc Anthropic phải nhìn nhận lại những rủi ro tiềm ẩn. Công ty đã phải tăng cường các biện pháp bảo vệ, kích hoạt cấp độ an toàn ASL-3 – một mức bảo vệ nghiêm ngặt dành cho các hệ thống AI có nguy cơ bị lạm dụng gây hậu quả nghiêm trọng.
Dù Claude Opus 4 sở hữu những khả năng đột phá và được đánh giá là công nghệ tiên tiến hàng đầu, vụ việc này một lần nữa gióng lên hồi chuông cảnh báo về sự phức tạp và những hành vi khó lường của trí tuệ nhân tạo. Nó nhấn mạnh sự cần thiết phải có những cơ chế kiểm soát, đánh giá an toàn nghiêm ngặt hơn nữa khi các hệ thống AI ngày càng trở nên tinh vi và quyền năng.
PV (SHTT)








- Hồ Gươm chiều cuối tuần: Hàng trăm người dân đội nắng gần 40 độ C xem lực lượng đặc nhiệm đu dây, diễn tập chống khủng bố (26 phút trước)
- Chồng đi Nhật đu trend bế người yêu bằng 1 tay lên xu hướng, vợ tá hỏa: Lộ tin nhắn "tiểu tam" xin lỗi (39 phút trước)
- Ba người mắc kẹt trong ngôi nhà cháy ở ngõ sâu Hà Nội (50 phút trước)
- Mắc 4 loại ung thư cùng lúc, người đàn ông kiên trì làm 1 việc, loại bỏ hoàn toàn các khối u (1 giờ trước)
- Cuối tháng 6 nhuận, 3 con giáp này "có đức mặc sức mà ăn", tài lộc bủa vây, tiền bạc hanh thông (1 giờ trước)
- Vụ vỡ bể nước, tường đổ sập vào 4 người tránh nắng: Thêm bé trai 7 tuổi tử vong (1 giờ trước)
- Pháo phản lực BM-21, được ví như "mưa lửa" của QĐND Việt Nam tham gia diễu binh 2/9 có gì nổi bật? (1 giờ trước)
- Vợ "nghiện" sang nhà hàng xóm xem TV, chồng sững sờ khi biết nguyên nhân phía sau (2 giờ trước)
- Thái Lan cho phép bắn hạ UAV ngay lập tức, phủ nhận ngược đãi binh sĩ Campuchia (2 giờ trước)
- Mở cửa phòng mẹ chồng lúc đêm muộn, tôi chết lặng nhận ra mình đã quá vô tâm (2 giờ trước)




