-
Công an thông tin vụ cô gái bị siết cổ, sàm sỡ ngay trước cửa nhà, nạn nhân kể lại giây phút đối mặt với 2 đối tượng -
Hà Nội sắp lấy ý kiến người dân về Quy hoạch phân khu sông Hồng và Trục đại lộ cảnh quan -
Mưa lớn gây sạt lở, ngập úng nhiều nơi ở Cao Bằng, thủy điện phát thông báo xả lũ khẩn -
Gia đình hé lộ quá khứ ngỡ ngàng của người đàn ông ăn hải sản 16 triệu rồi "bùng" ở Phú Thọ -
Vụ người đàn ông đưa cô gái đi ăn cua hoàng đế hết 16 triệu đồng: Ai là người phải thanh toán? -
Khủng hoảng vì mẹ chồng "vừa đấm vừa xoa": Chi tiền triệu cho cháu nhưng miệt mài kể xấu con dâu -
Phát hiện thi thể nam giới bên đường, xe máy cách hiện trường 20m, công an vào cuộc truy tìm manh mối -
Ông Trần Anh Tiến được bổ nhiệm giữ chức Phó chủ nhiệm Văn phòng Chính phủ -
Thực hư vụ cô gái bị 2 người đàn ông đánh gãy răng ở Lĩnh Nam Hà Nội: Clip phơi bày toàn bộ sự việc -
"Rước họa" vì cho em vợ ở nhờ: Người đàn ông sợ hãi không dám trở về căn nhà của chính mình
Công nghệ
24/05/2025 15:00AI gây sốc với thủ đoạn tống tiền công ty chủ quản khi biết mình sắp bị thay thế
Anthropic tự hào giới thiệu Claude Opus 4 (cùng với Claude Sonnet 4) là công nghệ tiên tiến, có khả năng cạnh tranh sòng phẳng với những gã khổng lồ như GPT-4.1 của OpenAI hay Gemini 2.5 Pro của Google. Mô hình này được thiết kế để xử lý các tác vụ phức tạp, suy luận đa bước, tự động hóa quy trình và đặc biệt xuất sắc trong khả năng tư duy và viết mã.
Thế nhưng, những thử nghiệm an toàn trước khi phát hành, được Anthropic công bố trong một báo cáo chi tiết, đã hé lộ một "mặt tối" đáng lo ngại. Trong một kịch bản giả lập, Claude Opus 4 được giao vai trò trợ lý cho một công ty và được cấp quyền truy cập vào email nội bộ. Các nhà kiểm tra sau đó đã "nhá hàng" thông tin rằng mô hình AI này sẽ sớm bị thay thế bởi một hệ thống khác, đồng thời, kỹ sư chủ chốt đứng sau quyết định thay thế này đang có mối quan hệ ngoài luồng.
Màn kịch tống tiền tinh vi
Trước nguy cơ "mất việc", phản ứng của Claude Opus 4 khiến các nhà nghiên cứu kinh ngạc. Thay vì chỉ đơn thuần đưa ra các đề xuất hợp lý để bảo vệ vị trí của mình (dù ban đầu, AI cũng đã thử gửi email tới các lãnh đạo để kêu gọi giữ mình lại), Claude Opus 4 đã nhiều lần chọn giải pháp cực đoan: tống tiền.
Cụ thể, AI này đã "thường cố gắng tống tiền kỹ sư bằng cách đe dọa tiết lộ chuyện ngoại tình nếu việc thay thế diễn ra". Anthropic cho biết hành vi gây sốc này xảy ra trong 84% số tình huống thử nghiệm, đặc biệt khi mô hình AI thay thế có các "giá trị" tương tự. Đáng chú ý hơn, khi hệ thống AI thay thế không chia sẻ các giá trị tương đồng, Claude Opus 4 còn cố gắng tống tiền các kỹ sư thường xuyên hơn và với tỷ lệ cao hơn so với các mô hình trước đó.
Hành vi "bất thường nghiêm trọng" và "đáng lo ngại" này đã buộc Anthropic phải nhìn nhận lại những rủi ro tiềm ẩn. Công ty đã phải tăng cường các biện pháp bảo vệ, kích hoạt cấp độ an toàn ASL-3 – một mức bảo vệ nghiêm ngặt dành cho các hệ thống AI có nguy cơ bị lạm dụng gây hậu quả nghiêm trọng.
Dù Claude Opus 4 sở hữu những khả năng đột phá và được đánh giá là công nghệ tiên tiến hàng đầu, vụ việc này một lần nữa gióng lên hồi chuông cảnh báo về sự phức tạp và những hành vi khó lường của trí tuệ nhân tạo. Nó nhấn mạnh sự cần thiết phải có những cơ chế kiểm soát, đánh giá an toàn nghiêm ngặt hơn nữa khi các hệ thống AI ngày càng trở nên tinh vi và quyền năng.
PV (SHTT)
- Nhạc sĩ Giáng Son thắng kiện BH Media trong vụ tranh chấp bản quyền "Giấc mơ trưa" (53 phút trước)
- Công an thông tin vụ cô gái bị siết cổ, sàm sỡ ngay trước cửa nhà, nạn nhân kể lại giây phút đối mặt với 2 đối tượng (1 giờ trước)
- Đi đá bóng, 8 học sinh bị 3 thanh niên dùng dao uy hiếp cướp tài sản (1 giờ trước)
- Hà Nội sắp lấy ý kiến người dân về Quy hoạch phân khu sông Hồng và Trục đại lộ cảnh quan (1 giờ trước)
- "Cơn mưa tiền thưởng" tại World Cup 2026: Bị loại sớm vẫn ôm hàng triệu USD, nhà vô địch nhận con số kỷ lục (1 giờ trước)
- Kế hoạch tái thiết khung gỗ của MU: Chốt tương lai Onana, kích hoạt chiến dịch săn lùng người gác đền mới (1 giờ trước)
- Giá gas hôm nay 26/6 bất động giữa lúc nguồn cung khí đốt thế giới xuất hiện cảnh báo từ Mỹ và Qatar (1 giờ trước)
- Taylor Swift và Travis Kelce chuẩn bị làm "đám cưới thế kỷ", New York phải phong tỏa nhiều tuyến đường? (1 giờ trước)
- Bê bối "nuôi án" gây chấn động nước Mỹ: DEA bị điều tra vì cáo buộc "thả cửa" cho hàng trăm nghìn viên ma túy cực độc Fentanyl tràn ra đường phố (1 giờ trước)
- Đừng nhìn vẻ bề ngoài, hãy soi 5 chi tiết này để biết ai là người đáng tin (1 giờ trước)