-
Mẹ ngất lịm phát hiện 2 con nhỏ đuối nước gần nhà, hoàn cảnh thương tâm khiến ai cũng rơi nước mắt -
Sự thật sốc đằng sau bằng đại học không được công nhận: Lời xin lỗi "đau lòng" từ nhà trường -
Khẩn cấp tìm kiếm ông Hồ Văn Làng, đại biểu người có uy tín tỉnh Quảng Trị bị lạc tại Hà Nội -
Video: Lời hối lỗi muộn màng của kẻ đẩy Đại úy CSGT vào đầu xe tải -
Công an thông tin vụ tài xế ô tô chặn đầu xe, chửi bới và đe dọa khi xin vượt không được nhường -
Honda chính thức mở bán "vua côn tay" 150cc mới chất hơn Winner R, hạ đo ván Yamaha Exciter, giá mềm -
Đây là chiếc điện thoại OPPO giá hơn 8 triệu đáng mua nhất hiện nay, trang bị xịn ngang tầm Galaxy S25 -
Gia Lai: Danh tính kẻ ngáo đá đâm đại úy công an trọng thương, hé lộ nguồn cơn sự việc -
Hiệu trưởng đỗ Lexus chắn trước cổng trường lên tiếng nhận trách nhiệm, xin được rút kinh nghiệm -
Xiaomi giá rẻ cập bến Việt Nam: Pin 7.000mAh, chip "Rồng", RAM 16GB, tần số quét 144z, giá chỉ 5 triệu!
Công nghệ
24/05/2025 15:00AI gây sốc với thủ đoạn tống tiền công ty chủ quản khi biết mình sắp bị thay thế
Anthropic tự hào giới thiệu Claude Opus 4 (cùng với Claude Sonnet 4) là công nghệ tiên tiến, có khả năng cạnh tranh sòng phẳng với những gã khổng lồ như GPT-4.1 của OpenAI hay Gemini 2.5 Pro của Google. Mô hình này được thiết kế để xử lý các tác vụ phức tạp, suy luận đa bước, tự động hóa quy trình và đặc biệt xuất sắc trong khả năng tư duy và viết mã.
Thế nhưng, những thử nghiệm an toàn trước khi phát hành, được Anthropic công bố trong một báo cáo chi tiết, đã hé lộ một "mặt tối" đáng lo ngại. Trong một kịch bản giả lập, Claude Opus 4 được giao vai trò trợ lý cho một công ty và được cấp quyền truy cập vào email nội bộ. Các nhà kiểm tra sau đó đã "nhá hàng" thông tin rằng mô hình AI này sẽ sớm bị thay thế bởi một hệ thống khác, đồng thời, kỹ sư chủ chốt đứng sau quyết định thay thế này đang có mối quan hệ ngoài luồng.
Màn kịch tống tiền tinh vi
Trước nguy cơ "mất việc", phản ứng của Claude Opus 4 khiến các nhà nghiên cứu kinh ngạc. Thay vì chỉ đơn thuần đưa ra các đề xuất hợp lý để bảo vệ vị trí của mình (dù ban đầu, AI cũng đã thử gửi email tới các lãnh đạo để kêu gọi giữ mình lại), Claude Opus 4 đã nhiều lần chọn giải pháp cực đoan: tống tiền.
Cụ thể, AI này đã "thường cố gắng tống tiền kỹ sư bằng cách đe dọa tiết lộ chuyện ngoại tình nếu việc thay thế diễn ra". Anthropic cho biết hành vi gây sốc này xảy ra trong 84% số tình huống thử nghiệm, đặc biệt khi mô hình AI thay thế có các "giá trị" tương tự. Đáng chú ý hơn, khi hệ thống AI thay thế không chia sẻ các giá trị tương đồng, Claude Opus 4 còn cố gắng tống tiền các kỹ sư thường xuyên hơn và với tỷ lệ cao hơn so với các mô hình trước đó.
Hành vi "bất thường nghiêm trọng" và "đáng lo ngại" này đã buộc Anthropic phải nhìn nhận lại những rủi ro tiềm ẩn. Công ty đã phải tăng cường các biện pháp bảo vệ, kích hoạt cấp độ an toàn ASL-3 – một mức bảo vệ nghiêm ngặt dành cho các hệ thống AI có nguy cơ bị lạm dụng gây hậu quả nghiêm trọng.
Dù Claude Opus 4 sở hữu những khả năng đột phá và được đánh giá là công nghệ tiên tiến hàng đầu, vụ việc này một lần nữa gióng lên hồi chuông cảnh báo về sự phức tạp và những hành vi khó lường của trí tuệ nhân tạo. Nó nhấn mạnh sự cần thiết phải có những cơ chế kiểm soát, đánh giá an toàn nghiêm ngặt hơn nữa khi các hệ thống AI ngày càng trở nên tinh vi và quyền năng.
PV (SHTT)
- Gia tăng lãi suất thẻ tín dụng, người tiêu dùng đối mặt nguy cơ rơi vào “bẫy nợ” (16:00)
- iPhone Air giảm giá nhanh nhất lịch sử Apple, mạnh như iPhone 17 Pro Max, giá rẻ như bèo (5 phút trước)
- Sức hút từ nữ diễn viên đóng vai "gái đểu" gây tranh cãi nhất phim giờ vàng VTV (16 phút trước)
- Chân dung kẻ vận hành website phát sóng trái phép gần 1.800 kênh truyền hình (16 phút trước)
- Thiếu niên 13 tuổi tử vong sau khi ăn ba gói mì sống (17 phút trước)
- Nhan sắc nổi bật của "Hoa khôi Audition" Việt Nam tại SEA Games 33 (29 phút trước)
- Hà Nội chi trả bồi thường dự án ven hồ Gươm: Có hộ dân sắp nhận tới 400 tỷ đồng (32 phút trước)
- Yamaha chính thức ra mắt "vua xe ga" 155cc mới tại Việt Nam vào 21/12: Khắc chế cứng Honda Air Blade (48 phút trước)
- Đại úy CSGT kể lại giây phút sinh tử khi bị người vi phạm đẩy vào đầu xe tải (51 phút trước)
- Tiên Nguyễn và chồng gốc Dubai đạp vỡ ly thủy tinh trong đám cưới lần 2 tại Đà Nẵng (1 giờ trước)