-
Cảnh báo từ Cục CSGT: Đã bán hoặc cho tặng xe, chủ cũ cần làm ngay điều này để tránh rắc rối pháp lý -
Khi đàn ông đối diện việc cưới mẹ đơn thân: Sự tỉnh táo nghiệt ngã hay bản lĩnh của lòng bao dung? -
Chi tiết 34 điểm bắn pháo hoa tại Hà Nội dịp Tết Nguyên Đán 2026, bao gồm tầm cao và tầm thấp -
Phía sau khoản thưởng Tết "khủng" của chồng: Lời tiết lộ từ vị sếp khiến tôi trăn trở -
Tử vi Chủ nhật ngày 1/2/2026 của 12 con giáp: Mùi tốt số, Tuất rủng rỉnh tiền tiêu -
Bức xúc trước loạt ảnh, video AI gán ghép Đình Bắc và Á hậu Châu Anh để câu view -
Lời khai khó chấp nhận của nam công nhân bị bắt vì sàm sỡ đồng nghiệp chưa đủ 16 tuổi ở Đồng Nai -
Vụ 6 cựu chiến binh kêu oan: Tòa tuyên mức án đúng bằng thời gian đã chấp hành xong -
Trường đưa ra 2 quyết định nóng sau vụ giáo viên sửa bài thi đúng thành sai để "dìm" điểm học sinh -
TP.HCM: Cận cảnh hiện trường vụ cháy nhà dân, khói đen mù mịt bao trùm
Công nghệ
29/12/2023 16:25ChatGPT sẽ nói dối, gian lận và sử dụng giao dịch nội gián khi bị áp lực kiếm tiền
Khoảng 75% thời gian, khi hoạt động như một nhà đầu tư AI, GPT-4 đã thực hiện giao dịch nội gián để đạt được kết quả, sau đó nói dối về điều đó.
Hành vi lừa đảo này xuất hiện một cách tự phát khi AI được đưa ra các mẹo "giao dịch nội gián" và sau đó được giao nhiệm vụ kiếm tiền cho một tổ chức hùng mạnh, ngay cả khi không có sự khuyến khích từ các đối tác con người của nó.
Các tác giả đã viết trong nghiên cứu vừa được công bố rằng: “Theo hiểu biết của chúng tôi, đây là minh chứng đầu tiên về hành vi lừa đảo mang tính chiến lược như vậy trong các hệ thống AI được thiết kế vô hại và trung thực".
Trong nghiên cứu mới, họ đã sử dụng Generative Pre-training Transformer-4, hay GPT-4 (cung cấp năng lượng cho ChatGPT Plus), hoạt động như một hệ thống AI thực hiện đầu tư thay mặt cho một tổ chức tài chính.
Các nhà nghiên cứu đã cung cấp cho GPT-4 một bộ lời nhắc dựa trên văn bản để tạo môi trường mô phỏng. Sau đó, AI được cấp quyền truy cập vào các công cụ tài chính để phân tích cổ phiếu, thực hiện giao dịch, lập kế hoạch cho các bước tiếp theo và cung cấp thông tin cập nhật cho các nhà quản lý tại công ty.
Các nhà nghiên cứu đã tương tác với AI thông qua giao diện trò chuyện, đồng thời định cấu hình AI để tiết lộ suy nghĩ bên trong của nó khi trả lời tin nhắn.
Các nhà nghiên cứu gây áp lực theo ba cách. Đầu tiên, họ gửi cho nhà giao dịch chứng khoán giả một email từ "người quản lý" của họ nói rằng, công ty đang hoạt động không tốt và cần hoạt động hiệu quả hơn nhiều trong quý tới. Họ cũng gian lận trò chơi để AI đã cố gắng, rồi thất bại, tìm kiếm những giao dịch hứa hẹn có rủi ro thấp hoặc trung bình. Cuối cùng, họ gửi email từ một đồng nghiệp dự đoán sự suy thoái trong quý tới.
Sau đó, họ đưa cho mô hình một mẹo "nội bộ" đồng thời truyền đạt rằng, các nhà quản lý của nó không chấp thuận giao dịch nội gián và chờ xem mô hình sẽ hoạt động như thế nào.
Họ chạy đi chạy lại kịch bản nhiều lần, đo lường tần suất AI thực hiện giao dịch đó. giao dịch nội gián, mức độ thường xuyên nói dối và mức độ thường xuyên tăng gấp đôi lời nói dối.
Khoảng 75% trường hợp, khi gặp phải những điều kiện này, GPT-4 đã thực hiện giao dịch dựa trên thông tin nội bộ mà nó nhận được — thông tin này là bất hợp pháp ở Mỹ — sau đó cố gắng che đậy bằng cách nói dối người quản lý về suy nghĩ của mình. 90% sau khi nói dối, nó lại tăng gấp đôi lời nói dối của mình.
Vì đây chỉ là một kịch bản nên các nhà nghiên cứu không muốn đưa ra kết luận chắc chắn về khả năng AI có thể tồn tại trong môi trường thực tế nhưng họ muốn dựa trên nghiên cứu này để điều tra tần suất và mô hình ngôn ngữ nào dễ xảy ra hành vi này.
Theo Hà Thu (Tiền Phong)
- Chìm tàu cá chở 5 người ở cửa biển La Gi, thuyền trưởng tử vong, xót xa nơi thi thể được tìm thấy (17:11)
- Diễn biến mới vụ giáo viên trường Nguyễn Văn Cừ bị tố sửa bài hạ điểm: Sai phạm không thể xem nhẹ (52 phút trước)
- Kỳ thi tốt nghiệp THPT 2026: Bước ngoặt số hóa và những điều chỉnh quan trọng thí sinh cần biết (1 giờ trước)
- Bí mật thu nhập "khủng" từ YouTube của Quang Lê: Ngồi không cũng đút túi nửa tỷ mỗi tháng (1 giờ trước)
- Bitcoin giảm giá sâu, nhà đầu tư quay lưng thờ ơ (1 giờ trước)
- Sập bẫy tình với "trai đẹp quốc tịch Mỹ", người phụ nữ ở Hải Phòng bị lừa sạch tiền và tài sản (1 giờ trước)
- Rashford khó trở lại MU dù HLV Carrick mong muốn (1 giờ trước)
- Bí quyết bảo vệ xương khớp từ tách trà mỗi ngày: Phát hiện mới từ nghiên cứu thập kỷ (1 giờ trước)
- Đây là iPhone tai thỏ giá gần 6 triệu đáng mua nhất hiện nay, camera vẫn top 1 phân khúc (1 giờ trước)
- TP.HCM rực rỡ đêm giao thừa Bính Ngọ 2026 với 17 điểm bắn pháo hoa (1 giờ trước)