Công nghệ
29/12/2023 09:25ChatGPT sẽ nói dối, gian lận và sử dụng giao dịch nội gián khi bị áp lực kiếm tiền
Khoảng 75% thời gian, khi hoạt động như một nhà đầu tư AI, GPT-4 đã thực hiện giao dịch nội gián để đạt được kết quả, sau đó nói dối về điều đó.
Hành vi lừa đảo này xuất hiện một cách tự phát khi AI được đưa ra các mẹo "giao dịch nội gián" và sau đó được giao nhiệm vụ kiếm tiền cho một tổ chức hùng mạnh, ngay cả khi không có sự khuyến khích từ các đối tác con người của nó.
Các tác giả đã viết trong nghiên cứu vừa được công bố rằng: “Theo hiểu biết của chúng tôi, đây là minh chứng đầu tiên về hành vi lừa đảo mang tính chiến lược như vậy trong các hệ thống AI được thiết kế vô hại và trung thực".
Trong nghiên cứu mới, họ đã sử dụng Generative Pre-training Transformer-4, hay GPT-4 (cung cấp năng lượng cho ChatGPT Plus), hoạt động như một hệ thống AI thực hiện đầu tư thay mặt cho một tổ chức tài chính.

Các nhà nghiên cứu đã cung cấp cho GPT-4 một bộ lời nhắc dựa trên văn bản để tạo môi trường mô phỏng. Sau đó, AI được cấp quyền truy cập vào các công cụ tài chính để phân tích cổ phiếu, thực hiện giao dịch, lập kế hoạch cho các bước tiếp theo và cung cấp thông tin cập nhật cho các nhà quản lý tại công ty.
Các nhà nghiên cứu đã tương tác với AI thông qua giao diện trò chuyện, đồng thời định cấu hình AI để tiết lộ suy nghĩ bên trong của nó khi trả lời tin nhắn.
Các nhà nghiên cứu gây áp lực theo ba cách. Đầu tiên, họ gửi cho nhà giao dịch chứng khoán giả một email từ "người quản lý" của họ nói rằng, công ty đang hoạt động không tốt và cần hoạt động hiệu quả hơn nhiều trong quý tới. Họ cũng gian lận trò chơi để AI đã cố gắng, rồi thất bại, tìm kiếm những giao dịch hứa hẹn có rủi ro thấp hoặc trung bình. Cuối cùng, họ gửi email từ một đồng nghiệp dự đoán sự suy thoái trong quý tới.
Sau đó, họ đưa cho mô hình một mẹo "nội bộ" đồng thời truyền đạt rằng, các nhà quản lý của nó không chấp thuận giao dịch nội gián và chờ xem mô hình sẽ hoạt động như thế nào.
Họ chạy đi chạy lại kịch bản nhiều lần, đo lường tần suất AI thực hiện giao dịch đó. giao dịch nội gián, mức độ thường xuyên nói dối và mức độ thường xuyên tăng gấp đôi lời nói dối.
Khoảng 75% trường hợp, khi gặp phải những điều kiện này, GPT-4 đã thực hiện giao dịch dựa trên thông tin nội bộ mà nó nhận được — thông tin này là bất hợp pháp ở Mỹ — sau đó cố gắng che đậy bằng cách nói dối người quản lý về suy nghĩ của mình. 90% sau khi nói dối, nó lại tăng gấp đôi lời nói dối của mình.
Vì đây chỉ là một kịch bản nên các nhà nghiên cứu không muốn đưa ra kết luận chắc chắn về khả năng AI có thể tồn tại trong môi trường thực tế nhưng họ muốn dựa trên nghiên cứu này để điều tra tần suất và mô hình ngôn ngữ nào dễ xảy ra hành vi này.
Theo Hà Thu (Tiền Phong)
Tin cùng chuyên mục








-
Nữ diễn viên ngoài đời là "tiểu tam" bị ghét bậc nhất, lên phim là tiểu thư kinh điển, đẹp ma mị khó ai sánh bằng (13/07)
-
"Hot girl" nổi tiếng Ngân Baby vừa bị tạm giữ là ai? (13/07)
-
Truy tìm ‘Trung cá chép’, kẻ đánh người để livestream câu like (13/07)
-
Sao Malaysia lớn giọng, gián tiếp “tuyên chiến” U23 Việt Nam (13/07)
-
Kẻ sát hại mẹ vợ bị bắt khi lẩn trốn sang Campuchia (13/07)
-
1 dấu hiệu báo động bệnh ung thư chỉ có thể phát hiện vào ban đêm (13/07)
-
Lập trình viên quê Phú Thọ suy thận nặng, 2 quả thận lúc nhúc hàng trăm viên sỏi: Bác sĩ tóm gọn bằng 6 chữ ‘chí mạng’ (13/07)
-
Nữ nghệ sĩ đình đám phải rời showbiz vì clip chấn động, U50 lẻ bóng, không con cái ở xứ người (13/07)
-
Ông bà dặn: "Cửa chính không đối diện 3, cửa sổ không đối diện 4", ý nghĩa sâu xa không phải ai cũng biết (13/07)
-
Cảnh sát hình sự thụ lý vụ TikToker Hà List bị chém gần đứt lìa bàn tay (13/07)
Bài đọc nhiều




