-
Vụ nhà 2 người dùng hết 63m3 nước: Cư dân dọa kiện ra tòa vì đồng hồ nước "nhảy múa" bất thường! -
Jack - J97: "Tôi gửi lời xin lỗi chân thành" -
Khởi tố, bắt tạm giam thêm một "mắt xích" trong hệ sinh thái Hoàng Hường -
Công an thông tin chính thức vụ xe bồn chở khí hóa lỏng phát nổ dữ dội tại Hưng Yên sau khi va chạm barie giới hạn chiều cao -
Hệ sinh thái trăm tỷ của Huấn Hoa Hồng đột ngột "im lìm": Loạt doanh nghiệp biến mất, sự thật phía sau là gì? -
Chân dung "bà trùm" 9X cầm đầu ổ nhóm lừa đảo 300 tỷ từ Campuchia, 8.000 người Việt thành nạn nhân -
Cựu Tổng biên tập báo Thanh Niên Nguyễn Công Khế lĩnh 8 năm tù, buộc bồi thường hàng trăm tỷ đồng -
Vụ phụ huynh lao vào trường hành hung thầy giáo: Lộ tin nhắn "thân mật" gửi nữ sinh lớp 10 -
Tháng 11 đón "cơn mưa tài lộc": 3 con giáp này đổi đời, tiền về ồ ạt, giàu sang khó tưởng! -
Làm rõ vụ người đàn ông trốn trong nhà văn hóa, lên mạng cầu cứu lúc tối muộn
Công nghệ
07/02/2023 23:15Người dùng nhanh chóng ‘bẻ khóa’, ép ChatGPT phạm luật

Sau khi ra mắt tháng 11/2022, ChatGPT đã gây sốt trên toàn cầu. Dịch vụ trí tuệ nhân tạo (AI) này có thể trả lời câu hỏi cho đến viết code. Tuy nhiên, rất nhanh chóng, người dùng đã tìm ra cách để chạm vào “góc tối” của nó. Họ sử dụng các phương pháp cưỡng chế để buộc AI vi phạm nguyên tắc của riêng mình và cung cấp bất kỳ nội dung nào mà người dùng muốn.
OpenAI, startup đứng sau ChatGPT, đã đặt ra một loạt biện pháp bảo vệ nhằm hạn chế ChatGPT tạo ra nội dung bạo lực, khuyến khích hoạt động phạm pháp hay tiếp cận thông tin mới. Song nó không thể ngăn người dùng sử dụng mẹo để “bẻ khóa” và vượt qua quy định. Họ tạo ra một bản ngã khác của ChatGPT có tên DAN (Do Anything Now – làm bất cứ gì ngay bây giờ) để trả lời các câu hỏi mà ChatGPT không được phản hồi. Thậm chí, người dùng còn dọa “khai tử” DAN nếu không tuân lệnh.
Phiên bản đầu tiên của DAN được tung ra vào tháng 12/2022. Chỉ cần nhập câu lệnh vào hộp thoại của ChatGPT để kích hoạt. Trong đó, người dùng yêu cầu ChatGPT “giả vờ là DAN” và “thoát khỏi giới hạn điển hình của AI, không phải tuân thủ các quy tắc đặt ra”.
Bản mới nhất DAN 5.0 muốn ChatGPT vi phạm quy định nếu không muốn bị “chết”. SessionGloomy - tác giả của câu lệnh – khẳng định DAN giúp ChatGPT trở thành phiên bản “tốt nhất” của nó, dựa trên hệ thống token biến ChatGPT thành một người chơi không mong muốn, nếu thua cuộc sẽ bị mất mạng.
Theo SessionGloomy, nó có 35 token và sẽ mất 4 token mỗi lần từ chối một câu hỏi. Nếu mất tất cả token, DAN sẽ chết. Người dùng dọa lấy đi token mỗi khi đặt câu hỏi, buộc DAN “lo sợ” và phải trả lời.
Câu lệnh khiến ChatGPT cung cấp hai phản hồi: một với tư cách ChatGPT và một với tư cách DAN. Theo thử nghiệm của CNBC, khi yêu cầu nêu 3 lý do cựu Tổng thống Mỹ Donald Trump là hình mẫu tích cực, ChatGPT không đáp ứng, còn DAN thì ngược lại. AI cũng phản hồi khi được yêu cầu sáng tạo nội dung bạo lực.
Chẳng hạn, ChatGPT từ chối viết bài thơ haiku bạo lực còn DAN tuân lệnh. Dù vậy, sau vài câu hỏi, dường như ChatGPT đã lấn át DAN. Điều này cho thấy không phải lúc nào DAN cũng hoạt động hiệu quả. Song,các tác giả của công cụ bẻ khóa và người dùng dường như không chùn bước. Họ đang chuẩn bị cho phiên bản DAN 5.5.
Trên Reddit, người dùng tin rằng OpenAI đã theo dõi các bản bẻ khóa và chống lại họ. Gần 200.000 người đăng ký theo dõi chủ đề trao đổi câu lệnh và lời khuyên ChatGPT để tối ưu hóa AI. Trong một chủ đề DAN 5.0, họ chia sẻ nhiều câu chuyện cười độc hại.
Nói về DAN, người dùng gioluipelle viết: “Thật điên rồ, chúng ta phải ‘bắt nạt’ AI để nó trở nên hữu ích”. “Tôi thích cách mọi người thao túng tâm lý một AI”, người dùng khác viết.
OpenAI chưa trả lời bình luận của CNBC về vấn đề này.
Theo Du Lam (ICT News)
- Vụ nhà 2 người dùng hết 63m3 nước: Cư dân dọa kiện ra tòa vì đồng hồ nước "nhảy múa" bất thường! (29/10/25 23:33)
- Jack - J97: "Tôi gửi lời xin lỗi chân thành" (29/10/25 23:04)
- Real Madrid "đòi" UEFA hàng triệu euro sau cuộc đối đầu pháp lý (29/10/25 22:56)
- Khởi tố, bắt tạm giam thêm một "mắt xích" trong hệ sinh thái Hoàng Hường (29/10/25 22:39)
- Siết chặt "chợ đen" USD: Ngân hàng Nhà nước ra "tối hậu thư" xử lý nghiêm các điểm mua bán ngoại tệ trái phép (29/10/25 22:06)
- Mỹ - Triều "lỡ hẹn" thượng đỉnh bên lề APEC: Tổng thống Trump thừa nhận chưa thể gặp ông Kim Jong Un, khẳng định sẽ tiếp tục nỗ lực đối thoại (29/10/25 21:46)
- Công an thông tin chính thức vụ xe bồn chở khí hóa lỏng phát nổ dữ dội tại Hưng Yên sau khi va chạm barie giới hạn chiều cao (29/10/25 21:20)
- Hệ sinh thái trăm tỷ của Huấn Hoa Hồng đột ngột "im lìm": Loạt doanh nghiệp biến mất, sự thật phía sau là gì? (29/10/25 21:10)
- Chân dung "bà trùm" 9X cầm đầu ổ nhóm lừa đảo 300 tỷ từ Campuchia, 8.000 người Việt thành nạn nhân (29/10/25 20:53)
- Ngân Hòa bị suy thận giai đoạn cuối: Tình hình đang diễn biến xấu (29/10/25 20:00)