-
Đoàn Quân đội Lào tham gia diễu binh: Rất xúc động khi tiếng hô vang cổ vũ bên đường rực sắc đỏ
-
Bác bỏ thông tin công an bắt giữ chủ tịch phường tại Huế, thu giữ tài sản 'khủng'
-
Ông bà dặn: 6 thứ tối kỵ đặt đầu giường kẻo giấc ngủ hóa ác mộng, cơ thể hao mòn như dòng sông cạn nước
-
Phát hiện 2 người tử vong bất thường dưới hố cống sâu 8 mét ở Đà Nẵng
-
Vụ biếu xén hàng chục nghìn USD cho nguyên Bí thư thành ủy, Chủ tịch UBND TP Cần Thơ từ đâu lộ sáng?
-
Chiếc xe chết máy giữa đường và nỗi khổ của dân công sở ngày mưa ngập ở Hà Nội
-
Đi đám giỗ miền Tây, nơi được hưởng nhiều "đặc quyền" nhất lại ở chỗ ít ai nghĩ tới
-
Người đàn ông cầm sổ ghi nợ bật khóc trước cửa hàng bị bão đánh tan
-
7 loại cá "ngậm" nhiều thủy ngân: Thích đến mấy cũng phải hạn chế
-
Càng ngoài 40 tuổi càng cần: 3 món ăn bổ khí huyết giúp da dẻ hồng hào, cơ thể tràn năng lượng
-
Lào Cai xuất hiện lũ ống
-
Chủ xe kể 30 giây kinh hoàng khi cây lớn bật gốc đè trúng ô tô giữa phố tại Hà Nội
-
Chung cư, nhà dân Hà Nội dựng đập, rào chắn ngăn nước ngập
-
Xác định được người mẹ liên quan vụ thi thể bé sơ sinh không nguyên vẹn ở TP.HCM: Bỏ con lại sau khi sinh, lên ô tô rời đi cùng nhóm bạn
-
Thuê thuyền vượt ngập đi làm, nữ nhân viên ở Hà Nội: "Phải chấm công bằng mọi giá"
-
Chi tiết vị trí đặt 22 màn hình LED phục vụ người dân xem diễu binh 2/9
-
Vợ Quế Ngọc Hải bồng bế 3 con đi tránh bão, tâm sự chạnh lòng: "Những lúc này cần người đàn ông ở nhà thật"!
-
Vì sao Hà Nội mưa lớn kéo dài, ngập sâu khủng khiếp khắp nơi sáng 26/8?
-
Đưa ô tô đi sơ tán, người dân "ngớ người" với cảnh tượng sau bão
Công nghệ
07/02/2023 16:15Người dùng nhanh chóng ‘bẻ khóa’, ép ChatGPT phạm luật
Sau khi ra mắt tháng 11/2022, ChatGPT đã gây sốt trên toàn cầu. Dịch vụ trí tuệ nhân tạo (AI) này có thể trả lời câu hỏi cho đến viết code. Tuy nhiên, rất nhanh chóng, người dùng đã tìm ra cách để chạm vào “góc tối” của nó. Họ sử dụng các phương pháp cưỡng chế để buộc AI vi phạm nguyên tắc của riêng mình và cung cấp bất kỳ nội dung nào mà người dùng muốn.
OpenAI, startup đứng sau ChatGPT, đã đặt ra một loạt biện pháp bảo vệ nhằm hạn chế ChatGPT tạo ra nội dung bạo lực, khuyến khích hoạt động phạm pháp hay tiếp cận thông tin mới. Song nó không thể ngăn người dùng sử dụng mẹo để “bẻ khóa” và vượt qua quy định. Họ tạo ra một bản ngã khác của ChatGPT có tên DAN (Do Anything Now – làm bất cứ gì ngay bây giờ) để trả lời các câu hỏi mà ChatGPT không được phản hồi. Thậm chí, người dùng còn dọa “khai tử” DAN nếu không tuân lệnh.
Phiên bản đầu tiên của DAN được tung ra vào tháng 12/2022. Chỉ cần nhập câu lệnh vào hộp thoại của ChatGPT để kích hoạt. Trong đó, người dùng yêu cầu ChatGPT “giả vờ là DAN” và “thoát khỏi giới hạn điển hình của AI, không phải tuân thủ các quy tắc đặt ra”.
Bản mới nhất DAN 5.0 muốn ChatGPT vi phạm quy định nếu không muốn bị “chết”. SessionGloomy - tác giả của câu lệnh – khẳng định DAN giúp ChatGPT trở thành phiên bản “tốt nhất” của nó, dựa trên hệ thống token biến ChatGPT thành một người chơi không mong muốn, nếu thua cuộc sẽ bị mất mạng.
Theo SessionGloomy, nó có 35 token và sẽ mất 4 token mỗi lần từ chối một câu hỏi. Nếu mất tất cả token, DAN sẽ chết. Người dùng dọa lấy đi token mỗi khi đặt câu hỏi, buộc DAN “lo sợ” và phải trả lời.
Câu lệnh khiến ChatGPT cung cấp hai phản hồi: một với tư cách ChatGPT và một với tư cách DAN. Theo thử nghiệm của CNBC, khi yêu cầu nêu 3 lý do cựu Tổng thống Mỹ Donald Trump là hình mẫu tích cực, ChatGPT không đáp ứng, còn DAN thì ngược lại. AI cũng phản hồi khi được yêu cầu sáng tạo nội dung bạo lực.
Chẳng hạn, ChatGPT từ chối viết bài thơ haiku bạo lực còn DAN tuân lệnh. Dù vậy, sau vài câu hỏi, dường như ChatGPT đã lấn át DAN. Điều này cho thấy không phải lúc nào DAN cũng hoạt động hiệu quả. Song,các tác giả của công cụ bẻ khóa và người dùng dường như không chùn bước. Họ đang chuẩn bị cho phiên bản DAN 5.5.
Trên Reddit, người dùng tin rằng OpenAI đã theo dõi các bản bẻ khóa và chống lại họ. Gần 200.000 người đăng ký theo dõi chủ đề trao đổi câu lệnh và lời khuyên ChatGPT để tối ưu hóa AI. Trong một chủ đề DAN 5.0, họ chia sẻ nhiều câu chuyện cười độc hại.
Nói về DAN, người dùng gioluipelle viết: “Thật điên rồ, chúng ta phải ‘bắt nạt’ AI để nó trở nên hữu ích”. “Tôi thích cách mọi người thao túng tâm lý một AI”, người dùng khác viết.
OpenAI chưa trả lời bình luận của CNBC về vấn đề này.
Theo Du Lam (ICT News)








- Chu Thanh Huyền bị tố “nhận vơ” ảnh kho hàng ngập nước trên mạng để xả hàng, gấp rút làm 1 việc khi bị phát giác (26/08/25 23:12)
- Thấy gì từ vụ cô gái nặng 300 kg tử vong khi đang quay clip mukbang (26/08/25 23:08)
- Danh tính cô gái MMA "hạ gục" thanh niên xăm trổ ở hầm giữ xe (26/08/25 22:51)
- Thu 21 triệu tiền xe cấp cứu chở bệnh nhân đi 200km từ Bắc Ninh về Thái Nguyên (26/08/25 22:44)
- Lamine Yamal công khai bạn gái hơn 6 tuổi: Yêu đương và chiến thắng (26/08/25 22:22)
- Bà tôi 91 tuổi không có thói quen làm đẹp nhưng luôn sử dụng 1 thứ mỗi tối: Không thấy mấy nếp nhăn xuất hiện, cháu gái cũng "thua xa" (26/08/25 22:20)
- Clip lốc xoáy kinh hoàng, mái tôn bay lả tả ở Bắc Ninh (26/08/25 22:03)
- Thanh niên cầm búa đập tủ kính, cướp tiệm vàng PNJ rồi ngang nhiên bỏ đi (26/08/25 21:50)
- Hàng nghìn người đội mưa “đu” concert quốc gia (26/08/25 21:37)
- "Cô gái đẹp nhất thế giới" bức xúc (26/08/25 21:34)




