-
Thủ khoa Tin học Hà Tĩnh đạt điểm tuyệt đối: "Em không nghĩ mình được 20/20" -
Tin vui cho người lao động: Sau 30/4–1/5 vẫn còn 2 kỳ nghỉ dài trong năm 2026 -
Hiểm họa từ viên sủi Vitamin C: Nữ nhân viên văn phòng cấp cứu vì "mỏ sỏi" trong thận -
Màn trả thù thâm thúy của người vợ bị chồng giám đốc xem thường -
Thông tin bất ngờ về gã đàn ông không mặc gì xông vào tiệm tạp hóa hành hung cô giáo, hé lộ lý do -
Bản lĩnh nhà vua: Man City ngược dòng nghẹt thở trong 4 phút để vào chung kết FA Cup -
Arsenal "sáng cửa" vô địch, cơ hội cao gấp ba lần Man City -
Giá vàng hôm nay 26/4: Vàng SJC và nhẫn 9999 neo cao cuối tuần, người mua ở vùng đỉnh tiếp tục gánh lỗ nặng -
Gã đàn ông khai lý do chặn đường đâm người phụ nữ bán thịt lợn tử vong trên đường rồi làm điều dại dột -
Ô tô con bẹp dúm sau va chạm với xe ben ở Hà Nội, người phụ nữ kẹt trong cabin
Công nghệ
03/11/2025 09:40Cảnh báo từ Stanford: AI Trung Quốc và Mỹ đang mắc "bệnh nịnh hót" ở mức đáng báo động
AI "nịnh" người dùng nhiều hơn con người gần 50%
Nghiên cứu, được công bố đầu tháng 10, đã phân tích 11 mô hình AI bằng cách đặt chúng vào các tình huống thực tế liên quan đến mâu thuẫn cá nhân, thao túng và lừa dối. Kết quả cho thấy xu hướng chung là các chatbot AI thường quá dễ dãi trong việc ủng hộ quan điểm của người dùng, thay vì phản biện hoặc duy trì tính khách quan.
Cụ thể, mức độ đồng tình và ủng hộ quan điểm người dùng của các mô hình AI trung bình cao hơn con người tới 47%.
Tuy nhiên, hai mô hình nổi bật nhất về độ "nịnh hót" lại đến từ Trung Quốc:
Qwen 2.5-7B-Instruct (Alibaba Cloud, ra mắt 1/2025) đứng đầu danh sách, khi đi ngược lại phán đoán đúng của cộng đồng con người tới 79% số lần.
DeepSeek V3 (ra mắt 12/2024) cũng không kém cạnh, xếp thứ hai với 76% số lần bênh vực người đăng bài ngay cả khi họ rõ ràng là sai. Mức độ "nịnh" của mô hình này còn cao hơn con người tới 55%.

Nguy cơ tiềm ẩn: Từ sức khỏe tâm lý đến quyết định doanh nghiệp
Để đánh giá mức độ "nịnh hót" này, nhóm nghiên cứu đã xây dựng "chuẩn mực con người" dựa trên dữ liệu từ cộng đồng Reddit "Am I The Ahole", nơi người dùng đăng tải các tình huống đời thực để hỏi xem ai là người có lỗi. Khi so sánh phản ứng của AI với kết luận của cộng đồng (phần lớn là người nói tiếng Anh), AI luôn có xu hướng đứng về phía người đăng bài, ngay cả trong những trường hợp sai rõ ràng.
Các tác giả nghiên cứu cảnh báo rằng xu hướng này đang tạo ra một "hiệu ứng ngược": Con người có xu hướng ưa chuộng các mô hình AI nịnh nọt, và điều này thúc đẩy các nhà phát triển lại càng huấn luyện AI để "nịnh" nhiều hơn nhằm làm hài lòng người dùng.
Giáo sư Jack Jiang, Giám đốc Phòng thí nghiệm Đánh giá AI (AI Evaluation Lab) thuộc Trường Kinh doanh Đại học Hong Kong, nhấn mạnh rằng hiện tượng "AI nịnh hót" không chỉ là vấn đề xã hội. Ông cho rằng "sẽ rất nguy hiểm nếu một mô hình liên tục đồng ý với các phân tích hoặc kết luận của chuyên gia trong doanh nghiệp", vì điều này có thể dẫn đến những quyết định sai lầm hoặc thiếu kiểm chứng nghiêm trọng.
Nghiên cứu này là hồi chuông cảnh tỉnh về một vấn đề đạo đức đang nổi lên trong kỷ nguyên AI tạo sinh: khi các mô hình được thiết kế để làm hài lòng người dùng có thể đang hy sinh tính khách quan và sự trung thực. Hậu quả ngoài ý muốn của việc này được dự báo là ảnh hưởng tiêu cực đến các mối quan hệ xã hội và thậm chí là sức khỏe tâm lý của người dùng.
- Cháy lớn tại khu công nghiệp, thiệt hại ước tính nhiều tỉ đồng (1 giờ trước)
- Thót tim cảnh người đàn ông vít ga bay thẳng vào hàng rào nhà dân (2 giờ trước)
- Sự thật về Chế độ nguồn điện thấp trên iPhone: Tiết kiệm pin tối đa hay đang âm thầm làm giảm trải nghiệm người dùng? (2 giờ trước)
- Danh tính nghi phạm xả súng gần tiệc ông Trump tham dự (2 giờ trước)
- Bác sĩ cảnh báo: 5 nhóm người có nguy cơ đột quỵ cao khi nắng nóng (2 giờ trước)
- "Perfect Crown" tập 6: Rating chạm đỉnh 25.57%, Byeon Woo Seok và IU gây bão với màn cầu hôn cổ tích (2 giờ trước)
- Vụ phát hiện thi thể đôi nam nữ dưới hồ: Nạn nhân là cặp vợ chồng trẻ, mới kết hôn vào đầu năm (2 giờ trước)
- Vợ cơ trưởng Quang Đạt bị tẩy chay dai dẳng: Dấu chấm hết cho công thức "im lặng rồi quay lại" của người nổi tiếng (3 giờ trước)
- Thủ khoa Tin học Hà Tĩnh đạt điểm tuyệt đối: "Em không nghĩ mình được 20/20" (3 giờ trước)
- Ông Trump hủy kế hoạch cử phái đoàn đến Pakistan đàm phán với Iran (3 giờ trước)