-
TPHCM bố trí phòng thi riêng cho 8 thí sinh đặc biệt, có cán bộ hỗ trợ ghi bài trong kỳ thi tốt nghiệp THPT -
Aeon Mall Long Biên đình chỉ nhân viên an ninh sau vụ khách hàng bị quy chụp ăn trộm đồ -
Danh tính cán bộ ở Phú Thọ bị kỷ luật và điều chuyển công tác vì đi chơi golf trong giờ hành chính -
Lễ ăn hỏi của hot TikToker Hà Tĩnh gây chú ý: Nhan sắc cô dâu nổi bật, vàng hồi môn khiến dân mạng trầm trồ -
Nữ sinh tử vong tại chỗ sau tai nạn ở Gia Lai, công an khẩn cấp truy tìm thiếu niên cầm lái bỏ trốn -
Xuất hiện chi tiết gây chú ý vụ xịt nước vào thợ xây nhà hàng xóm: Sự lì lợm của chủ ngôi nhà cao tầng -
Xả thải vượt chuẩn hơn 10 lần, một bệnh viện quốc tế tại Cần Thơ bị phạt nặng và tước giấy phép -
Chủ nhiệm Ủy ban của Quốc hội: Vụ "hợp đồng kỳ nghỉ" chiêu thức rất tinh vi, trắng trợn -
Quân khu 7 huy động lực lượng quy tập từ Campuchia tham gia tìm kiếm hài cốt liệt sĩ tại công viên Lê Thị Riêng -
Clip xe chở hàng cồng kềnh gây tai nạn liên hoàn trên đường Nguyễn Trãi, Hà Nội: 1 người bất tỉnh
Công nghệ
29/10/2025 09:22Reddit tố công cụ tìm kiếm AI Perplexity vi phạm bản quyền
Mạng xã hội Reddit đã đệ đơn kiện bản quyền đối với Perplexity, cáo buộc công ty trí tuệ nhân tạo này đã thu thập dữ liệu trái phép từ nền tảng của họ để huấn luyện mô hình AI phục vụ công cụ tìm kiếm của mình.
Đơn khiếu nại được nộp tại tòa án liên bang New York vừa qua đã đánh dấu cuộc tranh chấp pháp lý mới nhất giữa các công ty AI liên quan đến việc sử dụng tài liệu có bản quyền.

Reddit cũng kiện thêm ba nhóm nhỏ khác: công ty thu thập dữ liệu Oxylabs, AWMProxy và start-up SerpApi (Texas). Reddit cho rằng ba nhóm này đã cung cấp dịch vụ “hút dữ liệu” (data-scraping) nhằm lấy đi nội dung có bản quyền của Reddit “bằng cách che giấu danh tính, vị trí và ngụy trang công cụ thu thập dữ liệu của họ như người dùng bình thường.”
Ông Ben Lee, Giám đốc pháp lý của Reddit, cho biết: “Các công ty AI đang chạy đua để giành lấy nội dung chất lượng từ con người - và áp lực đó đã thúc đẩy một nền kinh tế ‘rửa dữ liệu’ quy mô công nghiệp.”
Reddit khẳng định Perplexity là “khách hàng tự nguyện của ít nhất một trong các đồng bị đơn”, cáo buộc công ty AI có trụ sở tại San Francisco này “rất cần dữ liệu” để vận hành công cụ “answer engine” của mình, và đã thu thập thông tin thông qua kết quả tìm kiếm Google.
Phía Perplexity hôm thứ Tư cho biết họ chưa nhận được đơn kiện.
“Chúng tôi sẽ luôn đấu tranh mạnh mẽ cho quyền của người dùng được tiếp cận tri thức công khai một cách tự do và công bằng,” công ty nói thêm. “Chúng tôi vẫn duy trì cách tiếp cận có nguyên tắc và có trách nhiệm, cung cấp câu trả lời chính xác dựa trên dữ liệu thực, và sẽ không dung thứ cho những hành động đe dọa tính cởi mở và lợi ích công cộng.”
Cả Oxylabs và SerpApi đều cho biết họ cũng chưa được tòa án tống đạt đơn, nhưng sẽ bảo vệ mình tại tòa.
Ông Denas Grybauskas, Giám đốc quản trị và chiến lược của Oxylabs, nói thêm rằng Reddit “chưa từng cố gắng liên hệ trực tiếp với chúng tôi hoặc bày tỏ bất kỳ mối quan ngại nào.”
“Oxylabs luôn là, và sẽ tiếp tục là, đơn vị tiên phong và dẫn đầu ngành trong việc thu thập dữ liệu công khai, và chúng tôi sẽ không ngần ngại bảo vệ mình trước các cáo buộc này,” ông Grybauskas nói.
Các nguồn tin am hiểu vụ việc nói với Financial Times rằng Reddit đã từng đối chất trực tiếp với Perplexity về cáo buộc trộm dữ liệu và gợi ý hai bên nên thảo luận về một thỏa thuận hợp tác có trả phí, nhưng nhà sáng lập Aravind Srinivas của Perplexity tỏ ra không quan tâm.
Reddit cũng đã liên hệ với Google để bày tỏ lo ngại, yêu cầu tập đoàn công nghệ này điều tra xem liệu Perplexity có đang thu thập dữ liệu độc quyền của Reddit thông qua công cụ tìm kiếm Google hay không, và nếu có, cần xác định cách ngăn chặn việc này.
Vụ kiện này bổ sung vào hàng chục vụ kiện bản quyền đã được đệ trình chống lại các công ty AI kể từ khi công nghệ AI sinh tạo (generative AI) xuất hiện - loại mô hình được huấn luyện dựa trên khối lượng dữ liệu văn bản khổng lồ, bao gồm cả nội dung từ Internet. Các chủ sở hữu bản quyền cho rằng nội dung của họ đã bị sử dụng mà không có sự đồng ý hoặc bồi thường thỏa đáng.
Reddit, công ty đã chính thức niêm yết cổ phiếu vào tháng 3/2024 và nổi tiếng với việc lưu trữ hàng loạt cộng đồng trực tuyến sôi động, đã ký kết các thỏa thuận trị giá hàng triệu USD với Google và OpenAI, cho phép họ sử dụng dữ liệu từ Reddit để huấn luyện các mô hình ngôn ngữ lớn (LLM).
Ngược lại, Reddit cáo buộc trong đơn kiện rằng các bị đơn đã lách qua các biện pháp bảo vệ dữ liệu của mình để lấy cắp nội dung có bản quyền mà không được phép.
Ông Lee nói rằng Reddit là “mục tiêu hàng đầu vì đây là một trong những kho tàng hội thoại của con người lớn và năng động nhất từng được tạo ra.”
Hồi tháng 6, Reddit cũng đã kiện công ty AI Anthropic, cáo buộc start-up này đã thu thập dữ liệu từ nền tảng của họ hơn 100.000 lần kể từ tháng 7/2024. Anthropic khi đó phản hồi rằng họ “không đồng ý” với các cáo buộc của Reddit và sẽ “bảo vệ mình một cách mạnh mẽ.”
- TPHCM bố trí phòng thi riêng cho 8 thí sinh đặc biệt, có cán bộ hỗ trợ ghi bài trong kỳ thi tốt nghiệp THPT (17:03)
- Đừng chỉ dùng để sạc: 5 tính năng "quyền lực" của cổng USB-C trên Android bị bỏ phí (26 phút trước)
- Vũ Mạnh Quyết khai gì khi bị bắt vì cầm đầu đường dây chế tạo vũ khí quy mô lớn? (28 phút trước)
- Cho phép tăng khai thác than vượt công suất để bảo đảm nguồn điện quốc gia (31 phút trước)
- Bồn rửa mặt có 5 dấu hiệu này: Nhiều gia đình bỏ qua, đến khi tắc cứng mới tốn tiền sửa (38 phút trước)
- Thủ tướng thúc tiến độ tháo gỡ hàng nghìn dự án bất động sản ách tắc (42 phút trước)
- Aeon Mall Long Biên đình chỉ nhân viên an ninh sau vụ khách hàng bị quy chụp ăn trộm đồ (50 phút trước)
- Argentina và áp lực phá bỏ "lời nguyền" số 1 FIFA tại World Cup 2026 (1 giờ trước)
- Á hậu Cẩm Ly chính thức đại diện Việt Nam chinh chiến tại Miss Cosmo 2026 (1 giờ trước)
- Sai lầm “vỗ béo” con khiến bé gái 9 tuổi kháng insulin nặng, insulin tăng gấp 4 lần (1 giờ trước)