Reddit đã đệ đơn kiện Anthropic, tố cáo startup AI này sử dụng bot để truy cập nền tảng của họ hơn 100,000 lần kể từ tháng 7/2024, dù trước đó Anthropic tuyên bố đã ngừng thu thập dữ liệu từ Reddit vào tháng 5/2024.

Reddit, một trong những nền tảng truyền thông xã hội lớn nhất thế giới, đã nộp đơn kiện Anthropic tại Tòa Thượng thẩm San Francisco vào thứ Tư, cáo buộc công ty AI này, đối thủ của OpenAI, vi phạm cam kết bằng cách tiếp tục sử dụng bot để thu thập dữ liệu từ nền tảng của họ. Theo hồ sơ kiện tụng, Anthropic đã truy cập Reddit hơn 100,000 lần kể từ tháng 7/2024, bất chấp tuyên bố trước đó rằng họ đã chặn các bot của mình từ tháng 5/2024.

Trong đơn kiện, Reddit mô tả Anthropic như một “công ty AI phát triển muộn, tự quảng bá là hiệp sĩ trắng của ngành AI,” nhưng thực tế “hoàn toàn không đúng như vậy.” Reddit nhấn mạnh: “Vụ kiện này xoay quanh hai bộ mặt của Anthropic: bộ mặt công khai cố gắng lấy lòng người dùng bằng những tuyên bố về sự chính trực và tôn trọng ranh giới cũng như luật pháp, và bộ mặt kín đáo sẵn sàng phớt lờ mọi quy tắc để trục lợi.”

Quan Điểm Từ Reddit

Ben Lee, Giám đốc Pháp lý của Reddit, chia sẻ trong một email gửi đến The Verge: “Reddit’s humanity is uniquely valuable in a world flattened by AI. Now more than ever, people are seeking authentic human-to-human conversation. Reddit hosts nearly 20 years of rich, human discussion on virtually every topic imaginable. These conversations don’t happen anywhere else—and they’re central to training language models like Claude.” Ông nhấn mạnh rằng việc Anthropic khai thác thương mại nội dung của Reddit có thể mang lại giá trị hàng tỷ USD.

Reddit đã ký thỏa thuận với Google vào tháng 2/2024 để cung cấp dữ liệu huấn luyện AI, được Bloomberg đưa tin có giá trị khoảng 60 triệu USD mỗi năm. Thỏa thuận tương tự cũng được ký với OpenAI vào tháng 5/2024, cho phép sử dụng nội dung công khai của Reddit nhưng phải tuân thủ các điều khoản cấp phép để bảo vệ quyền riêng tư của người dùng.

Bối Cảnh Pháp Lý Và Các Vụ Kiện Liên Quan

Anthropic, công ty đứng sau chatbot Claude nổi tiếng, không phải lần đầu đối mặt với cáo buộc vi phạm bản quyền. Vào tháng 8/2024, ba tác giả đã khởi kiện tập thể tại tòa án liên bang California, cáo buộc Anthropic “xây dựng một doanh nghiệp trị giá hàng tỷ USD bằng cách đánh cắp hàng trăm nghìn cuốn sách có bản quyền.” Trước đó, vào tháng 10/2023, Universal Music cũng kiện Anthropic tại tòa án liên bang Tennessee vì “vi phạm có hệ thống và rộng rãi đối với lời bài hát có bản quyền.”

Xu hướng kiện tụng các công ty AI vì vi phạm bản quyền đang gia tăng. OpenAI, đơn vị phát triển ChatGPT, cũng đối mặt với các vụ kiện từ The New York Times, một nhóm tác giả bao gồm George R.R. Martin, và các nhà xuất bản báo chí như The New York Daily News và The Chicago Tribune. Ngoài ra, các nhà xuất bản như Condé Nast và công ty mẹ của The Verge, Vox Media, đã kiện công ty AI Cohere vì các vấn đề tương tự.

Giá Trị Dữ Liệu Của Reddit

Với hơn 100 triệu người dùng hoạt động hàng ngày và 2.72 tỷ bình luận cùng tương tác trong năm 2024, Reddit là một kho dữ liệu khổng lồ cho việc huấn luyện AI. Các cuộc thảo luận trên nền tảng này trải rộng từ các chủ đề như làm vườn, lịch sử đến tư vấn cá nhân, khiến nó trở thành nguồn tài nguyên quý giá. Tuy nhiên, Reddit nhấn mạnh rằng các công ty AI cần tuân thủ quy định và ký kết thỏa thuận cấp phép để sử dụng dữ liệu một cách hợp pháp.

Phản Hồi Từ Cộng Đồng

Vụ kiện đã gây tranh cãi trên X, với nhiều ý kiến trái chiều. Một người dùng viết: “Tôi hy vọng cả hai bên đều thua trong vụ này. Reddit muốn bán dữ liệu mà họ không thực sự sở hữu, còn Anthropic không nên vi phạm bản quyền mà không có giấy phép.” Những ý kiến này phản ánh sự phức tạp của vấn đề, khi cả hai bên đều bị chỉ trích về cách xử lý dữ liệu và quyền sở hữu trí tuệ.

Kết Luận

Vụ kiện giữa Reddit và Anthropic làm nổi bật mâu thuẫn ngày càng gay gắt giữa các nền tảng nội dung và công ty AI về việc sử dụng dữ liệu người dùng. Với giá trị thị trường của Reddit đạt khoảng 22 tỷ USD sau IPO năm 2024 và Anthropic được định giá 61.5 tỷ USD vào tháng 3/2025, vụ kiện này có thể định hình cách các công ty công nghệ thương lượng về dữ liệu huấn luyện AI trong tương lai. Reddit đang yêu cầu bồi thường thiệt hại và lệnh cấm Anthropic sử dụng nội dung của họ cho mục đích thương mại, nhấn mạnh tầm quan trọng của việc bảo vệ quyền riêng tư và nội dung người dùng.

Theo The Verge, https://www.theverge.com/ai-artificial-intelligence/679768/reddit-sues-anthropic-alleging-its-bots-accessed-reddit-more-than-100000-times-since-last-july


Quảng cáo