Anthropic chấp nhận trả 1,5 tỷ đô la Mỹ để dàn xếp vụ tải sách lậu huấn luyện AI

Anthropic chấp nhận trả 1,5 tỷ đô la Mỹ để dàn xếp vụ tải sách lậu huấn luyện AI

Anthropic chấp nhận trả 1,5 tỷ đô la Mỹ để dàn xếp vụ tải sách lậu huấn luyện AI

Giữa cơn sốt trí tuệ nhân tạo (AI) đang bùng nổ, một vụ dàn xếp lịch sử vừa được công bố, gióng lên hồi chuông cảnh tỉnh về vấn đề bản quyền. Anthropic, một trong những công ty AI hàng đầu, đã đồng ý trả 1,5 tỷ đô la Mỹ để giải quyết vụ kiện liên quan đến việc sử dụng trái phép hàng triệu cuốn sách có bản quyền để huấn luyện chatbot AI Claude. Vụ việc này không chỉ gây chấn động giới công nghệ mà còn đặt ra những câu hỏi lớn về ranh giới giữa "sử dụng hợp lý" và vi phạm bản quyền trong kỷ nguyên AI.

Theo hồ sơ pháp lý được công bố trực tuyến, khoản tiền phạt khổng lồ này là cái giá mà Anthropic phải trả cho việc "sử dụng" trái phép hàng triệu cuốn sách có bản quyền để "huấn luyện" các mô hình cho chatbot AI Claude. Vụ dàn xếp này, đang chờ được thẩm phán liên bang phê duyệt, dự kiến sẽ chi trả 3.000 đô la cho mỗi cuốn sách cho hàng trăm nghìn tác giả.

Tòa án trước đó đã phán quyết rằng việc Anthropic sử dụng 7 triệu cuốn sách lậu là "sử dụng hợp lý" nhưng việc lưu trữ chúng trong một "thư viện trung tâm" lại vi phạm luật bản quyền. Các giám đốc điều hành Anthropic bị cáo buộc biết việc tải xuống các tác phẩm lậu, dẫn đến phiên tòa dự kiến diễn ra vào tháng 12.

Khoản dàn xếp 1,5 tỷ đô la sẽ là khoản thanh toán lớn nhất trong lịch sử luật bản quyền của Hoa Kỳ, mặc dù số tiền trả cho mỗi tác phẩm thường cao hơn trong các vụ kiện khác. Ví dụ, vào năm 2012, một người phụ nữ ở Minnesota đã phải trả khoảng 9.000 đô la cho mỗi bài hát được tải xuống, một con số giảm xuống sau khi ban đầu cô bị yêu cầu trả hơn 60.000 đô la cho mỗi bài hát.

Trong một tuyên bố gửi tới Gizmodo, Anthropic nhấn mạnh phán quyết trước đó từ tháng 6 rằng việc huấn luyện mô hình AI bằng sách là "sử dụng hợp lý". Theo Aparna Sridhar, Phó Cố vấn chung tại Anthropic:

"Vào tháng 6, Tòa án Quận đã đưa ra một phán quyết mang tính bước ngoặt về phát triển AI và luật bản quyền, nhận thấy rằng phương pháp đào tạo mô hình AI của Anthropic cấu thành sử dụng hợp lý."

Anthropic cho biết các khoản thanh toán sẽ được thực hiện theo bốn đợt, gắn liền với các cột mốc được tòa án phê duyệt. Đợt thanh toán đầu tiên sẽ là 300 triệu đô la trong vòng năm ngày sau khi tòa án phê duyệt sơ bộ việc dàn xếp, và 300 triệu đô la khác trong vòng năm ngày kể từ lệnh phê duyệt cuối cùng. Sau đó, 450 triệu đô la sẽ đến hạn, có lãi, trong vòng 12 tháng kể từ lệnh sơ bộ. Và cuối cùng là 450 triệu đô la trong năm sau đó.

Anthropic, gần đây được định giá 183 tỷ đô la, vẫn phải đối mặt với các vụ kiện từ các công ty như Reddit. Ngoài ra, các tác giả vẫn có các vụ kiện đang hoạt động chống lại các công ty công nghệ lớn khác như OpenAI, Microsoft và Meta.

Phán quyết từ tháng 6 giải thích rằng việc Anthropic huấn luyện các mô hình AI bằng sách có bản quyền sẽ được coi là sử dụng hợp lý theo luật bản quyền của Hoa Kỳ vì về mặt lý thuyết, ai đó có thể đọc "tất cả các tác phẩm kinh điển hiện đại" và mô phỏng chúng, điều này sẽ được bảo vệ:

"...không sao chép cho công chúng các yếu tố sáng tạo của một tác phẩm nhất định, hoặc thậm chí phong cách biểu đạt có thể nhận dạng của một tác giả... Đúng vậy, Claude đã tạo ra ngữ pháp, bố cục và phong cách mà LLM cơ bản chắt lọc từ hàng ngàn tác phẩm. Nhưng nếu ai đó đọc tất cả các tác phẩm kinh điển hiện đại vì biểu hiện đặc biệt của chúng, ghi nhớ chúng và sau đó mô phỏng sự pha trộn giữa những tác phẩm hay nhất của họ, thì điều đó có vi phạm Đạo luật Bản quyền không? Tất nhiên là không."

Theo lý thuyết pháp lý này, tất cả những gì công ty cần làm là mua mọi cuốn sách mà họ đã sao chép để đào tạo hợp pháp các mô hình của mình, điều này chắc chắn tốn ít hơn 3.000 đô la cho mỗi cuốn sách. Tuy nhiên, như tờ New York Times đã lưu ý, thỏa thuận dàn xếp này sẽ không tạo ra bất kỳ tiền lệ pháp lý nào có thể xác định các vụ việc trong tương lai vì nó sẽ không được đưa ra xét xử.

Vụ dàn xếp trị giá 1,5 tỷ đô la giữa Anthropic và các tác giả, nhà xuất bản là một lời nhắc nhở mạnh mẽ về tầm quan trọng của việc bảo vệ bản quyền trong kỷ nguyên AI. Mặc dù việc đào tạo mô hình AI bằng dữ liệu có bản quyền có thể được coi là "sử dụng hợp lý" trong một số trường hợp, nhưng việc sao chép và lưu trữ trái phép các tác phẩm có bản quyền vẫn là hành vi vi phạm pháp luật. Vụ việc này có thể đặt ra tiền lệ cho các vụ kiện tương tự trong tương lai và thúc đẩy các công ty AI tìm kiếm các phương pháp đào tạo mô hình AI một cách hợp pháp và đạo đức hơn.