Chính phủ Hoa Kỳ hôm thứ Sáu đã ra lệnh cho Anthropic ngay lập tức tắt quyền truy cập vào hai mô hình AI mạnh nhất của họ – Claude Fable 5 và Claude Mythos 5 – với lý do lo ngại về an ninh quốc gia. Anthropic đã thông báo trên X rằng họ đã tuân thủ, nhưng cũng nói rõ rằng họ cho rằng chính phủ đã sai về điều này.
Chỉ thị mà Anthropic cho biết họ đã nhận được vào thứ Sáu lúc 5:21 chiều theo giờ ET, buộc công ty phải vô hiệu hóa cả hai mô hình đối với tất cả người dùng trên toàn thế giới – không chỉ đối với công dân nước ngoài mà lệnh kiểm soát xuất khẩu của chính phủ trên danh nghĩa nhắm tới. Quyền truy cập vào các mô hình khác của Anthropic không bị ảnh hưởng.
Tại sao điều này lại quan trọng? Mythos là mô hình AI có khả năng nhất của Anthropic, một mô hình mà công ty đã xem trước vào đầu tháng 4 và đã bị hạn chế chặt chẽ kể từ đó vì những gì Anthropic mô tả là khả năng đặc biệt của nó trong việc tìm ra các lỗ hổng bảo mật trong phần mềm. Theo Anthropic, Mythos đã xác định các lỗ hổng trong mọi hệ điều hành và trình duyệt web chính mà nó đã thử nghiệm, vì vậy thay vì phát hành rộng rãi, công ty đã tung ra một chương trình được kiểm soát có tên Project Glasswing, chia sẻ nó với khoảng 50 tổ chức đã được kiểm duyệt, bao gồm Amazon, Apple, Google, Microsoft và CrowdStrike, để sử dụng cho công việc phòng thủ an ninh mạng.
Fable 5, được phát hành chỉ ba ngày trước, là câu trả lời của Anthropic trước áp lực thương mại rõ ràng: một phiên bản Mythos được trang bị các rào chắn ngăn chặn phản ứng trong các lĩnh vực có rủi ro cao như an ninh mạng và sinh học, khiến nó đủ an toàn để phát hành rộng rãi, công ty lập luận. Theo các bài kiểm tra điểm chuẩn từ Vals AI, một công ty theo dõi hiệu suất công nghệ AI, nó ngay lập tức trở thành mô hình AI có khả năng tốt nhất hiện có cho công chúng.

Chỉ thị của chính phủ được coi là một hành động kiểm soát xuất khẩu, hạn chế người nước ngoài tiếp cận các mô hình. Nhưng trong một bài đăng blog dài, Anthropic cho biết họ hiểu mối lo ngại cơ bản là một vụ bẻ khóa được tuyên bố của Fable 5. Cho đến nay, công ty cho biết, chính phủ chỉ cung cấp bằng chứng bằng lời nói về một “cuộc bẻ khóa hẹp, không phổ quát tiềm năng” – một việc mà, như Anthropic mô tả, có nghĩa là thúc đẩy mô hình đọc một cơ sở mã cụ thể và xác định các lỗi phần mềm. Và nhân tiện, công ty cho biết thêm, đó là “mức độ khả năng” đã có sẵn rộng rãi trong các mô hình có thể truy cập công khai khác, bao gồm cả GPT-5.5 của OpenAI. Anthropic cho biết, nó cũng được các chuyên gia an ninh mạng sử dụng thường xuyên cho mục đích phòng thủ.
Lập luận rộng hơn của Anthropic là các biện pháp bảo vệ mạnh nhất của nó hoạt động thông qua các hệ thống phân loại độc lập hoạt động tách biệt với chính mô hình, nghĩa là ngay cả khi ai đó thuyết phục Fable tiếp tục nói chuyện sau khi bị từ chối, các biện pháp bảo vệ cơ bản chống lại các kết quả đầu ra nguy hiểm nhất vẫn được áp dụng.
Rõ ràng, không điều nào trong số đó đủ để ngăn chính phủ hành động và Anthropic không che giấu sự thất vọng của mình. Công ty viết: “Chúng tôi không đồng ý rằng việc phát hiện một bản bẻ khóa có khả năng xảy ra trong phạm vi hẹp sẽ là nguyên nhân dẫn đến việc thu hồi một mô hình thương mại đã được triển khai cho hàng trăm triệu người”. “Nếu tiêu chuẩn này được áp dụng trên toàn ngành, chúng tôi tin rằng về cơ bản nó sẽ tạm dừng tất cả việc triển khai mô hình mới cho tất cả các nhà cung cấp mô hình biên giới.”
Anthropic được nhiều người dự đoán sẽ theo đuổi đợt IPO trong năm nay và đã đặt phần lớn danh tiếng của mình vào việc trở thành giải pháp thay thế có ý thức an toàn cho các đối thủ của mình. Điều trớ trêu không hề lọt vào mắt những người quan sát là sự thận trọng rất cao mà Anthropic thể hiện trong việc hạn chế Mythos – thứ được quảng cáo là một mô hình nguy hiểm đến mức không thể công bố rộng rãi – giờ đây rõ ràng đã thu hút chính xác kiểu giám sát của chính phủ có thể làm gián đoạn hoạt động kinh doanh của họ nhiều nhất.
Ít nhất thì Sam Altman của OpenAI hẳn phải thích thú với điều này. Vào tháng 4, anh ấy nói với podcaster Ashlee Vance rằng việc Anthropic xử lý Mythos giống như “tiếp thị dựa trên nỗi sợ hãi”. Altman nói: “Rõ ràng đó là một hoạt động tiếp thị đáng kinh ngạc khi nói: ‘Chúng tôi đã chế tạo một quả bom. Chúng tôi sắp thả nó lên đầu bạn. Chúng tôi sẽ bán cho bạn một hầm tránh bom với giá 100 triệu USD”. Altman, người có công ty cũng được cho là sẽ theo đuổi IPO càng sớm càng tốt, không dự đoán chính phủ sẽ đóng cửa, nhưng ông đã xác định được điều gì đó đã quay trở lại gây khó khăn cho Anthropic vào lúc này, đó là khi bạn dành hàng tháng trời để nói với thế giới rằng AI của bạn là đặc biệt nguy hiểm, thì thế giới – bao gồm cả chính phủ Hoa Kỳ – có xu hướng lắng nghe.
Khi bạn mua hàng thông qua các liên kết trong bài viết của chúng tôi, chúng tôi có thể kiếm được một khoản hoa hồng nhỏ. Điều này không ảnh hưởng đến tính độc lập biên tập của chúng tôi.