Rẻ hơn, nhanh hơn và mang tính văn hóa hơn, AI video của Avataar được xây dựng cho quy mô của Ấn Độ

Sản lượng mô hình AI của Ấn Độ chậm so với Mỹ, Châu Âu và Trung Quốc. Chỉ có một số công ty khởi nghiệp phát hành mô hình và hầu hết trong số đó là mô hình ngôn ngữ lớn hoặc mô hình giọng nói. Để khuyến khích phát triển hơn nữa, chính phủ đã khởi động Sứ mệnh AI Ấn Độ, một sáng kiến ​​trị giá khoảng 1,2 tỷ USD – cùng với những sáng kiến ​​khác – cung cấp cho các công ty khởi nghiệp được chọn quyền truy cập vào tính toán GPU được trợ cấp để đổi lấy việc phát hành công khai mô hình của họ. Một trong 12 công ty khởi nghiệp được chọn tham gia chương trình, Avataar AI, đã ra mắt một mô hình video mới có tên Varya được xây dựng để hiểu bối cảnh địa phương – chẳng hạn như xác định các lễ hội, ẩm thực và quần áo khác nhau.

Công ty khởi nghiệp được Peak XV hậu thuẫn, tập trung vào việc tạo các công cụ video cho thương mại điện tử, đã không xây dựng Varya từ đầu. Nó bắt đầu với Wan 2.2, một mô hình tạo video có sẵn công khai do Alibaba phát hành và sử dụng một kỹ thuật gọi là chưng cất – về cơ bản là nén các khả năng của mô hình thành một phiên bản gọn gàng hơn, nhanh hơn được tối ưu hóa cho các trường hợp sử dụng cụ thể của Avataar. Kết quả là một mô hình chạy theo bốn bước thay vì 50 bước của Wan 2.2, tạo ra video nhanh hơn 10 lần và với chi phí thấp hơn.

Nói một cách cụ thể: sử dụng GPU NVIDIA H200, Varya có thể tạo clip 720p dài 5 giây trong 45 giây, so với 1.230 giây của Wan 2.2.

Khía cạnh nổi bật nhất của Varya có thể là giá của nó. Công ty có kế hoạch tính phí ₹0,48 (0,005 USD) mỗi giây video trên dịch vụ lưu trữ của mình – rẻ hơn nhiều so với các mô hình như Veo, Kling, Luma và Runway, thường tính phí 0,10 USD trở lên mỗi giây. Đó là sự chênh lệch giá khoảng 20 lần.

“Ấn Độ là thị trường ưu tiên video. Chúng tôi thấy điều này trên mọi sản phẩm internet tiêu dùng lớn ở Ấn Độ: video chiếm ưu thế hơn văn bản. Các mô hình video AI hiện tại quá đắt để sử dụng trên quy mô dân số ở Ấn Độ. Nếu video AI sẽ tiếp cận được sinh viên, giáo viên, MSME, người sáng tạo, doanh nghiệp và dịch vụ công thì chi phí phải giảm đáng kể. Chi phí là cơ hội lớn nhất cho việc áp dụng AI ở Ấn Độ”, Rajan Anandan, giám đốc điều hành của Peak XV nói với TechCrunch.

Các mô hình tạo hình ảnh và video thường bỏ sót các sắc thái văn hóa và tạo ra các kết quả đầu ra rập khuôn hoặc chung chung – một vấn đề mà TechCrunch đã báo cáo trước đây. Avataar AI cho biết họ đã sử dụng dữ liệu được tuyển chọn để huấn luyện Varya nhận biết các sắc thái văn hóa bao gồm ẩm thực, quần áo, kiến ​​trúc và lễ hội.

Varya sẽ được phát hành dưới dạng mô hình mở trên cổng AI Kosh của Ấn Độ – kho lưu trữ tập trung của chính phủ Ấn Độ dành cho các mô hình và bộ dữ liệu AI có sẵn công khai – cùng với dữ liệu đào tạo của nó, nghĩa là các nhà phát triển có thể tự lưu trữ hoặc sửa đổi nó theo nhu cầu riêng của họ. Avataar cũng có kế hoạch cung cấp mô hình này cho khách hàng doanh nghiệp của mình và cho biết mô hình này sẵn sàng hợp tác với các công cụ video bao gồm Higgsfield và Adobe Firefly. Bất kỳ ai cũng có thể dùng thử ngay bây giờ trên trang web của mình bằng cách sử dụng lời nhắc bằng văn bản hoặc hình ảnh tham khảo.

Sự ra mắt của Varya phản ánh sự đánh đổi cơ bản trong tham vọng AI của Ấn Độ. Những người kỳ cựu trong ngành đã lưu ý rằng Ấn Độ có thể tạo dấu ấn trong lĩnh vực AI bằng cách tạo ra các ứng dụng và hệ sinh thái nhà phát triển mạnh mẽ thay vì cạnh tranh trên các mô hình nền tảng. Và có lý do cho chủ nghĩa thực dụng đó: việc phát triển mô hình ở Ấn Độ chậm hơn so với các đối thủ toàn cầu do thiếu khả năng tính toán và tính sẵn có của dữ liệu chất lượng hạn chế.

Sứ mệnh AI của Ấn Độ cũng là một phần trong nỗ lực rộng lớn hơn của chính phủ nhằm thu hẹp khoảng cách đó. Năm ngoái, họ đã chọn 12 công ty khởi nghiệp – trong số đó có Avataar AI – để phát triển các mô hình AI và cung cấp cho họ khả năng tính toán tiết kiệm chi phí. Đầu năm nay, Bộ trưởng CNTT Ashwini Vaishnaw cho biết Ấn Độ đặt mục tiêu thu hút 200 tỷ USD đầu tư vào AI vào năm 2028 và tăng hơn gấp đôi công suất GPU trong vòng sáu tháng.

Khi bạn mua hàng thông qua các liên kết trong bài viết của chúng tôi, chúng tôi có thể kiếm được một khoản hoa hồng nhỏ. Điều này không ảnh hưởng đến tính độc lập biên tập của chúng tôi.

Bài viết liên quan

Chuyên Mục: Tin tức
Bài trước
Equal AI huy động được 30 triệu USD để sàng lọc cuộc gọi để người Ấn Độ không cần phải làm vậy
Bài sau
Luật giám sát của Hoa Kỳ lần đầu tiên hết hiệu lực sau khi các nhà lập pháp bác bỏ sự lựa chọn gây tranh cãi của Trump để lãnh đạo các cơ quan gián điệp