
گوگل یک مدل جدید ویدیوی هوش مصنوعی برای توسعهدهندگان دارد و این مدل ارزانتر – به طور قابل توجهی ارزانتر – از مدلهای قبلی است.
Veo 3.1 Lite این هفته از طریق API جیمینای (Gemini) با هزینهای کمتر از نصف Veo 3.1 Fast، گزینه میانی در مجموعه تولید ویدیوی گوگل، راهاندازی شد. این مدل از تبدیل متن به ویدیو (Text-to-Video) و تصویر به ویدیو (Image-to-Video) در هر دو فرمت افقی (16:9) و عمودی (9:16) با وضوح 720p و 1080p پشتیبانی میکند. مدت زمان ویدیوها قابل تنظیم در 4، 6 یا 8 ثانیه است که هزینه بر اساس آن مقیاسپذیر خواهد بود.
برای درک بهتر: Veo 3.1 قبلاً حدود 0.40 دلار برای هر ثانیه ویدیوی تولید شده با صدا از طریق API هزینه داشت، در حالی که Veo 3.1 Fast حدود 0.15 دلار در هر ثانیه بود. نسخه Lite این کف قیمت را برای 720p به 0.05 دلار در هر ثانیه کاهش میدهد— که در نهایت برنامههای ویدیویی با حجم بالا را برای سازندگان کوچکتر از نظر مالی مقرونبهصرفه میکند.
ما این مدل را امتحان کردیم و تولیدات آن بسیار سریع و بدون افت کیفیت قابل توجهی انجام شد. یک ویدیوی 8 ثانیهای (طولانیترین مدت موجود) کمتر از 1 دقیقه طول کشید تا تولید شود. انطباق با دستور (prompt adherence) قابل قبول بود، با یک نقص جزئی در حروفنویسی. به غیر از این، تفاوت بین Veo 3.1 Lite و Veo 3.1 Fast به اندازه تفاوت بین Veo 3.1 Fast و نسخه کامل اصلی Veo 3.1 محسوس نیست.
گوگل فقط به قیمتگذاری رقابتی مدل جدید خود بسنده نکرد. در 7 آوریل، قیمت Veo 3.1 Fast نیز کاهش مییابد. این شرکت اعلام کرد که این اقدام "مجموعه مدلهای Veo 3.1 را کامل میکند و به توسعهدهندگان انعطافپذیری بر اساس نیازهایشان میدهد." پیام به سازندگان روشن است: رده خود را انتخاب کنید، نه سقف خود را.
این موضوع اهمیت دارد زیرا هزینه همیشه راز پنهان تولید ویدیوی هوش مصنوعی بوده است. خروجیها در دموها عالی به نظر میرسند اما معمولاً اینها تولیدات دستچین شده هستند و هوش مصنوعی ویدیو هنوز برای استفاده مداوم بیش از حد تصادفی است.
OpenAI این موضوع را به سختی دریافت. طبق گزارشها، سورا (Sora) روزانه 15 میلیون دلار میسوزاند و این شرکت هفته گذشته اعلام کرد که این محصول را به طور کامل تعطیل میکند. OpenAI اکنون "به تحقیقات شبیهسازی جهان برای پیشبرد رباتیک روی آورده است" - که این یک روش بسیار شرکتی برای گفتن این است که پروژه موفق نشد. یک قرارداد 1 میلیارد دلاری با دیزنی نیز در این میان از بین رفت.
Veo 3 در می 2025 به عنوان پر سر و صداترین نمایش هوش مصنوعی گوگل راهاندازی شد، که به عنوان یک ژنراتور همهکاره موقعیتیابی شده بود که نه تنها ویدیو بلکه موسیقی متن کامل — نویز محیط، افکتها و حتی دیالوگ — تولید میکرد. سپس Veo 3.1 در اکتبر آمد و با سورا 2 (Sora 2) رو در رو شد. کیفیت چشمگیر بود، اما برچسب قیمت آن برای هر کسی که قصد عرضه محصولی در مقیاس وسیع را داشت، چندان دعوتکننده نبود.
رقیبان چینی این شکاف را زودتر شناسایی کردند. Kling AI از Kuaishou، تولید ویدیوی قابل مقایسه را با قیمتهای بسیار ارزانتر از طرح 250 دلاری Ultra گوگل و حتی گزینه 20 دلاری Pro ارائه کرده است. Hunyuan Video از Tencent حتی فراتر رفت و یک مدل متن باز را به صورت رایگان منتشر کرد، که همزمان با چرخه تبلیغاتی راهاندازی سورا در سال 2024 توسط OpenAI بود. بازار چین فقط بر سر کیفیت رقابت نمیکند. این بازار بر سر اقتصاد رقابت میکند و برای مدتی در این بحث پیروز بوده است.
در حوزه حرفهای، ابزارهایی مانند PAI از Utopai یک جایگاه کاملاً متفاوت را ایجاد میکنند: داستانسرایی سینمایی بلند مدت با شخصیتهای ثابت، استوریبردهای دقیق، و ویرایش مبتنی بر هوش مصنوعی در سطح صحنه. PAI ارزان نیست – 100 دلار برای 10,000 اعتبار که به سرعت مصرف میشوند – اما نشان میدهد که سازندگان جدی به کجا میروند. آنها کنترل میخواهند، نه فقط تولید.
Veo 3.1 Lite قصد ندارد خط تولید سینمایی PAI باشد، و قصد رقابت با Kling را از نظر قیمت ندارد. این مدل میانگین را هدف قرار داده است: توسعهدهندگانی که نیاز دارند ویژگیهای ویدیویی را در مقیاس گسترده بدون هدر دادن اعتبارات API در هر تکرار، عرضه کنند. این مدل نقش گوگل را به عنوان زیرساختی برای نسل بعدی برنامههایی ایفا میکند که ویدیو را به عنوان یک جزء استاندارد در نظر میگیرند، نه یک ترفند لوکس.
اگر کاهش قیمت 7 آوریل برای Veo 3.1 Fast طبق وعده انجام شود، هزینه ساخت با ویدیوی هوش مصنوعی در کل مجموعه گوگل در یک هفته کاهش مییابد.