خلاصه
- مشترکین ChatGPT Plus تست طعم سورا ۵ ثانیه ای دریافت می کنند، نه کلیپ های کامل ۲۰ ثانیه ای.
- ویدیوهای سورا به دلیل مسائل مربوط به انسجام و تجسم اعلانها، از دست میدهند.
- فناوری ویدیوی سورا نسبت به تولید تصویر، کمتر به بلوغ رسیده است و از Veo 2 عقب مانده است.
پس از ماهها آزمایش، فناوری تولید ویدیوی سورا OpenAI در دسترس عموم قرار گرفت. من مدتی را صرف بازی با این فناوری موردانتظار کردم و صادقانه بگویم که کمی غافلگیر شدم.
مشترکین ChatGPT Plus یک تست طعم ۵ ثانیه ای از Sora دریافت می کنند
مثل بقیه ChatGPT Plus مشترک، هنگامی که Sora در دسترس عموم قرار گرفت، من به ساخت ویدیوهای خودم دسترسی پیدا کردم. با این حال، این بیشتر شبیه یک تست کننده طعم است تا معامله واقعی. افرادی که به طور خاص برای Sora پرداخت می کنند، می توانند کلیپ هایی تا ۲۰ ثانیه بسازند و به وضوح بالاتر ۱۰۸۰p دسترسی داشته باشند. برای مشترکین پلاس، کلیپهای ۵ ثانیهای و کیفیت تا ۷۲۰p دریافت میکنید.
تنها کاری که باید انجام دهید این است که درخواست خود را در کادر متن قرار دهید، و چند ثانیه بعد یک کلیپ ویدیویی دارید، تقریباً چگونه میانه سفر یا سایر تولیدکنندگان تصویر هوش مصنوعی از دیدگاه کاربر کار می کنند.
حتی کلیپ های کوتاه هم خیلی ضربه خورده اند
یکی از دلایل اصلی محدود شدن تجربه “کامل” Sora به ۲۰ ثانیه این است که هنوز مشکلات قابل توجهی در مورد این فناوری در مورد انسجام وجود دارد. هر چه ویدیو بیشتر ادامه پیدا کند، اشتباهات و مماس های عجیب و غریب بیشتری می گیرد.
این موضوع به کنار، به سختی میتوانست آنچه را که در درخواستهایم قرار دادهام تجسم کنم. به عنوان مثال، من از آن کلیپی از یک سفینه فضایی در حال رفتن به تاب خواستم، که یک داستان علمی تخیلی بسیار رایج است.
خب، این چیزی است که من در ذهن داشتم، اما من آن را در ویدیوی نیمه کاره صحبت کردن سر یوتیوب خود قرار نمی دهم.
در زمان های دیگر، آن را بسیار نقطه در. مانند زمانی که من برای لوگوی کروم HTG در حال چرخش درخواست کردم.
آخرین مشکل سورا در حال حاضر با هر نوع فیزیک است. من ویدیوهای زیادی را دیدهام که حیواناتی را نشان میدهند که به روشی قابلاعتماد حرکت نمیکنند، و وقتی چیزی ساده درخواست کردم – بلبرینگی که روی ریل میدوید، این ویدیوی عجیب را به من داد.
حتی وقتی ویدیوها از نظر بصری عالی هستند، معمولاً این حرکت است که آن را به عنوان یک کلیپ تولید شده توسط هوش مصنوعی نشان می دهد.
سورا نسبت به تولید تصویر بسیار کمتر بالغ است
من نمی خواهم این تصور را ایجاد کنم که سورا چشمگیر نیست. این یک دستاورد بزرگ است، اما در واقع استفاده از آن شبیه های اولیه تولید تصویر است. اگر اعلام دقیق به موقع گوگل نبود، این چندان واضح نبود من ۲ را می بینم.
ویدیوهای آن سیستم بسیار بهتر از سورا به نظر می رسند، به خصوص وقتی صحبت از فیزیک اجسام متحرک درست به نظر می رسد.
فقط این مجموعه رسمی از گوگل را بررسی کنید.
در حالی که ممکن است کسی استدلال کند که اینها انتخاب شده اند، چند کاربر یوتیوب به Veo 2 دسترسی داشته اند، و به نظر می رسد ،نظر این است که Veo 2 با اختلاف بسیار زیاد در صدر قرار می گیرد.
در حال حاضر، این فقط یک اسباب بازی سرگرم کننده است
به لطف اشتراکی که قبلاً داشتم، کمی با Sora بازی کردم، اما مطمئناً نمیخواهم ماهیانه ۲۰۰ دلار برای این محصول در وضعیت فعلی آن بپردازم. خیلی بهتر است که به سادگی در یک سرویس ویدیوی سهام مشترک شوید.
نگاهی به آنچه که گوگل ساخته است، و با توجه به اینکه رقبای دیگری در این فضا وجود دارند هی جن و باند ML، انتظار دارم به رسانی ها و بهبودها سریع و مکرر باشد. اگر دلیل دیگری وجود ندارد جز اینکه OpenAI در بهبود ChatGPT بی امان است.
من هنوز آیندهای میانمدت را میبینم که در آن تولید ویدیوی هوش مصنوعی توانایی بسیار بیشتری را داشته باشد و حتی اجازه میدهد محتوای طولانیتر با پایبندی سریع و دقیق و توانایی ویرایش عناصر در یک صحنه تولید شود. با این حال، آن هنوز چند سال دیگر باقی مانده است، و در حال حاضر یک کنجکاوی جالب و البته غیرعملی است.