حتی با دیدن هم باور کردنی نیست
یک بار دیگر، OpenAI با انتشار یک هوش مصنوعی، اینترنت را به هم ریخته است. OpenAi یک مولد ویدیویی با نام Sora معرفی کردهاند که قادر به ایجاد ویدیوهای متفاوتی با کیفیتی شبیه به زندگی است. تشخیص برخی از نمونههای قبلی که منتشر شدهاند، از فیلمهای واقعی بسیار دشوار است.
کارکرد هوش مصنوعی Sora
هوش مصنوعی Sora یک مدل انتشار با معماری ترانسفورمر است، به این معنی که عملکرد شبکه عصبی آن به روشی مشابه ChatGPT است. OpenAI در تاریخ انتشار رسمی خود صراحتاً میخواهد به مردم نشان دهد چه چیزی در آینده برای هوش مصنوعی ممکن است.
در ادامه همه چیزهایی که تاکنون در مورد هوش مصنوعی Sora می دانیم، و به مدت زمان دسترسی عموم مردم به هوش مصنوعی Sora می پردازیم
Sora یک مدل هوش مصنوعی است که از طریق طراحان ChatGPT در OpenAI توسعه یافته است. “Text-to-Video” به این معنا است که هوش مصنوعی Sora میتواند پیامهای متنی را دریافت کرده و آنها را به کلیپهای ویدیویی کوتاه تبدیل کند.
اسن هوش مصنوعی بسیار شگفت انگیزاست، به این ویدیوی کاملاً تولید شده توسط هوش مصنوعی Sora از اختاپوس توجه کنید.:
در یک پست وبلاگی که این هفته منتشر شده، OpenAI توضیح میدهد: «Sora قادر است صحنههای پیچیده با شخصیتهای متعدد، انواع حرکت خاص، و جزئیات دقیق سوژه و پسزمینه را ایجاد کند.» این مدل نه تنها مطلب مورد درخواست کاربر را متوجه میشود، بلکه نحوه وجود آن در دنیای فیزیکی را نیز درک میکند..
چه کسی اکنون می تواند به هوش مصنوعی Sora دسترسی داشته باشد؟
در حال حاضر، هوش مصنوعی Sora توسط محققان امنیتی که مسئول اطمینان از ایمنی و امنیت آن پیش از انتشار عمومی و ارزیابی “خطرات حیاتی” هستند، در حال بررسی قرار دارد.
با این حال، OpenAI اعلام کرده است که به گروه کوچکی از هنرمندان تجسمی، فیلمسازان، و طراحان نیز دسترسی به Sora داده است.
متأسفانه، هیچ نشانه ای مبنی بر اینکه چه زمانی می توانیم برای استفاده از هوش مصنوعی Sora ثبت نام کنیم، وجود ندارد.
چه زمانی هوش مصنوعی Sora در دسترس عموم قرار می گیرد؟
متاسفانه در حال حاضر تاریخ انتشاری برای Sora وجود ندارد. تمام محتوایی که در 24 ساعت گذشته در اینترنت پخش شده است، از پست وبلاگ اعلامیه منتشر شده توسط OpenAI بیرون آمده است.
جالب اینجاست که به نظر نمیرسد OpenAI حتی نشانهای مبهم از زمانی که ممکن است به طور کلی در دسترس قرار گیرد ارائه کرده باشد – حتی نشانهای مبنی بر عرضه آن در سال جاری وجود ندارد.
این برای چنین اعلامیه بزرگی کاملاً غیرعادی است و می تواند نشان دهد که فاصله زیادی با انتشار عمومی دارد – اما باز هم OpenAI اذعان می کند که تحقیقات خود را زود به اشتراک می گذارد. با سرعتی که صنعت هوش مصنوعی در طول دو سال گذشته حرکت کرده است، تاریخ واقعی راهاندازی را هر کسی حدس میزند.
هوش مصنوعی Sora چگونه کار می کند؟
OpenAI گفت: «Sora یک مدل معماری ویدیو است که با شروع با یک ویدیو که شبیه نویز استاتیک است، یک ویدیو تولید میکند و به تدریج با حذف نویز در طی مراحل مختلف، آن را تغییر میدهد».
این فناوری مشابه مدلهای زبانی خانواده GPT که ربات چت این شرکت، ChatGPT را تامین میکند، کار میکند. همه آنها از معماری “ترانسفورماتور” استفاده می کنند – نوعی شبکه عصبی که ورودی ها را می گیرد و آنها را به خروجی “تبدیل” می کند. آنها همچنین از عناصر DALLE-3 مانند سیستم بازنویسی استفاده کرده اند.
OpenAI ویدیوها و تصاویر Sora را به عنوان واحدهای داده – یا “وصله” تغذیه کرده است. «با یکسان کردن نحوه نمایش دادهها» روزهای OpenAI، «میتوانیم ترانسفورماتورهای انتشار را بر روی طیف وسیعتری از دادههای بصری نسبت به قبل آموزش دهیم، که مدتها، وضوحها و نسبتهای ابعادی متفاوتی را در بر میگیرد.