گوگل مدل تولید تصویر مبتنی بر هوش مصنوعی (AI) بومی خود را با دو قابلیت جدید ارتقا داده است.این قابلیت ها در کنفرانس سالانه Cloud Next در لاس وگاس اعلام شد. ابزار هوش مصنوعی یک محصول متمرکز بر سازمان است که در پلتفرم توسعه دهندگان Vertex AI موجود است و می تواند به ایجاد عناصر لوگو و سایر منابع بصری برای شرکت ها کمک کند. در حال حاضر، این غول فناوری قابلیتهای تولید ویدئو را نیز به مدل هوش مصنوعی اضافه کرده است و میتواند تا چهار ثانیه ویدیو تولید کند.
ویژگی تولید ویدیو توسط این شرکت تصویر متن به زنده نامیده می شود. با این قابلیت، Imagen 2 می تواند ویدیوهای چهار ثانیه ای را از پیام های متنی ایجاد کند. این ویدیوها طیف وسیعی از زوایای دوربین و حرکت خواهند داشت. طبق گزارش VentureBeat، ویدئوهای تولید شده ۲۴ فریم در ثانیه و با وضوح ۳۶۰ در ۶۴۰ پیکسل ارائه خواهند شد. گویا گوگل برنامه هایی برای بهبود این معیارها در آینده دارد.
همچنین گوگل ویدیویی را در یوتیوب منتشر کرد تا قابلیت های مدل هوش مصنوعی خود را به نمایش بگذارد. طبق گزارش ها، توماس کوریان، مدیر عامل گوگل کلود، در یک بیانیه مطبوعاتی گفته است که تصاویر متحرک می توانند تعامل کاربران را بهبود بخشند. به نظر می رسد کیفیت تولید مشابه Runway AI و Pika 1.0 باشد. هر دو برای عموم و همچنین شرکت ها در دسترس هستند.
به غیر از تولید ویدئو، Imagen 2 دارای قابلیت inpainting و outpainting نیز شده است. این به کاربران این امکان را می دهد که به جای بازسازی کل آن با یک اعلان جدید، قسمت خاصی از تصویر را ویرایش کنند. ایجاد تغییرات دانه ای در یک تصویر روشی ساده تر برای رسیدن به نتیجه دلخواه است. این ویژگی همچنین توسط Copilot مایکروسافت و DALL-E 3 از OpenAI ارائه شده است.