CoreTech

Nano Banana 2

گوگل از Nano Banana 2 با عنوان Gemini 3.1 Flash image رونمایی کرد، حفظ عملکرد با سرعت بالا

ابوالفضل | ۱۵ ساعت پیش

گوگل از مدل جدید تولید تصویر خود با نام Nano Banana 2 با عنوان فنی Gemini 3.1 Flash Image رونمایی کرد؛ مدلی که قابلیت‌های پیشرفته نسخه پرو را با سرعت پردازشی در سطح Flash ترکیب می‌کند. این مدل دانش گسترده دنیای واقعی، کیفیت بصری بالا و توان استدلالی ارتقایافته را در کنار تولید سریع ارائه می‌دهد و قرار است تجربه ساخت و ویرایش تصویر را در مقیاسی گسترده‌تر متحول کند.

نمونه دیاگرام‌های تولید شده با Nano Banana 2:

مدل اولیه Nano Banana در آگوست سال گذشته به‌عنوان موتور تصویری جمنای معرفی شد و به سرعت به پدیده‌ای وایرال تبدیل شد و استانداردهای تولید و ادیت تصویر را بازتعریف کرد. در نوامبر همان سال، نسخه Nano Banana Pro با تمرکز بر هوش پیشرفته‌تر و کنترل خلاقانه در سطح استودیو عرضه شد تا کاربران حرفه‌ای بتوانند خروجی‌هایی دقیق‌تر و قابل‌کنترل‌تر تولید کنند.

به گفته گوگل، نانو بنانا ۲ از پایگاه دانش دنیای واقعی جمنای بهره می‌گیرد و با اطلاعات و تصاویر به‌روز حاصل از جست‌وجوی وب تغذیه می‌شود تا سوژه‌های خاص را با دقت بیشتری رندر کند. این درک عمیق امکان تولید اینفوگرافیک، تبدیل یادداشت‌ها به دیاگرام و ایجاد مصورسازی داده را فراهم می‌کند. همچنین رندر دقیق و خوانای متن و قابلیت ترجمه و بومی‌سازی نوشته‌های داخل تصویر نیز فراهم شده است.

نمونه تصاویر تولید شده Nano Banana 2:

هوش مصنوعی جدید گوگل فاصله میان سرعت و وفاداری بصری را به‌طور چشمگیری کاهش داده و تصاویر فوتورئالیستی با نورپردازی زنده‌تر، بافت‌های غنی‌تر و جزئیات شارپ‌تر ارائه می‌کند. Nano Banana 2 می‌تواند شباهت ظاهری حداکثر پنج کاراکتر و دقت نمایش تا چهارده شیء را در یک گردش‌کار حفظ کند. همچنین پیروی دقیق‌تر از دستورهای پیچیده، ثبت ظرافت‌های مفهومی و کنترل نسبت تصویر و رزولوشن از ۵۱۲ پیکسل تا 4K را ممکن می‌سازد.

Nano Banana 2 از امروز در محصولات مختلف گوگل عرضه می‌شود. در اپلیکیشن Gemini جایگزین نسخه Pro در مدل‌های Fast، Thinking و Pro خواهد شد و مشترکان Google AI Pro و Ultra می‌توانند از طریق منوی سه‌نقطه تصاویر را با نسخه پرو بازتولید کنند. این مدل در Search شامل AI Mode و Lens، در اپلیکیشن Google و مرورگرهای موبایل و دسکتاپ، همچنین در ۱۴۱ کشور و منطقه جدید و هشت زبان اضافه در دسترس است.

نمونه اینفوگرافیک‌های تولید شده Nano Banana 2:

مدل تصویر رساز جدید گوگل به‌صورت پیش‌نمایش در AI Studio و Gemini API عرضه شده و قیمت‌گذاری آن اعلام شده است؛ همچنین در Google Antigravity و Google Cloud از طریق Gemini API در Vertex AI در دسترس قرار دارد. در سرویس Flow به‌عنوان مدل پیش‌فرض تولید تصویر برای همه کاربران بدون نیاز به اعتبار فعال شده و در Google Ads نیز هنگام ساخت کمپین‌ها پیشنهادهای هوشمند ارائه می‌دهد.

گوگل هم‌زمان رویکرد اصالت‌سنجی خود را تقویت کرده و فناوری SynthID را با استاندارد سازگار C2PA Content Credentials ترکیب می‌کند تا مشخص شود نه‌تنها آیا از هوش مصنوعی استفاده شده، بلکه چگونه استفاده شده است. به گفته این شرکت، قابلیت تأیید SynthID از زمان عرضه در نوامبر تاکنون بیش از ۲۰ میلیون بار در اپلیکیشن Gemini برای شناسایی تصاویر، ویدیو و صوت تولیدشده استفاده شده و پشتیبانی C2PA نیز به‌زودی اضافه می‌شود.

منبع

ابوالفضل | ۱۵ ساعت پیش

دیدگاهتان را بنویسید