CoreTech

Qwen Image 2512

علی‌بابا از Qwen Image 2512 با ادعای رقابت با نانو بنانا پرو رونمایی کرد

ابوالفضل | ۵ ماه پیش

علی‌بابا نسخه جدیدی از مدل متن‌به‌تصویر متن‌باز خود با نام Qwen Image 2512 منتشر کرده که تمرکز اصلی آن بر طبیعی‌تر شدن خروجی تصاویر است. این شرکت اعلام کرده نسخه تازه می‌تواند چهره انسان را با جزئیات ظریف‌تر تولید کند و مشکلات ظاهری مصنوعی، که در نسل‌های قبلی دیده می‌شد، تا حد زیادی کاهش یافته است و تجربه بصری باورپذیرتری را در کاربردهای عمومی ارائه می‌کند.

بهبودهای اعمال‌شده تنها به بازتولید چهره محدود نیست و نمایش متن در تصاویر نیز ارتقا یافته است. علی‌بابا می‌گوید نوشته‌ها در اینفوگرافیک‌ها و فایل‌های ارائه خواناتر و دقیق‌تر ظاهر می‌شوند. علاوه بر این، عناصر طبیعی مانند مناظر، پوشش حیوانات و بافت‌های محیطی با جزئیات ریزتر و جلوه‌ای واقعی‌تر تولید می‌شوند که این موضوع کیفیت کلی خروجی‌ نهایی‌را به‌طور محسوسی در پروژه‌های بصری افزایش می‌دهد.

مقایسه‌ی Qwen Image 2512 با Qwen Image

طبق اعلام علی‌بابا، Qwen Image 2512 در بیش از ده‌هزار آزمون کور انجام‌شده در پلتفرم AI Arena رتبه چهارم کلی را کسب کرده است. با این نتیجه Qwen Image 2512 به‌عنوان بالاترین مدل متن‌باز جدول شناخته می‌شود و در رقابتی مستقیم با گزینه‌هایی مانند HunyuanImage 3.0، Z image و Flux.2 قرار دارد. این جایگاه نشان‌دهنده عملکرد پایدار مدل در سناریوهای متنوع ارزیابی است و اعتماد جامعه توسعه‌دهندگان را تقویت می‌کند.

مدل Qwen Image 2512 هم‌اکنون به‌صورت عمومی از طریق پلتفرم‌های Hugging Face و ModelScope منتشر شده است. کاربران همچنین می‌توانند قابلیت‌های آن را مستقیماً در Qwen Chat آزمایش کنند. علی‌بابا جزئیات فنی، گزارش تخصصی و توضیحات تکمیلی مربوط به این نسخه را در وبلاگ رسمی و Tech Report خود ارائه داده است تا توسعه‌دهندگان و پژوهشگران دسترسی شفاف‌تری به اطلاعات داشته باشند و امکان بررسی عمیق‌تر فراهم شود.

منبع

ابوالفضل | ۵ ماه پیش

دیدگاهتان را بنویسید