گوگل مدل Gemini 2.5 Computer Use را معرفی کرد؛ هوش مصنوعی با رفتار انسانی در وب

گوگل از جدیدترین مدل هوش مصنوعی خود با نام Gemini 2.5 Computer Use رونمایی کرد؛ مدلی که به هوش مصنوعی اجازه میدهد مانند یک انسان با وبسایتها و رابطهای کاربری تعامل داشته باشد. این مدل اکنون در قالب پیشنمایش عمومی از طریق Gemini API در پلتفرمهای Google AI Studio و Vertex AI در دسترس توسعهدهندگان قرار دارد.
مدل جدید بر پایه قابلیتهای درک تصویری و استدلالی جمنای ۲.۵ پرو ساخته شده و میتواند مجموعهای از وظایف مبتنی بر مرورگر مانند کلیک، تایپ، اسکرول، باز کردن منوها و حرکت میان آدرسهای مختلف را انجام دهد. گوگل میگوید این مدل در بنچمارکها عملکردی برتر و با تأخیر کمتر نسبت به رقبا دارد.
برخلاف مدلهای سنتی که از API برای تعامل استفاده میکنند، این مدل از تصاویر رابط کاربری برای تحلیل محیط دیجیتال بهره میبرد و بر اساس آن، اقدامات خاصی مانند کلیک یا تایپ را انجام میدهد. در این فرآیند، مدل یک وظیفه، تصویری از محیط و سابقه اقدامات اخیر را دریافت میکند و سپس اقدام مناسب را انجام میدهد. این عمل در سمت کاربر اجرا شده و تصویر جدیدی برای ادامه تعامل ارسال میشود.
گوگل در نمایش عملکرد مدل، نمونههایی از مرتبسازی یادداشتها روی وایتبرد دیجیتال و انتقال دادههای حیوانات خانگی از یک وبسایت به سیستم مدیریت مشتری ارائه کرد. ویدیوهای نمایشدادهشده بهصورت تسریعشده پخش شدند تا عملکرد مدل در زمان واقعی نشان داده شود.
در حال حاضر، این مدل از ۱۳ نوع اقدام مختلف پشتیبانی میکند و بیشترین کارایی را در مرورگرهای وب دارد. گوگل اعلام کرده که مدل هنوز برای وظایف سطح سیستمعامل دسکتاپ بهینه نشده، اما در آزمایشهای موبایلی نتایج امیدوارکنندهای داشته. برای جلوگیری از سوءاستفاده، هر اقدام پیشنهادی مدل پیش از اجرا توسط یک سیستم ایمنی داخلی بررسی میشود. توسعهدهندگان همچنین میتوانند برخی اقدامات را محدود کرده یا برای فعالیتهای حساس مانند تراکنشهای مالی، تأیید کاربر را الزامی کنند.
در حال حاضر، چندین تیم داخلی گوگل از این مدل در محیطهای تولیدی استفاده میکنند؛ از جمله در بخشهای Search و Firebase برای آزمون رابط کاربری و خودکارسازی وظایف. توسعهدهندگان خارج از گوگل نیز از طریق برنامه دسترسی زودهنگام، از مدل برای ساخت ابزارهای خودکارسازی و دستیارهای هوشمند بهره گرفتهاند.





