تیم Qwen علی‌بابا روز سه‌شنبه از محصول جدیدی به نام Qwen-AgentWorld رونمایی کرد؛ دو مدل که نه برای عمل کردن در محیط‌های عامل، بلکه برای پیش‌بینی نتایجی که این محیط‌ها ارائه می‌دهند، آموزش دیده‌اند. این مدل‌ها در هفت حوزه شامل MCP، جستجو، ترمینال، مهندسی نرم‌افزار، اندروید، وب و سیستم‌عامل با یک ساختار یکتا تطابق دارند.

رهایی این مدل‌ها به تلاش‌های اخیر علی‌بابا در زمینه عوامل خودران دامن می‌زند. Qwen3.7-Max که در ماه مه منتشر شد، بر پایه قابلیت اجرایی ۳۵ ساعته خودکار طراحی شده بود. این روش به تیم‌ها اجازه می‌دهد تا با محدودیت‌هایی که در آموزش عوامل خودران وجود دارد، مقابله کنند و در عوض توانمندی‌هایی را توسعه دهند که در محیط‌های واقعی به سختی قابل مشاهده‌اند.

به گفته محققان، مدل‌های آموزشی داخل شبیه‌سازها از مدل‌های آموزش دیده شده در محیط‌های واقعی برتری نشان داده‌اند. به‌رغم اینکه این نتایج می‌تواند مشکلاتی نیز داشته باشد، اما می‌تواند به تیم‌ها در توسعه فرآیندهای معاملاتی و تجاری کمک کند.

تحلیل و بررسی: با توجه به موفقیت Qwen-AgentWorld در پیش‌بینی نتایج محیط، به نظر می‌رسد که علی‌بابا در حال ایجاد یک تغییر اساسی در شیوه آموزش مدل‌های عامل است. این تکنیک می‌تواند به تیم‌ها کمک کند تا به‌راحتی و با کمترین هزینه به استعدادهای جدید در زمینه هوش مصنوعی دست یابند. پیش‌بینی می‌شود که با ادامه این رویکرد، کاربردهای عملی بیشتری را در صنایع مختلف شاهد خواهیم بود.

منبع: VentureBeat (مشاهده متن اصلی)