تیم Qwen علیبابا روز سهشنبه از محصول جدیدی به نام Qwen-AgentWorld رونمایی کرد؛ دو مدل که نه برای عمل کردن در محیطهای عامل، بلکه برای پیشبینی نتایجی که این محیطها ارائه میدهند، آموزش دیدهاند. این مدلها در هفت حوزه شامل MCP، جستجو، ترمینال، مهندسی نرمافزار، اندروید، وب و سیستمعامل با یک ساختار یکتا تطابق دارند.
رهایی این مدلها به تلاشهای اخیر علیبابا در زمینه عوامل خودران دامن میزند. Qwen3.7-Max که در ماه مه منتشر شد، بر پایه قابلیت اجرایی ۳۵ ساعته خودکار طراحی شده بود. این روش به تیمها اجازه میدهد تا با محدودیتهایی که در آموزش عوامل خودران وجود دارد، مقابله کنند و در عوض توانمندیهایی را توسعه دهند که در محیطهای واقعی به سختی قابل مشاهدهاند.
به گفته محققان، مدلهای آموزشی داخل شبیهسازها از مدلهای آموزش دیده شده در محیطهای واقعی برتری نشان دادهاند. بهرغم اینکه این نتایج میتواند مشکلاتی نیز داشته باشد، اما میتواند به تیمها در توسعه فرآیندهای معاملاتی و تجاری کمک کند.
تحلیل و بررسی: با توجه به موفقیت Qwen-AgentWorld در پیشبینی نتایج محیط، به نظر میرسد که علیبابا در حال ایجاد یک تغییر اساسی در شیوه آموزش مدلهای عامل است. این تکنیک میتواند به تیمها کمک کند تا بهراحتی و با کمترین هزینه به استعدادهای جدید در زمینه هوش مصنوعی دست یابند. پیشبینی میشود که با ادامه این رویکرد، کاربردهای عملی بیشتری را در صنایع مختلف شاهد خواهیم بود.
منبع: VentureBeat (مشاهده متن اصلی)
n8n.ir/iit297h
کپی شد!