محققان متا، گوگل و چند دانشگاه، چارچوبی به نام AutoTTS ساختهاند که کار دستی و حدس و گمان در طراحی استراتژیهای افزایش توان استدلال مدلهای زبانی بزرگ را حذف میکند. تا به حال، مهندسان مجبور بودند قوانین پیچیدهای برای زمان انشعاب، عمقیابی یا توقف استدلال مدل بنویسند که محدود به شهود انسانی و پرخطا بود. با AutoTTS، یک مدل کاوشگر (مثل Claude Code) به صورت خودکار هزاران سناریو را در یک محیط آفلاین آزمایش میکند و بهینهترین قانون تخصیص منابع را پیدا میکند.
نتیجه این اتوماسیون هوشمند، یک کنترلکننده جدید به نام «کنترلکننده مومنتوم اطمینان» (Confidence Momentum Controller) است که مصرف توکن را در آزمایشهای عملی تا ۶۹.۵ درصد کاهش داده بدون اینکه دقت مدل افت کند. این کنترلکننده با مکانیزمهای غیرشهودی مثل توقف بر اساس میانگین متحرک اطمینان (نه اطمینان لحظهای) و تخصیص بودجه محاسباتی به شاخههایی که با پاسخ غالب همسو هستند، کار میکند. در بنچمارکهای ریاضی AIME24 و AIME25 و GPQA، نه تنها هزینه را تا یک سوم کاهش داد، بلکه در برخی موارد دقت را هم بهبود بخشید.
برای تیمهای سازمانی، خبر خوب این است که کل فرآیند کشف استراتژی برای یک مدل خاص فقط ۳۹.۹۰ دلار و ۱۶۰ دقیقه زمان برده است. این یعنی دیگر برای بهینهسازی استدلال هوش مصنوعی نیازی به بودجههای تحقیقاتی عظیم نیست. کد کامل AutoTTS و کنترلکننده جدید روی گیتهاب منتشر شده و میتواند به راحتی جایگزین کنترلکنندههای دستی فعلی شود.
تحلیل و بررسی: این دستاورد نشان میدهد که «طراحی استراتژی توسط هوش مصنوعی» به جای مهندسی دستی، به زودی به یک استاندارد تبدیل میشود و شکاف بین هزینه و کارایی را پر میکند. با توجه به افزایش هزینههای استقرار مدلهای استدلالی، ابزارهایی مثل AutoTTS میتوانند کسبوکارها را از وابستگی به تیمهای تحقیقاتی بزرگ رها کنند و بهینهسازی بومی را ممکن سازند. اما نگرانی اصلی اینجاست: اگر کاوشگر خودرو در محیط ناآشنا تصمیمات اشتباه بگیرد، آیا نظارت انسانی همچنان کافی خواهد بود؟
منبع: VentureBeat (مشاهده متن اصلی)
n8n.ir/iit1146
کپی شد!