محققان متا، گوگل و چند دانشگاه، چارچوبی به نام AutoTTS ساخته‌اند که کار دستی و حدس و گمان در طراحی استراتژی‌های افزایش توان استدلال مدل‌های زبانی بزرگ را حذف می‌کند. تا به حال، مهندسان مجبور بودند قوانین پیچیده‌ای برای زمان انشعاب، عمق‌یابی یا توقف استدلال مدل بنویسند که محدود به شهود انسانی و پرخطا بود. با AutoTTS، یک مدل کاوشگر (مثل Claude Code) به صورت خودکار هزاران سناریو را در یک محیط آفلاین آزمایش می‌کند و بهینه‌ترین قانون تخصیص منابع را پیدا می‌کند.

نتیجه این اتوماسیون هوشمند، یک کنترل‌کننده جدید به نام «کنترل‌کننده مومنتوم اطمینان» (Confidence Momentum Controller) است که مصرف توکن را در آزمایش‌های عملی تا ۶۹.۵ درصد کاهش داده بدون اینکه دقت مدل افت کند. این کنترل‌کننده با مکانیزم‌های غیرشهودی مثل توقف بر اساس میانگین متحرک اطمینان (نه اطمینان لحظه‌ای) و تخصیص بودجه محاسباتی به شاخه‌هایی که با پاسخ غالب همسو هستند، کار می‌کند. در بنچمارک‌های ریاضی AIME24 و AIME25 و GPQA، نه تنها هزینه را تا یک سوم کاهش داد، بلکه در برخی موارد دقت را هم بهبود بخشید.

برای تیم‌های سازمانی، خبر خوب این است که کل فرآیند کشف استراتژی برای یک مدل خاص فقط ۳۹.۹۰ دلار و ۱۶۰ دقیقه زمان برده است. این یعنی دیگر برای بهینه‌سازی استدلال هوش مصنوعی نیازی به بودجه‌های تحقیقاتی عظیم نیست. کد کامل AutoTTS و کنترل‌کننده جدید روی گیت‌هاب منتشر شده و می‌تواند به راحتی جایگزین کنترل‌کننده‌های دستی فعلی شود.

تحلیل و بررسی: این دستاورد نشان می‌دهد که «طراحی استراتژی توسط هوش مصنوعی» به جای مهندسی دستی، به زودی به یک استاندارد تبدیل می‌شود و شکاف بین هزینه و کارایی را پر می‌کند. با توجه به افزایش هزینه‌های استقرار مدل‌های استدلالی، ابزارهایی مثل AutoTTS می‌توانند کسب‌وکارها را از وابستگی به تیم‌های تحقیقاتی بزرگ رها کنند و بهینه‌سازی بومی را ممکن سازند. اما نگرانی اصلی اینجاست: اگر کاوشگر خودرو در محیط ناآشنا تصمیمات اشتباه بگیرد، آیا نظارت انسانی همچنان کافی خواهد بود؟

منبع: VentureBeat (مشاهده متن اصلی)