فریم‌ورک MeMo MIT؛ توانایی ارتقاء LLM بدون نیاز به retraining!

یک چالش بزرگ برای هوش مصنوعی در سازمان‌ها، به‌روز‌رسانی دانش پس از آموزش مدل‌های زبان بزرگ (LLM) است. فریم‌ورک جدید MeMo از محققین چندین دانشگاه، این مشکل را با استفاده از یک مدل حافظه کوچکتر که به طور مستقل از LLM اصلی عمل می‌کند، حل کرده است. این ساختار ماژولار می‌تواند هم با مدل‌های متن باز و هم بسته کار کند و از پیچیدگی‌های معمول در روش‌های یادگیری مجدد کامل جلوگیری کند. آزمایش‌ها نشان داده‌اند که MeMo قادر به مدیریت پرسش‌های پیچیده است، حتی زمانی که داده‌ها ناکارامد باشند.

مدل MeMo شامل دو بخش اصلی است: یک مدل حافظه که به صورت خاص برای کدگذاری دانش جدید طراحی شده و یک مدل اجرایی که به عنوان موتور استدلال عمل می‌کند. این مدل‌ها به گونه‌ای طراحی شده‌اند که به‌طور مؤثر با هم کار کنند و به پاسخ‌گویی به پرسش‌ها بپردازند. از جمله قابلیت‌های قابل توجه این فریم‌ورک، امکان ارتقاء سریع عملکرد مدل بدون نیاز به آموزش مجدد، با تغییر مدل اجرایی است. به طور خاص، تغییر از یک مدل متن باز به یک مدل اختصاصی عملکرد MeMo را تا ۲۶ درصد افزایش داد.

MeMo همچنین با مدیریت به‌روز‌رسانی‌های مداوم دانش، به سازمان‌ها کمک می‌کند تا به‌روز باشند و از هزینه‌های گزاف آموزشی جلوگیری کنند. این مدل به گونه‌ای طراحی شده است که نیاز به retraining مجدد را به حداقل برساند و در عین حال، کارایی بالایی را ارائه دهد.

منبع: VentureBeat (مشاهده متن اصلی)

لینک کوتاه: n8n.ir/iit1231 کپی شد!