یک چالش بزرگ برای هوش مصنوعی در سازمانها، بهروزرسانی دانش پس از آموزش مدلهای زبان بزرگ (LLM) است. فریمورک جدید MeMo از محققین چندین دانشگاه، این مشکل را با استفاده از یک مدل حافظه کوچکتر که به طور مستقل از LLM اصلی عمل میکند، حل کرده است. این ساختار ماژولار میتواند هم با مدلهای متن باز و هم بسته کار کند و از پیچیدگیهای معمول در روشهای یادگیری مجدد کامل جلوگیری کند. آزمایشها نشان دادهاند که MeMo قادر به مدیریت پرسشهای پیچیده است، حتی زمانی که دادهها ناکارامد باشند.
مدل MeMo شامل دو بخش اصلی است: یک مدل حافظه که به صورت خاص برای کدگذاری دانش جدید طراحی شده و یک مدل اجرایی که به عنوان موتور استدلال عمل میکند. این مدلها به گونهای طراحی شدهاند که بهطور مؤثر با هم کار کنند و به پاسخگویی به پرسشها بپردازند. از جمله قابلیتهای قابل توجه این فریمورک، امکان ارتقاء سریع عملکرد مدل بدون نیاز به آموزش مجدد، با تغییر مدل اجرایی است. به طور خاص، تغییر از یک مدل متن باز به یک مدل اختصاصی عملکرد MeMo را تا ۲۶ درصد افزایش داد.
MeMo همچنین با مدیریت بهروزرسانیهای مداوم دانش، به سازمانها کمک میکند تا بهروز باشند و از هزینههای گزاف آموزشی جلوگیری کنند. این مدل به گونهای طراحی شده است که نیاز به retraining مجدد را به حداقل برساند و در عین حال، کارایی بالایی را ارائه دهد.
منبع: VentureBeat (مشاهده متن اصلی)
n8n.ir/iit1231
کپی شد!