کیمی K2.7-Code: ۳۰٪ کاهش توکن‌های فکر، اما کارشناسان شک دارند!

هوش مصنوعی موون‌شات این هفته نسخه باز منبع Kimi K2.7-Code را منتشر کرد، که یک به‌روزرسانی برای خانواده مدل‌های کد K2 است. این نسخه جدید ادعا می‌کند که فکر کردن بهتر و بهبود عملکرد دو رقمی دارد.

K2.7-Code بر اساس همان معماری ترکیبی از کارشناسان با یک تریلیون پارامتر مانند پیشینهٔ خود K2.6 ساخته شده و از طریق یک API سازگار با OpenAI ارائه می‌شود. این موضوع برای تیم‌هایی که K2.6 را در دروازه‌های تولیدی اجرا می‌کنند، بسیار مهم است.

هنگامی که K2.6 در آوریل منتشر شد، در جدول رتبه‌بندی هفتگی LLM OpenRouter به صدر رسید — یک رتبه‌بندی بر اساس تصمیمات واقعی روتینگ API توسط توسعه‌دهندگان، نه امتیازهای خودگزارش شده. موون‌شات AI می‌گوید که K2.7-Code به آنچه را که «فکر کردن بیش از حد» می‌نامند، پاسخ می‌دهد و مصرف توکن‌های فکر را در مقایسه با K2.6 به ۳۰٪ کاهش می‌دهد — یک عدد که به طور مستقیم بر هزینه‌های استنتاج برای تیم‌هایی که جریان‌های کار آژانس را اجرا می‌کنند، تأثیر می‌گذارد. آیا این بهبود کارایی در آزمون‌های مستقل ثابت می‌شود، یک سؤال است که کارشناسان به طور عمومی شروع به مطرح کردن آن کرده‌اند.

تحلیل و بررسی: با این که ادعای موون‌شات AI در مورد کاهش توکن‌های فکر جذاب است، اما نیاز به تأیید از سوی آزمون‌های مستقل دارد. این نسخه جدید ممکن است در برخی از کاربردهای خاص بهتر عمل کند، اما کاربران باید با دقت عملکرد آن را در شرایط واقعی خود بررسی کنند. در نهایت، موفقیت K2.7-Code به میزان که بتواند در آزمون‌های مستقل و در شرایط واقعی کاربران بهتر عمل کند، بستگی دارد.

منبع: VentureBeat (مشاهده متن اصلی)

لینک کوتاه: n8n.ir/iit210g کپی شد!