در میان آزمایشگاه‌های پیشرو هوش مصنوعی، تازه‌ترین گزارش‌ها از شرکت Anthropic نشان می‌دهد که عامل مرورگر (browser agent) این شرکت در ۳۱.۵ درصد موارد، پیش از فعال‌شدن محافظ‌های امنیتی، توسط مهاجمان ربوده شده است. این عدد که در نوع خود بی‌نظیر است، در مقایسه با گزارش‌های OpenAI، Google و Meta که هیچ‌کدام رقم مشابهی منتشر نکرده‌اند، نه‌تنها یک نقطه ضعف، بلکه یک نقطه قوت محسوب می‌شود؛ چراکه شفافیت را به نمایش می‌گذارد.

Anthropic در یک کارت سیستم (system card) ۲۴۴ صفحه‌ای، چهار سطح مختلف عامل هوش مصنوعی خود را آزمایش کرده است: ابزارها (tool use)، کدنویسی (coding)، استفاده از کامپیوتر (computer use) و مرورگر (browser). در آزمایش مرورگر، مهاجمان حرفه‌ای ۱۲۹ محیط وب را هدف قرار دادند و نرخ موفقیت حملات تزریق دستور (prompt injection) بدون محافظ‌ها به ۳۱.۵ درصد رسید. با فعال‌سازی محافظ‌ها، این رقم به ۰.۵ درصد کاهش یافت. در مقابل، OpenAI تنها یک سطح (کانکتورها) را با حملات شناخته‌شده آزمایش کرده و Google و Meta نیز هیچ‌گونه عدد قابل مقایسه‌ای منتشر نکرده‌اند.

کمبود یک استاندارد صنعتی برای اندازه‌گیری این نوع حملات، چالش اصلی است. هر آزمایشگاه معیارهای خود را تعریف کرده است؛ به‌طوری که مقایسه مستقیم اعداد غیرممکن می‌شود. کارشناسان امنیتی هشدار می‌دهند که با گسترش استفاده از هوش مصنوعی، سطح حمله (attack surface) افزایش می‌یابد و سازمان‌ها باید خود برای محافظت از مدل‌ها در برابر سوءاستفاده، مسموم‌سازی داده‌ها و تزریق دستور اقدام کنند.

تحلیل و بررسی: این گزارش نشان می‌دهد که شفافیت Anthropic در افشای آسیب‌پذیری‌ها، یک استاندارد جدید در صنعت ایجاد می‌کند. در حالی که رقبا اعداد را پنهان می‌کنند، آنتروپیک با ارائه داده‌های دقیق، اعتماد خریداران را جلب می‌کند. پیش‌بینی می‌شود که در آینده نزدیک، سازمان‌ها برای ارزیابی امنیتی، به جای تکیه بر اعداد مبهم فروشندگان، تست‌های نفوذ اختصاصی خود را اجرا کنند.

منبع: VentureBeat (مشاهده متن اصلی)