مایسترال AI روز سه شنبه از مدل OCR 4 رونمایی کرد، که فراتر از استخراج متن خام عمل کرده و نمایش های ساختاریافته از کل اسناد را ارائه می‌دهد. این نسخه، چهارمین نسل از فناوری تشخیص کاراکتر نوری مایسترال در حدود 15 ماه اخیر است و در مقطعی منتشر می‌شود که درخواست این شرکت برای خودکفایی هوش مصنوعی در اروپا به طرز عجیبی درباره آن بحث می‌شود.

مدل جدید به 170 زبان مختلف از 10 گروه زبانی پشتیبانی می‌کند و فرمت‌های PDF، DOC، PPT و OpenDocument را می‌پذیرد. به علاوه، این توانایی را دارد که به عنوان یک کانتینر واحد روی زیرساخت‌های سازمان پیاده‌سازی شود؛ امکانی که مایسترال به طور خاص برای صنایع تنظیم‌شده‌ای که نمی‌توانند اسناد حساس را از طریق APIهای ابری تحت نظارت ایالات متحده مبادله کنند، طراحی کرده است.

مایسترال اعلام کرده که OCR 4 محتوای واسنادی را از انواع مختلف مستندات استخراج و ساختاردهی می‌کند. این مدل با نمایش‌های ساختاریافته و اعتماد به هردو صفحه و کلمات، تفاوت‌های بزرگی نسبت به نسخه‌های قبلی خود دارد.

تحلیل و بررسی: با توجه به نیاز روزافزون سازمان‌ها به محافظت از داده‌ها و قوانین محلی، مدل OCR 4 می‌تواند مزیت رقابتی قابل توجهی به مایسترال بدهد. به نظر می‌رسد که این مدل به ویژه در بازارهای اروپا اهمیت بیشتری پیدا کند، جایی که استقلال از تأمین‌کنندگان آمریکایی به یک ضرورت تبدیل شده است. با این حال، موفقیت آن به توانایی مایسترال در حفظ کیفیت و دقت استخراج داده‌ها وابسته است.

منبع: VentureBeat (مشاهده متن اصلی)