مایسترال AI روز سه شنبه از مدل OCR 4 رونمایی کرد، که فراتر از استخراج متن خام عمل کرده و نمایش های ساختاریافته از کل اسناد را ارائه میدهد. این نسخه، چهارمین نسل از فناوری تشخیص کاراکتر نوری مایسترال در حدود 15 ماه اخیر است و در مقطعی منتشر میشود که درخواست این شرکت برای خودکفایی هوش مصنوعی در اروپا به طرز عجیبی درباره آن بحث میشود.
مدل جدید به 170 زبان مختلف از 10 گروه زبانی پشتیبانی میکند و فرمتهای PDF، DOC، PPT و OpenDocument را میپذیرد. به علاوه، این توانایی را دارد که به عنوان یک کانتینر واحد روی زیرساختهای سازمان پیادهسازی شود؛ امکانی که مایسترال به طور خاص برای صنایع تنظیمشدهای که نمیتوانند اسناد حساس را از طریق APIهای ابری تحت نظارت ایالات متحده مبادله کنند، طراحی کرده است.
مایسترال اعلام کرده که OCR 4 محتوای واسنادی را از انواع مختلف مستندات استخراج و ساختاردهی میکند. این مدل با نمایشهای ساختاریافته و اعتماد به هردو صفحه و کلمات، تفاوتهای بزرگی نسبت به نسخههای قبلی خود دارد.
تحلیل و بررسی: با توجه به نیاز روزافزون سازمانها به محافظت از دادهها و قوانین محلی، مدل OCR 4 میتواند مزیت رقابتی قابل توجهی به مایسترال بدهد. به نظر میرسد که این مدل به ویژه در بازارهای اروپا اهمیت بیشتری پیدا کند، جایی که استقلال از تأمینکنندگان آمریکایی به یک ضرورت تبدیل شده است. با این حال، موفقیت آن به توانایی مایسترال در حفظ کیفیت و دقت استخراج دادهها وابسته است.
منبع: VentureBeat (مشاهده متن اصلی)
n8n.ir/iit295t
کپی شد!