في خطوة ثورية، أطلقت شركة Mistral الفرنسية المتخصصة في تطوير نماذج اللغة الضخمة (LLM) يوم الخميس API جديدًا يساعد المطورين في التعامل مع مستندات PDF المعقدة. تُعرف هذه الخدمة الجديدة باسم Mistral OCR، وهي واجهة برمجية للتعرف على النصوص (OCR) تعمل على تحويل أي مستند PDF إلى ملف نصي منسق بصيغة Markdown، مما يسهل معالجته بواسطة نماذج الذكاء الاصطناعي.
لماذا تعتبر هذه التقنية مهمة؟
تعتمد نماذج اللغة الضخمة (LLMs)، مثل ChatGPT من OpenAI، بشكل أساسي على النصوص الخام. لذا، فإن الشركات التي تسعى لإنشاء تدفقات عمل ذكاء اصطناعي تحتاج إلى تخزين وفهرسة البيانات بتنسيق نظيف لضمان إعادة استخدامها بكفاءة في عمليات المعالجة الذكية.
ما الذي يميز Mistral OCR عن غيرها؟
على عكس معظم تقنيات OCR التقليدية، فإن Mistral OCR هي واجهة برمجية متعددة الوسائط، مما يعني أنها تستطيع التعرف على الصور والرسوم التوضيحية داخل النصوص، وتُنشئ مربعات حدودية (Bounding Boxes) حول هذه العناصر الرسومية لضمان تضمينها في الإخراج النهائي.
Mistral OCR لا تقوم فقط باستخراج النص، بل تعمل أيضًا على تنسيقه في Markdown، وهي صيغة يستخدمها المطورون لإضافة روابط، عناوين، وتنسيقات مختلفة إلى الملفات النصية العادية.
مع مرور الوقت، تراكمت لدى الشركات العديد من المستندات، غالبًا بصيغة PDF أو عروض تقديمية، التي يصعب على نماذج الذكاء الاصطناعي معالجتها. باستخدام Mistral OCR، يمكن لعملائنا الآن تحويل هذه المستندات الغنية والمعقدة إلى محتوى قابل للقراءة بجميع اللغات.– غيوم لامبل، المؤسس المشارك وكبير العلماء في Mistral.
إمكانيات واسعة ومرونة تشغيلية
تتوفر Mistral OCR عبر منصة Mistral API، بالإضافة إلى شركائها السحابيين مثل AWS، Azure، وGoogle Cloud Vertex. كما توفر الشركة إمكانية النشر المحلي (On-Premise Deployment) للعملاء الذين يتعاملون مع بيانات سرية أو مصنفة.
أداء استثنائي يتفوق على المنافسين
وفقًا لشركة Mistral، فإن أدائها في معالجة الوثائق المعقدة يفوق أداء Google، Microsoft، وOpenAI. فقد أثبتت الاختبارات قدرتها على التعامل مع:
المعادلات الرياضية (بتنسيق LaTeX).
التخطيطات المتقدمة والجداول المعقدة.
المستندات غير الإنجليزية بدقة عالية.
التكامل مع المساعد الذكي Le Chat
تستخدم Mistral تقنيتها الجديدة داخل مساعدها الذكي Le Chat ، حيث يتم تشغيل Mistral OCR في الخلفية لتحليل مستندات PDF قبل معالجتها.
استخدامات واسعة النطاق
من المتوقع أن يُستخدم Mistral OCR على نطاق واسع في أنظمة RAG (استرجاع البيانات المعزز بالتوليد)، والتي تُستخدم لإدخال مستندات متعددة الوسائط في نماذج الذكاء الاصطناعي. على سبيل المثال، يمكن أن تستفيد مكاتب المحاماة من هذه التقنية لمراجعة كميات ضخمة من المستندات بسرعة وكفاءة.