ملتقى أهل الحديث

العودة   ملتقى أهل الحديث > قسم البرمجيات الإسلامية
.

الملاحظات

إضافة رد
 
أدوات الموضوع
  #21  
قديم 30-11-18, 12:05 AM
أبو عبدالله الأموي أبو عبدالله الأموي غير متصل حالياً
وفقه الله
 
تاريخ التسجيل: 16-09-12
المشاركات: 530
افتراضي رد: محرك التعرف الضوئي على الحروف وقارئ الصور (عربي) 2018 - Tesseract OCR - gImageReader

اقتباس:
المشاركة الأصلية كتبت بواسطة أبو ياسر الجزائري مشاهدة المشاركة
بسم الله الرحمن الرحيم
~~~~~~~~~~~~
السلام عليكم ورحمة الله وبركاته
~~~~~~~~~~~~~~~~~
الحمد لله على نعمة
والحمد لله
{الَّذِي عَلَّمَ بِالْقَلَمِ*عَلَّمَ الْإِنسَانَ مَا لَمْ يَعْلَمْ}
و
{الْحَمْدُ لِلَّهِ الَّذِي هَدَانَا لِهَذَا وَمَا كُنَّا لِنَهْتَدِيَ لَوْلَا أَنْ هَدَانَا اللَّهُ}
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
بعد غياب طويل (لظروف..)، عدت وكلي قلم وأمل وفكر، ورؤيا متجددة..
والحمد لله زالت المشاق، وأجدد معكم اللقاء..
والله يوفقنا على أن نستفيد ونفيد..
_____
من عادة الزائر أن يقدم هدية عند زيارة الأحباب، واليوم جئتكم بهذه الهدية المتواضعة..
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
محرك التعرف الضوئي على الحروف
وقارئ الصور
(عربي)
~~~~~~~~~
Tesseract OCR
+
gImageReader
~~~~~~~
1. Tesseract

يعتبر التعرف الضوئي على الحروف أحد أنواع التكنولوجيا التي تهدف إلى تسهيل حياتنا المكتبية.
وبرامج التعرف الضوئي على الحروف العربية الجيدة غالية الثمن وذات حقوق الملكية..
لحسن الحظ، تعمل (Google) على جعل الأشياء أفضل، حيث تقوم بتطوير محرك التعرف الضوئي على الحروف (Tesseract
الذي تم تصميمه في الأساس من قبل المهندسين هيوليت باكارد (HP) من 1985 إلى 1995، وتم التخلي عن تطويره للسنوات العشر التالية.
في عام 2005، أصدرت (HP) شفرة المصدر الخاصة بـ (Tesseract) بموجب ترخيص (Apache)..
منذ ذلك الحين تواصل (Google) في تحديث البرنامج..
[أحدث إصدار مستقر هو 3.05.02، صدر في 19 يونيو 2018]
[أما التجريبي هو 4.0.0-rc4، صدر في 24 أكتوبر 2018]
يعتبر (Tesseract) بحق واحد من أقوى محركات التعرف الضوئي على الحروف الحرة المتاحة..
العائق الوحيد (..) أنه برنامج سطر أوامر



بدلا من ذلك بحثت عن برنامج يوفر للمستخدم واجهة رسومية (GUI) تكون مرنة الاستعمال، وتسمح له بالعمل بشكل مريح.
وبعد تجربة العديد من البرامج الحرة (OcrFree) دفعني بحثي إلى استحسان برنامج وقع اختياري عليه لما يحمله من ميزات، اسمه:

2. gImageReader
هو برنامج مفتوح المصدر يوفر واجهة رسومية لمحرك التعرف الضوئي على الحروف (tesseract) ويسمح بسهولة استخراج النص من صورة أو وثيقة محمولة منسقة (PDF).
البرنامج له واجهة بسيطة للغاية ومنظمة بشكل واضح في ثلاث نوافذ:
1- يتم استخدام النافذة الجانبية اليسرى للتنقل في مجلد الصور أو الوثائق المحمولة المنسقة (مدخلات).
2- تعرض النافذة المركزية الوسطى الصورة أو الوثيقة المحمولة المنسقة (PDF) التي تعمل عليها (معاينة).
3- يظهر النص المتعرف عليه في نافذة جانبية على اليمين (مخرجات).
· مميزات البرنامج:
- استيراد مستندات (PDF) والصور من القرص أو أجهزة المسح أو الحافظة أو لقطات الشاشة.
- معالجة الصور والوثائق المتعددة دفعة واحدة.
- تحديد منطقة التعرف اليدوي أو التلقائي.
- التعرف على نص عادي أو على مستندات (hOCR *).
- النص المتعرف عليه يتم عرضه مباشرة بجوار الصورة.
- مرحلة المعالجة للنص المتعرف عليه، بما في ذلك التدقيق الإملائي.
- إنشاء مستندات (PDF) من وثائق (hOCR).
__________
* [(hOCR) هو تنسيق لتخزين نتائج ومخرجات التعرف في مستند (HTML)].


· تحميل البرنامج:
- رابط صفحة التحميل:
- روابط مباشرة:
Linux
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Tesseract 3.05.02
(إصدار مستقر)
Windows 32
Windows 64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Tesseract 4.0.0-RC3
(إصدار التجريبي)
Windows 32
Windows 64
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
شفرة المصدر
Windows
Linux
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
ملاحظة: عند تثبيت البرنامج
النافذة الثالثة - هذا الاختيار (standard localised) يعطيك واجهة عربية للبرنامج
ملف شرح البرنامج في المرفقات..
__________
في الأخير أترككم وبين أيديكم هذه الهدية، لتنطلق الخبرات والتجارب للإفادة والاستفادة بهدف الارتقاء والوصول إلى أحسن نتيجة..
أسأل الله أن يعلمنا ما ينفعنا وينفعنا بما يعلمنا.. وأن يجعلنا نفعا للإسلام والمسلمين..
ونأمل من الله عز وجل أن تنال هذه الهدية على رضا الجميع واستحسانكم..
__________
من طرف الأخ الكريم (ف.المهتدي) حفظه الله

أخذت نتيجة VERUS السابقة وقارنتها مع برنامج gImageReader
النتيجة مرفقة

اخانا أبا ياسر ممكن توضح لنا ماذا تقصد بإصدار مستقر وتجريبي وأيهما نحمل؟
رد مع اقتباس
  #22  
قديم 30-11-18, 08:50 PM
أبو ياسر الجزائري أبو ياسر الجزائري غير متصل حالياً
وفقه الله
 
تاريخ التسجيل: 17-10-09
الدولة: الجزائر
المشاركات: 1,429
افتراضي رد: محرك التعرف الضوئي على الحروف وقارئ الصور (عربي) 2018 - Tesseract OCR - gImageReader

اقتباس:
المشاركة الأصلية كتبت بواسطة أبو عبدالله الأموي مشاهدة المشاركة
اخانا أبا ياسر ممكن توضح لنا ماذا تقصد بإصدار مستقر وتجريبي وأيهما نحمل؟
1- كل برنامج يمر على مرحلة تجريبية (مع رقم معين للنسخة).
ومن خلال استخداماته تتبين الثغرات، فيتم إصلاح الخلل ومعالجة الشوائب درجة درجة (غالبا ما تأتي معها: Bug fix)..
هذا هو معنى تجريبي Beta.
وبعد اختبار هذه النسخة التجريبية بشكل كامل وبدون أخطاء وتعتبر الأفضل يتم الإعلان على أنها النسخة المستقرة Stable.

2- حمل الإصدار التجريبي (بما أنه أصبح مستقرا)
في انتظار نسخة gImageReader جديدة محسنة..
__________
للفائدة:
هناك برنامج رائع آخر لإنشاء ومراجعة وتصحيح بيانات OCR في ملفات PDF قابلة للبحث باستخدام محرك Tesseract 4.0. اسمه TesseractStudio.Net لغة إنكليزية، ولا يوجد فيه خاصية تحميل اللغات -العربية-
https://github.com/OpaitSoftware/TesseractStudio.Net

__________
كلي أمنية أن يكون للمبرمجين العرب حظ ونصيب من هذه المشاريع ويتم التعاون عليها بما أنها مفتوحة المصدر (فالمادة الخام موجودة)...
...



__________________
{وَفِي ذَلِكَ فَلْيَتَنَافَسِ الْمُتَنَافِسُونَ}
MyShamelaBooks
رد مع اقتباس
  #23  
قديم 30-11-18, 09:19 PM
أبو ياسر الجزائري أبو ياسر الجزائري غير متصل حالياً
وفقه الله
 
تاريخ التسجيل: 17-10-09
الدولة: الجزائر
المشاركات: 1,429
افتراضي رد: محرك التعرف الضوئي على الحروف وقارئ الصور (عربي) 2018 - Tesseract OCR - gImageReader

__________________
{وَفِي ذَلِكَ فَلْيَتَنَافَسِ الْمُتَنَافِسُونَ}
MyShamelaBooks
رد مع اقتباس
  #24  
قديم 01-12-18, 09:15 PM
أبو ياسر الجزائري أبو ياسر الجزائري غير متصل حالياً
وفقه الله
 
تاريخ التسجيل: 17-10-09
الدولة: الجزائر
المشاركات: 1,429
افتراضي رد: محرك التعرف الضوئي على الحروف وقارئ الصور (عربي) 2018 - Tesseract OCR - gImageReader

TesseractStudio.Net
هذا ما جاء عن البرنامج وهو حديث الصدور "23 يوما"
قيود
النسخة الحالية موزعة فقط بدعم الولايات المتحدة المحلية واللغة الإنجليزية.
تنطبق هذه القيود على لغة واجهة المستخدم ، OCR ولغات التدقيق الإملائي.
يدعم الإصدار الحالي لغة الولايات المتحدة واللغة الإنجليزية فقط.
هذه القيود ستتم إزالتها في إصدار لاحق.
__________
المقدمة
برنامج لإنشاء ومراجعة وتصحيح بيانات OCR في ملفات PDF قابلة للبحث باستخدام محرك Tesseract 4.0.
المميزات
يدعم ملفات PDF للصور وملفات الصور المتعددة ، مع أو بدون بيانات OCR سابقة.
يمكن تشغيل أو إعادة تشغيل عملية Tesseract OCR في الصفحة الحالية ، أو كل الصفحات أو الصفحات المحددة.
يحفظ أي نص مرئي على صفحة PDF أثناء تنفيذ OCR على عناصر الصورة فقط.
بالنسبة للملفات متعددة الصفحات ، تعمل مثيلات متعددة من محرك tesseract بالتوازي لتحسين الأداء. يعتمد تحسين السرعة على عدد نوى المعالج.
التعرف على نص OCR وعرضه على مستوى الكلمة مع ظهور حدود كلمة مرئية.
يقوم المدقق الإملائي المضمن تلقائيًا بوضع علامات على الكلمات غير الموجودة في القاموس.
عرض صفحات PDF في الأوضاع التالية:
صورة مع نص OCR مخفي
OCR نص مرئي وصورة مخفية
نص OCR مرئي على الصورة الباهتة
استخدم أي خط مثبت لعرض نص OCR. يتم ضبط الخطوط تلقائيًا لتلائم حدود الكلمات.
انقر على كلمة مرئية لفتح محرر نصوص لتصحيح أخطاء OCR.
تقسيم كلمة محددة في موضع المؤشر الحالي إلى كلمتين ، أو دمج الكلمة المحددة مع الكلمة التالية.
تعديل أو نقل حدود الكلمات.
إنشاء كلمات OCR جديدة ، حذف الكلمات الموجودة.
يدعم أي عدد من عمليات التراجع والإعادة.
حفظ التصحيحات كملفات PDF قابلة للبحث.
(ترجمة قوقل)
تصميم البرنامج رائع

دليل المستخدم
Tesseract Studio User Guide

__________________
{وَفِي ذَلِكَ فَلْيَتَنَافَسِ الْمُتَنَافِسُونَ}
MyShamelaBooks
رد مع اقتباس
  #25  
قديم 01-12-18, 09:21 PM
أبو ياسر الجزائري أبو ياسر الجزائري غير متصل حالياً
وفقه الله
 
تاريخ التسجيل: 17-10-09
الدولة: الجزائر
المشاركات: 1,429
افتراضي رد: محرك التعرف الضوئي على الحروف وقارئ الصور (عربي) 2018 - Tesseract OCR - gImageReader

متابع للإصدارات اللحقة إن شاء الله
__________________
{وَفِي ذَلِكَ فَلْيَتَنَافَسِ الْمُتَنَافِسُونَ}
MyShamelaBooks
رد مع اقتباس
  #26  
قديم 02-12-18, 08:52 PM
أبو ياسر الجزائري أبو ياسر الجزائري غير متصل حالياً
وفقه الله
 
تاريخ التسجيل: 17-10-09
الدولة: الجزائر
المشاركات: 1,429
افتراضي رد: محرك التعرف الضوئي على الحروف وقارئ الصور (عربي) 2018 - Tesseract OCR - gImageReader

برنامج تصميم كتب مصورة قابلة للبحث - TesseractStudio.Net - 2018
__________________
{وَفِي ذَلِكَ فَلْيَتَنَافَسِ الْمُتَنَافِسُونَ}
MyShamelaBooks
رد مع اقتباس
  #27  
قديم 14-12-18, 09:48 PM
أبو عبدالله الأموي أبو عبدالله الأموي غير متصل حالياً
وفقه الله
 
تاريخ التسجيل: 16-09-12
المشاركات: 530
افتراضي رد: محرك التعرف الضوئي على الحروف وقارئ الصور (عربي) 2018 - Tesseract OCR - gImageReader

يا أخانا أبا ياسر - بارك الله فيك - هل البرنامج هذا يحول الكتاب دفعة واحدة مثل (القارئ الذهبي) أم صفحة صفحة؟؟ وكذلك جعلها قابل للبحث فيه هل تتم العملية دفعة واحدة كالذهبي أم صفحة صفحة ؟؟؟؟؟ ( سؤال مهم)
رد مع اقتباس
  #28  
قديم 25-12-18, 11:56 PM
أبو عبدالله الأموي أبو عبدالله الأموي غير متصل حالياً
وفقه الله
 
تاريخ التسجيل: 16-09-12
المشاركات: 530
افتراضي رد: محرك التعرف الضوئي على الحروف وقارئ الصور (عربي) 2018 - Tesseract OCR - gImageReader

إلى الآن لم يجب علينا ابوياسر بارك الله فيه
رد مع اقتباس
  #29  
قديم 31-12-18, 09:43 PM
أبو ياسر الجزائري أبو ياسر الجزائري غير متصل حالياً
وفقه الله
 
تاريخ التسجيل: 17-10-09
الدولة: الجزائر
المشاركات: 1,429
افتراضي رد: محرك التعرف الضوئي على الحروف وقارئ الصور (عربي) 2018 - Tesseract OCR - gImageReader

اقتباس:
المشاركة الأصلية كتبت بواسطة أبو عبدالله الأموي مشاهدة المشاركة
يا أخانا أبا ياسر - بارك الله فيك - هل البرنامج هذا يحول الكتاب دفعة واحدة مثل (القارئ الذهبي) أم صفحة صفحة؟؟ وكذلك جعلها قابل للبحث فيه هل تتم العملية دفعة واحدة كالذهبي أم صفحة صفحة ؟؟؟؟؟ ( سؤال مهم)
وفيكم بارك الله
أتقصد برنامج:
gImageReader
أم
TesseractStudio.Net
إن كان الأول فنعم يحول الكتاب دفعة واحدة، وكذلك جعلها قابلة للبحث (راجع الشروحات)
أما الثاني فلم يعمل معي بشكل جيد.

اقتباس:
المشاركة الأصلية كتبت بواسطة أبو عبدالله الأموي مشاهدة المشاركة
إلى الآن لم يجب علينا ابوياسر بارك الله فيه
أما الظروف فلا أتحكم فيها بارك الله فيك
وعذرا على التأخر بالرد عليك
__________________
{وَفِي ذَلِكَ فَلْيَتَنَافَسِ الْمُتَنَافِسُونَ}
MyShamelaBooks
رد مع اقتباس
  #30  
قديم 04-01-19, 12:48 AM
أبو عبدالله الأموي أبو عبدالله الأموي غير متصل حالياً
وفقه الله
 
تاريخ التسجيل: 16-09-12
المشاركات: 530
افتراضي رد: محرك التعرف الضوئي على الحروف وقارئ الصور (عربي) 2018 - Tesseract OCR - gImageReader

جزاك الله خيرا
رد مع اقتباس
إضافة رد

أدوات الموضوع

تعليمات المشاركة
لا تستطيع إضافة مواضيع جديدة
لا تستطيع الرد على المواضيع
لا تستطيع إرفاق ملفات
لا تستطيع تعديل مشاركاتك

BB code is متاحة
كود [IMG] متاحة
كود HTML معطلة

الانتقال السريع


الساعة الآن 05:41 PM.


vBulletin الإصدار 3.8.11

حَيَّاكُمُ اللهُ فِيْ مُلْتَقَى أَهْلِ الْحَدِيْثِ

Powered by vBulletin® Version 3.8.11
Copyright ©2000 - 2019, Jelsoft Enterprises Ltd.