مرة أخرى أجد نفسي أتوق الى معانقة هذا الفذ الاستاذ خالد الشمعة http://ar-php.com على اهتمامه بلغتنا العربية.
اليوم تلقيت ملف PDF فيه أكثر من 60 صفحة مكتوبة باللغة العربية وعلي أخذ النصوص من الملف ووضعها في مشروع أقوم ببنائه ... من اللحظة الأولى عرفت أنه لدي مشكلة ... فعندما نسخت الكلمات الى ملف وورد حصلت على التالي:
يسردم رادصإ :عونلا
اي
النوع: إصدار مدرسي
وكان يجب علي أن أحل المشكلة. بحثت في الانترنت عن برنامج جاهز - لم أجد...
لكني قبل أن اشرع في كتابة كود التحويل ... قلت لا بد أن الاستاذ خالد فكر بذلك قبلي:
كيف لا؟ وهو بالضبط واضع مثال على ذلك في الصفحة التالية:
http://ar-php.com/Examples/ArNormalise-php-arabic.html
بعد بعض التعديلات البسيطة ... وبضغطة زر .. استطعت تحويل كل النصوص لدي الى ملف نصي واحد به عربية ...
هذا الكود الذي استعملته:
كود:
<?php
error_reporting(E_STRICT);
$time_start = microtime(true);
include('../Arabic.php');
$normalise = new Arabic('ArNormalise');
$file = fopen('./Normalization/sample.txt', 'r');
while($read = fgets($file)) {
if(strlen($read)>3){
$n2 = $normalise->utf8Strrev($read);
$n2=str_replace(array('اال','األ','اإل','..'),array('الا','ألا','الإ',''),$n2);
echo "$n2\r\n <br />";
}
}
fclose($file);
?>
converting Arabic PDF to word or text document can be done with additional conversion, you must use the solution above to reverse texts extracted from normal adobe Arabic pdf file.
You can read more about fixing arabic pdf files in
http://ar-php.com/Examples/ArNormalise-php-arabic.html