أكثر أخطاء الفهرسة شيوعًا وكيفية إصلاحها

أخطاء الفهرسة هي واحدة من أسوأ المشاكل التي يمكن أن يواجهها مسؤول الموقع . يؤثر بعضها فقط على قابلية الزحف وفهرسة موقع الويب الخاص بك ، وهو أمر سيئ بدرجة كافية. لكن هناك مشكلات أخرى ، مثل حلقات إعادة التوجيه التي يمكن أن تمنع الوصول إلى أي شخص أو مستخدم أو روبوت.
هناك العديد من العوامل التي تؤثر على كيفية قيام محركات البحث بالزحف إلى موقع الويب الخاص بك وفهرسته .لهذا السبب ، أردت في هذه المقالة جمع أخطاء الفهرسة الأكثر شيوعًا التي تؤثر على موقع الويب ،وكيفية إصلاحها.
ما هي أخطاء الفهرسة؟
خطأ الفهرسة هو في الأساس مشكلة تؤثر على قدرة محركات البحث على الزحف وتضمين صفحة واحدة أو أكثر من موقع الويب الخاص بك في فهرس البحث . هذا يعني أن عناوين URL التي بها أخطاء في الفهرسة لن تظهر في نتائج البحث.من الضروري لصحة موقع الويب الخاص بك التحكم في أخطاء الفهرسة وحلها في أسرع وقت ممكن. للقيام بذلك ، لدينا أدوات لا حصر لها تسمح لنا بتحليل موقعنا على الإنترنت بحثًا عن مثل هذه الأخطاء. سنركز هنا على Google Search Console لأنها مجانية وأيضًا لأن الطريقة التي تقدم بها المعلومات لنا بديهية ودقيقة للغاية.
تقرير التغطية ادوات مشرفي البحث
تظهر أخطاء الفهرسة في Search Console في تقرير التغطية . هذا القسم من أداة مشرفي المواقع من Google كامل جدًا ويقدم معلومات حول حالة فهرسة موقعنا على الويب . بالإضافة إلى الأخطاء ، يمكنك مشاهدة الصفحات المفهرسة والمستبعدة لأسباب أخرى ، بالإضافة إلى تحميل ملفات Sitemap وتعديلها.
سنركز على فهرسة الأخطاء (تلك التي تظهر باللون الأحمر). إذا مررنا لأسفل ، فسنرى الأنواع المختلفة من الأخطاء التي وجدها Google على موقعنا على الويب ، بالإضافة إلى عناوين URL المتأثرة وحالة التحقق (فيما بعد سأشرح ما هي).
سيؤدي النقر فوق نوع معين من الخطأ إلى فتح نافذة تحتوي على مزيد من التفاصيل وعناوين URL المتأثرة وتاريخ اكتشاف الخطأ لأول مرة. من هنا أيضًا يمكننا تحليل الصفحة باستخدام أداة فحص عنوان URL وبدء عملية التحقق بمجرد حل المشكلة.
أكثر أخطاء الفهرسة شيوعًا
هناك العديد من أنواع أخطاء الفهرسة ويمكن أن يكون كل منها نتيجة لأسباب مختلفة. إذا تناولت الكثير من التفاصيل ، فسيكون هذا المنشور طويلًا جدًا ، لذلك قمت بتجميع العناصر التي أعتبرها أكثر أهمية ، مع التركيز على السبب أو الأسباب الأكثر احتمالية.
عدم وجود خريطة للموقع (Sitemap)
على الرغم من أنه ليس خطأ فهرسة على هذا النحو ، فإن عدم وجود خريطة موقع محدثة على موقع الويب الخاص بك يترك الباب مفتوحًا أمام المشاكل المحتملة في المستقبل . لأنه مع الخريطة كل شيء أسهل. حيث يخبر ملف Sitemap محرك البحث بالصفحات التي تريد فهرستها مباشرة فور نشرها في موقعك دون الحاجة إلى انتظار محرك البحث للعثور عليها بمفرده.
بالإضافة إلى ذلك ، من خلال الإشارة إلى الصفحات التي تريد فهرستها ، إذا اكتشفت أي مشكلة (مثل تعطل أو 404) ، فسيعلمك بالخطأ حتى تتمكن من تصحيحه في الوقت المناسب.
حظر عنوان URL
يعتبر خطأ الفهرسة هذا أكثر شيوعًا مما تعتقد.قد يحدث أنك تمنع عن غير قصد عنوان URL في ملف robots.txt الخاص بك لأنه داخل دليل مقيد بتوجيه Disallow .على سبيل المثال ، تخيل أن لديك العبارة التالية في ملف الروبوتات لديك:
Disallow: / categoria /
إذا كانت بنية صفحاتك /categoria/nombre-de-la-pagina
، فأنت تخبر محركات البحث بعدم الزحف إلى الفئة المعنية ، ولكن أيضًا الصفحات الموجودة في هذه الفئة ، مما قد يكون خطأً. لتصليح هذا الخطأ ،يمكنك إزالة الشرطة المائلة الموجودة في نهاية السطر للإشارة إلى أنك تريد حظر عنوان URL للفئة فقط وليس الدليل بأكمله.
استخدم أمر noindex في ملف robots.txt الخاص بك
في سبتمبر 2019 ، توقفت Google عن دعم أمر noindex في ملفات robots.txt. بدلاً من ذلك ، يجب عليك إدراج العلامات الوصفية noindex في <head> لكل صفحة للإشارة إلى أنك لا تريد فهرستها ، أو استخدام التوجيه disallow في ملف الروبوتات لحظر عناوين URL التي لا تريد فهرستها. وإذا قام محرك بحث Google بفهرسة إحدى الصفحات عن طريق الخطأ ، فتذكر أنه يمكنك دائمًا إزالتها يدويًا من الفهرس باستخدام أداة إزالة عناوين URL الجديدة في Search Console.
مشكلة إعادة التوجيه
إحدى أسوأ مشاكل الفهرسة هي حلقات إعادة التوجيه. في بعض الأحيان يمكن أن يحدث أنه عند محاولة الوصول إلى صفحة ما ، يقوم الخادم بإعادة توجيهك إلى أخرى ، ثم إلى أخرى ، وهكذا إلى ما لا نهاية. بعد تجاوز عدد المحاولات ، ستظهر لك المتصفحات رسالة مثل “عدد كبير جدًا من عمليات إعادة التوجيه”.
من الواضح أن هذا ليس شيئًا جيدًا ، لأن الروبوتات التي تسير وتلتف في النهاية ستغادر دون الزحف إلى صفحتك ، وقد تتم معاقبتك على ذلك.
حلقات إعادة التوجيه قابلة للإصلاح ، على الرغم من أنه في بعض الأحيان يكون الأمر صعباً ، حيث يمكن أن يكون سببها العديد من الأشياء.نوصي بإفراغ جميع ذاكرات التخزين المؤقت وتعطيل أي مكونات إضافية أو أدوات للتخزين المؤقت تستخدمها.
أحد الأسباب الأخرى المحتملة هو أن بعض مكونات WordPress الإضافية تسبب التكرار . أفضل شيء هو إلغاء تنشيطهم جميعًا وتجربة واحدًا تلو الآخر. إذا عاد الخطأ بعد تغيير التكوين عند تنشيط المكون الإضافي ، فمن الأفضل إزالته تمامًا.
إذا كانت مشكلة اعادة التوجيه مازالت مستمرة ولم تستطيع الدخول الى موقعك،فتحقق من ملف htaccess. هذا هو المسؤول عن إدارة جميع عمليات إعادة التوجيه على موقع الويب الخاص بك . ولكن قبل أن تلمس أي شيء ، قم بعمل نسخة من الملف تحسبًا لأخطاء محتملة. يمكن أن يؤدي تحرير هذا الملف بلا مبالاة إلى حظر الوصول إلى موقع الويب الخاص بك تمامًا.إذا كنت تستخدم WordPress ، فقم بالوصول إلى الخادم الخاص بك وحذف هذا الملف بالكامل (بعد تنزيل نسخة ، بالطبع). انتقل إلى الإعدادات واحفظ إعدادات الرابط الثابت دون تغيير أي شيء. سيؤدي هذا ببساطة إلى إنشاء ملف htaccess جديد مع تكوين نظيف للخطأ.
الخلاصة في اكتشاف اخطاء الفهرسة واصلاحها
- قم بإجراء هذا البحث: “site: yourwebname.xxx” لتعرف ما وكيف وعدد عناوين url التي قام Google بفهرستها.من خلال إجراء هذا الفحص البسيط ، يمكنك بالتأكيد استخلاص النتائج بمجرد النظر إلى أول صفحتين من النتائج ومعرفة هل لديك مشاكل في الفهرسة ام لا.
- إذا قمت بإجراء تغييرات على العنوان أو عنوان url أو التعريف الخاص بمنشور ما ، فلا تنس إعادة فهرسته يدوياً.
- كنقطة بداية ، تحقق مما إذا كان هناك اختلاف بين عدد المقالات والصفحات التي نشرتها على موقع الويب الخاص بك وعدد عناوين url التي فهرستها Google من تقرير التغطية من Search Console.

- عندما يخبرك Google أن البحث “site: yourweb.xxx” لا يحصل على أية نتائج. انه يؤكد أن موقع الويب الخاص بك غير مفهرس.من المؤكد أنه ليس خطأ Google: على الأرجح ، أنت تمنع ارادياً أو لا إراديًا الوصول إلى نظام التتبع الخاص بها (Googlebot) .
- إذا كنت تستخدم WordPress ، فانتقل إلى الإعدادات> القراءة وتأكد من عدم تحديد المربع الذي يمنع فهرسة موقع الويب الخاص بك بواسطة محركات البحث.

- إذا كان عدد النتائج التي أرجعها Google عند البحث عن “site: tuweb.xxx” أعلى بكثير من عدد المشاركات التي كتبتها ، فإنك تلحق الضرر بـ SEO لموقعك على الويب (دون علم) عن طريق فهرسة محتوى مكرر أو منخفض القيمة (محتوى ضعيف) لا يحبه Google على الإطلاق .لذا تحقق من تكوين المكون الإضافي الذي قمت بتثبيته في WordPress الخاص بك لتحسين SEO (Yoast ، All in One SEO Pack ، SEOPress … هناك العديد).