وب فارسی از الگوریتم ضعیف گوگل و سایتهای تبلیغاتی رنج می برد
1.اهمیت بسیار زیاد به آدرس صفحات
اگر دقت کرده باشید در بسیاری از مواقع سایتهای اسپم فهرست شده در نتایج جستجو دقیقا عبارات خاصی را در آدرس صفحات URL دارند. به نظر می رسد که گوگل توجه زیادی به وجود کلمات کلیدی در URL صفحات دارد و همین مسئله از چشم اسپمرها دور نمانده و آنها نیز هر آنچه که میتوانند در آدرس صفحات قرار میدهند و یا هزاران صفحه که فقط کلمات کلیدی در آدرس آنهاست می سازند. همین امروز اگر در گوگل یک عبارات خاص و غیرمعمول ( مثلا نام یک فرد) را جستجو کنید سایتهایی که در آدرس صفحات خود این عبارت را دارند در موقعیت بالاتری از سایتها یا وبلاگهایی که فقط در محتوای خود این عبارت را دارند ولیکن معتبرتر هستند قرار می گیرند.
2. توجه زیاد به تکرار کلمات و یا وجود دقیق عبارات در صفحه
اگرچه میزان چگالی کلمات در محتوا معیاری معمول در موتورهای جستجو جهت رتبه بندی است اما به نظر میرسد که دیگر این معیار کارآمد نیست و اسپمرها با تکرار دهها باره کلمات کلیدی مد نظر خود در محتوا سعی در افزایش رتبه و ارتباط محتوای صفحات سایت خود با کلمات کلیدی مورد جستجوی کاربران دارند.
3.عدم اهمیت به موقعیت واقعی یک صفحه یا سایت
فقط کافیست در مورد برخی از سایتهایی که بارها در نتایج جستجوی عبارات فارسی در گوگل می آیند کمی تحقیق کنید و مثلا تعداد لینکهای موجود به آنها را بررسی کنید. برخی از این سایتها که پای ثابت اکثر نتایج گوگل هستند کمتر از ده یا حتی پنج لینک از دیگر سایتها و بخصوص سایتهای معتبر دارند. در واقع معیار تعداد لینکهای صورت گرفته به یک صفجه از دیگر سایتها که به نوعی به معنای محبوبیت و به رسمیت شناخته شدن آن صفحه است در گوگل کم رنگتر بوده و جای آنرا اهمیت بیشتر به آدرس صفحات و... گرفته است و با توجه به اهمیت این معیار در جستجوگرهای دیگر (مانند بینگ) شاهد آن هستیم که سایتهای اسپم یا نیازمندیها در دیگر جستجوگرها کم رنگتر از گوگل است. لازم به ذکر است که اگر چه گوگل در رتبه بندی سایتها به این معیار اهمیت می دهد اما همانظور که اشاره شد نتایج گوگل نشان میدهد که در نتایج جستجو ارتباط محتوای صفحات با عبارات جستجو شده (مثل وجود عبارت در آدرس صفحه) اهمیت بیشتری دارد.
شاید گوگل پیشرفتهای زیادی در الگوریتمهای رتبه بندی و تحلیل محتوایی صفحات انگلیسی داشته است اما با وجود نشانه هایی از پیشرفت در تحلیل زبان فارسی (مثل جستجوی همزمان کلمات مترداف یا مشابه فارسی) در گوگل همچنان این جستجوگر در تشخیص صفحات با اهمیت و مفید برای کاربران فارسی زبان خود موفق نبوده است و به نظر می رسد جستجوگرهایی که از الگوریتهای سنتی و شناخته شده رتبه صفحات استفاده می کنند حداقل در ارائه نتایج پاک تر (از حیث وجود سایتهای تبلیغاتی) موفق تر هستند.
علیرضا شیرازی