Googlebot و چیز 15 مگابایتی | وبلاگ مرکزی جستجوی گوگل | توسعه دهندگان گوگل

سه شنبه 28 ژوئن 2022

در چند روز گذشته، ما سوالات زیادی در مورد به‌روزرسانی اخیر اسناد خود درباره Googlebot دریافت کرده‌ایم. یعنی، ما مستند کرده‌ایم که Googlebot فقط 15 مگابایت (MB) اول را هنگام واکشی انواع فایل‌های خاص «می‌بیند». این آستانه جدید نیست. سالهاست که وجود دارد ما فقط آن را به اسناد خود اضافه کردیم زیرا ممکن است برای برخی از افراد هنگام اشکال زدایی مفید باشد و به ندرت تغییر می کند.

این محدودیت فقط برای بایت‌ها (محتوای) دریافت‌شده برای درخواست اولیه Googlebot اعمال می‌شود، نه منابع ارجاع‌شده در صفحه.

مثلا وقتی باز می کنید https://example.com/puppies.html، مرورگر شما ابتدا بایت های فایل HTML را دانلود می کند و بر اساس آن بایت ها ممکن است درخواست های بیشتری برای جاوا اسکریپت خارجی، تصاویر، یا هر چیز دیگری که با URL در HTML ارجاع داده شده است، ارائه دهد. Googlebot هم همین کار را می کند.

این محدودیت 15 مگابایتی برای من چه معنایی دارد؟
به احتمال زیاد هیچی وجود دارد
صفحات بسیار کمی
در اینترنت که از نظر اندازه بزرگتر هستند. شما، خواننده عزیز، بعید است که صاحب یکی باشید، زیرا اندازه متوسط ​​یک فایل HTML حدود 500 برابر کوچکتر است: 30 کیلوبایت (کیلو بایت). با این حال، اگر صاحب یک صفحه HTML با بیش از 15 مگابایت هستید، شاید بتوانید حداقل برخی از اسکریپت های درون خطی و گرد و غبار CSS را به فایل های خارجی منتقل کنید، بسیار لطفا.

بعد از 15 مگابایت چه اتفاقی برای محتوا می افتد؟
محتوا پس از 15 مگابایت اول توسط Googlebot حذف می شود و تنها 15 مگابایت اول به فهرست بندی ارسال می شود.

محدودیت 15 مگابایتی برای چه نوع محتوایی اعمال می شود؟
محدودیت 15 مگابایتی برای واکشی‌های انجام‌شده توسط Googlebot (گوگل بات تلفن هوشمند و Googlebot Desktop) هنگام واکشی انواع فایل‌های پشتیبانی‌شده توسط جستجوی Google اعمال می‌شود.

آیا این بدان معناست که Googlebot تصویر یا ویدیوی من را نمی بیند؟
خیر. Googlebot ویدیوها و تصاویری را که در HTML با یک URL ارجاع داده شده اند (به عنوان مثال،
<img src="https://example.com/images/puppy.jpg" alt="cute puppy looking very disappointed" />
به طور جداگانه با واکشی های متوالی.

آیا URI های داده به اندازه فایل HTML اضافه می کنند؟
آره. استفاده كردن
URI های داده
از آنجایی که در فایل HTML هستند، به اندازه فایل HTML کمک خواهند کرد.

چگونه می توانم اندازه یک صفحه را جستجو کنم؟
چند راه وجود دارد، اما ساده ترین آنها احتمالاً استفاده از مرورگر خود و ابزارهای توسعه دهنده آن است. صفحه را همانطور که معمولاً بارگیری می کنید، سپس Developer Tools را اجرا کنید و به تب Network بروید. صفحه را مجدداً بارگیری کنید، و باید تمام درخواست‌هایی را که مرورگر شما برای ارائه صفحه انجام می‌داد، ببینید. درخواست بالا همان چیزی است که شما به دنبال آن هستید، با اندازه بایت صفحه در ستون Size.

به عنوان مثال، در Chrome Developer Tools ممکن است چیزی شبیه به این باشد، با 150 کیلوبایت در ستون اندازه:

اگر بیشتر اهل ماجراجویی هستید، می توانید از cURL از یک خط فرمان استفاده کنید:

curl \
-A "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36" \
-so /dev/null https://example.com/puppies.html -w '%{size_download}'

اگر سوال بیشتری دارید، می توانید ما را در این آدرس بیابید
توییتر
و در تالارهای گفتمان مرکزی جستجو، و اگر به توضیح بیشتر در مورد اسناد ما نیاز دارید، بازخورد خود را در صفحات خود با ما در میان بگذارید.