پروژه های جدید منبع باز robots.txt | وبلاگ مرکزی جستجوی گوگل | توسعه دهندگان گوگل

دوشنبه 21 سپتامبر 2020

سال گذشته تجزیه کننده و تطبیق robots.txt را که در سیستم های تولیدی خود استفاده می کنیم، در دنیای متن باز منتشر کردیم. از آن زمان، ما دیدیم که مردم ابزارهای جدیدی با آن می‌سازند، به کتابخانه منبع باز کمک می‌کنند (به طور موثر سیستم‌های تولید ما را بهبود می‌بخشند- متشکرم!)، و نسخه‌های زبان جدیدی مانند golang و rust را منتشر می‌کنند که ساختن جدید را برای توسعه‌دهندگان آسان‌تر می‌کند. ابزار.

با پایان یافتن فصل کارآموزی اینجا در Google، می‌خواستیم دو نسخه جدید مرتبط با robots.txt را برجسته کنیم که توسط دو کارآموز که در تیم جستجوی منبع باز کار می‌کردند، Andreea Dutulescu و Ian Dolzhanskii امکان‌پذیر شد.

تست مشخصات Robots.txt

ابتدا، ما یک چارچوب آزمایشی را برای توسعه دهندگان تجزیه کننده robots.txt منتشر می کنیم که توسط Andreea ایجاد شده است. این پروژه ابزار آزمایشی را ارائه می‌کند که می‌تواند تأیید کند که آیا تجزیه‌کننده robots.txt از پروتکل محرومیت روبات‌ها پیروی می‌کند یا تا چه حد. در حال حاضر هیچ روش رسمی و کاملی برای ارزیابی درستی تجزیه کننده وجود ندارد، بنابراین Andreea ابزاری ساخت که می تواند برای ایجاد تجزیه کننده های robots.txt که از پروتکل پیروی می کنند استفاده کند.

تجزیه کننده و تطبیق جاوا robots.txt

دوم، ما در حال انتشار یک پورت رسمی جاوا از C++ robots.txt تجزیه کننده، ایجاد شده توسط Ian هستیم. جاوا سومین زبان برنامه نویسی محبوب در GitHub است و به طور گسترده در گوگل نیز استفاده می شود، بنابراین جای تعجب نیست که این پورت زبان بیشترین درخواست را داشته است. تجزیه کننده یک ترجمه 1 به 1 از تجزیه کننده C++ از نظر عملکرد و رفتار است، و به طور کامل برای برابری در برابر مجموعه بزرگی از قوانین robots.txt آزمایش شده است. تیم‌ها در حال برنامه‌ریزی برای استفاده از تجزیه‌کننده Java robots.txt در سیستم‌های تولید Google هستند و امیدواریم که برای شما نیز مفید باشد.

طبق معمول از مشارکت شما در این پروژه ها استقبال می کنیم. اگر چیزی را با تجزیه‌کننده robots.txt C++ یا با این نسخه‌های جدید ساخته‌اید، به ما اطلاع دهید تا به طور بالقوه بتوانیم به شما کمک کنیم تا این خبر را گسترش دهید! اگر اشکالی پیدا کردید، با باز کردن مشکلی در GitHub یا مشارکت مستقیم با یک درخواست کشش، به ما کمک کنید آن را برطرف کنیم. اگر سوال یا نظری در مورد این پروژه ها دارید، با ما تماس بگیرید
توییتر!

ما واقعاً از میزبانی آندریا و ایان لذت بردیم و از اینکه دوره کارآموزی آنها به پایان رسیده است ناراحتیم. مشارکت‌های آن‌ها به تبدیل اینترنت به مکانی بهتر کمک می‌کند و ما امیدواریم که بتوانیم در آینده از آنها به Google استقبال کنیم.

ارسال شده توسط ادو پردا و گری ایلیس، تیم منبع باز جستجوی گوگل