بدین ترتیب و با نوشتن این دستورالعملهای ساده میتوانید فعالیت رباتها در وب سایت خود را محدود کرده و کنترل کاملی بر آن داشته باشید. فایل robots سایت، یک فایل متنی بسیار ساده با فرمت txt است که شما میتوانید نمونه آن را همین حالا روی صفحه رایانه خودتان بسازید. گاها ممکن است ما قصد داشته باشیم که محتوایی خاص را از دید ایندکس گوگل پنهان کنیم.
- امروزه اما گوشی موبایل خود را برمیدارید و در عرض چند دقیقه متوجه میشوید که چه مواردی در کدام محلهها مناسب شماست.
- باید یک فایل ربات توی روت اصلی سایت بسازید و به همون صورتی که اخر متن نوشتید درج کنید.
- با تنظیم صحیح این فایل میتوانید فرایند خزش در سایت خود را بهینه سازی کنید و از فهرست شدن صفحات با محتوای تکراری جلوگیری کنید.
دستور سایت مپ(نقشه سایت) برای معرفی کردن نقشه سایت (سایت مپ) به کراولر ها کاربرد دارد. نقشه سایت یک فایل XML است که شامل لیستی از تمام صفحات وب سایت شما و همچنین متادیتاها می باشد (متادیتا شامل اطلاعاتی است که به هر URL منسوب می شود). فایل txt کار می کند، نقشه سایت به موتورهای جستجو اجازه می دهد تا در فهرستی از تمام صفحات وب سایت شما در یک مکان بخزند. این دستور به رباتها اجازه میدهد به یک صفحه یا بخش وبسایت دسترسی پیدا کنند.
آموزش ساخت فایل robots txt در وردپرس
Txt که از قبل در سایت شما قابل دسترسی هستند استفاده کنید. تصور پیش فرض این است که یک عامل کاربر میتواند هر صفحه یا دایرکتوری را که توسط یک قانونعدم اجازه مسدود نشده است، جستجو کند. یک عامل کاربر میتواند فقط با یک مجموعه از قوانین مطابقت داشته باشد که اولین و خاصترین گروهی است که با یک عامل کاربر مشخص مطابقت دارد. پردازندههای کلمه اغلب فایلها را در قالب اختصاصی ذخیره میکنند و میتوانند نویسههای غیر منتظرهای را اضافه کنند که این امر میتواند خزندهها را با مشکل مواجه کند.
دستور های موجود در فایل Robot.txt
استفاده از دستورالعملهای متا میتواند به خوبی Robots. Txt را برای جلوگیری از فهرست شدن صفحات مؤثر به کار گیرد. ۳ دلیل اصلی که باید از پرونده فایل متنی ربات استفاده کنید. حالا خودتون با توجه به مزایایی که بهتون شرح دادم، کافیه یه دو دو تا چهارتا بکنید تا ببینید که استفاده از کدوم روش ها به نفع شما هست. موارد آموزشی سئو را در سایت مهرارقام به نشانی blog.mehrargham.com بخوانید.
متدها و راهکارهای بسیاری در این زمینه وجود دارند که یکی از این موارد با کمک بهینه سازی فایل Robot.txt انجام میشود. در این مقاله به معرفی و ساخت فایل robots.txt پرداختیم. امیدواریم مطالعه این مقاله گامی مثبت در راستای بهینهسازی سایت شما باشد.
برای کاربران واقعی user-agent شامل نوع مرورگر، و سیستم عامل است و حاوی اطلاعات شخصی نیست. این اطلاعات به وبسایتها کمک میکند اطلاعات سازگار با سیستم کاربر را نمایش دهند. تصویر زیر فایل robots.txt سایت یوتیوب به عنوان نمونه نمایش داده شدهاست. دقت کنید که دستور disallow باید در خط بعد از user-agent قرار بگیرد. این یعنی در ابتدا باید ربات های مورد نظر را فراخوانی کنید سپس به آنها دستور ایندکس کردن یا نکردن صفحات را بدهید. این فایل خیلی مهم هست و یه سئوکار حرفهای باید از کدهای داخل این فایل کامل اطلاعات و دسترسی داشته باشه.