ຄໍາແນະນໍາໄວສໍາລັບການຂຽນໄຟລ໌ Robots.txt

ເຈົ້າປຶກສາປື້ມແບບຮຽນອັນໃຫຍ່ຫຼວງແນວໃດ? Sifting ຜ່ານດັດຊະນີ. ດີ: ມີອົງປະກອບຫນຶ່ງທີ່ເປັນບົດສະຫຼຸບທີ່ແທ້ຈິງຂອງເວັບໄຊທ໌ຂອງເຈົ້າ…

Robots.txt: ລະຫັດການຂຽນໂປລແກລມຖືກຜູກມັດເພື່ອໃຫ້ມີຄວາມຊັບຊ້ອນຫຼາຍຂຶ້ນ
ລະຫັດການຂຽນໂປລແກລມຖືກຕັ້ງໃຫ້ມີຄວາມຊັບຊ້ອນຫຼາຍຂຶ້ນ

ວິທີດຽວທີ່ຈະຕິດຕໍ່ກັບ spider ເຄື່ອງຈັກຊອກຫາ, ຫຼື crawler, ແມ່ນຜ່ານໄຟລ໌ທີ່ເອີ້ນວ່າ robots.txt. ຫຼືດີກວ່າ. ເມື່ອທ່ານສົ່ງຂໍ້ສະເຫນີເວັບໄຊທ໌ຂອງທ່ານໃຫ້ Google, ມັນຖືກປະເຊີນຫນ້າກັບຂໍ້ມູນຈໍານວນຫຼວງຫຼາຍ.

ເຈົ້າປຶກສາປຶ້ມແບບຮຽນຂະໜາດໃຫຍ່ແນວໃດ ເຈົ້າຮູ້ສຶກວ່າເຈົ້າບໍ່ເຄີຍຊອກຫາທຸກຢ່າງທີ່ເຈົ້າຕ້ອງການ? ທ່ານປຶກສາ ດັດຊະນີ. ດີ: ໄຟລ໌ robots.txt ແມ່ນດັດສະນີຂອງເວັບໄຊທ໌ຂອງທ່ານ.

ນີ້ແມ່ນເອກະສານທີ່ງ່າຍຕໍ່ການຕື່ມຂໍ້ມູນທີ່ບອກຕົວກວາດເວັບຂອງເຄື່ອງຈັກຊອກຫາສິ່ງທີ່ຕ້ອງຊອກຫາ. ໃນສັ້ນ: ເຈົ້າຈະຊ່ວຍໃຫ້ລາວເຂົ້າໃຈສິ່ງທີ່ເວັບໄຊຂອງເຈົ້າເຮັດຈາກ, ດັ່ງນັ້ນ algorithm ສາມາດໃຫ້ທ່ານຈັດອັນດັບທີ່ກົງກັນກັບວຽກງານທີ່ທ່ານໄດ້ເຮັດ.

ມີໃຜສາມາດຂຽນໄຟລ໌ robots.txt ໄດ້ບໍ?

ຄໍາຕອບສັ້ນແມ່ນແມ່ນ. ຄໍາຕອບທີ່ຊື່ສັດແມ່ນບໍ່. ເຖິງແມ່ນວ່າໄວຍາກອນຂອງໄຟລ໌ robots.txt ແມ່ນງ່າຍດາຍທີ່ສຸດ, ແລະອົງປະກອບຂອງມັນປະກອບດ້ວຍສອງສາມເສັ້ນ, ມັນດີກວ່າທີ່ຈະອີງໃສ່ການດູແລຂອງຜູ້ຄຸ້ມຄອງເວັບທີ່ຊ່ຽວຊານທີ່ຮູ້ບ່ອນທີ່ຈະວາງມືຂອງລາວ. ຫຼັງຈາກທີ່ທັງຫມົດ, ຄວາມຜິດພາດຂະຫນາດນ້ອຍແມ່ນພຽງພໍທີ່ຈະປະນີປະນອມການຈັດຕໍາແຫນ່ງຂອງເວັບໄຊທ໌ຂອງເຈົ້າ, ແລະດັ່ງນັ້ນຈິ່ງສົ່ງການປະຕິບັດ SEO ທັງຫມົດໃຫ້ຢຸດເຊົາກ່ອນທີ່ຈະເລີ່ມຕົ້ນ.

ກ່ອນທີ່ທ່ານຈະເລີ່ມຕົ້ນ, ຮູ້ສິ່ງຫນຶ່ງ: ທຸກຄົນສາມາດປຶກສາໄຟລ໌ robots.txt ຂອງເວັບໄຊທ໌ໃດກໍໄດ້ໂດຍການຂຽນ /robots.txt ຫຼັງຈາກໂດເມນ. ທ່ານຍັງສາມາດປຶກສາຂອງ Google ໄດ້!

ທ່ານສາມາດຂຽນໄຟລ໌ດັ່ງກ່າວໄດ້ໂດຍບໍ່ຕ້ອງດາວໂຫລດຊອບແວພິເສດ. ໃນຄວາມເປັນຈິງ, ມັນພຽງພໍທີ່ຈະໃຊ້ notepad ຂອງທ່ານແລະປະຫຍັດ, ເດົາຫຍັງ, ໃນຮູບແບບ .txt.

ມາຂຽນ robots.txt ນຳກັນ: ສ່ວນຫົວ

ໃຫ້ເລີ່ມຕົ້ນຈາກການເລີ່ມຕົ້ນ, ຍ້ອນວ່າມັນສະເຫມີມີເຫດຜົນທີ່ຈະເຮັດ. ການເປີດໄຟລ໌, ຫຼືແທນທີ່ຈະເປັນ header, ແມ່ນອຸທິດຕົນທັງຫມົດໃຫ້ກັບຊື່ຂອງ spider, ກ່ອນຫນ້າດ້ວຍຄໍາສັບນ້ອຍໆທີ່ສະເຫມີຄືກັນ. ໃຫ້ສົມມຸດວ່າທ່ານຕ້ອງການທີ່ຈະໄດ້ຮັບການສັງເກດເຫັນໂດຍ Google. ດັ່ງນັ້ນເສັ້ນທໍາອິດຈະເປັນ:

ຕົວແທນຜູ້ໃຊ້: Googlebot

ສະຕິງສັ້ນນີ້ບອກ Google ວ່າທຸກຢ່າງທີ່ຕິດຕາມມາແນ່ນອນຈະມີຄວາມສົນໃຈກັບມັນ. ໃນ​ກໍ​ລະ​ນີ​ທີ່​ທ່ານ​ຕ້ອງ​ການ​ຕົວ​ກວາດ​ເວັບ​ທັງ​ຫມົດ​ທີ່​ອ່ານ​ໄຟລ​໌​ປະ​ເພດ​ນີ້​ເພື່ອ​ສາ​ມາດ​ປຶກ​ສາ​ຫາ​ລື​ເອ​ກະ​ສານ​, ທົດ​ແທນ Googlebot ສໍາ​ລັບ​ການ​ງ່າຍ​ດາຍ *​, a ດາວ.

ດຽວນີ້ເຈົ້າໄດ້ຊີ້ບອກວ່າແມງມຸມໃດ, i.e. WHO, ເຈົ້າຈະຕ້ອງຊີ້ບອກ ສິ່ງທີ່ລາວຈະຕ້ອງອ່ານ.

ແຕ່ລະເສັ້ນຂອງລະຫັດ, ຕາມຄໍານິຍາມ, ກົງກັບການກະທໍາຂອງເຄື່ອງຈັກ. ມັນໄປໂດຍບໍ່ບອກວ່າແຕ່ລະຄໍາສັ່ງໃນໄຟລ໌ robots.txt ກົງກັບສິ່ງທີ່ເຄື່ອງຈັກບໍ່ຄວນເຮັດ. ແລະນີ້ແມ່ນກຸນແຈທີ່ຊ່ວຍໃຫ້ທ່ານສາມາດຂຽນປະສິດທິຜົນແທ້ໆ. ພວກເຮົາເວົ້າກ່ຽວກັບຄໍາສັ່ງ DISALLOW.

ຄຳສັ່ງ DISALLOW ແມ່ນຫຍັງ?

Il ບໍ່​ອະ​ນຸ​ຍາດ​ໃຫ້​ຄໍາ​ສັ່ງ​ ອະນຸຍາດໃຫ້ທ່ານເຫດຜົນໂດຍການຍົກເວັ້ນ. ໃນຄໍາສັບຕ່າງໆອື່ນໆ, ໃນເວລາທີ່ມັນເວົ້າວ່າມັນເປັນຄັ້ງທໍາອິດທີ່ຈະເວົ້າວ່າສິ່ງທີ່ບໍ່ຄວນເຮັດ - ດີ, ທ່ານກໍາລັງສົມເຫດສົມຜົນໂດຍການຍົກເວັ້ນ. ນອກ ເໜືອ ໄປຈາກ disallow ຍັງມີການອະນຸຍາດ, ເຊິ່ງເປັນຂໍ້ຍົກເວັ້ນຂອງຕັນ.

ຖ້າທ່ານຕ້ອງການຂຽນໄຟລ໌ຫຸ່ນຍົນທີ່ດີ, ທ່ານຈະຕ້ອງຄິດໃນທາງອື່ນ, ດັ່ງນັ້ນທ່ານຈະຕ້ອງບອກ Google ວ່າມັນບໍ່ຄວນອ່ານ. ຖ້າທ່ານຂຽນ:

ບໍ່ອະນຸຍາດ:

spider ຈະອ່ານເວັບໄຊທ໌ທັງຫມົດຂອງທ່ານ, ໂດຍບໍ່ມີການຫ້າມລໍ້ໃດໆ.

ຖ້າຫຼັງຈາກ "Disallow:" ທ່ານໃສ່ slash (ດັ່ງນັ້ນ Disallow: /), ເວັບໄຊທ໌ຈະບໍ່ເຂົ້າໄປໃນເຄື່ອງຈັກຊອກຫາ, ຢຸດເຕັມ.

ບໍ່ອະນຸຍາດ: /directories/

ແທນທີ່ໄດເລກະທໍລີຄໍາທີ່ມີໂຟນເດີທີ່ທ່ານຕ້ອງການທີ່ຈະຖືກປະຕິເສດຈາກມຸມເບິ່ງ spider. ທ່ານສາມາດເຮັດເຊັ່ນດຽວກັນກັບໄຟລ໌ສະເພາະໃດຫນຶ່ງ.

ບໍ່ອະນຸຍາດ: /myfile.html

ເອົາ​ໃຈ​ໃສ່ ເຄື່ອງໝາຍວັກຕອນ ແລະຕົວອັກສອນ, ຕົວພິມໃຫຍ່ຫຼືຕົວພິມນ້ອຍ. ປະເພດຂອງໄຟລ໌ນີ້ຖືປະເພດຂອງ "trifles" ເຫຼົ່ານີ້ຢູ່ໃນຄວາມສໍາຄັນສູງ, ແຕ່ພວກເຂົາສ້າງຄວາມແຕກຕ່າງຢ່າງຫຼວງຫຼາຍ.

ເປັນຫຍັງເຈົ້າຈຶ່ງຢຸດ Google ຈາກການອ່ານສ່ວນໃຫຍ່ຂອງເວັບໄຊຂອງເຈົ້າ? ເມື່ອທ່ານຂຽນໄຟລ໌ປະເພດນີ້, ມັນເປັນສິ່ງສໍາຄັນທີ່ຈະເຂົ້າໃຈວ່າໄຟລ໌ໃດບໍ່ຄວນປາກົດຢູ່ໃນເຄື່ອງຈັກຊອກຫາ, ແຕ່ໂດຍບໍ່ມີການລ່ວງລະເມີດ. ຢ່າງໃດກໍ່ຕາມ, ຮູ້ວ່າຜູ້ໃດທີ່ຮູ້ທີ່ຢູ່ທີ່ແນ່ນອນຂອງໄຟລ໌ສະເພາະນັ້ນຈະສາມາດເຂົ້າເຖິງມັນໄດ້ໃນກໍລະນີໃດກໍ່ຕາມ.

ຄໍາສັ່ງ ALLOW ແມ່ນຫຍັງ?

ໃນໄຟລ໌ທ່ານສາມາດເພີ່ມຂໍ້ຍົກເວັ້ນດ້ວຍຄໍາສັ່ງ ທັງ ໝົດ. ໄວຍາກອນແມ່ນຄືກັນ, ແຕ່ມັນຈະສ້າງຂໍ້ຍົກເວັ້ນບາງຢ່າງຕໍ່ກັບ DISALLOW ເຊິ່ງຈະອະນຸຍາດໃຫ້ເປີດຂອບເຂດທີ່ຫນ້າສົນໃຈຂອງການສໍາຫຼວດສໍາລັບ spider.

ໄຟລ໌ຕົວຢ່າງຂະຫນາດນ້ອຍ:

ຕົວແທນຜູ້ໃຊ້: Googlebot

ບໍ່ອະນຸຍາດ: /images/

ອະນຸຍາດ: /images/holidays.jpg

ໂດຍພື້ນຖານແລ້ວພວກເຮົາໄດ້ບອກ Googlebot ບໍ່ໃຫ້ພິຈາລະນາໂຟນເດີຮູບພາບ, ຍົກເວັ້ນຮູບພາບສະເພາະພາຍໃນມັນ, ຄືຮູບຈາກວັນພັກ.

ແລະນັ້ນ, guys, ມັນແມ່ນ. ພວກເຮົາຂຽນໄຟລ໌ robots.txt ທໍາອິດຂອງພວກເຮົາ. ແນ່ນອນ, ສິ່ງທີ່ພວກເຮົາກໍາລັງຈະເຮັດສໍາລັບເວັບໄຊທ໌ທີ່ແທ້ຈິງອາດຈະແຕກຕ່າງກັນເລັກນ້ອຍ, ແຕ່ບໍ່ແມ່ນຫຼາຍ. ຖ້າສົງໃສ, ສະເຫມີໄດ້ຮັບຄໍາແນະນໍາຈາກຜູ້ຄຸ້ມຄອງເວັບພິເສດ. ພວກເຮົາແນະນໍາໃຫ້ທ່ານພະຍາຍາມຂຽນມັນເອງ, ກ່ອນອື່ນ ໝົດ, ແລະສົ່ງມັນໃຫ້ລາວເພື່ອກວດກາ, ເພື່ອໃຫ້ສາມາດເຂົ້າໃຈໄດ້ດີກວ່າວິທີການເຮັດວຽກຂອງເວັບໄຊທ໌ຂອງທ່ານ.

ຄວາມກ່ຽວຂ້ອງກັນລະຫວ່າງ robots.txt ແລະແຜນຜັງເວັບໄຊທ໌ແມ່ນຫຍັງ?

ແຜນຜັງເວັບໄຊທ໌ແມ່ນໄຟລ໌ທີ່ສ້າງຂຶ້ນໂດຍ plugins ພິເສດທີ່ມີການເຊື່ອມຕໍ່ທັງຫມົດຢູ່ໃນເວັບໄຊທ໌. ເມື່ອ spider ເຂົ້າໄປໃນເວັບໄຊທ໌, ມັນທໍາອິດອ່ານຫຸ່ນຍົນ, ຫຼັງຈາກນັ້ນກວາດເວັບໄຊທ໌. ຖ້າໃນລະຫວ່າງການລວບລວມຂໍ້ມູນຫຸ່ນຍົນຊອກຫາທີ່ຢູ່ແຜນຜັງເວັບໄຊທ໌, ຂະບວນການທັງຫມົດຈະງ່າຍຂຶ້ນຫຼາຍ.

ເພີ່ມຕໍ່ໄປນີ້ໃສ່ລະຫັດຂ້າງເທິງ:

ແຜນຜັງເວັບໄຊທ໌: http://www.ilnomedeltuositobellissimo.com/sitemap.xml

ໃນການສະຫລຸບ

ໄຟລ໌ຫຸ່ນຍົນທັງຫມົດແມ່ນຄືກັນ. ນີ້ຫມາຍຄວາມວ່າໄຟລ໌ຫຸ່ນຍົນທີ່ຂຽນສໍາລັບ Google ຍັງຈະເຮັດວຽກໄດ້ດີສໍາລັບ Bing, ແລະປະຕິບັດຕາມໄວຍາກອນດຽວກັນ.

ໄຟລ໌ robots.txt ທີ່ຈັດເປັນລະບຽບດີອະນຸຍາດໃຫ້ທ່ານ ປະຫຍັດເວລາຕົວກວາດເວັບ. ຢ່າທໍ້ຖອຍໃຈ: ນີ້ແມ່ນບາດກ້າວທໍາອິດໄປສູ່ຄວາມສໍາເລັດ!

Robots.txt: Google ແມ່ນເຄື່ອງຈັກຊອກຫາທີ່ມີປະສິດທິພາບທີ່ສຸດໃນອິນເຕີເນັດ
Google ແມ່ນເຄື່ອງຈັກຊອກຫາທີ່ມີປະສິດທິພາບທີ່ສຸດໃນອິນເຕີເນັດ