ຄໍາແນະນໍາໄວສໍາລັບການຂຽນໄຟລ໌ Robots.txt
ເຈົ້າປຶກສາປື້ມແບບຮຽນອັນໃຫຍ່ຫຼວງແນວໃດ? Sifting ຜ່ານດັດຊະນີ. ດີ: ມີອົງປະກອບຫນຶ່ງທີ່ເປັນບົດສະຫຼຸບທີ່ແທ້ຈິງຂອງເວັບໄຊທ໌ຂອງເຈົ້າ…
ວິທີດຽວທີ່ຈະຕິດຕໍ່ກັບ spider ເຄື່ອງຈັກຊອກຫາ, ຫຼື crawler, ແມ່ນຜ່ານໄຟລ໌ທີ່ເອີ້ນວ່າ robots.txt. ຫຼືດີກວ່າ. ເມື່ອທ່ານສົ່ງຂໍ້ສະເຫນີເວັບໄຊທ໌ຂອງທ່ານໃຫ້ Google, ມັນຖືກປະເຊີນຫນ້າກັບຂໍ້ມູນຈໍານວນຫຼວງຫຼາຍ.
ເຈົ້າປຶກສາປຶ້ມແບບຮຽນຂະໜາດໃຫຍ່ແນວໃດ ເຈົ້າຮູ້ສຶກວ່າເຈົ້າບໍ່ເຄີຍຊອກຫາທຸກຢ່າງທີ່ເຈົ້າຕ້ອງການ? ທ່ານປຶກສາ ດັດຊະນີ. ດີ: ໄຟລ໌ robots.txt ແມ່ນດັດສະນີຂອງເວັບໄຊທ໌ຂອງທ່ານ.
ນີ້ແມ່ນເອກະສານທີ່ງ່າຍຕໍ່ການຕື່ມຂໍ້ມູນທີ່ບອກຕົວກວາດເວັບຂອງເຄື່ອງຈັກຊອກຫາສິ່ງທີ່ຕ້ອງຊອກຫາ. ໃນສັ້ນ: ເຈົ້າຈະຊ່ວຍໃຫ້ລາວເຂົ້າໃຈສິ່ງທີ່ເວັບໄຊຂອງເຈົ້າເຮັດຈາກ, ດັ່ງນັ້ນ algorithm ສາມາດໃຫ້ທ່ານຈັດອັນດັບທີ່ກົງກັນກັບວຽກງານທີ່ທ່ານໄດ້ເຮັດ.
ມີໃຜສາມາດຂຽນໄຟລ໌ robots.txt ໄດ້ບໍ?
ຄໍາຕອບສັ້ນແມ່ນແມ່ນ. ຄໍາຕອບທີ່ຊື່ສັດແມ່ນບໍ່. ເຖິງແມ່ນວ່າໄວຍາກອນຂອງໄຟລ໌ robots.txt ແມ່ນງ່າຍດາຍທີ່ສຸດ, ແລະອົງປະກອບຂອງມັນປະກອບດ້ວຍສອງສາມເສັ້ນ, ມັນດີກວ່າທີ່ຈະອີງໃສ່ການດູແລຂອງຜູ້ຄຸ້ມຄອງເວັບທີ່ຊ່ຽວຊານທີ່ຮູ້ບ່ອນທີ່ຈະວາງມືຂອງລາວ. ຫຼັງຈາກທີ່ທັງຫມົດ, ຄວາມຜິດພາດຂະຫນາດນ້ອຍແມ່ນພຽງພໍທີ່ຈະປະນີປະນອມການຈັດຕໍາແຫນ່ງຂອງເວັບໄຊທ໌ຂອງເຈົ້າ, ແລະດັ່ງນັ້ນຈິ່ງສົ່ງການປະຕິບັດ SEO ທັງຫມົດໃຫ້ຢຸດເຊົາກ່ອນທີ່ຈະເລີ່ມຕົ້ນ.
ກ່ອນທີ່ທ່ານຈະເລີ່ມຕົ້ນ, ຮູ້ສິ່ງຫນຶ່ງ: ທຸກຄົນສາມາດປຶກສາໄຟລ໌ robots.txt ຂອງເວັບໄຊທ໌ໃດກໍໄດ້ໂດຍການຂຽນ /robots.txt ຫຼັງຈາກໂດເມນ. ທ່ານຍັງສາມາດປຶກສາຂອງ Google ໄດ້!
ທ່ານສາມາດຂຽນໄຟລ໌ດັ່ງກ່າວໄດ້ໂດຍບໍ່ຕ້ອງດາວໂຫລດຊອບແວພິເສດ. ໃນຄວາມເປັນຈິງ, ມັນພຽງພໍທີ່ຈະໃຊ້ notepad ຂອງທ່ານແລະປະຫຍັດ, ເດົາຫຍັງ, ໃນຮູບແບບ .txt.
ມາຂຽນ robots.txt ນຳກັນ: ສ່ວນຫົວ
ໃຫ້ເລີ່ມຕົ້ນຈາກການເລີ່ມຕົ້ນ, ຍ້ອນວ່າມັນສະເຫມີມີເຫດຜົນທີ່ຈະເຮັດ. ການເປີດໄຟລ໌, ຫຼືແທນທີ່ຈະເປັນ header, ແມ່ນອຸທິດຕົນທັງຫມົດໃຫ້ກັບຊື່ຂອງ spider, ກ່ອນຫນ້າດ້ວຍຄໍາສັບນ້ອຍໆທີ່ສະເຫມີຄືກັນ. ໃຫ້ສົມມຸດວ່າທ່ານຕ້ອງການທີ່ຈະໄດ້ຮັບການສັງເກດເຫັນໂດຍ Google. ດັ່ງນັ້ນເສັ້ນທໍາອິດຈະເປັນ:
ຕົວແທນຜູ້ໃຊ້: Googlebot
ສະຕິງສັ້ນນີ້ບອກ Google ວ່າທຸກຢ່າງທີ່ຕິດຕາມມາແນ່ນອນຈະມີຄວາມສົນໃຈກັບມັນ. ໃນກໍລະນີທີ່ທ່ານຕ້ອງການຕົວກວາດເວັບທັງຫມົດທີ່ອ່ານໄຟລ໌ປະເພດນີ້ເພື່ອສາມາດປຶກສາຫາລືເອກະສານ, ທົດແທນ Googlebot ສໍາລັບການງ່າຍດາຍ *, a ດາວ.
ດຽວນີ້ເຈົ້າໄດ້ຊີ້ບອກວ່າແມງມຸມໃດ, i.e. WHO, ເຈົ້າຈະຕ້ອງຊີ້ບອກ ສິ່ງທີ່ລາວຈະຕ້ອງອ່ານ.
ແຕ່ລະເສັ້ນຂອງລະຫັດ, ຕາມຄໍານິຍາມ, ກົງກັບການກະທໍາຂອງເຄື່ອງຈັກ. ມັນໄປໂດຍບໍ່ບອກວ່າແຕ່ລະຄໍາສັ່ງໃນໄຟລ໌ robots.txt ກົງກັບສິ່ງທີ່ເຄື່ອງຈັກບໍ່ຄວນເຮັດ. ແລະນີ້ແມ່ນກຸນແຈທີ່ຊ່ວຍໃຫ້ທ່ານສາມາດຂຽນປະສິດທິຜົນແທ້ໆ. ພວກເຮົາເວົ້າກ່ຽວກັບຄໍາສັ່ງ DISALLOW.
ຄຳສັ່ງ DISALLOW ແມ່ນຫຍັງ?
Il ບໍ່ອະນຸຍາດໃຫ້ຄໍາສັ່ງ ອະນຸຍາດໃຫ້ທ່ານເຫດຜົນໂດຍການຍົກເວັ້ນ. ໃນຄໍາສັບຕ່າງໆອື່ນໆ, ໃນເວລາທີ່ມັນເວົ້າວ່າມັນເປັນຄັ້ງທໍາອິດທີ່ຈະເວົ້າວ່າສິ່ງທີ່ບໍ່ຄວນເຮັດ - ດີ, ທ່ານກໍາລັງສົມເຫດສົມຜົນໂດຍການຍົກເວັ້ນ. ນອກ ເໜືອ ໄປຈາກ disallow ຍັງມີການອະນຸຍາດ, ເຊິ່ງເປັນຂໍ້ຍົກເວັ້ນຂອງຕັນ.
ຖ້າທ່ານຕ້ອງການຂຽນໄຟລ໌ຫຸ່ນຍົນທີ່ດີ, ທ່ານຈະຕ້ອງຄິດໃນທາງອື່ນ, ດັ່ງນັ້ນທ່ານຈະຕ້ອງບອກ Google ວ່າມັນບໍ່ຄວນອ່ານ. ຖ້າທ່ານຂຽນ:
ບໍ່ອະນຸຍາດ:
spider ຈະອ່ານເວັບໄຊທ໌ທັງຫມົດຂອງທ່ານ, ໂດຍບໍ່ມີການຫ້າມລໍ້ໃດໆ.
ຖ້າຫຼັງຈາກ "Disallow:" ທ່ານໃສ່ slash (ດັ່ງນັ້ນ Disallow: /), ເວັບໄຊທ໌ຈະບໍ່ເຂົ້າໄປໃນເຄື່ອງຈັກຊອກຫາ, ຢຸດເຕັມ.
ບໍ່ອະນຸຍາດ: /directories/
ແທນທີ່ໄດເລກະທໍລີຄໍາທີ່ມີໂຟນເດີທີ່ທ່ານຕ້ອງການທີ່ຈະຖືກປະຕິເສດຈາກມຸມເບິ່ງ spider. ທ່ານສາມາດເຮັດເຊັ່ນດຽວກັນກັບໄຟລ໌ສະເພາະໃດຫນຶ່ງ.
ບໍ່ອະນຸຍາດ: /myfile.html
ເອົາໃຈໃສ່ ເຄື່ອງໝາຍວັກຕອນ ແລະຕົວອັກສອນ, ຕົວພິມໃຫຍ່ຫຼືຕົວພິມນ້ອຍ. ປະເພດຂອງໄຟລ໌ນີ້ຖືປະເພດຂອງ "trifles" ເຫຼົ່ານີ້ຢູ່ໃນຄວາມສໍາຄັນສູງ, ແຕ່ພວກເຂົາສ້າງຄວາມແຕກຕ່າງຢ່າງຫຼວງຫຼາຍ.
ເປັນຫຍັງເຈົ້າຈຶ່ງຢຸດ Google ຈາກການອ່ານສ່ວນໃຫຍ່ຂອງເວັບໄຊຂອງເຈົ້າ? ເມື່ອທ່ານຂຽນໄຟລ໌ປະເພດນີ້, ມັນເປັນສິ່ງສໍາຄັນທີ່ຈະເຂົ້າໃຈວ່າໄຟລ໌ໃດບໍ່ຄວນປາກົດຢູ່ໃນເຄື່ອງຈັກຊອກຫາ, ແຕ່ໂດຍບໍ່ມີການລ່ວງລະເມີດ. ຢ່າງໃດກໍ່ຕາມ, ຮູ້ວ່າຜູ້ໃດທີ່ຮູ້ທີ່ຢູ່ທີ່ແນ່ນອນຂອງໄຟລ໌ສະເພາະນັ້ນຈະສາມາດເຂົ້າເຖິງມັນໄດ້ໃນກໍລະນີໃດກໍ່ຕາມ.
ຄໍາສັ່ງ ALLOW ແມ່ນຫຍັງ?
ໃນໄຟລ໌ທ່ານສາມາດເພີ່ມຂໍ້ຍົກເວັ້ນດ້ວຍຄໍາສັ່ງ ທັງ ໝົດ. ໄວຍາກອນແມ່ນຄືກັນ, ແຕ່ມັນຈະສ້າງຂໍ້ຍົກເວັ້ນບາງຢ່າງຕໍ່ກັບ DISALLOW ເຊິ່ງຈະອະນຸຍາດໃຫ້ເປີດຂອບເຂດທີ່ຫນ້າສົນໃຈຂອງການສໍາຫຼວດສໍາລັບ spider.
ໄຟລ໌ຕົວຢ່າງຂະຫນາດນ້ອຍ:
ຕົວແທນຜູ້ໃຊ້: Googlebot
ບໍ່ອະນຸຍາດ: /images/
ອະນຸຍາດ: /images/holidays.jpg
ໂດຍພື້ນຖານແລ້ວພວກເຮົາໄດ້ບອກ Googlebot ບໍ່ໃຫ້ພິຈາລະນາໂຟນເດີຮູບພາບ, ຍົກເວັ້ນຮູບພາບສະເພາະພາຍໃນມັນ, ຄືຮູບຈາກວັນພັກ.
ແລະນັ້ນ, guys, ມັນແມ່ນ. ພວກເຮົາຂຽນໄຟລ໌ robots.txt ທໍາອິດຂອງພວກເຮົາ. ແນ່ນອນ, ສິ່ງທີ່ພວກເຮົາກໍາລັງຈະເຮັດສໍາລັບເວັບໄຊທ໌ທີ່ແທ້ຈິງອາດຈະແຕກຕ່າງກັນເລັກນ້ອຍ, ແຕ່ບໍ່ແມ່ນຫຼາຍ. ຖ້າສົງໃສ, ສະເຫມີໄດ້ຮັບຄໍາແນະນໍາຈາກຜູ້ຄຸ້ມຄອງເວັບພິເສດ. ພວກເຮົາແນະນໍາໃຫ້ທ່ານພະຍາຍາມຂຽນມັນເອງ, ກ່ອນອື່ນ ໝົດ, ແລະສົ່ງມັນໃຫ້ລາວເພື່ອກວດກາ, ເພື່ອໃຫ້ສາມາດເຂົ້າໃຈໄດ້ດີກວ່າວິທີການເຮັດວຽກຂອງເວັບໄຊທ໌ຂອງທ່ານ.
ຄວາມກ່ຽວຂ້ອງກັນລະຫວ່າງ robots.txt ແລະແຜນຜັງເວັບໄຊທ໌ແມ່ນຫຍັງ?
ແຜນຜັງເວັບໄຊທ໌ແມ່ນໄຟລ໌ທີ່ສ້າງຂຶ້ນໂດຍ plugins ພິເສດທີ່ມີການເຊື່ອມຕໍ່ທັງຫມົດຢູ່ໃນເວັບໄຊທ໌. ເມື່ອ spider ເຂົ້າໄປໃນເວັບໄຊທ໌, ມັນທໍາອິດອ່ານຫຸ່ນຍົນ, ຫຼັງຈາກນັ້ນກວາດເວັບໄຊທ໌. ຖ້າໃນລະຫວ່າງການລວບລວມຂໍ້ມູນຫຸ່ນຍົນຊອກຫາທີ່ຢູ່ແຜນຜັງເວັບໄຊທ໌, ຂະບວນການທັງຫມົດຈະງ່າຍຂຶ້ນຫຼາຍ.
ເພີ່ມຕໍ່ໄປນີ້ໃສ່ລະຫັດຂ້າງເທິງ:
ແຜນຜັງເວັບໄຊທ໌: http://www.ilnomedeltuositobellissimo.com/sitemap.xml
ໃນການສະຫລຸບ
ໄຟລ໌ຫຸ່ນຍົນທັງຫມົດແມ່ນຄືກັນ. ນີ້ຫມາຍຄວາມວ່າໄຟລ໌ຫຸ່ນຍົນທີ່ຂຽນສໍາລັບ Google ຍັງຈະເຮັດວຽກໄດ້ດີສໍາລັບ Bing, ແລະປະຕິບັດຕາມໄວຍາກອນດຽວກັນ.
ໄຟລ໌ robots.txt ທີ່ຈັດເປັນລະບຽບດີອະນຸຍາດໃຫ້ທ່ານ ປະຫຍັດເວລາຕົວກວາດເວັບ. ຢ່າທໍ້ຖອຍໃຈ: ນີ້ແມ່ນບາດກ້າວທໍາອິດໄປສູ່ຄວາມສໍາເລັດ!
ທ່ານອາດຈະສົນໃຈໃນ:
ການຊັກຊວນຫຼືການຫມູນໃຊ້? Genesis ແລະຜົນກະທົບປະຫວັດສາດຂອງ PR
ນີ້ແມ່ນວິທີການພົວພັນສາທາລະນະ, ຈາກການປຶກສາຫາລືທີ່ທັນສະໄຫມຂອງປະເທດເກຣັກໂບຮານເພື່ອຍຸກດິຈິຕອນໃນປັດຈຸບັນ, ສືບຕໍ່ສະເຫນີໃຫ້ມີການປະດິດສ້າງຢ່າງຕໍ່ເນື່ອງ.
ຊາວຫນຸ່ມແລະ cryptocurrencies: ວິທີການຊອກຫາເພີ່ມເຕີມກ່ຽວກັບ Bitcoin…
ການແນະນໍາເດັກນ້ອຍໄປສູ່ສະກຸນເງິນດິຈິຕອລ ແລະ Blockchain ສາມາດເປັນຄວາມພະຍາຍາມທີ່ຫນ້າຕື່ນຕາຕື່ນໃຈ, ເນື່ອງຈາກຄວາມສຳພັນຂອງເຂົາເຈົ້າສໍາລັບເຕັກໂນໂລຊີ ແລະນະວັດຕະກໍາ.
"ຄົນເຈັບຢູ່ໃນສູນ": ຄວາມຫວັງທີ່ຍິ່ງໃຫຍ່ແລະການປະຊຸມຢູ່ໃນວຽງຈັນຝົນ
ຫົວຂໍ້ກ່ຽວກັບຄວາມສໍາຄັນຂອງນະວັດກໍາໃນອຸປະກອນການແພດສໍາລັບການດູແລສຸຂະພາບຂອງເອີຣົບຈະຖືກຄົ້ນຫາໃນວັນທີ 15 ພຶດສະພາໃນ Rome ໂດຍຜູ້ຊ່ຽວຊານແລະນັກການເມືອງ.
ໂດຍ Alberto Nicoliniບັນນາທິການຂອງ districtbiomedicale.it, ຂ່າວ BioMed ແລະວິທະຍຸ Pico
ສີ່ປະເທດ, ຫນຶ່ງມະຫາສະຫມຸດຂະຫນາດໃຫຍ່: ກໍລະນີ CMAR
ມັນເປັນແລວທາງທະເລຂອງປາຊີຟິກຕາເວັນອອກເຂດຮ້ອນ: Panama, Ecuador, Colombia ແລະ Costa Rica ພັນທະມິດສໍາລັບການປົກປັກຮັກສາທະເລແລະຊະນິດພັນທະເລ ...