เป็นที่ทราบกันดีว่าถ้าคุณนำข้อมูลใส่เข้าไปบนอินเทอร์เน็ตนั่นก็หมายความว่าคุณยอมรับ
ที่จะเผยแพร่ข้อมูลนั้นต่อสาธารณ เพียงแค่ใช้ ชื่อหรืออีเมล ของบุคคลที่คุณต้องการสืบค้น
เสิร์ชด้วยกูเกิลคุณก็จะพบกับข้อมูลมากมาย
วิธีที่จะช่วยให้เว็บไซท์ หรือ บางเพจของเว็บไม่ให้ถูกค้นเจอด้วย search engine
1.ใส่ robots meta tag ในเพจที่ไม่ต้องการให้ search engine เก็บข้อมูลไปทำ index
-
<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
ค่า NAME ที่สามารถใส่เข้าไปได้
- ROBOTS หมายถึง robots ของทุกตัว
- GOOGLEBOT หมายถึง การเจาะจงให้มีผลเฉพาะ robot ของ google
ค่า CONTENT ที่สามารถใส่เข้าไปได้
- NOINDEX หมายถึง ไม่ให้ทำ index เพจนี้
- NOFOLLOW หมายถึง ห้ามตาม link ที่ปรากฏในเพจนี้
- NOARCHIVE หมายถึง ห้าม cache เพจนี้

2.สร้างไฟล์ robots.txt ไว้ที่ root / top level ไดเรคทอรี่
เมื่อ robots เข้ามาเยี่ยมเว็บไซท์เรา มันจะมองมาไฟล์ robots.txt ก่อน
เช่น url เว็บไซท์ http://www.example.com/ robot ก็จะเข้าไปที่
http://www.example.com/robots.txt เป็นอันดับแรก
ถ้าเราใส่โคดข้างล่างนี้เข้าไปในไฟล์ robots.txt
-
User-agent: *
-
Disallow: /
robots มันก็จะออกไปจากเว็บไซท์เราทันที
“User-agent: *” หมายความว่า ให้มีผลกับ robots ทุกตัว
“Disallow: /” คือ การบอกให้ robots ไม่ต้องเข้ามายุ่มย่ามเว็บไซท์นี้
วิธีนี้ก็สามารถระบุตัว robot ได้เช่นเดียวกับวิธีแรกโดยใส่ค่า User-agent ดังนี้
“User-agent: Google”
มาดูกันอีกตัวอย่างนึง
-
User-agent: *
-
Disallow: /cgi-bin/
-
Disallow: /tmp/
-
Disallow: /junk/foo.html
“Disallow: /cgi-bin/ ” หมายความว่า ห้าม robots ตัวใด ๆ เข้าไปโฟลเดอร์ cgi-bin
“Disallow: /junk/foo.html” หมายความว่า ห้าม robots ตัวใด ๆ เข้าไปยุ่งกะไฟล์
foo.html ที่อยู่ในโฟลเดอร์ junk
ตัวอย่างเว็บที่ใช้ robots.txt
- http://www.pantip.com/robots.txt
- http://www.amazon.com/robots.txt
- http://www.google.com/robots.txt
- http://www.ebay.com/robots.txt
- http://edition.cnn.com/robots.txt
Reference:
- http://googlewebmastercentral.blogspot.com/2007/03/using-robots-meta-tag.html
- http://www.robotstxt.org/robotstxt.html

August 26th, 2008 เมื่อ 11:39 pm
ความรู้ใหม่อีกแว้ว
August 27th, 2008 เมื่อ 11:10 am
กระจ่างเลยครับ
August 28th, 2008 เมื่อ 8:55 pm
ที่จริงน่าจะลองเขียนเรื่องอื่นๆดูบ้างนะครับ (แต่ก็ไม่ต้องมาเลียนแบบผมก็ได้นะ) ผมจะได้เข้ามาเม้นท์ได้บ้าง
September 8th, 2008 เมื่อ 1:26 pm
ป้องกันหุ่นยนต์(robots)ทำไมล่ะครับ
ไปกันมัน มันก็ไม่พัฒนาสิครับ
ไม่งั้นคงจะไม่มี azumo มาหรอก
ถ้ามีแต่คนมากันอย่างงี้อ่ะครับ
September 8th, 2008 เมื่อ 1:31 pm
เดี๋ยวมันก็ฉลาดเกินไปสิครับ
หรือคุณเต่าคิดว่าไงล่ะ?
September 8th, 2008 เมื่อ 1:39 pm
อืมๆ ที่คุณพูดมาก็มีเหตุผล
เห็นในหนังเรื่องสตาร์วอร์ R2D2 โคตรโหดเลย
เดี๋ยวมันมายึดครองโลกละแย่เลย
ละว่าแต่ใครคือคุณเต่าครับ??
September 8th, 2008 เมื่อ 1:42 pm
ละว่าแต่ใครคือคุณเต่าครับ??
-ก็คุณเทพโลคอลโฮสไงคับ หรือว่าลืมฉายาตัวเอง 5555