web 2.0


    

Index, De-Index และ Re-Index

ถึงแม้ว่า Search Engine จะมีการ De-Index เว็บเพจ, เว็บไซต์ที่ทำผิดหลักหรือข้อกำหนดของ Search Engine แต่เราสามารถที่จะนำเว็บเพจ, เว็บไซต์ของเรากลับมา Index ได้ เรียกกรณีเช่นนี้ว่า Re-Index นั่นเองครับ

เพราะว่าการ De-Index นั้น ก็คือ ลักษณะที่ Search Engine มองว่าเว็บใดๆ มีการกระทำที่ไม่น่าไว้ใจ ทั้งในทางที่จัดอยู่พวก spam web หรือเว็บที่ทำ SEO จำพวก Black Hat ดังนั้น Search Engine จะต้องทำการกวาดล้างหรือยกเลิกออกจากฐานข้อมูล

สมมติว่าเว็บของเราถูก De-Index ไปแล้ว ถ้าถามว่ามีทางที่จะ Index คืนมาหรือไม่ คำตอบคือ มีครับ

ซึ่งน่าจะจำแนกเป็นขั้นตอนได้ คร่าวๆ ดังนี้
1. ทำความสะอาดเว็บเพจด้วยการเครียร์สิ่งที่ผิดปกติ (Black Hat) ออกจากเว็บเพจ
2. ปรับปรุงเนื้อหาและรูปแบบของเว็บเพจให้ดีขึ้น
3. แก้ไข Source Code ให้ถูกต้องตามหลัก Webmaster Guideline รวมถึง W3C ยิ่งดี
4. ปฏิบัติการตามแนวทาง SEO อีกครั้งหนึ่ง

บทความโดย ic-seo.com

VN:F [1.0.8_357]

Direct Ping

การส่งคำสั่ง Ping แบบตรงไปยัง Search Engine เพื่อเรียก Robot ให้เข้ามาเก็บข้อมูลหลังการอัพเดต
เป็นกระบวนการที่ทำให้เว็บของเราได้รับการเก็บข้อมูลไป indexed ยัง Search Engine โดยการแนะนำไฟล์ Feed เช่น sitemap.xml

มีตัวอย่างของลิงก์ที่ทำการ Ping ต่อไปนี้ครับ

ตัวอย่างเว็บไซต์ที่ทำการส่งคำสั่ง Ping คือ http://www.ic-seo.com/sitemap.xml

1. Google
http://www.google.com/webmasters/sitemaps/ping?sitemap=http://www.ic-seo.com/sitemap.xml

2. Yahoo!
http://api.search.yahoo.com/SiteExplorerService/V1/updateNotification?appid=MicrosysProgramSER&url=http://www.ic-seo.com/sitemap.xml

3. Live
http://webmaster.live.com/ping.aspx?siteMap=http://www.ic-seo.com/sitemap.xml

4. Ask
http://submissions.ask.com/ping?sitemap=http://www.ic-seo.com/sitemap.xml

หลังจากส่งคำสั่ง Ping แล้ว Robot จาก Search Engine ก็จะถูกส่งมาเก็บข้อมูลไปสู่การ indexed ต่อไปครับ
ดังนั้นเว็บไซต์ของเราที่ทำการ update อย่างสม่ำเสมอ การ Ping ก็จะเพิ่มประสิทธิภาพของ SEO ที่ดีอีกทางหนึ่งนั่นเองครับ

บทความโดย ic-seo.com


VN:F [1.0.8_357]

Spider, Crawlwer, Bot

Spider, Crawler และ Bot หรือ Robot คือโปรแกรมการทำงานชนิดหนึ่งของ Search Engine ซึ่งถูกสร้างขึ้นให้เป็นเสมือนแมงมุมตัวเล็กๆ ที่ค่อยๆ ไต่ไปตามส่วนต่างๆ ของใยแมงมุมแห่งเวิร์ดไวด์เว็บ เพื่อทำการเก็บข้อมูลส่งกลับไปยัง Search Engine ไว้สำหรับการทำดัชนี (Index) และที่เรียกชื่อต่างกันนั่นเพราะค่านิยม แต่โดยส่วนใหญ่แล้วมักจะเรียกกันว่า Bot เพียงสั้นๆ

บทความโดย ic-seo.com

VN:F [1.0.8_357]

การลงทะเบียนที่อยู่เว็บไซต์

การลงทะเบียนที่อยู่เว็บไซต์ เริ่มจากที่การ “ลงทะเบียน URL เพื่อให้มีการเก็บข้อมูลใหม่” หรือเรียกว่า search engine submit URL กับเว็บไซต์ของเรา เช่น google submit URL โดยไปที่ http://www.google.com/addurl.html เพื่อทำการลงทะเบียนกับระบบให้ search engine ทำการส่งแมงมุมเข้ามาทำการเก็บข้อมูลเว็บไซต์ของเราแบบตรงๆ ได้เลย

วิธีการ search engine submit URL เหมาะอย่างยิ่งสำหรับเว็บไซต์ที่เพิ่งจะทำการเปิดตัวใหม่ และไม่ได้มีลิงค์มาจากเว็บไซต์อื่นๆ และอีกกรณีหนึ่งที่เหมาะสมในการใช้งาน คือ หากเว็บไซต์ของเราทำการอัพเดทกันครั้งใหญ่ ไม่ว่าจะเป็นส่วนของเนื้อหาหรือว่าโครงสร้างเว็บไซต์ แต่ถ้าหากแมงมุมมาทำการเก็บข้อมูลที่เว็บไซต์ของเราบ่อยอยู่แล้ว ประมาณ 2-3 วันต่อครั้ง เราก็ไม่ต้องใช้คำสั่งนี้ก็ได้
วิธีการนี้ อาจเรียกได้ว่าเป็นการ “ส่งบัตรเชิญแมงมุม” หรือ Robots Invite ขอแนะนำว่าเราไม่ควรใช้คำสั่งนี้บ่อยเกินไป ควรใช้เฉพาะตอนที่จำเป็น หรือเฉพาะเว็บเปิดตัวใหม่แน่นอนว่าการใช้บ่อย เรียกแมงมุมให้เข้ามาบ่อยๆ ย่อมไม่ส่งผลดีต่อความน่าเชื่อถือของเว็บไซต์เราแน่ๆ (ในอนาคต)

 

บทความโดย  :  ic-seo.com

VN:F [1.0.8_357]

SEO Tip : หลักการง่ายๆ ให้ติด Search Engine ในหน้าแรก

สวัสดีครับ

วันนี้ขอนำเอาทริปเล็กๆ น้อยๆ แต่สามารถสร้างความยิ่งใหญ่ให้กับเว็บไซต์ ในการเข้าสู่หน้าแรกของ Search Engine ได้นะครับ ผมได้ทดสอบแล้วทั้งใน Google และ Yahoo!

ขอให้ท่านพิจารณาลองดูนะครับ เพียงแค่….

1. เลือกคีย์เวิร์ดที่เหมาะสมและสัมพันธ์กับเว็บไซต์ คือให้มันสื่อระหว่างคีย์เวิร์ดที่ท่านต้องการและชื่อโดเมนที่เราเลือกใช้

2. เขียน Content ของเว็บไซต์ให้มีคีย์เวิร์ดเป็นพื้นฐาน และพยายามใช้คีย์ให้เป็นการเสมือนการบอกย้ำ

3. สร้าง Title tag โดยให้มีคีย์เวิร์ดเป็นหลัก

4. สร้าง Meta tag ให้เป็นประโยคที่สื่อถึงคำและความหมายทางการตลาด โดยสัมพันธ์กับคีย์เวิร์ดด้วย

เพียง 4 ข้อเท่านี้เองครับ ก็สามารถสร้างเว็บไซต์ที่มีพื้นฐานในการที่จะลงแข่งขันทางด้าน SEO กับเว็บไซต์อื่นๆ ได้อย่างมีประสิทธิภาพและประสิทธิผลแล้วครับ

-ตัวอย่างผลการจัดทำครับ

1. ที่ Yahoo! อันดับหนึ่ง ใน 1 - 10 of about 2,810,000 for sem thai

ที่ลิงก์นี้ครับ http://search.yahoo.com/search;_ylt=A0oGkkxa8UVIyawAH1BXNyoA?p=sem+thai&fr=yfp-t-501&ei=UTF-8&fp_ip=TH

2. ที่ Google.com อันดับสอง ใน Results 1 - 10 of about 695,000 for sem thai.

ที่ลิงก์นี้ครับ http://www.google.com/search?hl=en&q=sem+thai&meta=

 

บทความโดย  :  ic-seo.com

VN:F [1.0.8_357]

Google Index Server Engine

Google จะมี ระบบการจัดเก็บข้อมูลเอกสารที่ถูก copy มา (index server) ซึ่งเป็นระบบการจัดเก็บข้อมูลที่ได้รับมาจาก googlebots อีกที โดยข้อมูลที่นำมาทำการจัดเก็บนั้น ส่วนใหญ่แล้วจะเป็นเอกสารหน้าเพจ (HTML Document) และไฟล์เอกสารรูปภาพต่างๆ (Image Document) จะเก็บข้อมูลทั้งหน้าเพจ อาจเรียกได้ว่าทุกภาพ ทุกตัวอักษร จนกลายเป็นสำเนาเอกสาร วิธีการนี้เรียกสั้นๆได้ว่า “การ Index หน้าเพจ” ระบบนี้จะอำนวยความสะดวกสำหรับขั้นตอนต่อไปในการให้เอกสารที่มีอยู่ในระบบการค้นหานั้น แสดงผลออกมาให้ตรงกับเอกสารปัจจุบันให้มากที่สุด

การ index ข้อมูลทั้งหมดนั้น ทางระบบการประมวลผลในการจัดอันดับการค้นหา หรืออัลกอริมึม จะทำการตัดคำสิ้นเปลือง และคำหยุด (common words หรือ stop words) ออกไปจากหน้าเอกสารนั้นๆทุกครั้งที่มีการประมวลผล ( เช่น the,is,on,on,of,a,it) เพื่อลดอัตราการสิ้นเปลืองในการประมวลผลแต่ละครั้งให้เหลือน้อยที่สุด

common words หรือ stop words เป็นคำค้นโดยทั่วไป ที่ไม่สามารถจำกัดขอบเขตของการค้นหาได้และเพื่อเป็นการป้องกันให้ประสิทธิภาพของ index server ลดลง จึงไม่สามารถค้นหาประเภทนี้ได้ เนื่องจากคำประเภทนี้เป็นคำกล่าวที่สามารถพบได้กับเอกสารโดยทั่วไปที่มีอยู่บนอินเตอร์เน็ตเป็นจำนวนมาก

 

บทความโดย  :  ic-seo.com

VN:F [1.0.8_357]

PR Update

หลังจากก่อนหน้านี้หลายๆ คนเคยให้การคาดเดาเอาไว้ ว่าจะอัพเดตวันนั้น วันนี้ จนแล้วจนรอดก็มาอัพเดตเอาวันนี้จนได้ครับ การอัพเดตของ Google PR หรือ Google PageRang ในแต่ละครั้งนั้น สร้างความตื่นเต้นดีใจให้กับบรรดาเจ้าของเว็บไซต์ผู้เฝ้าติดตามดูแลและได้จัดทำ Search Engine Optimization หรือ SEO เป็นอย่างมาก เนื่องจากว่า ค่า PR ของเว็บไซต์ใดๆ สามารถนำไปแสดงเป็นการการันตีเว็บที่มีคุณภาพได้ นอกเหนือจากจำนวนการเข้าชมของผู้สนใจ (Traffic) ส่วนท่านใดที่ยังไม่ทราบว่า จริงๆ แล้ว PR ที่เรียกกันอยู่นี้คืออะไร เดี๋ยวรอไว้จะมาอัพเดตบนบล็อกนี้ให้นะครับ หรือไม่ก็สามารถติดตามหาอ่านได้จาก Google โดยตรงเลยก็ได้ครับ

 

บทความโดย  :  ic-seo.com

VN:F [1.0.8_357]

Search Engine Spider

Search Engine Spider หรือ”แมงมุม” จริงๆแล้วก็เป็นโปรแกรมเล็กๆ โปรแกรมหนึ่ง โดยสามารถเรียกเหมารวมได้หลายแบบทั้ง “spider” ,”crawlers” หรือ “robots” แต่เพื่อความชัดเจน เราก็สามารถเรียกชือตรงๆ เพื่อ ระบุแยกลงไปได้อีก เช่น Google มีชื่อเรียก Search Engine Spider ของตัวเองว่า Googlebot, Yahoo มีชื่อเรียกว่า Slurp และ MSN มีชื่อเรียกว่า MSNbot

การเก็บข้อมูลนี้จะอาศัยหลักการ “ ไต่” ไปตามลิงค์ต่างๆของหน้าเพจที่กำลังทำการตรวจสอบอยู่ และจะทำการ”สำเนาข้อมูล” ของหน้าเพจทั้งหมด (มันคือการcopy ข้อมูลทุกสิ่งทุกอย่างที่ตรวจพบยกเว้นไฟล์เอกสารที่อยู่ในตระกูล Flash เช่น .swf ) แล้วจึงส่งข้อมูลที่ copy แล้วกลับไปยัง server ต้นทางของตนเอง เพื่อทำการบันทึก (page index) ลงสู่ฐานข้อมูลขนาดใหญ่ (Search Engine Index Server) จะเริ่มทำการประมวลผลจากฐานข้อมูลของตนเองที่ถืออยู่และแสดงผลการค้นหาออกมา

Search Engine Index Server ของ   นั้น ใช้ระบบปฏิบัติการของทั้งระบบ ซึ่งตัวเลขของจำนวน server เล็กๆทั้งหมดที่ Google ที่อยู่ตอนนี้คือ 300,000 เครื่องทั่วโลก โดยใช้พื้นที่ในการจัดเก็บข้อมูลไปทั้งสิ้นในตอนนี้ มากกว่า 5 ล้าน Terbyte ไปแล้ว
และนี่คือเหตุผลว่าทำไม Search Engine ชื่อดังหลายแห่งถึงได้ค้นหาหน้าเพจต่างๆ ได้อย่างรวดเร็ว โดยใช้เวลาเพียงแค่เสี้ยววินาทีเท่านั้น ต่อการค้นหา 1 ครั้ง โดยตัวอย่างของ Search Engine  ประเภทนี้ก็คือ Google, Yahoo และ MSN

 

บทความโดย  :  ic-seo.com

VN:F [1.0.8_357]

สาเหตุที่ google ได้รับความนิยม

สาเหตุที่ google ได้รับความนิยมในการใช้ค้นหาข้อมูลจากผู้ใช้งานทั่วโลกอย่างล้นหลาม จนสามารถถือส่วนแบ่งของตลาดไว้ได้มากสุดมาอย่างยาวนานนั้น อาจเป็นเพราะ google สามารถค้นหาข้อมูลได้รวดเร็วตรงใจภายในระยะเวลาการค้นหาแค่เพียงไม่กี่เสี้ยววินาที ใช้งานง่ายเพียงแค่คลิก ผลลัพธ์การค้นหาที่ต้องการที่ต้องการจะปรากฏแสดงบนหน้าจอทันที นอกจากนี้ยังสนับสนุนการใช้งานได้หลากหลายภาษา ซึ่งรวมไปถึงภาษาไทย และยังมีบริการเสริมต่างๆ อีกมากมายที่ล้วนเป็นของฟรี ต่างทยอยเปิดตัวออกมาให้เราได้ใช้บริการกันอย่างตลอดเวลา สิ่งเหล่านี้เองที่ทำให้ google ครองใจคนทั่วโลกได้ภายในระยะเวลาอันรวดเร็วเพียงแค่ไม่กี่ปีที่ผ่านมา

ในฐานะที่เป็น Search Engine ที่มีส่วนแบ่งในตลาดสูงที่สุด และได้รับความนิยมทั้งจากคนไทยและทั่วโลกมากที่สุด ด้วยเหตุนี้จึงหยิบยก google ขึ้นมาเพื่ออธิบายหลักการทำงานทั้งระบบของเครื่องมือค้นหาบนอินเทอร์เน็ต
Google จัดว่าอยู่ในประเภท Crawler-Based Search Engines  แต่ว่าทาง Google จะเน้นระบบการทำงานด้านการจัดเก็บข้อมูลและการประมวลผลการค้นหาอย่างเต็มรูปแบบมากที่สุด โดยมีอัลกอริทึม ที่ขึ้นชื่อว่าละเอียดและซับซ้อนที่สุด และมีการออกแต้ม”ค่าคะแนนความน่าเชื่อถือของหน้าเพจ” หรือ Google PageRank

 

บทความโดย  :  ic-seo.com

VN:F [1.0.8_357]

การทำงานของ Google Robots

โปรแกรม “แมงมุม” ของกูเกิ้ล  แมงมุมของที่นี้ มีชื่อเรียกอย่างเป็นทางการว่า googlebots ซึ่งเป็นโปรแกรมตัวเล็กๆที่จะคอยเก็บข้อมูลเว็บไซต์ต่างๆโดยจะทำการ “ ไต่” ไปตามลิ้งค์ที่มันตรวจพบ หรือได้รับคำสั่งจากเครื่องแม่ข่าย ให้ไปเก็บข้อมูลใหม่ตามที่มีผู้มาทำการลงทะเบียน URL กับทางระบบออนไลน์ของ google (google submit URL)

ระบบการจัดเก็บข้อมูลเอกสารที่ถูก copy มา (index server) ซึ่งเป็นระบบการจัดเก็บข้อมูลที่ได้รับมาจาก googlebots อีกที โดยข้อมูลที่นำมาทำการจัดเก็บนั้น ส่วนใหญ่แล้วจะเป็นเอกสารหน้าเพจ (HTML Document) และไฟล์เอกสารรูปภาพต่างๆ (Image Document) จะเก็บข้อมูลทั้งหน้าเพจ อาจเรียกได้ว่าทุกภาพ ทุกตัวอักษร จนกลายเป็นสำเนาเอกสาร วิธีการนี้เรียกสั้นๆได้ว่า “การ Index หน้าเพจ” ระบบนี้จะอำนวยความสะดวกสำหรับขั้นตอนต่อไปในการให้เอกสารที่มีอยู่ในระบบการค้นหานั้น แสดงผลออกมาให้ตรงกับเอกสารปัจจุบันให้มากที่สุด

การ index ข้อมูลทั้งหมดนั้น ทางระบบการประมวลผลในการจัดอันดับการค้นหา หรืออัลกอริมึม จะทำการตัดคำสิ้นเปลือง และคำหยุด (common words หรือ stop words) ออกไปจากหน้าเอกสารนั้นๆทุกครั้งที่มีการประมวลผล ( เช่น the,is,on,on,of,a,it) เพื่อลดอัตราการสิ้นเปลืองในการประมวลผลแต่ละครั้งให้เหลือน้อยที่สุด
common words หรือ stop words เป็นคำค้นโดยทั่วไป ที่ไม่สามารถจำกัดขอบเขตของการค้นหาได้และเพื่อเป็นการป้องกันให้ประสิทธิภาพของ index server ลดลง จึงไม่สามารถค้นหาประเภทนี้ได้ เนื่องจากคำประเภทนี้เป็นคำกล่าวที่สามารถพบได้กับเอกสารโดยทั่วไปที่มีอยู่บนอินเตอร์เน็ตเป็นจำนวนมาก

 

บทความโดย  :  ic-seo.com

VN:F [1.0.8_357]
Previous Entries