search engine

Seach Engine News.

ห่างหายไม่ได้อัพเดทข่าวสารเลย เหตุตั้งแต่ช่วงวันหยุดเมื่อต้นเดือน ก็ไม่อยู่บ้าน ไม่ได้จับคอมฯเลย เนื่องจากตะลอนทัวร์ไปต่างจังหวัดครับ ผลคือไม่ได้ทำงานทำการอะไรเพิ่มเติม พอกลับมาก็งานกองเต็มบ้านไปหม

63.5% of US Internet people used Google for searchs.

ทาง ComScore ได้เผยข้อมูลเกี่ยวกับผลการสำรวจของปีที่ผ่านมาแล้วนะครับ ซึ่งผมเองก็ได้โหลดไปอ่านดูแล้วครับ เลยคัดในส่วนที่เกี่ยวข้องมาเล่าให้ฟังกันนะครับ ซึ่งก็คงเน้นเกี่ยวกับเรื่องของ Search Engine เป็นหลักครับ

Cuil, new search engine.

Cuil (อ่านว่า คูล) นะครับ เป็นเสิร์ชเอ็นจิ้นรายใหม่ในตลาดที่เปิดตัวกันล่าสุดครับ โดยเจ้าของนั้นก็เป็นอดีตลูกหม้อเก่าของGoogle และจาก IBM ซึ่ง cuil ก็ออกมาโฆษณาตัวเองว่า มีindex มากมาย ครับ แต่ในรายละเอียดผมไม่ขอเอ่ยถึงแล้วกันว่า เค้าอวดอ้างสรรพคุณอะไรไว้บ้างครับ ใครอยากทราบรายละเอียดก็เชิญที่นี่ครับ (จิ้มเลยจ้าา) ส่วนผมเองจะขอกึ่งๆรีวิวและคอมเม้นต์ดีกว่า

[caption id="attachment_446" align="aligncenter" width="300" caption="cuil index"]cuil index[/caption]

หน้าจอมืด ช่องง่ายๆ ก็คงไม่ต้องเอ่ยอะไรกันมาครับว่า รูปแบบนี้ มันกลายเป็นหน้าตามาตรฐานของเว็บ Search engine ไปแล้วมั้งครับ เพราะหลายค่ายหันมาใช้ลักษณะนี้แล้ว และคงไม่ต้องเอ่ยว่า ต้นฉบับเป็นใครนะครับ

Cuil เองบอกว่า มีหน้าเว็บเก็บไว้อยู่มากกว่า 1.20 แสนล้านหน้า ในขณะที่ก่อนหน้านี้ Google เคยกล่าวหรือให้ข่าวว่า มีหน้าเว็บเก็บไว้ประมาณ 1พันล้านหน้า (แต่ในบล็อกเขียนไว้ว่า trillion pages สรุปเชื่อข่าวไหนดี)ซึ่งตรงนี้ ผมเองไม่ได้สนใจหรอกครับว่า มันจะมีอยู่กี่ร้อยกี่ล้านหน้า

ประเด็นมันอยู่ที่ว่า การผลการค้นหานั้น มันให้เราได้อย่างที่เราต้องการรึเปล่า

สิ่งแรกๆ ที่ผมมักจะลองเสมอๆ คือ ค้นด้วยคำภาษาไทย นี่ล่ะครับ เพราะแม้ว่ามักจะติดพิมพ์ภาษาอังกฤษแต่ถ้าลองอะไรพวกนี้แล้วคำภาษาไทยนี่ล่ะสุดๆ ครับ

ผลคือ ไม่ได้ตามต้องการ เพราะเจ้า cuil ตัวนี้ ยังไม่สนับสนุนภาษาไทย รวมทั้งภาษาประหลาดๆ อื่นๆ ที่ไม่ใช่อังกฤษครับ

ถ้าในกรณีที่ค้นพบ เนื้อหาก็จะมีรายละเอียดของเว็บที่พบเหมือนอย่างในภาพครับ

ซึ่งหลักจะมีเนื้อหาอยู่ทั้งหมด 3 column ครับ ซึ่งสามารถรับแต่งให้เป็นสองได้แต่ ลองดูเฉพาะตรงผลการค้นหานะครับ

เราจะเห็นว่าจะมีภาพประกอบและเนือ้หาให้ด้วย นอกจากนี้ ตรงด้านบนจะมีเมนูที่แสดงคำที่เกี่ยวข้องด้วยครับ ซึ่งก็จะเป็นผลการค้นหาเกี่ยวกับเรื่องนั้น

ถ้าในกรณีที่มันมี Relevant keyword เป็นจำนวนมากก็จะปรับมาเป็นเมนู more ด้านหลังครับ เป็น Drop Down menu

ในขณะที่ ด้านข้างๆจะมี เมนูข้อมูลเพิ่มเติมที่เกี่ยวข้อง ซึ่งเป็นเหมือนลักษณะQuick link ให้ครับ

สรุปจากการใช้งาน

โดยส่วนตัวแล้วผมรู้สึกไม่ปลื้มครับ ซึ่งประเด็นแรกคือ

การที่มีจำนวน index เยอะไม่ได้หมายความว่ามันจะดีครับ เพราะมีการจัดเรื่องเนื้อหาหน้าเว็บที่ซ้ำกันบ้าง หรือ url ซ้ำกันบ้าง ซึ่งในบางคำนั้น มีข้อมูลที่มาจากเว็บเดียวกันซ้ำๆ อยู่เป็นจำนวนหลายอันด้วยกัน

เนื่องจากการคัดคำ, การเลือกเก็บข้อมูลในหน้านั้นๆ บางครั้งหน้าเว็บที่แสดงขึ้นมาก็เป็นคำที่อยู่ใน heading หรือ footer บ้างซึ่งไม่ได้มีเนื้อหาหลักของ Content ตรงกับสิ่งที่ต้องการเท่าไหร่ครับ

ต่อมาคือ หน้าตาที่เป็น 3 colunm นั้น แม้ว่าจะแสดงเนื้อหาได้มากกว่า แต่กลับไม่ได้ทำให้การ scan หน้าหาเนื้อหาของผมทำได้ง่ายขึ้นเลยครับ เพราะเหมือนมันมีความขัดกันของ UI อยู่หน่อยๆ

การ fix ตรงแบ่งหน้าให้ดูติดขอบด้านล่างของ Status bar ตลอดทำให้มุมมองในการอ่านเนื้อหาจริงๆ เหลือน้อยครับ ยิ่งอยู่ในหน้าจอ notebook ด้วย ทำให้ดูแล้วไม่ถนัด

ซึ่งนอกเหนือจากนี้ ก็ยังไม่มีอะไรครับ หลักน่าจะเป็นเรื่องความถนัดส่วนตัวมากกว่า ในเรื่องของเนื้อหา ผมว่า มี index เยอะ แต่ไม่ครอบคลุม และทั่วถึงครับ

แต่ถือว่า ก็น่าสนใจไม่น้อยทีเดียวครับ ถือเป็นSearch engine ตัวใหม่ตัวที่ 2 ของปีนี้ครับ

PowerSet! new search engine from Wikipedia.

เอาละครับ สนุกแล้วครับ หลังจากที่ก่อนหน้านี้ ทาง wikipedia เคยออกมาให้ข่าวว่าจะทำ search engine มาใช้งานเอง ในระบบของ wiki ที่มีเนื้อหาอยู่เป็นจำนวนมากครับ

ตอนนี้ ออกมาแล้วครับ โดยใช้ชื่อว่า PowerSet (www.powerset.com) ซึ่งถือเป็นก้าวที่สำคัญของวงการ Search engine เลยครับ เพราะนอกจากการแข่งขันในวงการ SE นั้นดูจะหายไป กลายเป็นสามก๊ก SE แล้ว (Google, yahoo and live) ไม่ได้เกิดการควบรวมครั้งใหญ่ระหว่างMS กับ Yahoo ทำให้สภาวะ สามก๊กนี้ ยังอยู่ครับ

กลับมาเข้าเรื่องของPowerset ครับ ถือเป็นเรื่องที่น่าสนใจครับ เพราะแน่นอน ว่าในปัจจุบัน เราคงต้องยอมรับกันส่วนหนึ่งว่า การค้นหาในSE ใหญ่ มักจะมีส่วนของ spamdexing, Blackhat site, Irrelevance site หรือสรุปง่ายคือ เว็บในกลุ่มสายดำ ทั้งหลายเข้ามาปะปน

หรือหลายครั้ง คุณก็พบว่า i feel lucky ของ google นั้นพึ่งพาอาศัยไม่ไ้ด้ หรือบางครั้งเบื่อหน่ายกับเว็บดักคีย์ ดักควายอะไรพวกนี้  แต่เจ้า Powerset ทำให้สิ่งเหล่านั้นหมดไปได้ครับ

เพราะเนื่องจาก PowerSet นั้นจะพยายามหาข้อมูลที่เกี่ยวข้องมาให้คุณเลย ซึ่งข้อมูลนั้นมาจากWiki pedia เป็นตัวหลักเลย และเราก็รู้ๆ กันดีว่า หลายครั้งที่ wikipediaช่วยให้เราได้ข้อมูล ความรู้ที่เราต้องการ และอัพเดทมากกว่าใน google เสียอีกครับ

Powerset search

จากภาพด้านบนในตัวอย่างนะครับ จะเห็นว่า นอกจากมี Info ที่เกี่ยวกับคำว่าSEO (Search engine optimization) แล้ว ยังมี Seo (ชื่อที่เป็นภาษาเกาเหลี)  ให้เราเข้าใจอีกด้วยครับ

ส่วนในการลอง search ด้วยคำภาษาไทยนั้น ยังไม่ค่อยดีเท่าไหร่ แน่นอนว่า อาจจะเกิดจากการที่เนื้อหาในเว็บของ th.wikipedia นั้นยังมีไม่มากพอ ที่จะทำให้สรุปเนื้อหาเข้ามาด้วยกันได้ แต่ก็ยังพอมีลิ้งค์จาก wikipedia ให้เราในด้านล่างครับ ดังนั้น ต่อไป น่าจับตามองทีเดียวกับกับ PowerSet ตัวนี้

แต่แน่นอน ในมุมมองของผมนั้น เจ้า PowerSet ยังไม่ใช่คู่แข่งที่จะขึ้นมาทาบรัศมียักษ์ใหญ่ทั้งสามก๊กนั้นได้ หากแต่เป็นแค่ชนเผ่าเล็กๆ เป็น Search engine เฉพาะทางมากกว่าครับ

เพราะอะไร???

เพราะว่า ผลการค้นหานั้น มุ่งเน้นในส่วนของ wiki อย่างเดียว เนื้อหาที่ได้จึงไม่ทั่วถึงไปยังเว็บ และเนื้อหาอื่นๆ มากพอครับ เว็บไซต์หรือเนื้อหาดีๆ จากบล็อกต่างๆ ก็ไม่สามารถจะแทรกเข้าไปได้ หากมิได้เข้าไปแปะอยู่ในส่วนของ wikipedia (linkของeblogbiz.com ของผมเคยอยู่แต่ปัจจุบันไม่รู้ใครมาเอาออกไปซะงั้น)

ปัญหาอีกส่วนหนึ่งของ Wiki เอง นั่นคือ ความเอนเอียง หรือความไม่เป็นกลางของเนื้อหาในบางประเด็น ซึ่งปัญหานี้ ในส่วนของ Wiki เองก็ยังจัดการไม่ได้มากนัก นอกจากขึ้นตัวหนังสือ สีแดงๆ เตือนเท่านั้น

หลายครั้งที่เรามักจะเห็นบทความที่เกิดจาก ทฤษฏีสมคบคิด ขึ้นไปแปะอยู่บน wiki ครับ

แน่นอนว่า มันเพิ่งจะเปิดตัว ดังนั้น อย่าเพิ่งจะคิดว่า มันไม่ดีเลยครับ เพราะอย่างน้อยทาง Wikiเองก็ได้แสดงให้เห็นแล้วว่า พวกเค้าทำได้