ITM 640: เทคโนโลยีการสื่อสารและอินเทอร์เน็ต Show เครื่องมือสืบค้นข้อมูล ( Search Engine ) ปัจจุบันการใช้อินเทอร์เน็ตเข้ามามีบทบาทในชีวิตประจำวันมากขึ้น เพื่อใช้เป็นช่องทางในการติดต่อสื่อสารและแพร่กระจายข่าวสารข้อมูลต่างๆ เมื่อความนิยมในการใช้อินเทอร์เน็ตเป็นไปอย่างแพร่หลาย ทำให้ปริมาณข้อมูลมีมากขึ้นการสืบค้นข้อมูลจึงเป็นเรื่องยากลำบากในการค้นหา จึงมีบริการสืบค้นข้อมูล (Search Engine) เกิดขึ้นเพื่อเข้ามาช่วยในการสืบค้นข้อมูลให้ง่ายสะดวกและรวดเร็วมากยิ่งขึ้น ความหมายของ Search Engine เครื่องมือสืบค้นอาจแบ่งเป็น 4 ประเภท ดังนี้ 1. Crawler Based Search Engine โครงสร้างของ Crawler Based Search Engine จะประกอบไปด้วย 3 ส่วนหลักๆ คือ 1. Spider หรือ Web Robot นอกจาก Spider จะทำงานหาลิงค์เพิ่มโดยอัตโนมัติแล้ว Search Engine ส่วนใหญ่อนุญาตให้ส่ง URL เพื่อกำหนดให้ Spider มาทำดัชนีที่เว็บไซต์ใดๆได้ ในปัจจุบันมีบริการที่จะส่ง URL ไป Search Engine หลายๆแห่งพร้อมกันในคราวเดียวเช่นที่ www.submit-it.com Spider หรือ Web Robot จะมีโปรแกรมคำสั่งที่เรียกว่า robots.txt คือการคำสั่งให้ Web Robot ของแต่ละ search engine นั้น ทำตามเก็บ index แต่ละอย่างที่เว็บไซต์ที่อนุญาติ โดยบางเว็บไซต์อาจไม่ต้องการให้ search engine เข้าไปในเว็บบางอย่าง ก็จะเขียนกำหนดได้บน Robot.txt นี้เอง robots.txt เป็น fileที่บอก Search engine ว่า ไม่ต้องมาเก็บเว็บไซต์นี้ หรือเว็บเพจบางหน้า หรือไฟล์บางไฟล์ Robot เป็นโปรแกรมเก็บข้อมูลในอินเตอร์เน็ต ซึ่งบางครั้ง เรียกว่า Spider หรือ ครอว์เลอร์(Crawler) จะทําหน้าที่รวบรวมไฟล์ HTML เพื่อมาเป็นข้อมูล สําหรับสร้างดัชนีค้นหา ให้กับ Search Engine โดยทั่วไปแล้ว โรบอตจะกลับมาที่เว็บไซต์ที่อ่านไปแล้ว เพื่อตรวจสอบ การเปลี่ยนแปลง ตามระยะเวลาที่กําหนด 2. indexer 3. Search Engine software ตัวอย่าง Crawler Based Search Enginewww.google.com Google ซึ่งเป็น Search Engine ที่ได้รับความนิยมอย่างมากในขณะนี้ มี Spider ที่มีความเร็วในการเก็บข้อมูลโดยที่ความเร็วสูงสุด Spider 4 ตัวสามารถรวบรวมข้อมูลได้มากกว่า 100 เว็บเพจต่อวินาที หรือได้ข้อมูลประมาณ 600 Kต่อวินาที เวลาปรกติประสิทธิภาพของ Spider และ indexer ทำให้ Google ดาวน์โหลดข้อมูลล่าสุด 11 ล้านหน้าในเวลาเพียง 63 ชั่วโมงเฉลี่ยเพียง 4 ล้านหน้าต่อวันหรือ 48.5 หน้าต่อวินาทีเพราะ indexer ทำงานเร็วกว่า Spider จีงมีเวลาพอเพียงเพิ่มประสิทธิภาพการทำ indexer เพื่อให้มันไม่คั่งค้าง ตัวอย่างสถาปัตยกรรม ของ Google ดังรูป รูปที่ 1 High Level Architecture Googleตัวอย่าง Crawler Based Search Engine อื่น ๆ http://www.excite.com/ http://www.altavista.com/ http://www.lycos.com/ http://www.bing.com/ 2.Meta Search Engine ตัวอย่าง Meta Search Engine http://www.ixquick.com/ http://www.dogpile.com/ http://www.metacrawler.com/ http://www.mamma.com/ 3 Classified Directory การเพิ่มชื่อเว็บไซต์เข้าสู่เว็บ Classified
Directory ตัวอย่าง Classified Directory http://www.dmoz.org/ http://www.galaxy.com/ http://www.yahoo.com/ http://www.sanook.com/ 4. Subject Gateway เห็นได้ว่า Search Engine แต่ละที่มีวิธีการจัดเก็บฐานข้อมูลที่แตกต่างกันไปตามประเภทของ Search Engine ที่นำมาใช้เก็บรวบรวมข้อมูล ดังนั้นการที่จะเข้าไปหาข้อมูลหรือเว็บไซต์ โดยวิธีการ Search
เพื่อที่จะให้ได้ข้อมูลตรงกับวัตถุประสงค์และความต้องการมากที่สุดจะต้องทราบว่า เว็บไซต์ที่เข้าไปใช้บริการ ใช้วิธีการหรือ ประเภทของ Search Engine อะไร เนื่องจากแต่ละประเภทมีความละเอียดในการจัดเก็บข้อมูลต่างกันไป Top Search Engine -
Volume Top Search Engines – Visits The following report shows websites for the industry 'Computers and Internet - Search Engines', ranked by Visits for the week ending21/08/2010.เทคนิคการใช้ Search Engine การแทรก
Meta tags Meta tags ที่จะแทรกนั้นจะมี 2 อย่างคือ 1.Description เป็นส่วนที่ใช้บอกรายละเอียดของเว็บเพจแบบคร่าวๆ 2.Keywords เป็นส่วนที่ใช้บอก คำที่เกี่ยวข้องกับเว็บเพจหน้านี้ เป็นคำที่ใช้ในการค้นหาหน้านี้ การแทรก Meta tags ในส่วนของ Description 1.เปิดหน้าเว็บเพจที่เราต้องการแทรก Meta tags ขึ้นมา 2.ไปที่ Menu เลือก Insert > HTML > Head Tags > Description 3.จะมีกล่องข้อความขี้นมาให้เขียนรายละเอียดลงไปในกล่องนั้น ใส่ได้เฉพาะตัวอักษรห้ามใส่ Code ต่างๆ จะ เป็นภาษาอังกฤษ หรือไทยก็ได้ 4.คลิก OK ก็จะแทรก Meta tags เรียบร้อย การแทรก Meta tags ในส่วนของ Keywords 1.เปิดหน้าเว็บเพจที่เราต้องการแทรก Meta tags ขึ้นมา 2.ไปที่ Menu เลือก Insert > HTML > Head Tags > Keywords 3.จะมีกล่องข้อความขี้นมาให้เขียนรายละเอียดลงไปในกล่องนั้น การใส่ Keywords จะใส่เป็นคำและคั่นด้วย (,) 4.คลิก OK ก็จะแทรก Meta tags เรียบร้อย เครื่องมือในการสืบค้นข้อมูลสารสนเทศ มีอะไรบ้างประเภทเครื่องมือสืบค้นสารนิเทศ
1.1 บัตรรายการ (Card Catalog) 1.2 บัตรดัชนีวารสาร (Card Index) 2. การสืบค้นสารนิเทศด้วยระบบคอมพิวเตอร์ ปัจจุบันที่นิยมใช้มี 3 ระบบ คือ 2.1 การสืบค้นสารนิเทศด้วยระบบโอแพก (OPAC)
การสืบค้นข้อมูลด้วยมือมีอะไรบ้างการสืบค้นสารสนเทศด้วยระบบมือ สามารถกระทำได้โดยผ่านเครื่องมือหลายประเภท เช่น บัตรรายการ บัตรดรรชนีวารสาร บรรณานุกรม เป็นต้น ในที่นี้จะกล่าวถึงเฉพาะบัตรรายการและ บัตรดรรชนีวารสารเท่านั้น การสืบค้นสารสนเทศด้วยระบบคอมพิวเตอร์ สามารถกระทำได้โดยผ่านอุปกรณ์คอมพิวเตอร์
ข้อใดคือการสืบค้นสารสนเทศเป็นกระบวนการในการ แสวงหาทรัพยากรสารสนเทศที่ได้มีการบันทึกและ เผยแพร่ไว้ในสื่อต่างๆ ได้แก่ สื่อสิ่งพิมพ์ สื่อโสตทัศน์ และสื่ออิเล็กทรอนิกส์ โดยใช้วิธีค้นหาในรูปแบบ ต่างๆ เพื่อให้ได้สารสนเทศที่เกี่ยวข้องกับเรื่องที่ ต้องการ เทคนิคในการสืบค้นสารสนเทศ หมายถึง วิธีการ ค้นเพื่อให้ได้สารสนเทศตามวัตถุประสงค์อย่าง
ข้อใดคือเครื่องมือในการสืบค้นข้อมูลในห้องสมุดOPAC เป็นคำที่เรียกย่อมาจาก Online Public Access Catalog หมายถึง เครื่องมือในการช่วยสืบค้นรายการทรัพยากรสารสนเทศของห้องสมุด และแสดงรายละเอียดให้ทราบว่าทรัพยากรสารสนเทศ ที่ต้องการนั้นจัดเก็บอยู่ที่ใด นอกจากนั้นระบบ OPAC สามารถแจ้งให้ผู้ใช้บริการรับทราบข้อมูลข่าวสารต่าง ๆ
|