Поняття про пошукові технології системи Internet та їх класифікація

 
  • Версія друку Весь реферат без реклами та завантаження шаблону:)
  •  
    Реферат
    на тему:
    Поняття про пошукові технології системи Internet та їх класифікація


    Поповнення інформаційного ресурсу Internet відбувається швидкими темпами, тому знайти необхідну інформацію стає все важче. Різноманітні друковані довідники старіють ще до їх появи у торгівельній мережі. Єдиним надійним способом пошуку інформації є використання спеціальних пошукових методів та технологій, які постійно слідкують за зміною інформаційного ресурсу мережі.
    За час існування мережі Internet робились різноманітні спроби організації пошукових технологій. Багато з цих спроб виявилися невдалими, інші привели до створення зручних технологій пошуку інформації. Найефективніші технології пошуку з’явилися в останні два-три роки. Загалом у світі існують сотні різноманітних пошукових технологій, тому вибір тієї чи іншої технології та її пошукової системи залежить від компетентності користувача та його особистих уподобань.
    Багато пошукових технологій дозволяють шукати інформацію не тільки на Web-сторінках, але й в групах новин, сховищах файлів мережі Internet. Таким чином, в результаті пошуку можна знайти повідомлення в групі новин або який-небудь файл. Тому зручнішим є застосовувати замість терміна “сторінка” більш загальний термін “документ”. Під документом треба розуміти Web-сторінку, повідомлення чи файл, що вміщує ту чи іншу інформацію.
    В Internet пошукові технології можна класифікувати за групами, за допомогою яких здійснюється пошук документів:
    Пошук за допомогою систем FTP, Gopher, Archie, Veronica тощо;
    Пошук за допомогою “жовтих” та ”білих” сторінок Internet;
    Пошук за допомогою каталогів;
    Пошук за допомогою пошукових машин;
    Пошук за допомогою метапошукових машин;
    Пошук за допомогою програмних агентів;
    Пошук за допомогою професійних служб пошуку.
    Розглянемо ці технології пошуку.
    Перша технологія.
    В Internet створені спеціальні Web-вузли FTP, на яких знаходяться програми, графічні та звукові файли й інша цінна інформація.
    Вузол FTP-search
    Предметний.
    При роботі з ним необхідно знати ім’я файлу, що відшукується.
    Вузол Snoopie
    Адреса: Найшвидший предметний покажчик пошуку вузлів FTP.
    За допомогою архівів Gopher краще всього знаходити текстові ресурси, наприклад, книги, статті тощо. Для пошуку в архівах Gopher можна використовувати такі вузли: Alex, Archie, Veronica та Galaxy.
    Технологія “жовтих” сторінок.
    Жовті сторінки Internet використовують ту саму концепцію, що й однойменні телефонні довідники, й призначені для полегшення пошуку в мережі шляхом розподілення їх за визначеними темами.
    Більшість “жовтих” сторінок упорядковані за темами та надають користувачеві назви вузлів та їх опис, а також URL. Найбільш популярні довідники:
    Official World Wide Web Yellow Pages від New Riders;
    The Internet Yellow Pages від McGraw Hill;
    McKinley Yellow Pages від New Riders.
    Взагалі існує багато видань подібного типу, що містить інформацію про вузли Web. Вартість таких довідників становить US$25-50.
    Пошук за допомогою каталогів.
    Каталоги – це вузли Web, які вміщують предметні покажчики інформації про інші вузли, доступ до яких важливо отримати за допомогою перегляду або пошуку. Завдяки розбивці даних на різноманітні категорії, забезпечується можливість звуження пошуку доки не буде отримано необхідний документ.
    Найпопулярнішим є каталог Yahoo, що має множину категорій та підкатегорій. З його допомогою можна виконати пошук за визначеним критерієм в цілому каталозі або його підкаталозі.
    Інші каталоги, такі як Magellan, Excite, надають у ваше розпорядження переліки вузлів, інформацію про них, різні статті, книги, новини (як внутрішні, так і міжнародні) тощо.
    Крім того, можна використовувати комерційні каталоги для отримання інформації про місцезнаходження товарів та послуг. Комерційними каталогами є Apollo, Linkstar та інші. В таблиці 1 наведено перелік основних каталогів.
    Таблиця 1. Перелік основних каталогів
    № | Назва | Адреса | Призначення
    1. | Apollo | Комерційний
    2. | Excite Netdirectory | Бібліотечний
    3. | Galaxy | комерційний та бібліотечний
    4. | Linkstar | Комерційний
    5. | Point.com | Загального призначення
    6. | Yahoo | Загального призначення
    7. | Clearing House | Бібліотечний
    Пошукові машини.
    Пошукові машини являють собою вузли Web, на яких для полегшення пошуку знаходяться алфавітні покажчики майже всіх слів, що розміщуються на всіх існуючих сторінках Web. Деякі пошукові машини призначені для роботи з групами новин Usenet. Заслуговують на увагу двоє вузлів, за допомогою яких виконується пошук серед груп новин:
    Dejanews – http://www.dejanews.com
    SIFT – http://sift.stanford.edu
    Деякі пошукові машини розміщують дані про сторінки Web, що створені заново. Уже за кілька годин після виникнення Web-сторінки інформація про неї може бути в пошуковій машині.
    Нижче в Таблиці 2 наведено перелік пошукових машин, що спеціалізуються на наданні інформації про недавно створені вузли Web.
    Таблиця 2. Інформація про нещодавно створені вузли
    № | Назва | Адреса
    1. | What's New Too
    2. | What's New On Yahoo
    3. | Starting Point
    4. | New Happenings
    Пошук адреси електронної пошти.
    Існують пошукові машини, призначені для того, щоб знаходити адреси електронної пошти.
    Fourll – база даних, що вміщує більш ніж 3 мільйони адрес електронної пошти: http://www.fourll.com
    LookUp – база даних (менших за розміром), вміщує адреси електронної пошти: http://www.lookup.com
    Пошук за допомогою метапошукових машин.
    Метапошукова машина являє собою вузол, за допомогою якого в системі Web здійснюється пошук визначеної, деталізованої інформації. Метапошукова машина дозволяє при введенні критерію пошуку лише раз, одночасно опитувати велику кількість баз даних, представляючи результати в організованій, релевантній формі. На жаль, більшість з існуючих на даний час метапошукових машин не функціонують таким чином. Більшість з них здійснюють пошук у декількох базах даних, але не одночасно, а послідовно звертаючись до них.
    Найкращою метапошуковою машиною є система Sawy Search, яка може звертатися одночасно до 5 баз даних. Перед видачею результатів ця система вилучає інформацію, що дублюється.
    В таблиці 3 наведені найбільш популярні метапошукові машини з їх адресами:
    Таблиця 3. Метапошукові машини
    № | Назва | Адреса
    1. | All-In-One
    2. | Internet Heuth | http://www.intbc.соm/sleuth/sleuth/html
    3. | Metasearch
    4. | Sawy Search
    5. | Web-Search
    6. | W3 Catalog
    Програмні агенти.
    Незважаючи на велику кількість пошукових та метапошукових машин, розробники програмного забезпечення створили пошук за допомогою програмних агентів. Такі агенти являють собою інтелектуальне програмне забезпечення, яке може відслідковувати найбільш важливі вузли. Агенти переходять від одного вузла до іншого, відшуковуючи потрібні дані та визначають їх місцезнаходження. Таким чином зберігається час користувача, який би він витрачав на введення умов для пошуку, відвідуючи кожен вузол окремо. Агенти також зможуть відслідковувати зміну інформації на певних вузлах і повідомляти про це користувачу.
    У таблиці 4 наведені найбільш уживані системи програмних агентів.
    Таблиця 4. Програмні агенти
    № | Назва | Адреса | Призначення
    1. | Web Compass | http://www.quarterdeck.com | Найбільший пошуковий агент
    2. | SqURL | http://www.bluesguierrd.com | Працює із системами Altavista, Exite, Lycos
    3. | Surfbot | http://www.specter.com | Забезпечує пошук у пошукових машинах за ключовими словами
    Професійні служби.
    Зараз усе більше фірм починають спеціалізуватися на наданні платних послуг, що пов’язані з пошуком інформації.
    Фірма Dataquest (http://dataquest.com/weekly/main.html) спеціалізується в області комп’ютерної індустрії. Ця компанія видає оперативну газету Dataquest Interactive, основна частина якої є безкоштовною для споживачів. Але при звертанні до комерційної інформації потрібна оплата від US$95 до US$4000, залежно від обсягу та виду інформації (детальний аналіз ринку, тенденція його розвитку тощо.)
    Для отримання свіжих новин, спортивної інформації, прогнозу погоди можна використовувати вузол Forecast (http://www.forcast.com). Служба Data Times (http://www.de.enews.com/chisters/datatimes) є також комерційною професійною інформаційною системою. Вона використовує у своїй базі даних повідомлення, взяті з місцевих, регіональних і міжнародних газет, журналів, теле- і радіопередач та інших джерел інформації. Але існують компанії, що надають інформаційні послуги цілком безкоштовно.
    В таблиці 5 представлені такі вузли
    Таблиця 5. Безкоштовні вузли.
    № | Назва | Адреса | Призначення
    1. | National Public Radio | http://www.npr.com | Загальна інформація
    2. | СNN Interactive | http://www.cnn.com | Загальна інформація
    3. | Reuters New Media | http://www.yahoo.com/headlines | Загальна інформація
    4. | USA Today | http://www.usatoday.com | Газетна інформація
    5. | The New York Times | http://nytemes.com | Газетна інформація
    6. | Time | http://www.pathfinder.com/time/ | Журнальна інформація
    7. | The Washington Times Weekly Edition | http://www.watchtimeweekly.com | Журнальна інформаціяVchys: ГДЗ, Решебники , Ответы, Реферати, Твори, ПрезентаціїГДЗ, Решебники и Ответы