4.5.1. Традиційні пошукові системи Інтернету

Для пошуку інформації використовуються спеціальні зовнішні служби - пошукові сервери: пошукові машини і каталоги.

Пошукові машини - це такі сервери, які накопичують інформацію про вміст сайтів автоматично, за допомогою спеціальних програм-роботів.

Інформацію для серверів-каталогів відбирають люди. На відміну від пошукових машин, інформація в каталогах більш точно структурована, причому в вертикальному ієрархічному вигляді.

І пошукові машини, і каталоги є зовнішніми службами або, як їх ще називають, автономними системами. Особливістю автономних систем є те, що цикл роботи з інформацією виконується повністю безпосередньо на цій системі, починаючи з отримання інформації від першоджерела і закінчуючи наданням пошукового сервісу кінцевому користувачеві.

Автоматичні пошукові системи охоплюють більший обсяг інформації, їх відомості частіше оновлюються і тому більш актуальні. Однак інформація на таких серверах погано структурована, тому що оцінка вмісту того чи іншого сайту - важко формалізується завдання. Найчастіше програма-робот відбирає документи тільки за наявністю шуканих слів в тексті документа. Прикладом пошукової машини є AltaVista (http://www.altavista.com).

У каталогах вся інформація має чітку вертикальну ієрархічну структуру. Причому ця структура будується на основі смислового змісту. У цьому головна цінність каталогів, оброблюваних людьми: можна знайти не безліч сайтів, що містять дані ключові слова, а безліч сайтів, присвячених даній тематиці. Прикладом каталогу може служити сервер Yahoo (http://www.yahoo.com).

Каталоги WWW, що містять велику кількість записів, часто розміщують на своїх сторінках локальні пошукові машини. Реалізовані у вигляді традиційних шаблонів, які мало чим відрізняються від шаблонів на автоматичних індексах.

Як для пошукових машин, так і для каталогів встановлюється якийсь принцип відбору інформації. Цей принцип закладається або в алгоритми роботи пошукових машин, або в регламент роботи людей (для каталогів). Залежно від того, звідки і який тип інформації накопичується, оцінюють дві характеристики автономних систем - просторовий масштаб і спеціалізацію.

Просторовий масштаб покликаний обмежити кількість першоджерел інформації до якогось кінцевого межі. Наприклад, пошукова система може бути побудована в рамках тільки одного сайту. Пошук може бути обмежений рамками одного географічного домену (наприклад, ru). Такі системи називають регіональними.

Існує безліч пошукових серверів, які не мають подібних обмежень. Їх називають глобальними інформаційно-пошуковими системами.

Особливості регіонального підходу можуть бути присутніми і в глобальних системах. Так, система Lycos (http://www.lycos.com) сортує результати пошуку в залежності від того, з якого регіону надійшов запит.

Найбільш популярні пошукові сервера завантажені настільки, що виникає необхідність в створенні "дзеркал" (mirrors). Дзеркала повинні містити точну копію первинної пошукової системи і гарантувати швидке обслуговування звернень, що надходять з певної географічної зони.

При зверненні до тієї чи іншої пошукової системи слід враховувати, які сервіси вона надає. Наприклад, у вітчизняній пошуковій машині Яндекс (http://www.yandex.ru) введений пошук не тільки сторінок, але і серверів. Суть цього методу полягає в тому, що ключові слова шукаються не по всіх сторінках, а лише по їх заголовкам (то, що укладено в HTML між тегами "title"). У зарубіжній AltaVista зроблена окрема служба Real Names, яка містить перелік всіх зареєстрованих сторінок компаній і організацій.

Наступний важливий сервіс - це спеціалізація пошуку. В даний час Інтернет є сховищем різних типів інформації. Тому і пошук інформації теж може бути формалізований. Можна шукати виключно графічні зображення, можна - мультимедійні записи в форматі MP3 і т.д. На багатьох пошукових серверах можна задати тип шуканої інформації. крім того, існують і сервери, які спеціалізуються на пошуку інформації чітко визначеного типу. FTPSearch (http://ftpsearch.lycos.com) спеціалізується виключно на пошуку файлів. Він індексує всілякі ftp-сервери на предмет знаходяться там файлів. Пошук здійснюється безпосередньо по найменуванню шуканого файлу. Аналогічно MP3Search (http://mp3.box.sk) спеціалізується на пошуку виключно файлів у форматі MP3.

Ще одним важливим моментом є те, яка мова запитів використовує та чи інша система. Чим складніше ця мова - тим більш тонке налаштування пошуку виявляється можливим провести. В даний час не існує єдиного уніфікованого мови запитів для пошукових систем. Розробка такого мови зробила б можливою інтеграцію різних пошукових сервісів в єдину сверхсістему пошуку. У лютому 1999 було розпочато проект SESP (Search Engine Standards Project), в якому бере участь 15 найбільших пошукових систем Інтернету. У завдання проекту входить стандартизація роботи пошукових служб (матеріали про нього можна знайти за адресою http://www.searchenginewatch.com).

4.5.2. метапоісковая системи

Ще одним перспективним напрямком розвитку пошукових сервісів в мережі є використання метапоіскових систем. Основа метапоіскових систем - це інтерфейс між користувачем і безліччю пошукових систем. Метапоісковая система не призначена для індексування та накопичення інформації. призначення її - чистий пошук і обробка результатів пошуку.

Метасистема дозволяє, відповідно до побажань користувача, обмежити свій пошук певними пошуковими серверами, перевіряти існування ресурсів, на які вказують результати пошуку, здійснювати уточнений пошук в результатах пошуку і т.д. Метапоісковая системи часто називають клієнтами до пошукових серверів.

Прикладом метапоісковая системи може служити вітчизняна розробка "Диск Шукач" компанії "Диск" (http://www.disco.ru).

Основною рисою метапоіскових систем нового покоління є об'єднання пошукових серверів різних спеціалізацій. В рамках однієї програми можна здійснювати пошук інформації різного типу. При обробці пошукового запиту допускається з'єднання більш ніж з 100 пошуковими системами (в т.ч. і зі спеціалізованими). Результати пошуку додатково обробляються: посилання, дублюючі вже знайдені, системою виключаються; отримані адреси перевіряються на доступність. Є можливість зміни роботи з пошуковими серверами (можна вибрати сервери, з якими буде працювати система, вказати максимальне число посилань, одержуваних з кожного сервера і т.д.).

Однак і в разі використання метапоіскових систем не обійтися без знань про традиційні пошукових серверах - саме вони служать базою для будь-якого пошуку.

Розглянемо постановку задачі пошуку в загальному вигляді. Для цього нам необхідно відповісти на три пи-са:

1. що шукати - які джерела інформації;

2. де шукати - місця розміщення цих джерел;

3. як шукати - які інструменти для цього використовувати.

Виділимо основні джерела інформації, представлені в Інтернеті. Це документи WWW, статті в групах новин і списках розсилки, файли в бібліотеках файлів, довідники адресному ін-формації організацій і людей (електронна пошта, адреса, телефон), статті в тематичних базах дан-них, енциклопедіях. Зауважимо, перерахований список не претендує на повноту.

Тепер відповідаємо на питання, де ці джерела інформації розміщуються. Це такі популярні ресур-си Інтернет, як WWW, групи новин, списки розсилки і FTP-сервери.

Безумовно, можна шукати потрібні джерела інформації вручну, дізнаватися адреси з специализиро-ванних журналів з інформатики та Інтернету, використовувати спеціальні паперові довідники з класифікованими за категоріями адресами. Однак для такого мінливого простору як Ін-тернет необхідно навчитися користуватися спеціальними інструментами, мета яких - збирати дані про інформаційні ресурси та надавати користувачам послугу швидкого пошуку. Таким чином, ми підходимо до поняття автономного інструменту пошуку - інформаційно-пошукової сис-теми.

Інформаційно-пошукова система(ІПС) -це система, що забезпечує пошук і відбір необхід-мих даних в спеціальній базі з описами джерел інформації (індексі) на основі інформа-ційно-пошукової мови і відповідних правил пошуку.

головним завданнямбудь-який ІПС є пошук інформації релевантної інформаційним потрібно було-ня користувача. Дуже важливо в результаті проведеного пошуку нічого не втратити, тобто знайти всі документи, які стосуються запиту, і не знайти нічого зайвого. Тому вводиться якісна ха-рактеристика процедури пошуку - релевантність.

релевантністьце відповідність результатів пошуку сформульованому запитом.

Основними показниками ІПС для WWW є просторовий масштаб і спеціалізація.

За просторового масштабу ІПС можна розділити на:

- локальні;

- глобальні;

- регіональні;

- спеціалізовані.

Локальні пошукові системиможуть бути розроблені для швидкого пошуку сторінок в масштабі від-ділового сервера. Регіональні ІПС описують інформаційні ресурси певного регіону, наприклад, російськомовні сторінки в Інтернеті. Глобальні пошукові системи , По можливості найбільш повно, описують ресурси всього інформаційного простору мережі Інтернет. Специали зірованние ІПС зосереджені на пошуку певних джерел інформації: документовWWW, файлів, адрес і т.д.

Розглянемо докладніше основні завдання, які повинні вирішити розробники ІПС. Як випливає з визначення, ІПС для WWW проводять пошук в своїй основі (індексі) з описом розподілений-них джерел інформації. Отже, спочатку потрібно описати інформаційні ресурси і ство-дати індекс. Побудова індексу починається з визначення початкового набору URL джерел ін-формації. Потім проводиться процедура індексування.

індексування-Опис джерел інформації і побудова спеціальної бази даних (індексу) для ефективного пошуку.

У деяких інформаційно-пошукових системах опис джерел інформації проводиться пер-соналом ІПС, тобто, людьми, які складають коротку анотацію на кожен ресурс. Потім, як правило, проводиться сортування анотацій за темами (складання тематичного каталогу). Звичайно, опис, складений людиною, буде абсолютно адекватно джерела. Правда, в цьому випадку про-цедура опису займає значний період часу, тому що формується індекс має, як правило, обмежений обсяг. Зате пошук в подібній системі можна буде проводити так само легко, як

в тематичних каталогах бібліотек.

В ІПС іншого типу процедура опису інформаційних ресурсів автоматизована. Для цього раз-ється спеціальна програма-робот, яка за певною технологією обходить ресурси, описує їх (проводить індексування) і аналізує посилання з поточної сторінки для розширення області пошуку. Як може описати документ програма? Найчастіше просто складається список слів, які зустрічаються в тексті і інших частинах документа, при цьому враховується частота повторення і місце розташування слова, тобто, слову приписується своєрідний ваговий коефіцієнт в залежності-сти від його значущості. Наприклад, якщо слово знаходиться в назві Web-сторінки, робот помітить цей факт для себе. Оскільки опис автоматизовано, витрати часу невеликі, і індекс може ока-тися дуже великим за розміром.

Отже, наступним завданням для ІПС другого типу є розробка робота-індексіровщіка. Робот-індексіровшік - програма, яка служить для сканування Інтернет і підтримки бази даних індексу в актуальному стані. Для пошуку в системах даного типу пользо-ному доведеться навчитися складати запити, в найпростішому випадку складаються з декількох слів. Тоді ІПС буде шукати в своєму індексі документи, в описах яких зустрічаються слова з запро-са. Для проведення більш якісного пошуку необхідно розробляти спеціальний мову запитів для користувача. Залежно від особливостей побудови моделі індексу і підтримуваного язи-ка запитів розробляється механізм пошуку і алгоритм сортування результатів пошуку. Оскільки індекс має значний обсяг, кількість знайдених документів може виявитися досить великим. Отже, надзвичайно важливо, як пошукова машина проведе пошук і відсортує його результати. Не останнє значення має зовнішній вигляд пошукової системи, котрий постає перед поль-зователем, тому одним із завдань є розробка зручного і красивого інтерфейсу. Нарешті, ис-ключітельно важлива форма представлення результатів пошуку, оскільки користувачеві необхідно уз-нать якомога більше про знайдений джерелі інформації, щоб прийняти правильне рішення про НЕ-обходимости його відвідування.

Для звернення до пошукового сервера користувач використовує стандартну програму-клієнт для всесвітньої павутини, тобто браузер. За адресою домашньої сторінки ІПС користувач працює з ін-терфейс пошукової системи, який служить для спілкування користувача з пошуковим апаратом системи (системою формування запитів і перегляду результатів пошуку).

Основним компонентом ІПС є пошукова машина, яка служить для перекладу запиту поль-зователя в формальний запит системи, пошуку посилань на інформаційні ресурси та видачі резуль-татів пошуку користувачу.

Як вже говорилося раніше, пошук здійснюється в спеціальній базі, іменованої індексом. Архитекту-ра індексу влаштована таким чином, щоб пошук проходив максимально швидко, і при цьому можна б-ло відстежити цінність кожного із знайдених ресурсів. Деякі системи зберігають запити пользо-Ватель в його особистій базі даних, оскільки на налагодження кожного запиту йде багато часу, і через-вичайно важливо зберігати запити, на які отримано задовільну відповідь.

Web-сайти-ті інформаційні ресурси, доступ до яких забезпечує ІПС.

Як відомо, Web-сторінка - це складний документ, що складається з безлічі елементів. При описа-нии подібного документа програмою-роботом необхідно враховувати, в якій саме частині Web-сторінки зустрілося дане слово. Джерелами індексування для документів WWW є:

- Заголовки (Title).

- Заголовки (H1-H6).

- Анотація (Description).

- Списки ключових слів (KeyWords).

- Повні тексти документів.

Пошукові системи, які описують абсолютно весь текст документа WWW, називаються повно-текстовими.

Для того, щоб описати файл в ресурсі FTP використовується його URL. Для опису статті в групі ново-стей джерелами індексування є поля Тема (Subject) і Keywords (ключові слова).

Під час процедури індексування часто проводиться нормалізація лексики (приведення слова до базової формі), деякі неінформативні слова, наприклад, союзи або приводи, ігноруються. У кожній ІПС існує свій список так званих стоп-слів, які ігноруються в процесі ін-

дексірованія. У системах з сильно змінними мовами, наприклад, російським, проводиться облік морфо-логії. Облік морфології означає вміння працювати з різними формами слів конкретного мови. Слід зазначити достатню складність російської мови, слова якого змінюються по числах, па-дежам, пологів і часів, причому найчастіше несподіваним чином. Наприклад: йде, йшов, піде, йдуть

і т.д. Всі існуючі ІПС з урахуванням морфології російської мови використовують "Граматичний сло-варь російської мови", складеним Андрієм Анатолійовичем Залізняком. Словник містить 90000 словникових статей, по кожному слову подано відомості про те, змінність воно, і як саме воно скло-вується або відмінюється.

Отже, узагальнена технологія пошуку складається з наступних етапів:

1. Користувач формулює запит.

2. Система проводить пошук документів (або їх пошукових образів).

3. Користувач отримує результат (відомості про документи).

4. Користувач удосконалює або реформує запит.

5. Організація нового пошуку.

З вищевикладеного випливає, що основними інструментами пошуку інформації в WWW є ІПС. Однак в Інтернет існують засоби пошуку, що мають принципові відмінності від рассмот-корінних. У загальному випадку, можна виділити наступні пошукові інструменти для WWW:

- пошукові системи;

- метапоісковая системи;

- програми прискореного пошуку.

Центральне місце по праву належить пошуковим системам, які в свою чергу поділяють-ся на каталоги, автоматичні індекси (пошукові машини) і каталоги-індекси. Тільки пошукові системи майже в повному обсязі володіють можливостями і властивостями ІПС.

Каталог-пошуковий система з класифікованих за темами списком анотацій з посиланнями наweb-ресурси. Класифікація, як правило, проводиться людьми.

Пошукова машина-пошуковий система з формованої роботом базою даних, що містить інформа-цію про інформаційні ресурси.

метапоісковая система-система, яка не має свого індексу, здатна послати запити користування земельними діл-теля одночасно декількох пошукових серверів, потім об'єднати отримані результати і пред-ставити їх користувачеві у вигляді документа з посиланнями.

Програма прискореного пошукуце програма з можливостями метапоісковая системи, встанов-ваемая на локальному комп'ютері.

Принциповою відмінністю метапоіскових систем і програм прискореного пошуку від ІПС є відсутність свого власного індексу. Зате вони чудово вміють використовувати результати роботи інших пошукових систем.

Розглянемо особливості систем-каталогів.

Пошук в каталозі дуже зручний і проводиться за допомогою послідовного уточнення тем. Проте, каталоги підтримують можливість швидкого пошуку певної категорії або сторінки за ключовими словами за допомогою локальної пошукової машини. База даних посилань (індекс) каталогу зазвичай має обмежений обсяг, заповнюється вручну персоналом каталогу. Деякі каталоги використовують автоматичне оновлення індексу. Результат пошуку в каталозі представляється у вигляді списку, що складається з короткого опису (анотації) документів з гіпертекстової посиланням на першо-джерело. Серед найпопулярніших зарубіжних каталогів можна згадати:

- Yahoo (www.yahoo.com),

- Magellan (www.mckinley.com),

- Російські каталоги:

- @Rus (www.atrus.ru)

- Weblist (www.weblist.ru)

- Сузір'я інтернет (www.stars.ru).

Відмінною рисою пошукових машин є той факт, що база даних, яка містить інформацію про Web-сторінках, статтях Usenet і т.д., формується програмою-роботом. Пошук в такій системі проводиться за запитом, що складається користувачем, що складається з набору ключових слів або фрази, укладеної в лапки. Індекс формується і підтримується в актуальному стані роботами-індексіровщікамі. Для звуження області пошуку можлива сортування вмісту індексу по кате-горіям. Як правило, пошукові машини підтримують два режими: режим простого пошуку і ре-жим розширеного пошуку .

Розглянемо узагальнені можливості формування запиту в режимі простого пошуку. Можна про-сто вводити через пробіл одне або кілька слів; пошук слів зі всілякими закінченнями моді-ліруется символом * в кінці слова. Багато системи дозволяють шукати словосполучення або фразу, для цього необхідно її взяти в лапки. Можливо обов'язкове включення або виключення визна-лених слів. Основна проблема пошуку по примітивно складеним запитом (у вигляді перерахування ключових слів) полягає в тому, що пошукова машина знайде всі сторінки, на яких зазначені слова зустрічаються в будь-якій частині документа. Як правило, кількість знайдених сторінок буде занадто-ком велике. Для поліпшення якості пошуку в режимі простого пошуку допустимо використання логи-чеських операторів і операторів, що дозволяють обмежити область пошуку, а також вибір визначений-ної категорії документів з представленого списку.

В якості операторів, що встановлюють відносини між ключовими словами, більшість поис-кових систем використовують такі:

AND (І) &Обов'язково присутність всіх ключових слів;

OR (АБО) |-присутність хоча б одного з ключових слів;

NOT (НЕ)!-відсутність ключового слова;

NEAR (БІЛЯ) ~-визначення інтервал між ключовими словами.

Багато пошукових систем включають в свою мову складання запитів спеціальні оператори, по-зволяет проводити пошук в певних зонах документа, наприклад, в його заголовку, або шукати документ по певній частині його адреси. Цікавою можливістю є пошук документів в мережі, що посилаються на сторінку з зазначеним вами адресою (URL). Таким чином, можна знайти в мережі стра-ниці, на яких є посилання на ваш Web-сайт. Деякі системи дозволять обмежити область по-позову всередині зазначеного домену.

В якості додаткових спеціальних операторів можна виділити:

- Оператори пошуку документів з певним графічним файлом;

- Оператори обмеження за датою потрібних сторінок;

- Оператори близькості між словами;

- Оператори обліку словоформи;

- Оператори сортування результатів (за релевантністю, свіжості, старості).

Слід зауважити, що на сьогоднішній день не існує стандарту на кількість і синтаксис під-тримувати операторів для різних пошукових систем. Тому користувач, звертаючись до визна-діленої пошуковій системі, неодмінно повинен в першу чергу ознайомитися з її правилами со-дання запитів. Як правило, на домашній сторінці буде обов'язково бути присутнім посилання Як міць (Help), по якій можна перейдете до довідкової інформації.

Режим розширеного або детального запиту в різних системах реалізований індивідуально, але найчастіше це бланк, в якому згадані оператори і ключові елементи реалізуються простий установ-кою відповідних прапорців або вибором параметрів зі списку.

Розглянемо способи представлення результатів пошуку в пошукових машинах. Найчастіше кількість знайдених документів перевищує кілька десятків, а в окремих випадках може досягати сотень тисяч! Тому в якості форми видачі складається список документів по 5-10-15 одиниць на стра-ниці з можливістю переходу до наступної порції внизу сторінки. Обов'язково вказується заголовки-вок і URL (адресу) знайденого документа, іноді система вказує у відсотках ступінь релевантності документа.

В описі документа найчастіше міститься кілька перших речень або витяги з тексту документа з виділенням ключових слів. Як правило, вказана дата поновлення (перевірки) документа, його розмір у кілобайтах, деякі системи визначають мову документа і його кодування (для русскоя-зичних документів).

Що можна робити з отриманими результатами? Якщо назва і опис документа відповідає вашим вимогам, можна негайно перейти до його першоджерела по посиланню. Це зручніше робити в новому вікні, щоб мати можливість далі аналізувати результати видачі. Багато пошукових сис-теми дозволяють проводити пошук в знайдених документах, причому ви можете уточнити ваш запит введенням додаткових термінів. Якщо інтелектуальність системи висока, вам можуть запропонованого-жити послугу пошуку схожих документів. Для цього ви вибираєте особливо сподобався документ і вказуєте його системі в якості зразка для наслідування. Однак, автоматизація визначення похо-жерсті - вельми нетривіальне завдання, і часто ця функція працює неадекватно вашим надіям. Деякі пошуковики дозволяють провести пересортовування результатів. Для економії вашого време-ні можна зберегти результати пошуку в вигляді файлу на локальному диску для подальшого вивчення в автономному режимі.

Найбільш популярні пошукові машини за кордоном і в Росії.

Зарубіжні пошукові машини:

Google www.google.com

Altavista www.altavista.com

Excite www.excite.com

HotBot www.hotbot.com

Nothern Light www.northernlight.com

Go (Infoseek) www.go.com (infoseek.com)

Fast www.alltheweb.com

Російські пошукові машини:

Яndex www.yandex.ru (або www.ya.ru)

Ремблер www.rambler.ru

Апарат www.aport.ru

Білоруські пошукові системи:

Система 09 www.09.open.by

Пошукова система Unibel http://search.unibel.by

Система * .BY http://search.promedia.minsk.by/

Білоруський интенет-каталог Акавiта http://akavita.kryvia.net/

Зверніть увагу на те, що різні пошукові системи описують різну кількість джерел інформації в Інтернет. Тому не можна обмежуватися пошуком тільки в одній із зазначених пошуку-вих системах.

Тепер познайомимося з інструментами пошуку, які не формують власний індекс, але вміють використовувати можливості інших пошукових систем. Це метапоісковая системи (пошукові служби)

- системи, здатні послати запити користувача одночасно декількох пошукових серверів, потім об'єднати отримані результати і представити їх користувачеві у вигляді документа з посилання-ми.

Тут наведено адреси відомих метапоіскових систем.

MetaCrawlerwww.metacrawler.com

SavvySearchwww.savvysearch.com

Нарешті, розглянемо останній в списку інструмент пошуку - програми прискореного пошуку.

Програма прискореного пошукуце програма, яка встановлюється на комп'ютері користувача і спо-собнимі:

- посилати запити до декількох пошукових серверів;

- сортувати результати пошуку за релевантністю;

- видаляти дублікати;

- перевіряти наявність документів в мережі.

WebFerret, NewsFerret www.ferretsoft.com

Inforia Quest 99 http://www.inforia.com/quest

Subject Search Spider (SSSpider) www.kryltech.com.

Після докладного вивчення основних можливостей інструментів звернемося до проблеми ефек-ності пошуку .Основними параметрами ефективності пошуку є повнота як відношення чісланайденних документів до загальної кількості релевантних документів (тобто, знайдені всі документи, з-ответствующие вимогу), і точність пошуку - відношення числа релевантних документів до загальної кількості отриманих документів (тобто не знайдено нічого зайвого, що не відноситься до справи). Це і означа-ет поняття релевантності. Важливе значення має актуальність посилань на документи, тобто існування в даний момент знайдених документів в мережі, і швидкість пошуку.

Таким чином, можна виділити наступні фактори, що впливають на ефективність пошуку:

- Властивості і можливості пошукової системи.

- Якість формулювання запиту користувачем.

- Яким чином можна оцінити якість пошукового інструменту? Пошукові системи зазвичай порівнюють за такими параметрами:

- Кількість проіндексованих сторінок (обсяг індексу).

- Кількість операторов.

- Стандартний оператор, який об'єднує кілька ключових слів. Якщо стандартним операто-ром є оператор І, пошукова машина автоматично буде шукати документи, на яких

обов'язково будуть присутні всі введені ключові слова. В іншому випадку (оператор АБО) будуть знайдені документи зі всіма ключовими словами і з кожним окремо

- Пошук точної фрази.

- Пошук слів з різними закінченнями.

- Облік словоформ. У разі автоматичного режиму обліку словоформ система буде шукати в до-кумента слово з усіма його змінами.

- Чутливість до великої букви. Якщо система не розрізняє великі і малі літери, ре-зультати пошуку будуть менш якісними.

- Пошук мультимедійних файлів.

- Форма представлення результатів.

- Період відновлення індексу. Цей показник впливає на такий параметр як актуальність най-денних посилань. Чим частіше оновлюється індекс, тим рідше в результатах пошуку будуть зустрічатися застарілі посилання.

- Затримка перед пропискою. Даний параметр вказує на часовий інтервал перед занесенням третьому опису Web-сторінки в індекс після прохання її автора.

Тепер розглянемо, як краще підготуватися користувачеві до складання запиту. Перш за все, не-обходимо провести всебічний лексичний аналіз інформації, яку ви збираєтеся шукати. За-тим необхідно скласти набір ключових слів (при необхідності, на декількох мовах) у вигляді від-ділових термінів, словосполучень, професійної лексики і кліше.

- Тестові запити з 1-2 ключових слів або фрази.

- Аналіз кількісного відгуку.

- Коригування запиту за релевантністю відгуку.

Виходячи з вищевикладеного, можна виділити наступні прийоми ефективного пошуку:

- Пошук загальної інформації в каталогах. У каталогах ви, як правило, обов'язково вийдете на спеціалізовані сервера в області, в якій.

- Пошук вузькоспеціальної інформації в пошукових машинах. Для проведення ширшого пошуку обмеженого числа посилань в каталогах явно недостатньо. Крім того, узкоспеціаль-ва інформація в каталогах може просто не бути. Тому необхідно проводити пошук в пошукових машинах, що володіють індексами великого обсягу.

- Використання операторів або бланка розширеного запиту для звуження області пошуку. Для проведення якісного пошуку необхідно ознайомитися з цих слів конкретної по-позовної машини. Ефективним і простим способом вирішення проблеми складання качест-венного запиту є використання режиму розширеного запиту.

- Використання функції пошуку в знайденому. Більшість пошукових систем підтримують можливість пошуку усередині отриманих результатів. Як правило, для цього потрібно включити спеціальний прапорець Шукати в знайденому і ввести додаткові слова для повторного поис-ка серед знайдених за запитом сторінок.

- Використання пошуку схожих документів.

- Використання метапоіскових систем і програм прискореного пошуку інформації. Для напів-чення загального огляду документів доцільно використовувати можливості метапоіскових сис-тем або програм прискореного пошуку. Нагадуємо, дані інструменти пошуку відправляють ваш запит відразу декількох пошукових системах і від кожної системи отримують кілька са-мих релевантних посилань.

- Перегляд розділу Посилання на спеціалізованих сайтах. Автори багатьох спеціалізованих Web-вузлів накопичують свої колекції посилань по тематиці сайту. Найчастіше ви зайдете в цих колекціях багато корисних джерел, заощадивши час, що витрачається на самостійний пошук з використанням розглянутих вище інструментів.

- Пошук відповідей на питання в групах новин. При бажанні можна звернутися з конкретним питанням про допомогу в спеціалізовану групу новин. Знайти потрібну групу можна, ис-пользуя спеціальні інструменти пошуку, які ми розглянемо далі.

- Підписка на спеціалізовані списки розсилки. Підписавшись на спеціалізований спи-сок розсилки, ви зможете отримувати по електронній пошті свіжу інформацію по вашій тема-тику, а також задавати питання вашим колегам-передплатникам.

Обговоримо проблему пошуку такого джерела інформації, як статті в групах новин. Инструмен-тами пошуку в даному випадку можуть бути розглянуті пошукові машини WWW, які ін-сується не тільки простір WWW, але й статті в телеконференціях і мають спеціальний ре-жим пошуку саме в цьому ресурсі. Пошук в групах новин підтримує, наприклад, пошуковий сер-вер Altavist а. Слід зазначити, що пошукові системи WWW вельми оперативно індексують групи новин і містять інформацію про статті, реально існуючих в мережі. Для пошуку в архівах ново-стей існую спеціалізовані системи, найвідомішою з яких є система Deja (www.deja.com). Ця система дозволяє проводити як пошук окремих статей, що містять введений термін, так і пошук певних груп новин, присвячених обговоренню заданої теми. Можна зареєструватися в Deja і підписатися на певні групи новин.

Тепер розглянемо інструменти, що дозволяють проводити пошук файлів. Багато пошукових систем

WWW стали надавати послугу пошуку мультимедійних файлів (Altavista, Aport, ...). Для цього зовсім не потрібно знати спеціальні оператори, а досить перейти з домашньої сторінки по си лан-кам Картинки (Images), MP3 / Audio або Video до спеціального режиму пошуку. Пошук проводиться по можливому імені файлу або за текстом в коментарі до заслання на мультимедійний файл. Ви можете спрогнозувати ім'я файлу, наприклад, файл із зображенням орла може називатися eagle.gif. Або до-гадати, що фото Білла Гейтса буде мати відповідний підпис.

Що стосується пошуку програмного забезпечення, у всесвітній павутині існують пошукові Web-сервери з колекціями умовно-безкоштовного програмного забезпечення, деякі з них спеціалізуються на пошук програмного забезпечення для Інтернету або для конкретної операційної системи. Ці системи в ко-нечном підсумку приведуть вас до конкретного сервера, з якого і можна завантажити шуканий програмний продукт. Слід згадати сервери Archie, також надають послугу пошуку файлів на FTP-серверах, проте користуватися Web-серверами набагато зручніше.

Розглянемо пошукові інструменти для пошуку адресної інформації. Введемо поняття Білого (White) і Жовтого (Yellow) пошуку.

White-пошук-пошук адресної інформації по заздалегідь відомому власного імені адресата (імячеловека або організації)

Yellow-пошук-пошук власного імені за додатковими ознаками (за родом діяльності, погеографіческому ознакою), а потім пошук його адресної інформації.

Зазвичай Yellow Pages системи фактично відразу включають в себе і White Pages - у знайденого адреси-ту відразу видно його телефон і адресу електронної пошти. Крім того, деякі Yellow Pages дозволяють шукати просто в алфавітному списку своїх абонентів (white-пошук). З іншого боку, White pages також со-тримають елементи yellow-пошуку - крім завдання власного імені вони зазвичай дозволяють вказати назву міста, штату та інші, які звужують пошук, дані (що необхідно в разі багатьох однофа-Мильці). Можливо, саме тому багато on-line телефонні довідники, виконують, факти-но white-пошук, називають себе Yellow pages.

Тут наведено адреси Web-систем для пошуку адресної інформації для людей і організацій.

Пошук людей:

- Пошук людей на Yahoo (http://people.yahoo.com).

- Система WhoWhere (www.whowhere.com).

- Система Bigfoot (www.bigfoot.com).

Пошук організацій:

- розділ Жовті сторінки (Yellow pages) на пошукових системах

- спеціалізовані сервера

- www.yellowpages.com - для пошуку в США та інших країнах

РОБОТА З ПОШТОВИМ КЛІЄНТОМ

Як згадувалося вище, одним з напрямків використання Інтернету є обмін інформацією.

Розглянемо основні засоби обміну інформацією, доступні через глобальну мережу:

Електронна пошта, Що дозволяє дуже швидко відправляти електронні листи на електронні ад-Реса користувачів Інтернету.

списки розсилки, На які можна підписатися, як на журнал, і потім періодично отримувати насвій електронну адресу добірку статей на задану тему. Згодом можна відправляти свої со-спілкування всім передплатникам.

Групи новин, Які дозволяють публікувати повідомлення за інтересами на спеціальних серверахв мережі. Повідомлення можна читати, підключившись до сервера і вибравши тему для себе. Далі, по ба-

Надзвичайно популярним ресурсом є IRC , Який служить для прямого спілкування групи лю-дей в режимі реального часу за допомогою введення тексту з клавіатури і негайного появи його на загальній дошці.

Розроблено спеціальні програми для спілкування в реальному режимі часу, що дозволяють після встановлення зв'язку передавати текст, що вводиться з клавіатури, а також звук, зображення і будь-які файли. За допомогою цих програм можна організувати спільну роботу віддалених користувачів з програмою, запущеної на локальному комп'ютері.

- За допомогою спеціального обладнання і програмного забезпечення через Інтернет можна проводити аудіо- та відеоконференції, тобто передавати звук і зображення від одного до мно-гим.

- В Інтернеті є свої пейджингові системи, в яких можна зареєструватися і отримати свій персональний номер. Знаючи персональний номер іншої людини, можна через централь-ний сервер пейджингового служби відправити йому повідомлення з пропозицією встановити соеди-ня і поспілкуватися. Найпопулярнішою пейджингового системою в Інтернеті є система

- Інтернет-телефонією називається система, що дозволяє вести розмову в реальному часі че-рез мережу Інтернет.

Приступимо до більш докладного опису засобів обміну інформацією в Інтернеті. Почнемо з самого древнього для мережевого спілкування кошти під назвою електронна пошта. Введемо визначення:

Електронна пошта-Засіб обміну інформацією, підготовленою в електронному вигляді, між людьми, що мають доступ до комп'ютерної мережі.

Основними областями застосування електронної пошти є ведення особистого листування і робота з деякими інформаційними ресурсами Інтернету, такими як списки розсилки, off-line групи но-востей і системи пересилки файлів по електронній пошті. Звичайно, маючи варіант підключення до Ін-тернет в режимі on-line, зручніше для копіювання файлів використовувати будь-який FTP-клієнт або про-граму завантаження файлів. Однак іноді для користувачів, що мають спосіб підключення по протоках-лу UUCP, єдиним способом отримати файл з FTP-сервера є замовлення його поштою з викорис-танням спеціальної служби файли-поштою. Крім того, поштова система не вимагає вашої неодмінно-ного присутності в Інтернеті, тому можливість отримати архів з програмою пристойного розміру по електронній пошті іноді зручніше навіть для користувачів, що має повноцінний доступ до всіх ресурсів Інтернету.

Як реалізована технологія клієнт / сервер в разі електронної пошти. Серверну частину представля-ет поштовий сервер.

Поштовий сервер-програма, що пересилає повідомлення з поштових скриньок на інші сервери илина комп'ютер користувача по запиту його поштового клієнта. На поштовому сервері створюють поштові скриньки для користувачів з певним ім'ям і паролем для доступу.

Клієнтську частину сервісу представляє поштовий клієнт. Поштовий клієнт (Мейлер) - програма, яка допомагає складати і посилати електронні повідомлення, отримувати і відображати листи на комп'ютерах тере користувача.

Робота з поштою може проводитися в режимі off-line. Це означає, що для отримання і відправки поч-ти в призначену годину ви встановлюєте з'єднання з провайдером. Потім ви даєте команду вашому поштовому клієнтові, по якій він підключається до вашого поштового сервера, відсилає підготовлений-ні листи і забирає на локальний комп'ютер повідомлення, що прийшли за минулий період на вашу поштову скриньку. Писати листи і читати отримані з сервера повідомлення ви можете в автономному ре-жимі, тобто, без підключення до Інтернету.

Тепер розглянемо поштові протоколи.

Одним з варіантів підключення до Інтернету є підключення по протоколу UUCP. UUCP (протокол копіювання з Unix на Unix) використовувався для передачі інформації з комп'ютерних се-тям дуже давно, до винаходу протоколу TCP / IP. UUCP (протокол копіювання сUnixнаUnix) - застарілий протокол для передачі інформації по комп'ютерних мережах. У той час єдиним засобом спілкування була електронна пошта, яка і передавалася по згаданого протоколу, досто-інством якого є невибагливість до ресурсів комп'ютера, параметрам модему і якості телефонної лінії зв'язку. На сьогоднішній день протокол UUCP безнадійно застарів, він не відноситься до Інтернет-протоколах, тобто, не базується на TCP / IP. Проте, слід згадати про програмі-

клієнті, розробленої російськими програмістами спеціально для роботи з поштою з цього прото-колу - програмі, яка працює під упра

Інтернет надає необмежений доступ до інформаційних ресурсів, як в області юридичної науки, так і практичного законотворчості. Пошукові системи значно полегшують завдання по знаходженню необхідної інформації, будь-яких даних, статей, монографій і програм. Інтернет-ресурси стають ефективним засобом придбання нових знань, а також реалізують доступ до електронних версій не тільки юридичних журналів і газет, а й до безлічі юридичної літератури, доступної як в безкоштовній, так і платній формі.

Практично будь-який юрист може спробувати себе в якості «дистанційного консультанта» з юридичних проблем. Для цього необов'язково створювати персональну web-сторінку, досить стати учасником одного з уже діючих Інтернет-проектів. Наприклад, великою популярністю у вітчизняному Інтернеті користується так звана «Віртуальна Юридична Консультація» (www.uristy.ru). Взяти участь в роботі цієї консультації може будь-який фахівець, який має юридичну освіту, достатньо лише зареєструватися в системі.

Але не можна не відзначити, що доступність і простота розміщення інформації, а також практично повна незалежність серверів один від одного в Інтернеті, перетворила всесвітнє досягнення в хаос. Ось чому з року в рік проблема пошуку необхідної інформації в Інтернеті стає все більш актуальною. Особливо це важливо в умовах обмеженого часу і в тому випадку, коли прийняття рішення має спиратися на конкретний документ.

Найпростіша можливість щось знайти, це ввести ключові слова прямо в адресний рядок браузера. Пошук відбувається в майкрософтовського системі WSN Search.

Рис.18 Система WSN Search

Інший спосіб пошуку дає кнопка Пошук на панелі браузера. При використанні цієї кнопки вікно ділиться на дві частини. Зліва знаходиться рядок для введення ключових слів, список знайдених сторінок, а справа можна переглядати вибрані сторінки. Можна використовувати іншу пошукову систему, використовуючи кнопку налаштувати в панелі Пошук.

Пошукові системи Інтернет:

Пошукові системи можна поділити на такі групи:

    пошукові каталоги

    пошукові машини або пошукові покажчики

Пошукові каталоги.

Каталоги ресурсів - глобальні, локальні, спеціалізовані - представляють собою розміщуються в Мережі бази даних з адресами ресурсів. Ці бази даних можуть мати різний обсяг накопиченої інформації. Зазвичай вони мають ієрархічну структуру.

Пошукові каталоги влаштовані за тим же принципом, що і тематичні каталоги великих бібліотек. Звернувшись до адресою пошукового каталогу, ми знаходимо на його основній сторінці список тематичних категорій, наприклад таких як «Юриспруденція», «Освіта», «Спорт» і т.д.

Кожен запис в списку категорій - це гіперпосилання. Клацання по ній відкриває наступну сторінку пошукового каталога, на якому обрана тема представлена \u200b\u200bбільш детально. Продовжуючи занурюватися в тему, можна дійти до списку конкретних Web-сторінок і вибрати той ресурс, який найбільш підходить для вирішення Вашої завдання. Також в пошуковому каталозі можна використовувати кнопку Пошук для уточнення пошуку потрібних сторінок.

Пошукові каталоги створюються в основному вручну висококваліфікованими редакторами, які переглядають простір WWW, відбирають те, що на їхню думку становить суспільний інтерес і заносять адреси в каталог.

Yahoo (Www.yahoo.com) -визнаний найбільш популярним каталогом у всьому світі. Можливий пошук російською мовою.

Російські каталоги:

« List. Ru» (www. list. ru),

«Сузір'я Інтернет» (www. stars. ru),

«Russia on the Net» (www.ru) та інші.

освіти та науки Росії

Державна освітня установа вищої професійної освіти

«РОСІЙСЬКИЙ

Державний гуманітарний університет »

Філія РДГУ в м Санкт-Петербурзі.

Санкт-Петербург 2011

введення 3

1. Мережа інтернет як сучасний джерело інформації 4

2. Специфіка інформації в навчальній діяльності студента 6

3. Особливості використання мережі інтернет в пошуку інформації для навчальної діяльності студента 8

висновок 13

Список джерел та літератури 14

Вступ

Сьогодні студенту не обійтися без ПК. Спілкування з комп'ютером починається ще зі школи, де учні освоюють ази комп'ютерних технологій, знайомляться з освітніми веб-сайтами Інтернету. Як правило, під час вступу до вузу багато абітурієнтів вже добре знайомі з комп'ютером, і у більшості він є вдома.

Щоб полегшити собі навчальний процес часто студенти звертаються за допомогою Інтернету, завантажуючи реферати та твори. До пори до часу таке ставлення до занять може сходити з рук. Однак навчання в вузі передбачає більш серйозний підхід, вимагає освоєння різних специфічних наук. У цьому сенсі Інтернет вже перестає бути достовірним джерелом інформації, а в певному сенсі і зовсім шкідливий.

Сучасний Інтернет має багато соціальних і культурних граней він є універсальною інформаційним середовищем. У зв'язку з цим питання Інтернету як джерела інформації в навчальній діяльності студента є актуальним.

Завданнями роботи є:

    Дати характеристику мережі інтернет як сучасного джерела інформації.

    Розкрити специфіку інформації в навчальній діяльності студента.

    Розглянути особливості використання мережі інтернет в пошуку інформації для навчальної діяльності студента.

1. Мережа інтернет як сучасний джерело інформації

Згідно сайту wikipedia.org: Інтернет (вимовляється [інтернет]; англ. Internet) - всесвітня система об'єднаних комп'ютерних мереж, побудована на використанні протоколу IP і маршрутизації пакетів даних. Інтернет утворює глобальний інформаційний простір, служить фізичною основою для Всесвітньої павутини і безлічі інших систем (протоколів) передачі даних. Часто згадується як «Всесвітня мережа» і «Глобальна мережа». У побуті іноді говорять «інет» 1.

В даний час, коли слово «Інтернет» вживається в побуті, частіше за все мається на увазі Всесвітня павутина і доступна в ній інформація, а не сама фізична мережа.

Сьогодні, Інтернет стає одним з основних джерел інформації завдяки гігантського кількості даних, розміщених в мережі і можливістю легкого доступу до них. При цьому пошук в мережі набуває все більшої практичну цінність оскільки з швидким збільшенням обсягу доступних даних все більш ускладнюється і процедура пошуку необхідної інформації 2.

У мережі наявна величезна кількість інформаційних ресурсів. За деякими оцінками, число документів перевищило 65 млн. І продовжує стрімко зростати 3. Такий обсяг інформації вимагає правильної організації процесу пошуку і застосування спеціальних технологічних засобів, таких як пошукові машини. Простий пошук за ключовим словом дає зазвичай від десятків тисяч до декількох мільйонів посилань очевидно, що робота з такою великою кількістю документів практично неможлива, тобто містить інформацію, що не відноситься до справи.

Крім проблеми пошуку існує проблема достовірності інформації в інтернет. Легкість доступу та публікації даних уможливлює легке поширення помилкової, а часто і навмисно брехливої \u200b\u200bінформації 4.

Ці дві проблеми: пошуку і вірогідності визначають специфіку інтернету як джерела інформації.

2. Специфіка інформації в навчальній діяльності студента

Згідно сайту wikipedia.org: Термін інформація походить від латинського слова information, що означає «відомості, роз'яснення, викладу» 5.

В даний час наука намагається знайти загальні властивості і закономірності, притаманні поняттю «інформація», але поки це поняття багато в чому залишається інтуїтивним і отримує різні смислові наповнення в різноманітних галузях людської діяльності.

У побуті інформацією називають будь-які дані або відомості, які кого-небудь цікавлять, наприклад повідомлення про які-небудь події, про чию-небудь діяльності і т.п. «Інформувати» в цьому сенсі означає «повідомити щось, невідоме раніше».

Інформація - зведення про об'єкти і явища навколишнього середовища, їх параметри, властивості і стан, які зменшують наявну про них ступінь невизначеності, неповноти знань 6.

Одне і теж інформаційне повідомлення (стаття в газеті, оголошення, лист, телеграма, довідка, розповідь, креслення, радіопередача, і т.п.) може містити різну кількість інформації для різних людей залежно від їх накопичених знань, від рівня розуміння цього повідомлення і інтересу до нього 7.

Виходячи з вищевикладеного, можна зробити висновок, що інформація в навчальній діяльності студента повинна володіти рядом специфічних особливостей.

1. Інформація повинна відповідати ступеню підготовленості студента, його рівню знань. Занадто високий рівень складності знижує засвоюваність і знижує мотивацію студентів. Занадто низький рівень - знижує інформативність і негативно впливає на ефективність процесу навчання.

2. Інформація, яка використовується студентом повинна бути актуальна, тобто відповідати сучасному рівню наукових знань і розвитку суспільства.

3. Інформація, яка використовується студентом повинна бути достовірна.

4. Інформація, повинна бути доступна з точки зору її каталогізації і пошуку.

3. Особливості використання мережі інтернет в пошуку інформації для навчальної діяльності студента

Сучасний студент, озброєний персональним комп'ютером, добре обізнаний про те, що і де знаходиться в Інтернеті. Він цілком віртуозно видобуває в Інтернеті все те, що йому потрібно для створення чергового обов'язкового творіння: твори, реферату, курсового проекту, диплома і т.п. І після невеликого доопрацювання, яка часто полягає лише у вказівці свого прізвища і номери групи, роздрукувавши на принтері, здає «свою роботу» викладачеві 8.

При цьому його лінь зростає багаторазово, і такий підхід зменшує ймовірність на успіх у майбутній кар'єрі. Варто відзначити, що практика списування, яка по суті є плагіатом, поширена в Росії набагато більше ніж на Заході, що зменшує шанси отримати престижну роботу в конкуренції з випускниками західних Вузів.

Щоб досягти успіху в конкурентній боротьбі, слід навчитися обробляти колосальні обсяги інформації, вміти переглядати зразки письмових робіт, помічаючи в них слабкі і сильні сторони, пробувати «препарувати» чужий текст, щоб виділити з нього найбільш істотну частину. На основі отриманого скелета студенту слід навчитися створювати необхідну роботу. По суті така робота проводилася в бібліотеках з книгами до того як стався інформаційних бум Інтернет 9. Тут також важлива робота викладача, якому слід грамотно направляти студента, що не забороняючи використання Інтернет, а вказуючи на можливі підводні камені і даючи настанови щодо використання. Наприклад, щоб звузити коло пошуку викладач може порадити ті чи інші інформаційні ресурси, таким чином забезпечується адаптація навчального матеріалу до підготовки студента, до того ж викладач допоможе відфільтрувати помилкову і некоректну інформацію.

У сучасному інформаційному суспільстві все більше зростає роль викладача. Так наприклад вчителя «старої школи» можуть роками читати одні й ті ж лекції, анітрохи не цікавлячись останніми досягненнями в даній галузі, сфері діяльності. Більш того, студент з будь-яким мобільним пристроєм, підключеним до Інтернет може поставити в глухий кут будь-якого викладача. Викладач вже не сприймається як єдине джерело знання. У будь-який момент студент з Інтернетом може і поправити викладача, і покритикувати і поставити перед нерозв'язним питанням. Викладач повинен бути до цього готовим, такий виклик сучасного суспільства до сучасної системи освіти. Викладач не повинен злитися, уникати відповіді або складати відповідь на ходу. Якщо раніше ставлення викладач-студент будувалися за принципом старший-молодший, то тепер вони повинні бути більш наближені до принципу інтернет: рівний-рівному.

Є ще одна небезпека, яка зберігає в собі мобільність інтернету, а саме відсутність необхідності що-небудь запам'ятовувати. А навіщо? Якщо завжди можна запитати у Яндекса. Щоб не потрапити в цю пастку студент повинен виконувати всі завдання предавателя, не лінуватися, записувати, запам'ятовувати, вчити. Саме багаж знань в людській пам'яті утворює його загальну ерудицію і здатність вирішувати прикладні завдання в заданій предметній області. Крайній ступінь цього ефекту мобільності полягає в тому, що студент, зустрівши незнайомий термін, каже собі: «Я можу подивитися значення цього терміна в Інтернет в будь-який момент. Зараз у мене немає часу, я потім подивлюся »- ось таким чином і наступають прогалини в освіті. До ери Інтернет студент б розмірковував по-іншому: «Я можу подивитися значення цього терміна в словнику (підручнику, енциклопедії, ...). Зараз у мене немає часу, але мені доведеться подивитися значення цього терміна і запам'ятати його, тому що я не можу весь час ходити зі словником ».

З точки зору самоосвіти перед студентом, та й перед усім суспільством стоїть проблема інформаційної кризи 10. Інформаційний криза полягає в суперечливому єдності «інформаційного голоду» і «інформаційного вибуху», тобто в дефіциті інформації в умовах її перевиробництва 11. Кількість інформації по певній галузі людської діяльності перевалілівает за здатності людського мозку 12. Тому зростає необхідність в систематизації інформації і в фільтрації інформаційних шумів. Студенту слід використовувати перевірені джерела, рекомендовані викладачем, зазначені в списках літератури підручників.

Швидкість зростання інформації піддається оцінці. Бібліотекар Р. Бартон і фізик Р. Кеблера з США ввели поняття «напівперіод життя» наукових статей по аналогії з періодом напіврозпаду радіоактивних речовин. Напівперіод життя публікації - це час, протягом якого була опублікована половина усієї використовуваної в даний час літератури з якої-небудь галузі або предмету 13. Наприклад, якщо напівперіод життя публікації з фізики дорівнює 4,6 року, то це означає, що 50% всіх нині використовуваних (цитованих) публікацій з цієї галузі мають вік не більше 4,6 року. Хоча таке визначення дає чисельну оцінку старіння інформації, до такої оцінки треба ставитися обережно та в кінцевому світлі кожен фахівець сам визначає глибину і ступінь давності, необхідну йому в кожному конкретному випадку 14. Для студента ступінь актуальності інформації допоможе визначити науковий керівник.

Ще однією особливістю інформації в інтернет є її розсіювання по ансамблю джерел - закон Бредфорда 15. Спрощено це можна сформулювати так: 1/3 наукових статей по конкретній темі буде опублікована в малій кількості джерел, які безпосередньо стосуються даної теми. Наступна третину буде опублікована в більшій кількості джерел, що стосуються даної теми. І остання третина буде опублікована в джерелах, що не мають ніякого відношення до теми, причому співвідношення кількості джерел в цих зона по Бредфорд рівні. З огляду на цю закономірність, слід зазначити, що досягнення повної інформативності по конкретній темі неможливо, якщо дослідник обмежується колом джерел з даної проблеми, не вдаючись до допомоги спеціальних інформаційно-сервісних та бібліографічних служб. У більшості випадків студенту буде досить першої третини, проте для більш глибоких робіт, таких як курсові роботи з профільних дисциплін, дипломна робота, студенту необхідно звертатися за допомогою до такого роду електронних каталогів.

Незважаючи на те, що свобода доступу користувачів Інтернету до інформаційних ресурсів не обмежується державними кордонами, але мовні кордони зберігаються. Переважною мовою Інтернету є англійська мова. Другим за популярністю є китайську мову, а третім - іспанська. Російська мова займає 9 місце 16. У зв'язку з цим студент, який володіє іноземними мовами, в першу чергу англійською, отримує доступ до набагато більшої інформації. Якщо говорити про поділ інформації в мережі Інтернет, то варто відзначити, що інформація з різних галузей людської діяльності представлена \u200b\u200bнерівномірно в плані обсягу. В інтернет більше технічної інформації, пов'язаної з програмуванням, інформаційними технологіями, пристроєм комп'ютера і менше інформації пов'язаної з гуманітарними науками. Це можна пояснити тим, що технічні фахівці так чи інакше пов'язані з інформаційними технологіями та Інтернет за родом своєї діяльності, і тому кількість публікованих ними матеріалів вище.

висновок

Підводячи підсумок розглянутим аспектам Інтернету як джерела інформації в навчальній діяльності студента можна виділити основні ключові особливості та рекомендації.

    Студент повинен вміти користуватися Інтернетом і при цьому постійно вдосконалювати свої навички використання Інтернету.

    Студенту слід, покладаючись на інформацію в Інтернет перевіряти її ступінь достовірності і актуальності.

    Для пошуку інформації по заданій тематиці доцільно використання спеціалізованих електронно-бібліографічних покажчиків.

    Для збільшення ефективності використання Інтернет студенту слід вдосконалювати англійську мову, як найбільш поширений в Інтернет.

    Відповідаючи викликам інформаційного суспільства, студент повинен вміти обробляти великі обсяги даних, виділяючи з них ключову інформацію і фільтруючи надлишкові і непотрібні дані.

    Інтернет дає не тільки величезні можливості по отриманню інформації, але і таїть в собі небезпеку у вигляді шпаргалки, яка часто робить ведмежу послугу в процесі навчання.

Слід зауважити, що за пунктами 2 і 3 студент повинен працювати в безпосередньому контакті зі своїм науковим керівником.

Список джерел та літератури

література

    Блюменау, В. І. Інформація та інформаційний сервіс. / Д. І. Блюменау. - Л .: Наука, 1989.- 192 с.

    Галеева, І. С. Інтернет як інструмент бібліографічного пошуку / І. С. Галеева; науч. ред. М. І. Вершинін. - СПб .: Професія, 2007. - 248 с.

    Єфімов, А. Н. Інформаційний вибух: проблеми реальні і уявні / А. Н. Єфімов. - М .: Наука, 1985. - 160 с.

    Інформаційний пошук в мережі Інтернет: навч. посібник / В. І. Аверченко, В. В. Мірошников, С. М. Рощин та ін.,; Брянь. держ. техн. ун-т. - Брянськ, 2001. - 28 с.

    Кузин, Ф. А. Кандидатська дисертація: методика написання, правила оформлення і порядок захисту: практ. Посібник для аспірантів і здобувачів вчений. Ступені / Ф. А. Кузін. -. - М .: Ось-89, 1999. - 208 с.

    Кузнєцов І. Н. Інтернет у навчальній та науковій роботі: Практичний посібник. - 2-е вид. - М .: Іздателско-торгова корпорація «Дашков і К о», 2005. - 192 с.

    Кузнєцов І. Н. Підручник з інформаційно-аналітичної роботи. М .: Яуза, 2001. - 320 с.

    Михайлов, О. А. Нове в пошуку в Інтернеті за джерелами 2000-го року / О. А. Михайлов; Ріс. держ. арх. наук.-техн. документації. - М .: Макс Прес, 2001. - 171 с.

    Паршукова Г. Б. Методика пошуку професійної інформації: учеб.-метод. Посібник / Г. Б. Паршукова.- СПб .: Професія, 2009. - 224 с.

    Соломенчук В. Г. Інтернет: Короткий курс. СПб .: Пітер, 2001 - 322 с.

ресурси Інтернет

    URL: Інтернет

    URL: http://ru.wikipedia.org/wiki/Информация

1 URL: http://ru.wikipedia.org/wiki/Інтернет

Кочеганова Поліна

Методи пошуку навчальної інформації в інтернет

Однією з умов і провідним чинником, що визначає успішність навчальної діяльності з використанням комп'ютерних технологій, є готовність учнів до продуктивної діяльності в дидактичної комп'ютерному середовищі.

Оволодіння ефективними методами і засобами пошуку, обробки та використання навчальної інформації дає можливість не тільки інтенсифікувати освітні процеси, а й розвивати пізнавальні інтереси учнів, прагнення до продуктивної, творчої діяльності.

Завдяки повсюдному розвитку і застосування комп'ютерних технологій в даний час в тій чи іншій електронній формі знаходиться інформація всіх областей людської діяльності: наука, виробництво, комерція, література, розваги і т.д. Мережа Інтернет має сумісність з різними електронними мережами і базами даних і дозволяє отримати зручний доступ практично до будь-якого виду інформації.

Інформаційні ресурси, доступні через Інтернет, величезні. Це десятки мільйонів документів, представлених різними способами, число яких постійно збільшується. Залежно від способу подання, виду і характеру інформації різняться і методи доступу до неї, тому, перш ніж розглядати методи пошуку, розглянемо класифікацію інформаційних ресурсів.

За принципом організації та використання коштів пошуку можна розділити на каталоги (довідники, директорії) і пошукові машини.

    Каталоги

Каталоги є довідниками, що містять списки адрес Інтернет, згруповані за певними ознаками. Як правило, вони об'єднуються за тематикою (наука, мистецтво, новини і т.д.), де кожна тема розгалужується на кілька підрівнів.

Особливість цих коштів пошуку інформації полягає в тому, що створення структури, бази даних і їх постійне оновлення здійснюється "вручну", колективом редакторів і програмістів, і сам процес пошуку вимагає безпосередньої участі користувача, самостійно переходить від посилання до посилання.

    пошукові машини

Дія пошукових машин полягає в постійному послідовному дослідженні всіх вузлів Інтернет, доступних даній системі пошуку, з усіма їх зв'язками і відгалуженнями. У зв'язку з постійним оновленням інформації машина пошуку регулярно повертається через певний термін (близько місяця) до вже вивченим вузлів, щоб виявити і зареєструвати зміни. Вся прочитана інформація індексується, тобто створюється спеціалізована база даних, в якій закодовані всі досліджені системою сторінки Інтернет.

Під час отримання запиту від користувача машина пошуку розглядає всю індексовану інформацію і видає список документів, відповідних завданню пошуку. Знайдені документи ранжуються в залежності від місця розташування ключових слів (в заголовку, на початку тексту, в перших параграфах) і частоти їх появи в тексті.

Незважаючи на схожий принцип роботи, машини пошуку розрізняються по мовам запиту, зонам пошуку, глибині пошуку всередині документа, методам ранжирування і пріоритетів, тому застосування різних пошукових машин дає різні результати.

Більш-менш серйозний підхід до будь-якого завдання починається з аналізу можливих методів її рішення. Пошук інформації в Інтернеті може бути проведений за кількома методами, значно розрізняються як по ефективності і якості пошуку, так і по типу витягується інформації. У ряді випадків доводиться використовувати досить трудомісткі методи - результат того вартий.

Можна виділити наступні основні методи пошуку інформації в Інтернеті, які, в залежності від цілей і завдань шукає, використовуються окремо або в комбінації один з одним:

    Безпосередній пошук з використанням гіпертекстових посилань

Оскільки всі сайти в просторі WWW фактично виявляються пов'язаними між собою, пошук інформації може бути здійснений шляхом послідовного перегляду пов'язаних сторінок за допомогою браузера.

Хоча цей повністю ручний метод пошуку виглядає повним анахронізмом в Мережі, яка містить понад 60 млн. Вузлів, "ручний" перегляд Web-сторінок часто виявляється єдино можливим на заключних етапах інформаційного пошуку, коли механічне "копання" поступається місцем більш глибокого аналізу. Використання каталогів, класифікованих і тематичних списків і всіляких невеликих довідників також відноситься до цього виду пошуку.

    Використання пошукових машин

Сьогодні цей метод є одним з основних і фактично єдиним при проведенні попереднього пошуку. Результатом останнього може бути список ресурсів Мережі, які підлягають детальному розгляду.

Як правило, застосування пошукових машин засноване на використанні ключових слів, які передаються пошуковим серверам в якості аргументів пошуку: що шукати. Якщо робити все правильно, то формування списку ключових слів вимагає попередньої роботи по складанню тезауруса.

    Пошук із застосуванням спеціальних засобів

Цей повністю автоматизований метод може виявитися досить ефективним для проведення первинного пошуку.

Спайдер - це ключовий інструмент для пошуку в Web. Як уіоміпалось раніше, спайдер є програмою, яка отримує деякі або всі ресурси з великого числа сайтів, головним чином з метою створення інвертованих індексів, які пізніше будуть використовуватися пошуковими додатками. Подібно до інших Web-кліенгам, спайдер формує HTTP-запити для доступу до ресурсів Web-сайту і здійснює синтаксичний аналіз відповідей. Головними відмінностями між спайдером і браузером є набагато більше число сайтів, до яких здійснюється звернення і надсилаються запити, відсутність будь-якого відображення відповідей і досить незвичайне використання відповідей.

На практиці, однак, з сайтів може запитуватися тільки частина ресурсів. Багато спайдери, наприклад, не можуть звертатися зображення або мультимедійні ресурси. Це робиться, якщо спайдер використовується для побудови індексу тільки текстових ресурсів.

    Аналіз нових ресурсів

Пошук по новоствореним ресурсів може виявитися необхідним при проведенні повторних циклів пошуку, пошуку найбільш свіжої інформації або для аналізу тенденцій розвитку об'єкта дослідження в динаміці.

Іншою можливою причиною може з'явитися те, що більшість пошукових машин оновлює свої індекси зі значною затримкою, викликаної гігантськими обсягами оброблюваних даних, і ця затримка зазвичай тим більше, ніж менш популярна цікавить тема. Це міркування може виявитися досить істотним при проведенні пошуку в вузькоспеціальної предметної області. Сюди можна віднести, наприклад, роботу з соціальними мережами, відео-контентом.

Дійсно корисні методи пошуку навчальної інформації в Інтернет:

    складання тезауруса

Для ефективного використання пошукових серверів необхідний список ключових слів, організований з урахуванням семантичних відносин між ними, тобто тезаурус. При складанні тезауруса необхідно передбачити обробку синонімів, омонімів і морфологічних варіацій ключових слів. Не варто вводити назву самої теми.

    Дивіться 2-3-4 сторінки пошуку

    Відбір пошукових машин

Встановлюється послідовність використання пошукових машин відповідно до убування очікуваної ефективності пошуку із застосуванням кожної машини.

Всього відомо близько 180 пошукових серверів, що розрізняються по регіонах охоплення, принципам проведення пошуку (а отже, по вхідному мови і характеру сприймаються запитів), обсягом індексної бази, швидкості оновлення інформації, здатності шукати "нестандартну" інформацію тощо. Основними критеріями вибору пошукових серверів є обсяг індексної бази сервера і ступінь розвиненості самої пошукової машини, тобто рівень складності сприймаються нею запитів.

    Використовуйте англомовні ресурси, навіть якщо не володієте мовою. Сьогодні технічний машинний переклад - це вже не просто набір слів, як було раніше. Хороші, корисні іноземні сайти переводяться більш ніж адекватно.

    Використовуйте спеціалізовані джерела пошуку навчальної інформації:e- library, Банк дисертацій, кіберленінка, сайти архівів і т.д.

Завершуючи роботу, можна прийти до висновку, що в мережі Інтернет зберігається дуже великий обсяг навчальної інформації з різної тематики у вигляді статей в електронних газетах, звітів, довідників, графічних зображень, аудіо- та відео-файлів і багато чого іншого. Подорожуючи по Інтернет, можна знайти будь-яку інформацію, інакше кажучи, якщо будь-які дані вводилися коли-небудь в комп'ютер, то найімовірніше їх можна знайти десь на неозорих просторах Інтернет.

Немає такої інформації, яку не можна було б знайти в Інтернеті, треба просто знати, де і як саме шукати.

Список літератури

    Гармашов М. Ю., Коротков А. М. Підготовка учнів до продуктивної діяльності в дидактичної комп'ютерному середовищі. - Волгоград, 2001..

    Норенков І.П. Управління знаннями в інформаційно-освітньому середовищі. - М .: МЕСІ, 2000..

    Путілов Г.П. Концепція побудови інформаційно-освітнього середовища технічного вузу. - М .: МГІЕМ, 1999..

    Засоби пошуку інформації в INTERNET // Афанасій-біржа (Твер). - 28 березень 1997.

    Усков В.Л. Дистанційне інженерну освіту на базі Internet / Бібліотечка журналу "Інформаційні технології", 2000, № 3.

    Дьомін Ігор Святославович Пошук наукової та навчальної інформації в мережі Інтернет // Вісник ТГУ. 2008. №9.