Кочеганова Поліна

Методи пошуку навчальної інформації в інтернет

Однією з умов і провідним чинником, що визначає успішність навчальної діяльності з використанням комп'ютерних технологій, є готовність учнів до продуктивної діяльності в дидактичної комп'ютерному середовищі.

Оволодіння ефективними методами і засобами пошуку, обробки та використання навчальної інформації дає можливість не тільки інтенсифікувати освітні процеси, а й розвивати пізнавальні інтереси учнів, прагнення до продуктивної, творчої діяльності.

Завдяки повсюдному розвитку і застосування комп'ютерних технологій в даний час в тій чи іншій електронній формі знаходиться інформація всіх областей людської діяльності: наука, виробництво, комерція, література, розваги і т.д. Мережа Інтернет має сумісність з різними електронними мережами і базами даних і дозволяє отримати зручний доступ практично до будь-якого виду інформації.

Інформаційні ресурси, доступні через Інтернет, величезні. Це десятки мільйонів документів, представлених різними способами, число яких постійно збільшується. Залежно від способу подання, виду і характеру інформації різняться і методи доступу до неї, тому, перш ніж розглядати методи пошуку, розглянемо класифікацію інформаційних ресурсів.

За принципом організації та використання коштів пошуку можна розділити на каталоги (довідники, директорії) і пошукові машини.

    Каталоги

Каталоги є довідниками, що містять списки адрес Інтернет, згруповані за певними ознаками. Як правило, вони об'єднуються за тематикою (наука, мистецтво, новини і т.д.), де кожна тема розгалужується на кілька підрівнів.

Особливість цих коштів пошуку інформації полягає в тому, що створення структури, бази даних і їх постійне оновлення здійснюється "вручну", колективом редакторів і програмістів, і сам процес пошуку вимагає безпосередньої участі користувача, самостійно переходить від посилання до посилання.

    пошукові машини

Дія пошукових машин полягає в постійному послідовному дослідженні всіх вузлів Інтернет, доступних даній системі пошуку, з усіма їх зв'язками і відгалуженнями. У зв'язку з постійним оновленням інформації машина пошуку регулярно повертається через певний термін (близько місяця) до вже вивченим вузлів, щоб виявити і зареєструвати зміни. Вся прочитана інформація індексується, тобто створюється спеціалізована база даних, в якій закодовані всі досліджені системою сторінки Інтернет.

Під час отримання запиту від користувача машина пошуку розглядає всю індексовану інформацію і видає список документів, відповідних завданню пошуку. Знайдені документи ранжуються в залежності від місця розташування ключових слів (в заголовку, на початку тексту, в перших параграфах) і частоти їх появи в тексті.

Незважаючи на схожий принцип роботи, машини пошуку розрізняються по мовам запиту, зонам пошуку, глибині пошуку всередині документа, методам ранжирування і пріоритетів, тому застосування різних пошукових машин дає різні результати.

Більш-менш серйозний підхід до будь-якого завдання починається з аналізу можливих методів її рішення. Пошук інформації в Інтернеті може бути проведений за кількома методами, значно розрізняються як по ефективності і якості пошуку, так і по типу витягується інформації. У ряді випадків доводиться використовувати досить трудомісткі методи - результат того вартий.

Можна виділити наступні основні методи пошуку інформації в Інтернеті, які, в залежності від цілей і завдань шукає, використовуються окремо або в комбінації один з одним:

    Безпосередній пошук з використанням гіпертекстових посилань

Оскільки всі сайти в просторі WWW фактично виявляються пов'язаними між собою, пошук інформації може бути здійснений шляхом послідовного перегляду пов'язаних сторінок за допомогою браузера.

Хоча цей повністю ручний метод пошуку виглядає повним анахронізмом в Мережі, яка містить понад 60 млн. Вузлів, "ручний" перегляд Web-сторінок часто виявляється єдино можливим на заключних етапах інформаційного пошуку, коли механічне "копання" поступається місцем більш глибокого аналізу. Використання каталогів, класифікованих і тематичних списків і всіляких невеликих довідників також відноситься до цього виду пошуку.

    Використання пошукових машин

Сьогодні цей метод є одним з основних і фактично єдиним при проведенні попереднього пошуку. Результатом останнього може бути список ресурсів Мережі, які підлягають детальному розгляду.

Як правило, застосування пошукових машин засноване на використанні ключових слів, які передаються пошуковим серверам в якості аргументів пошуку: що шукати. Якщо робити все правильно, то формування списку ключових слів вимагає попередньої роботи по складанню тезауруса.

    Пошук із застосуванням спеціальних засобів

Цей повністю автоматизований метод може виявитися досить ефективним для проведення первинного пошуку.

Спайдер - це ключовий інструмент для пошуку в Web. Як уіоміпалось раніше, спайдер є програмою, яка отримує деякі або всі ресурси з великого числа сайтів, головним чином з метою створення інвертованих індексів, які пізніше будуть використовуватися пошуковими додатками. Подібно до інших Web-кліенгам, спайдер формує HTTP-запити для доступу до ресурсів Web-сайту і здійснює синтаксичний аналіз відповідей. Головними відмінностями між спайдером і браузером є набагато більше число сайтів, до яких здійснюється звернення і надсилаються запити, відсутність будь-якого відображення відповідей і досить незвичайне використання відповідей.

На практиці, однак, з сайтів може запитуватися тільки частина ресурсів. Багато спайдери, наприклад, не можуть звертатися зображення або мультимедійні ресурси. Це робиться, якщо спайдер використовується для побудови індексу тільки текстових ресурсів.

    Аналіз нових ресурсів

Пошук по новоствореним ресурсів може виявитися необхідним при проведенні повторних циклів пошуку, пошуку найбільш свіжої інформації або для аналізу тенденцій розвитку об'єкта дослідження в динаміці.

Іншою можливою причиною може з'явитися те, що більшість пошукових машин оновлює свої індекси зі значною затримкою, викликаної гігантськими обсягами оброблюваних даних, і ця затримка зазвичай тим більше, ніж менш популярна цікавить тема. Це міркування може виявитися досить істотним при проведенні пошуку в вузькоспеціальної предметної області. Сюди можна віднести, наприклад, роботу з соціальними мережами, відео-контентом.

Дійсно корисні методи пошуку навчальної інформації в Інтернет:

    складання тезауруса

Для ефективного використання пошукових серверів необхідний список ключових слів, організований з урахуванням семантичних відносин між ними, тобто тезаурус. При складанні тезауруса необхідно передбачити обробку синонімів, омонімів і морфологічних варіацій ключових слів. Не варто вводити назву самої теми.

    Дивіться 2-3-4 сторінки пошуку

    Відбір пошукових машин

Встановлюється послідовність використання пошукових машин відповідно до убування очікуваної ефективності пошуку із застосуванням кожної машини.

Всього відомо близько 180 пошукових серверів, що розрізняються по регіонах охоплення, принципам проведення пошуку (а отже, по вхідному мови і характеру сприймаються запитів), обсягом індексної бази, швидкості оновлення інформації, здатності шукати "нестандартну" інформацію тощо. Основними критеріями вибору пошукових серверів є обсяг індексної бази сервера і ступінь розвиненості самої пошукової машини, тобто рівень складності сприймаються нею запитів.

    Використовуйте англомовні ресурси, навіть якщо не володієте мовою. Сьогодні технічний машинний переклад - це вже не просто набір слів, як було раніше. Хороші, корисні іноземні сайти переводяться більш ніж адекватно.

    Використовуйте спеціалізовані джерела пошуку навчальної інформації:e- library, Банк дисертацій, кіберленінка, сайти архівів і т.д.

Завершуючи роботу, можна прийти до висновку, що в мережі Інтернет зберігається дуже великий обсяг навчальної інформації з різної тематики у вигляді статей в електронних газетах, звітів, довідників, графічних зображень, аудіо- та відео-файлів і багато чого іншого. Подорожуючи по Інтернет, можна знайти будь-яку інформацію, інакше кажучи, якщо будь-які дані вводилися коли-небудь в комп'ютер, то найімовірніше їх можна знайти десь на неозорих просторах Інтернет.

Немає такої інформації, яку не можна було б знайти в Інтернеті, треба просто знати, де і як саме шукати.

Список літератури

    Гармашов М. Ю., Коротков А. М. Підготовка учнів до продуктивної діяльності в дидактичної комп'ютерному середовищі. - Волгоград, 2001..

    Норенков І.П. Управління знаннями в інформаційно-освітньому середовищі. - М .: МЕСІ, 2000..

    Путілов Г.П. Концепція побудови інформаційно-освітнього середовища технічного вузу. - М .: МГІЕМ, 1999..

    Засоби пошуку інформації в INTERNET // Афанасій-біржа (Твер). - 28 березень 1997.

    Усков В.Л. Дистанційне інженерну освіту на базі Internet / Бібліотечка журналу "Інформаційні технології", 2000, № 3.

    Дьомін Ігор Святославович Пошук наукової та навчальної інформації в мережі Інтернет // Вісник ТГУ. 2008. №9.

Пошук інформації - завдання, яке людство вирішує вже багато століть. У міру зростання обсягу інформаційних ресурсів, потенційно доступних одній людині, були вироблені дедалі витонченіші і досконалі пошукові засоби, і прийоми, що дозволяють знайти необхідний документ.

За книгою К. Маннинга «Введення в інформаційний пошук», можна сказати, що ефективна робота будь-якої ІПС заснована на швидкості і можливості багатоаспектною вибірки потрібних даних з великого масиву (пошук інформації) для внутрішньої роботи з даними. Це накладає певні вимоги на організацію правил пошуку, побудову призначеного для користувача і програмного інтерфейсу і форми надання інформації.

Реалізація перерахованих вище вимог покладено на наступний ряд структурних компонентів, так званих блоків [додаток 4].

За книгою Варфоломєєва А.А. «Основи інформаційної безпеки», в основі вибору саме такої структури інформаційно-пошукової системи лежить дуже проста логіка - будь-який блок системи повинен отримувати дані, обробляти їх і видавати користувачу в певному порядку, забезпечуючи логіку процесу.

Неможливо говорити про інформаційно-пошукових системах, не згадавши про таке поняття, як пошукова машина. Як пише Д.Н. Колісниченко в книзі «Пошукові системи і просування сайтів в Інтернеті», Пошукова машина - система з формованої роботом базою даних, що містить інформацію про інформаційні ресурси. Відмінною рисою пошукових машин є той факт, що база даних, яка містить інформацію про Web-сторінках, формується програмою-роботом. При отриманні результату, якщо назва і опис документа відповідає вашим вимогам, можна негайно перейти до його першоджерела по посиланню. Це зручніше робити в новому вікні, щоб мати можливість далі аналізувати результати видачі. Багато пошукових систем дозволяють проводити пошук в знайдених документах, причому є можливість уточнити запит введенням додаткових термінів. Якщо інтелектуальність системи висока, то присутній так само можливість пошуку схожих документів. Однак, автоматизація визначення схожості - вельми нетривіальне завдання, і часто ця функція працює не завжди правильно. Деякі пошуковики дозволяють провести пересортовування результатів. Варто звернути увагу на те, що різні пошукові системи описують різну кількість джерел інформації в інтернеті. Тому не можна обмежуватися пошуком тільки в одній із зазначених пошукових систем. Існують різні інструменти пошуку, які не формують власний індекс, але вміють використовувати можливості інших пошукових систем. Це, як пише Н.А. Гайдмамакін в книзі «Автоматизовані інформаційні системи, бази і банки даних», метапоісковая системи (Пошукові служби) - системи, здатні послати запити користувача одночасно декількох пошукових серверів, потім об'єднати отримані результати і представити їх користувачеві у вигляді документа з посиланнями.

Так само, Д.Н. Колісниченко пише, що для найбільш точного і швидкого знаходження необхідної інформації в мережі, ІПС використовують індексування.

Пошуковий індекс - структура даних, яка містить інформацію про документи і використовується в пошукових системах.

індексування (Або індексація), що здійснюється пошуковою машиною, - процес збору, сортування та зберігання даних з метою забезпечити швидкий і точний пошук інформації. Створення індексу включає міждисциплінарні поняття з лінгвістики, математики та інформатики.

Популярні пошукові машини зосереджуються на повнотекстової індексації документів, написаних на природних мовах. Мультимедійні документи, такі як відео і аудіо і графіка також можуть брати участь в пошуку.

А.Ю. Келіна в книзі «Основи інформаційної безпеки» пише про те, що метапоісковая машини використовують індекси інших пошукових сервісів і не зберігають локальний індекс, в той час як пошукові машини, засновані на кешованих сторінках, довго зберігають як індекс, так і текстові корпуси. На відміну від повнотекстових індексів, частково-текстові сервіси обмежують глибину індексації, щоб зменшити розмір індексу.

Архітектура пошукової системи різниться за способами індексування. Індекси бувають наступних типів [Додаток 5]:

  • · Прямий індекс.Прямий індекс зберігає список слів для кожного документа.
  • · Інвертований індекс.Сховище списку входжень кожного критерію пошуку.

Індекс - це тільки частина пошукового апарату, прихована від користувача. Другою частиною цього апарату є інформаційно-пошукова мова (ІПМ), Про який докладно пише Варфоломєєв А.А. в книзі «Основи інформаційної безпеки». ІПЯ- це мова, яка дозволяє сформулювати запит до системи в простій і наочній формі. Якщо навіть користувачеві пропонується вводити запити на природній мові, то це ще не означає, що система буде здійснювати семантичний розбір запиту користувача. Основна суть полягає в тому, що зазвичай фраза розбивається на слова, з цього списку видаляються заборонені і загальні слова, іноді проводиться нормалізація лексики, а потім все слова зв'язуються або логічним AND, або OR.

Можливі й варіанти, на що вказує Н.А. Чурсін в книзі «Популярна інформатика». Так, в більшості систем, деякі фрази будуть впізнані як ключові, і не буде поділятися на окремі слова. Інший підхід полягає в обчисленні близькості між запитом і документом. До теперішнього часу відомо близько дюжини різних заходів близькості. Саме ці відсотки відповідності документа запиту і видаються в якості довідкової інформації при списку знайдених документів.

Найбільш просунутим цих слів із сучасних інформаційно-пошукових систем Internet, на думку К. Маннинга, володіє AltaVista. Крім звичайного набору AND, OR, NOT, ця система дозволяє використовувати ще і NEAR. Останній оператор дозволяє організувати контекстний пошук. Всі документи в системі розбиті на поля, тому в запиті можна вказати в якій частині документа користувач хоче побачити ключове слово (на засланні, заголовку і т.п.).

(Для більш докладних відомостей про інформаційно-пошукових мовах мережі інтернет див. Додаток)

З книги Ю.І. Кудінова «Основи сучасної інформатики» можна дізнатися, що найбільш поширеними моделями подання документів в інформаційно-пошуковій системі є різні варіації на тему уявлення документа як набору термінів. Як уже згадувалося раніше, це не весь текст документа, а тільки невеликий набір термінів, який відображає його зміст. Базуючись на такому поданні про документ і потрібно розглядати різні інформаційно-пошукові мови.

Найбільш поширеним ІПМ є традиційний мову, що дозволяє скласти логічні вирази з набору термінів. При цьому використовуються булеві оператори AND, OR, NOT.

Така схема досить проста, і тому найбільш широко застосовується в сучасних інформаційно-пошукових системах. Але ще 20 років тому були добре відомі і її недоліки.

Булевий пошук погано масштабує видачу. Оператор AND може дуже сильно скоротити число документів, які видаються на запит. При цьому все буде дуже сильно залежати від того, наскільки типовими для бази даних є пошукові терміни. Оператор OR навпаки може призвести до невиправдано широкого запитом, в якому корисна інформація загубиться за інформаційним шумом. Для успішного застосування цього ІПМ слід добре знати лексику системи і її тематичну спрямованість. Як правило, для системи з таким ІПМ створюються спеціальні документально лексичні бази даних зі складними словниками, які називаються тезаурусами і містять інформацію про зв'язок термінів словника один з одним.

К. Меннінг вказує на те, що модифікацією булевого пошуку є зважений булевий пошук. Ідея такого пошуку досить проста. Вважається, що термін описує зміст документа з якоюсь точністю, і цю точність виражають у вигляді ваги терміна. При цьому зважувати можна як терміни документа, так і терміни запиту. Запит може формулюватися на ІПМ, описаному вище, але видача документів при цьому ранжируватиметься в залежності від ступеня близькості запиту і документа. При цьому вимір близькості будується таким чином, щоб звичайний булевий пошук був би окремим випадком зваженого булевого пошуку.

Але, на відміну від Варфоломєєва А.А. , І.С. Ашманов у своїй книзі «Просування сайту в пошукових системах» пише, що хоч ІПМ зараз не досконалі, особливу увагу варто приділяти алгоритму ранжирування (Упорядкованого вибудовування) отриманих посилань, так як він не менш важливий. Найбільш часто використовуваними критеріями при ранжируванні в ІПС є наявність слів із запиту в документі, їх кількість, близькість до початку документа, близькість один до одного;

Наявність слів із запиту в заголовках і короткий зміст документів (заголовки повинні бути спеціально відформатовані);

Кількість посилань на даний документ з інших документів; «Респектабельність» документів, що посилаються.

Різні пошукові системи використовують різні алгоритми ранжування, однак основні принципи визначення релевантності наступні:

  • · Кількість слів запиту в текстовому вмісті документу (тобто в html-коді).
  • · Теги, в яких ці слова розташовуються.
  • · Місцезнаходження шуканих слів у документі.
  • · Питома вага слів, відносно яких визначається релевантність, в загальній кількості слів документа.

Ці принципи застосовуються всіма пошуковими системами.

База даних виводить ранжируваних подібним чином список документів з HTML і повертає його людині, яка зробила запит. Різні пошукові механізми також вибирають різні способи показу отриманого списку - деякі показують тільки посилання; інші виводять посилання c першими кількома пропозиціями, що містяться в документі або заголовок документа разом з Посилання. Ранжування результатів пошуку є невід'ємною частиною інформаційного пошуку.

Аспекти даного поняття добре представлені в книзі К. Маннинга «Введення в інформаційний пошук». інформаційний пошук має на увазі використання певних стратегій, методів, механізмів і засобів. Поведінка користувача, який здійснює управління процесом пошуку, визначається не тільки інформаційною потребою, а й інструментальним різноманітністю системи - технологіями і засобами, наданими системою.

стратегія пошуку - загальний план (концепція, перевагу, установка) поведінки системи або користувача для вираження і задоволення інформаційної потреби користувача, обумовлений як характером мети та видом пошуку, так і системними "стратегічними" рішеннями - архітектурою БД, методами і засобами пошуку в конкретній ІПС. Вибір стратегії в загальному випадку є оптимізаційної завданням. На практиці в значній мірі він визначається мистецтвом досягнення компромісу між практичними потребами і можливостями наявних коштів.

метод пошуку - сукупність моделей і алгоритмів реалізації окремих технологічних етапів: побудови пошукового образу запиту, відбору документів (зіставлення пошукових образів запитів і документів), розширення запиту, локалізації та оцінки видачі.

Пошуковий образ запиту - записаний на ІПМ текст, що виражає смислове зміст інформаційного запиту і містить вказівки, необхідні для найбільш ефективного здійснення інформаційного пошуку.

Процес пошуку інформації представляє послідовність кроків, що призводять при посередництві системи до деякого результату, і дозволяють оцінити його повноту. Так як користувач зазвичай не має вичерпних знань про інформаційне зміст ресурсу, в якому проводить пошук, то оцінити адекватність вираження запиту, так само як і повноту одержуваного результату, він може, ґрунтуючись лише на зовнішніх оцінках або на проміжних результатах і узагальненнях, зіставляючи їх, наприклад , з попередніми.

Процес пошуку можна представити у вигляді наступних основних компонентів:

  • 1) формулювання запиту природною мовою, вибір пошукових системи і сервісів, формалізація запиту на відповідному ІПМ;
  • 2) проведення пошуку в одній або декількох пошукових системах;
  • 3) огляд отриманих результатів (посилань);
  • 4) попередня обробка отриманих результатів: перегляд змісту посилань, вилучення та збереження релевантних даних;
  • 5) при необхідності, модифікація запиту і проведення повторного (уточнюючого) пошуку з подальшою обробкою отриманих результатів.

Для зменшення обсягу відібраних матеріалів здійснюють фільтрацію результатів пошуку за типом джерел (сайтів, порталів), тематиці і інших підстав.

За використовуваним пошуковим технологіям ІС можна розбити на 4 категорії:

  • 1. Тематичні каталоги;
  • 2. Спеціалізовані каталоги (онлайнові довідники);
  • 3. Пошукові машини (повнотекстовий пошук);
  • 4. Засоби метапоіска.

Тематичні каталоги передбачають обробку документів і віднесення їх до однієї з декількох категорій, перелік яких заздалегідь заданий. Фактично це індексування на основі класифікації. Індексування може проводитися автоматично або вручну за допомогою фахівців, які переглядають популярні веб-сайти і складових короткий опис документів-резюме (ключові слова, анотація, реферат).

спеціалізовані каталоги або довідники створюються по окремих галузях і темах, за новинами, по містах, на адресу електронної пошти і т. п.

пошукові машини (Найрозвиненіша засіб пошуку в Інтернеті) реалізують технологію повнотекстового пошуку. Індексуються тексти, розташовані на опитуваних серверах. Індекс може містити інформацію про кілька мільйонів документів.

При використанні коштів метапоіска запит здійснюється одночасно кількома пошуковими системами. Результат пошуку об'єднується в загальний, упорядкований за ступенем релевантності список. Кожна система обробляє тільки частина вузлів мережі, що дозволяє розширити базу пошуку.

Так само дуже важлива так звані «організація пошуку» і «реалізація пошуку», про що пише Д.Н. Колісниченко в книзі «Пошукові системи і просування сайтів в Інтернеті».

організація пошуку

Процедура пошуку необхідної інформації розділяється на дев'ять основних етапів:

  • · Визначення області знань;
  • · Вибір типу і джерел даних;
  • · Збір матеріалів необхідних для наповнення інформаційної моделі;
  • · Відбір найбільш корисної інформації;
  • · Вибір методу обробки інформації (класифікація, кластеризація, регресійний аналіз і т.д.);
  • · Вибір алгоритму пошуку закономірностей;
  • · Пошук закономірностей, формальних правил і структурних зв'язків в зібраної інформації;
  • · Творча інтерпретація отриманих результатів;
  • · Інтеграція витягнутих "знань".

Для проведення пошуку спочатку на комп'ютері користувача завантажується інтерфейс роботи з відповідної БД. Це може бути локальна або віддалена БД. Спочатку слід визначитися з видом пошуку (простий, розширений і т.д.). Потім з набором пропонованих для пошуку полів. ІПС можуть запропонувати для введення одне або кілька полів. В останньому випадку це зазвичай поля: автора, заголовки (назви), тимчасового періоду, виду документа, ключових слів, рубрик і ін.

Реалізація пошуку

Загальноприйнята організація пошуку за початковими фрагментами слова (пошук з урізанням праворуч), наприклад, замість слова "бібліотечний" можна ввести його фрагмент "бібліоте *". При цьому будуть знайдені документи, в яких міститься не тільки слово "бібліотечний", але і "бібліотека", "бібліотекар", "бібілотековеденіе" і ін. У кожному разі користувач повинен представляти, що саме він хоче знайти, так як в запропонованому йому варіанті буде знайдено набагато більшу кількість документів, ніж при завданні даного слова повністю (без усічення). У подібному випадку можливо в отриманому масиві інформації провести уточнююче пошук і в результаті отримати більш релевантні дані.

ІПС характеризуються також часом виконання пошуку, інтерфейсом, що надаються користувачеві і видом відображаються результатів. При виборі ІПС звертають увагу на такі їх параметри, як охоплення і глибина. під охопленням розуміється обсяг бази пошукової машини, вимірюваний трьома показниками: загальним обсягом проіндексованою інформації, кількістю унікальних серверів і кількістю унікальних документів. під глибиною розуміється - чи існує обмеження на кількість сторінок або на глибину вкладеності директорій на одному сервері.

Так само, деякі аспекти інформаційного пошуку висвітлені в книзі В.А. Цвяховий «Основи побудови автоматизованих інформаційних систем». Як написано в книзі, кожна пошукова машина має свої алгоритми сортування результатів пошуку. Чим ближче до початку списку, отриманого в результаті проведення пошуку, виявляється потрібний документ, тим вище релевантність і краще працює пошукова машина. Всі вони дозволяють за ключовими словами, тематичними рубриками та навіть окремим буквах оперативно знаходити в мережі, наприклад, все або майже все тексти, де ці слова присутні. При цьому користувачеві повідомляються адреси сайтів, де знайдені результати постійно присутні. Однак жодна з них не має пригнічують переваг перед іншими. Для проведення надійного пошуку по складних запитах фахівці рекомендують використовувати послідовно або паралельно (одночасно) різні ІПС.

З книги Д.М. Кадеева «Інформаційні технології та електронні комунікації» можна дізнатися про таке поняття, як «повнотекстова пошукова машина». Вона індексує всі слова відомого користувачеві тексту. Наявність морфології дає можливість знаходити шукані слова у всіх склонениях або дієвідмінах. Деякі машини вміють шукати словосполучення або слова на заданій відстані, що часто буває важливо для отримання розумного результату. Крім цього, в мові HTML існують теги, які також можуть оброблятися пошуковою машиною (заголовки, посилання, підписи до картинок і т.д.). При цьому необхідно знати, що чим менше кількість ключових слів включено в ці теги, тим з більшою частотою вони можуть зустрічатися в текстах сторінок сайту і, отже, тим вище їх релевантність. Оптимальним вважається частота таких слів не більше 5%. Ключових слів повинно бути не дуже багато, вони в більшій мірі повинні складатися з одного або двох слів, утворюючи найбільш вживані терміни. Чим більшу релевантність мають ключові слова, тим більшу конкурентоспроможність вони надають документу з точки зору пошукових машин.

Повноту і точність відповіді користувач отримує в залежності від точності сформульованого ним запиту. В результаті пошуку йому зазвичай надається набагато більше інформації, ніж йому необхідно, частина якої може взагалі не мати відношення до сформованого запиту. Легко помітити, що багато що залежить не тільки від грамотно сформульованого запиту, але і від можливостей пошукових систем, які дуже різні. При цьому досить яскраво проявляється той факт, що в отриманих даних можна припустити головні, необхідні відомості. Прості запити у вигляді окремих досить поширених термінів призводять до вилучення тисяч (сотень тисяч) документів, абсолютна більшість яких користувачеві не потрібно ( інформаційний шум).

Важливим аспектом також є можливість ІПС підтримувати багатомовність, тобто здатність обробляти запити на різних мовах. Так само, як правило пошук в повнотекстових БД здійснюється з використанням морфологічних аналізаторів (як правило, російських і англійських), що дозволяють автоматично знаходити існуючі словоформи за фрагментом слова, слова, фрази, навіть якщо в словах запиту присутні деякі помилки.

Ще, не можна не згадати про таку особливість ІПС, як з редства пошуку і структурування , Іноді звані пошуковими механізмами . Як пише І.С. Ашманов у своїй книзі «Просування сайту в пошукових системах», пошукові механізми використовуються для того, щоб допомогти людям знайти інформацію, якої вони потребують. Засоби пошуку типу агентів, павуків, кроулеров і роботів використовуються для збору інформації про документи, які перебувають в Мережі Інтернет. Це спеціальні програми, які займаються пошуком сторінок в Мережі, витягають гіпертекстові посилання на цих сторінках і автоматично індексують інформацію, яку вони знаходять для побудови бази даних. Кожен пошуковий механізм має власний набір правил, що визначають, як знаходити і обробляти документи. Деякі йдуть за кожним посиланням на кожного знайденого сторінці і потім, в свою чергу, досліджують кожну посилання на кожній з нових сторінок, і так далі. Деякі ігнорують посилання, які ведуть до графічним і звуковим файлам, файлам мультиплікації; інші проінструктовані, що потрібно переглядати насамперед найбільш популярні сторінки. Класифікація пошукових механізмів найкраще представлена \u200b\u200bв книзі Варфоломєєва А.А. «Основи інформаційної безпеки":

  • · агенти- самі "інтелектуальні" з пошукових засобів. Вони можуть робити більше, ніж просто шукати: вони можуть виконувати навіть транзакції від Вашого імені. Вже зараз вони можуть шукати Сайти специфічної тематики і повертати списки cайтов, відсортованих по їх відвідуваності. Агенти можуть обробляти вміст документів, знаходити і індексувати інші види ресурсів, не лише сторінки. Вони можуть також бути запрограмовані для витягання інформації з вже існуючих баз даних. Незалежно від інформації, яку агенти індексують, вони передають її назад базі даних пошукового механізму.
  • · Загальний пошук інформації в Мережі здійснюють програми, відомі як павуки. Павуки повідомляють про зміст знайденого документа, індексують його і витягають підсумкову інформацію. Також вони переглядають заголовки, деякі посилання і посилають проіндексовану інформацію базі даних пошукового механізму.
  • · кроулери переглядають заголовки і повертають тільки перше посилання.
  • · роботи можуть бути запрограмовані так, щоб переходити по різним посиланням різної глибини вкладеності, виконувати індексацію і навіть перевіряти посилання в документі. Через їх природи вони можуть застрявати в циклах, тому, проходячи по посиланнях, їм потрібні значні ресурси Мережі, однак, є методи, призначені для того, щоб заборонити роботам пошук по сайтах, власники яких не бажають, щоб вони були проіндексовані.

На завершення можна сказати, що ІПС в мережі, при всьому їхньому зовнішньому розмаїтті, своєю класифікацією, яка описана в книзі Л.Г. Гагаріної «Автоматизовані інформаційні системи»:

Класифікаційні інформаційно-пошукові системи

У класифікаційних ІПС використовується ієрархічна (деревоподібна) організація інформації, яка називається Класифікатора. Розділи класифікатора називаються рубриці. Бібліотечний аналог класифікаційної ІПС - систематичний каталог. Класифікатор розробляється і вдосконалюється колективом авторів. Потім його використовує інший колектив фахівців, які називаються систематизатор. Систематизатори, знаючи класифікатор, читають документи і приписують їм класифікаційні індекси, які вказують, яким розділах класифікатора ці документи відповідаю.

Предметні ІПС (Web-кільця)

Предметна ІПС з точки зору користувача влаштована найбільш просто. Шукай назву потрібного предмета свого інтересу (предметом може бути і щось нематеріальне, наприклад, індійська музика), а з назвою пов'язані списки відповідних ресурсів Інтернет. Це було б особливо зручно, якщо повний перелік предметів невеликий.

словникові ІПС

Культурні проблеми, пов'язані з використанням класифікаційних ІПС, привели до створення ІПС словникового типу, з узагальненим англомовною назвою search engines. Основна ідея словникової ІПС - створити словник з слів, що зустрічаються в документах Інтернет, в якому при кожному слові буде зберігатися список документів, з яких взято дане слово.

Грунтуючись на відомостях з книги А.Ю. Келіном «Основи інформаційної безпеки», можна з'ясувати що є два основних алгоритму роботи словникових ІПС: з використанням ключових слів і з використанням дескрипторів ( дескриптор - лексична одиниця (слово, словосполучення) інформаційно-пошукової мови, що служить для опису основного змісту документа або формулювання запиту під час пошуку документа (інформації) в інформаційно-пошуковій системі). У першому випадку, для оцінки вмісту документа використовуються тільки ті слова, які в ньому зустрічаються, і за запитом ІПС зіставляє слова із запиту зі словами документа, визначаючи за кількістю, розташуванням, вагою слів із запиту в документі його релевантність. ІПС з історичних причин використовують цей алгоритм, в різних модифікаціях.

Пошук інформації в Інтернеті

Пошук інформації в Інтернеті

Для пошуку інформації в зазвичай використовуються три способи (Див. Рис.1). перший з них - пошук за адресою. Він застосовується, коли користувачеві відома адреса інформаційного ресурсу, що містить необхідну йому інформацію. При організації пошуку інформації за адресою (форма адреси - IP, доменний або URL - в цьому випадку значення не має) користувачеві досить просто ввести адресу ресурсу у відповідне поле браузера - програми, призначеної для забезпечення доступу до мережевих ресурсів.

Мал. 1. Способи пошуку інформації в гіпертекстових базах даних

другий - пошук за допомогою навігації по гіперзв'язку. При використанні цього виду пошуку разі користувач спочатку повинен отримати доступ до сервера, пов'язаного з відповідною БД. Після цього можна знайти документ, використовуючи гіперпосилання. Очевидно, що цей спосіб зручний, коли адреса ресурсу невідомий користувачеві. Для використання в якості вихідної точки для пошуку при реалізації цього способу призначені Web-портали - сервери, що надають прямий доступ до деякого безлічі серверів, включаючи встановлені на них інформаційні ресурси, а також Web-додатки, які реалізують Web-сервіси, відповідають призначенню порталу. Доступні через портал сервери можуть ставитися до певної системи (наприклад - корпоративної) або різних систем і бути спеціально підібрані за видовим, тематичним або іншими ознаками документів і даних, що містяться на їх сайтах. Зазвичай портали поєднують в собі різноманітні функції з метою утримати клієнта якомога довше. Домінуючим сервісом порталу є сервіс довідкової служби: пошук, рубрикатори, фінансові індекси, інформація про погоду і т.д. Якщо Web-сайти в більшості випадків являють собою набори статичних Web-сторінок, то портали є сукупностями програмних засобів і заздалегідь неструктурованою інформації, яку ці кошти перетворюють в структуровані дані за запитом конкретних користувачів.

третій спосіб пошуку передбачає використання пошукових серверів Інтернету. Пошуковими серверами називають виділені хост - комп'ютери, в яких розміщуються бази даних ресурсів Інтернету. Інтерфейс такого сервера має поле для введення ключових слів, що описують тему, цікаву для користувача (Див. Рис. 2).

Рис.2. Вид вікна пошукового сервера системи Яндекс

Ці слова сервер сприймає як інформаційний запит, відповідно до якого він здійснює пошук ресурсів і представляє список знайдених документів користувачеві. Очевидно, що при реалізації цього способу можливі помилки як 1-го (пропуск цілі), так і 2-го роду (інформаційний шум). Слід згадати, що розрізняються дві групи пошукових серверів: пошукові машини і предметні каталоги. Їх відмінність обумовлена \u200b\u200bспособом створення і подальшого поповнення бази даних ресурсів Інтернету, якій даний сервер здійснює інформаційний пошук. Так, пошукові машини мають в своєму складі спеціальну програму - пошуковий робот. Вона здійснює постійний моніторинг мережі, збирає інформацію з Web- сторінок, індексує їх і фіксує їх пошуковий образ у своїй базі даних. У предметних каталогах база даних про документах Інтернету формується «вручну» фахівцями-редакторами. Оскільки в Інтернеті відсутня єдина адміністрування, остільки його інформаційні ресурси постійно змінюються. У ньому можуть з'являтися нові і зникати існуючі документи. Частота оновлення інформації в документах для різних сайтів різна: для деяких - це кілька разів на годину, для деяких - раз на добу, день, місяць і т.д. Тому дуже важливо розуміти, що при використанні інформаційно-пошукових систем для знаходження інформації в Інтернеті, пошук здійснюється не на реальному просторі документів Мережі, а в деякій моделі, зміст якої може значно відрізнятися від дійсного змісту Інтернет в момент проведення пошуку. За ступенем охоплення індексованих ресурсів пошукові системи можна розділити на дві групи: міжнародні та російськомовні. Перші індексують всі опубліковані в Інтернеті документи поспіль. Другі індексують ресурси, розташовані в доменних зонах з переважанням російської мови. Список найбільш популярних систем наведено в Табл. 1.

Табл. 1. Найбільш популярні пошукові системи

міжнародні російськомовні
Google Яндекс (44,4% Рунета)
Yahoo! Rambler (10,6% Рунета)
Bing Mail.ru (7,3% Рунета)
MSN Nigma (0,5% Рунета)
AltaVista Gogo.ru (0,3% Рунета)
Ask Aport (0,2% Рунета)

Примітка: Рунет - це російськомовна частина Інтернету, складова домени з іменами ru і рф.

Необхідно згадати, що існує особлива категорія пошукових серверів - метапоісковая системи. Їх принципова відмінність від пошукових машин і предметних каталогів полягає в тому, що у них відсутня власна індексна база даних, і тому вони, отримавши запит користувача, перенаправляють його відразу до декількох пошукових серверів (Див. Рис. 3).

Мал. 3. Схема роботи метапоісковая системи

Можливість одночасного використання декількох пошукових серверів по одному запиту є очевидною перевагою метапоіскових систем. В даний широке застосування час знайшла система Metabot.ru, інтерфейс якої представлений на Рис. 4. Ця система дозволяє використовувати для пошуку ресурсів як міжнародні, так і російськомовні пошукові сервери.

Хто володіє інформацією, той володіє світом. Для помічника керівника бажання володіти певними знаннями продиктовано зовсім не марнославством або ідеями завоювати світ, а найчастіше професійною необхідністю. Уміння добути корисні дані є, безперечно, одним з ключових в роботі персонального асистента, оскільки далеко не завжди справжня або потрібна інформація лежить на поверхні.

Що таке конфіденційність інформації?

Згідно п. 7 ст. 2 Федерального закону від 27.07.2006 № 149-ФЗ «Про інформацію, інформаційні технології і про захист інформації» (в ред. Від 24.11.2014) конфіденційність інформації - обов'язкове для виконання особою, яка одержала доступ до певної інформації, вимога не передавати таку інформацію третім особам без згоди її власника. Інше поняття конфіденційності - це недоступність для певного кола користувачів інформації. Так чи інакше, це інформація, яка передається тільки за певними правилами, встановленим її правовласником, чи це юридична особа (організація) або фізична особа (звичайний громадянин, який став нам з якихось причин цікавим). Так, з одного боку, конфіденційність забезпечує захист правовласнику інформації, а з іншого - створює перешкоди для того, кого цікавить доступ до неї.

інформаційний puzzle

Одним з особливих властивостей інформації є те, що вона «живе», тобто передається тим чи іншим способом, з використанням різних методів та інструментів. З цієї причини навіть конфіденційна інформація, дістати яку шляхом подачі офіційного запиту виявляється найчастіше неможливим, з'являється в загальному доступі через неуважність її правовласника або безтурботного ставлення до своїх даних. Сьогодні, зважаючи на активний використання сучасних технічних пристроїв, а також мережі Інтернет найчастіше шматочки мозаїки від загального інформаційного образу її правовласника хаотично розкидані в інтернет-просторі. Для того щоб приховати дані, необхідно робити це цілеспрямовано, крім того, потрібно володіти певними вміннями і навичками. Та й потім, хіба комусь прийде в голову, що з приводу його персони або організації хтось задумає провести інформаційне розслідування?

Словом, для того щоб добути необхідні відомості, асистенту керівника досить мати доступ в Інтернет, зробити необхідні запити, зібрати дані і в повній мірі використовувати свої аналітичні здібності.

шпигунські мотиви

Недолік інформації - основний мотив для поповнення інформаційного запасу. Відомо, що дії, початі в умовах дефіциту інформації, можуть привести до неприємних наслідків. Цілепокладання в «інформаційному розслідуванні» грає велику роль, з одного боку, у визначенні очікуваного результату, з іншого - у виборі джерел для пошуку потрібних даних. У професійній діяльності помічник керівника може отримувати різні доручення від свого начальства, що стосуються пошуку будь-якого роду відомостей. Їх перелік індивідуальний, і, ймовірно, його межі неозорі. Однак можна виділити основні ситуації, для вирішення яких асистентові керівника буде корисно вдатися до збору додаткової інформації.

  • Співбесіда.Зміна місця роботи і пошук нового вимагають відповідальності і ретельного аналізу отриманих про роботодавця даних. Буває, що за підсумками одного або декількох етапів співбесіди, недостатньо даних для прийняття зваженого рішення «за» або «проти». Або через те, що роботодавець не надав необхідні матеріали через відсутність часу або просто не надавши їм значення, або через бажання навмисно їх приховати. У будь-якому випадку, представники компанії навряд чи готові на співбесіді відповідати на «тонкі» приватні питання чесно, наприклад, на питання про затримку заробітної плати, плинність кадрів або пов'язані із загальними проблемами в організації.

При наявності вихідних даних асистентові керівника рекомендується до проходження співбесіди знайти максимум корисної інформації про компанії: з одного боку, щоб підстрахуватися і поставити необхідні питання, з іншого - щоб мати можливість проявити професіоналізм і блиснути обізнаністю і підготовленістю до зустрічі.

  • Професійні завдання. Діяльність сучасних організацій неминуче пов'язана з співпрацею між один одним. Кожна фірма має партнерів, замовників, виконавців-контрагентів і т.д. Так, наприклад, до укладення договору з певною компанією на поставку продукції або надання послуг, юрист запитує для перевірки необхідний пакет документів, що містить мінімальний або максимально повний перелік - в залежності від вимог вашої організації до контрагентам. Не завжди перевіркою компаній займається юрист, в деяких випадках це робить асистент керівника за дорученням свого начальства. Тому пошук інформації про нову компанію або його керівництві може входити в обов'язки персонального помічника.
  • Особисті і професійні контакти. Помічник керівника щодня спілкується з великою кількістю людей (колегами, підрядниками, новими знайомими по роботі або в приватного життя). Бувають випадки, коли з якихось причин необхідно зібрати додаткову інформацію про людину, наприклад, при прийомі на роботу нового співробітника: ким він працював раніше, чим захоплюється, чи є якісь недоліки у професійній біографії і т.д. Щодо особистих контактів додаткові знання теж зайвими не будуть, оскільки в більшості випадків людям властиво приховувати про себе особисті відомості (в кращому випадку - з огляду на просту людську підозрілості, в гіршому - коли дійсно є що приховувати).

У великих організаціях часто створюється т.зв. служба безпеки. Вона займається професійним пошуком всієї інформації про приватних осіб або організаціях, якщо того вимагає забезпечення ділової, економічної, промислової безпеки компанії. Як правило, у фахівців цієї служби є в розпорядженні свої ресурси для наведення довідок і збору даних. Якщо у вашій організації існує служба безпеки, то рекомендується звернутися до її фахівцям для отримання потрібної інформації з надійних джерел.

Вихідні дані

При проведенні «інформаційного розслідування» ніякі деталі «дрібними» або зайвими не бувають. Крім того, в умовах нестачі відомостей будь-який інформаційний «гачок» є необхідною зачіпкою для знаходження корисних даних крок за кроком. «Гачками» для пошуку потрібних матеріалів в інтернет-просторі є чітко сформульовані запити, як і будь-які вихідні дані, якими асистент керівника зараз володіє. Досить буде найбільш «скромних», на перший погляд, новин, щоб почати пошук.

Запит по найменуванню організації:

  • дасть інформацію про найменування сайту компанії;
  • дозволить отримати контактну інформацію;
  • надасть результати пошуку за даними новинних і рекламних ресурсів;
  • дасть інформацію про сферу діяльності, реєстраційних даних, місцезнаходження і т.д.

Запит по П.І.Б. керівника організації або приватної особи:

  • допоможе отримати інформацію про найменування компанії і сфері діяльності;
  • дозволить ознайомитися з інформацією рекламних, ділових, новинних ресурсів;
  • надасть результати пошуку по резюме, біографій, довідкових матеріалів;
  • дасть інформацію про «присутності» в ділових і розважальних соціальних мережах і т.д.

Запит по номеру телефону компанії або номеру мобільного телефону:

  • дозволить отримати інформацію про компанії в разі, якщо це офісний номер телефону;
  • дасть інформацію про приналежність номера мобільного телефону до певного регіону Росії;
  • надасть дані пошуку по рекламним сайтам, оголошенням, розміщеним вакансій і пропозицій організації або приватної особи і т.д.

На замітку.Зазначені вихідні дані можна вважати базовими для подальшого збору інформації. Результати пошуку за вказаними запитам необхідно використовувати як дані для подальших запитів. Наприклад, якщо спочатку був відомий тільки номер телефону організації, то за результатами такого запиту можна отримати дані про найменування організації, а слідом і інформацію з даними керівників і засновників.

Розглянемо приклад пошуку інформації та її використання.

У пошуковій системі вводимо спочатку відомий номер телефону. Отримуємо наступний результат (рис. 1):

Далі по найменуванню організації набираємо наступний запит і отримуємо кілька сайтів з довідковою інформацією про організації. В даному випадку знайомимося з результатами на сайті rusprofile. ru (Рис. 2).

В яких випадках ця інформація може бути корисна?

  • Асистент керівника отримав завдання зв'язатися з редакцією журналу для розміщення реклами;
  • помічнику керівника доручено підготувати офіційний лист на ім'я генерального директора, однак ім'я генерального директора з самого початку не було відомо;
  • керівнику надійшов дзвінок з визначенням номера телефону та імені контактної особи та помічника попросили уточнити, з якої компанії дзвонили.

За запитами по П.І.Б., номеру телефону і найменуванню компанії пошукові системи, як правило, надають безліч результатів з посиланнями на різні ресурси і сайти. Асистентові керівника рекомендується уважно ознайомитися з довідковими матеріалами і ретельно відфільтрувати корисні дані від «спаму», приділяючи також особливу увагу джерела інформації: офіційний сайт організації в цьому випадку виявиться більш надійним, ніж, наприклад, рекламно-довідковий веб-ресурс.

Таким чином, маючи мінімум вихідних даних і навички роботи з пошуковими системами мережі Інтернет, помічник керівника може знайти необхідну в даний час інформацію або отримати додаткові дані для подальших запитів і продовження «інформаційного розслідування».

"Елементарно, Ватсон!"

В інтернет-просторі кожен з користувачів так чи інакше залишає свої «сліди», а відомості, коли-небудь розміщені їм, мають «хвости». Так, при використанні запитів в рядку пошуку Google, Yandex або інших пошукових систем асистент може ознайомитися з інформацією:

  • про розміщених користувачем оголошеннях на сайтах пошуку роботи або співробітників, приватних оголошеннях про продаж або купівлю, про які надають або потрібних послуги;
  • про опубліковані новинах організації або про посадових осіб, про участь в будь-яких ділових заходах, виставках, іншої діяльності компанії;
  • про створених резюме і біографіях, якщо мова йде про приватну особу;
  • про присутність в соціальних мережах і групах;
  • про відгуки про продукцію компанії або відгуках про компанії як роботодавця і мн. ін.

Навіть в разі, якщо інформація про пошук роботи або співробітників, розміщені оголошення та новини не є актуальними, вони не завжди видаляються правовласниками - через забудькуватість або за відсутності необхідності.

Що і де шукаємо? Як використовуємо?

Залежно від того, яку інформаційну задачу належить вирішити персонального асистенту (будь то збір максимально повної інформації або тільки перевірка певних даних про організацію або приватну особу), можуть бути обрані й інші ефективні методи пошуку в Інтернеті. Для їх використання необхідні також вихідні дані (досить буде інформації про найменування компанії, або контактних даних, або П.І.Б. керівника або приватної особи) (див. Таблицю).

Вид інформації та приклади її використання

вид інформації

приклади використання

Повне найменування компанії і її види діяльності

Повна назва, організаційно-правова форма і офіційно зареєстровані види здійснюваної діяльності - основна інформація про компанію. Вона буде корисна як при пошуку нового місця роботи для збору даних про роботодавця, так і в роботі персонального асистента для перевірки діяльності партнера або контрагента.

Часто недобросовісні співробітники організацій представляють свої компанії як «великі» або навіть «міжнародні», а на ділі виявляється, що це звичайні ІП, до переліку видів діяльності яких не входять ті роботи, для яких ваша компанія планувала їх залучити

Дата реєстрації в державних органах

Дата реєстрації підприємства в державних органах має значення в тому випадку, якщо для вашої організації важливий багаторічний досвід роботи контрагента або партнера в певній галузі.

Наприклад, якщо компанія повідомила вам, що є присутнім на ринку більше 10 років, а насправді зареєстрована кілька місяців тому, це може викликати сумніви щодо солідності і надійності фірми.

Інформація про тривалість функціонування підприємства буде корисна як в професійній роботі помічника керівника, так і в разі, якщо необхідно зібрати найбільш повні дані про новий роботодавця

Дані про засновників і керівників організації

Інформація про керівництво і засновників компанії може включати відомості про кількість засновників, їх П.І.Б., частки участі, кількості керівників і їх П.І.Б. Користь цих даних полягає в тому, що вони можуть послужити основою для подальшого пошуку інформації. Так, наприклад, знаючи засновників і керівників компанії, необхідно зробити подальший запит по П.І.Б. і участі цих осіб у діяльності інших організацій. Таким чином можна зрозуміти, наскільки «великими» є засновники, і якщо їх частки участі великі, можливо, вони є і інвесторами декількох компаній. За результатами пошуку можна піти далі і ознайомитися з діяльністю нових знайдених компаній - для створення найбільш ясної картини ділової активності її учасників.

Крім того, додатково отримані дані про засновників і директорів можна проаналізувати з різних точок зору. Наприклад, якщо в списку осіб однакові прізвища, ймовірно, компанія є сімейної. Якщо зустрічаються прізвища іноземних осіб, можливо, підприємство має зв'язки із зарубіжними партнерами або головними організаціями

Адреси та телефони компанії

Необхідність контактних даних переоцінити складно. Вони виконують свою основну роль: дають можливість зв'язатися з організацією або окремими її співробітниками. Однак часом має сенс зробити додаткові запити за адресою організації та за її телефонами.

Трапляється, що по одному і тому ж адресою компанії можуть перебувати кілька юридичних осіб. Такими часто є як дочірні підприємства, так і сторонні організації. Крім того, до реєстрації по одному і тому ж адресою часто вдаються недобросовісні організації, що не мають засобів для оренди повноцінного офісу. Тоді на певних умовах купується юридична адреса, а фактично компанія за вказаною адресою не має.

За запитом помічника керівника телефон компанії може з'явитися в різних «відповідях» пошукової системи. Необхідно ретельно ознайомитися з результатами, щоб зрозуміти, чи немає в них інформації, наприклад, про занесення телефонного номера в чорні списки роботодавців і т.п.

Адреса офіційного сайту підприємства

Адреса офіційного сайту компанії є дуже інформативним ресурсом:

  • якщо організація не має сайту, то ймовірно, у компанії немає коштів на його створення або вона була створена відносно недавно;
  • має значення обсяг наданої компанією інформації: наявність або відсутність даних про керівників, співробітників, новини, інформація про партнерів або замовників і т.д .;
  • дата створення сайту і його інтерфейс говорять про те, коли сайт був створений і наскільки професійно виконаний технічно і з точки зору дизайну;
  • наявність або відсутність контактних даних (див. вище);
  • адреса домену сайту містить додаткову інформацію, за допомогою якої існує можливість додаткової перевірки

Розмір статутного капіталу компанії

Велике значення має розмір статутного капатала організації. Існує мінімальний розмір статутного капіталу, і багато компаній при реєстрації їм обмежуються. Однак якщо компанія поставляє вашому підприємству продукцію або надає послуги на суму, в десятки або сотні разів перевищує її статутний капітал, варто пам'ятати про те, що в разі недобросовісної роботи або поставки ваша організація отримає тільки те, що знаходиться у фонді компанії

Наявність заборгованостей перед податковими органами

Дані про відсутність боргів є тільки плюсом і говорять про компанію як про сумлінному платника податків. Однак наявність заборгованостей перед податковими органами, як і розмір цих заборгованостей, необхідно обов'язково врахувати.

При працевлаштуванні на роботу буде корисно знати, чи немає у компанії боргів перед Пенсійним фондом.

При співпраці компанії як з контрагентом або партнером заборгованості можуть стати показником її недобросовісного ділового підходу або ж збиткового стану

Участь в судових розглядах

Інформація про участь в судових розглядах важлива, однак при цьому необхідно ознайомитися з їх змістом. Одна справа - несплата штрафів за неправильну парковку службового автомобіля, інше - трудові спори або інші серйозні справи. Важливо також врахувати, виступала компанія в ролі позивача або відповідача

Дискваліфікація посадової особи

Трапляється, що посадові особи організацій, будь то керівники або інші посадові особи, дискваліфікуються в судовому порядку відповідно до законодавства. Ця інформація стане корисною для аналізу нових компаній-партнерів або при працевлаштуванні на роботу. Особливо це важливо для асистента керівника, робота якого безпосередньо пов'язана з професійною діяльністю начальства

Адреса електронної пошти контактної особи

За адресою електронної пошти організації або її співробітника можна судити про її «солідності». Як правило, в сучасних організаціях прийнято користуватися корпоративними електронними адресами, розміщеними на своїх доменах (доменну адресу після значка @), з метою інформаційної безпеки і показника певної корпоративної культури. У разі, якщо адреса компанії знаходиться на загальнодоступному сервері, наприклад mail.ru або yandex.ru, то має сенс додатково його перевірити шляхом введення запиту за адресою в пошуковому рядку. За результатами пошуку можна проаналізувати, в яких статтях використовувався адреса, в яких оголошеннях був зазначений і не потрапив він в чорні списки користувачів

Номер мобільного телефону

За номером мобільного телефону можна дізнатися його приналежність до певної компанії - фігурує він за результатами пошуку в оголошеннях від імені юридичної особи. Крім того, він може бути зафіксований і на сайтах приватних оголошень - корисно буде ознайомитися з їх змістом. Необхідно звернути увагу, була внесена він в будь-які чорні списки користувачів і чи немає до нього коментарів.

Крім того, за номером мобільного телефону можна дізнатися його приналежність до певних телефонному оператору і регіону

Особисті дані

З метою характеристики особистості майбутнього керівника, нових колег або ж тих, з ким помічник керівника перетинається на нинішньому місці роботи, часто бувають корисними особисті дані. Сімейний стан, фотографії, захоплення, стиль спілкування, коло друзів, інтереси - все це часто є в соціальних мережах. Не рекомендується витрачати час на пошук подібної інформації з цікавості, однак для додаткової характеристики людини соціальні мережі можуть надати персонального асистенту різні дані: як позитивно, так і негативно характеризують особистість

Відгуки працівників, списки роботодавців

Відгуки колишніх співробітників організацій, а також тих, хто брав участь в співбесідах, що проводяться організацією, мають значення в тому випадку, якщо помічник керівника планує здійснювати в ній свою професійну діяльність. Коштувати врахувати, що завжди є «скривджені» і «незадоволені», не рекомендується робити висновки виходячи тільки з відгуків і коментарів приватних осіб. Однак необхідно їх врахувати і зіставити з іншими даними про компанію.

Крім того, існують офіційні ресурси, які періодично публікують списки як кращих, так і недобросовісних роботодавців

В Інтернеті існує безліч ресурсів, які пропонують надати користувачам інформацію про організацію. При цьому є ті, на яких відомості представлені у вільному доступі, а також комерційні сайти. Часто платні веб-сторінки пропонують надати вам за гроші ті дані, які на іншій сторінці ви знайдете абсолютно безкоштовно. Не поспішайте сплачувати першу-ліпшу інформацію, ретельно вивчіть наявні ресурси, в т.ч. надійні джерела - офіційні сайти різних служб, перш ніж вдатися до платного запитом.

Довідково.Як правило, дані по компаніям, які містить цей довідкових ресурсах, отримані з відкритих джерел (ЕГРЮЛ і Росстат) і не підпадають під дію Федерального закону від 27.07.2006 № 152-ФЗ «Про персональних даних» (в ред. Від 21.07.2014) згідно зі ст. 6 Федерального закону від 08.08.2001 № 129-ФЗ «Про державну реєстрацію юридичних осіб та індивідуальних підприємців» (в ред. Від 30.03.2015; із змінами. Від 18.05.2015).

  • www.egrul.nalog.ru . Офіційний сайт Федеральної податкової служби надасть асистентові керівника безкоштовну інформацію, опубліковану в відповідно до законодавства і не є конфіденційною. Цей ресурс дозволяє отримати дані відразу по декількох позиціях, зазначеним в таблиці.

Необхідні вихідні дані для пошуку: найменування юридичної особи або ІП, свідоцтва про Державну реєстрацію або ІПН (рис. 3).

В цьому випадку ми здійснюємо пошук по найменуванню юридичної особи. Регіон місця знаходження вводити не обов'язково, проте при наявності таких відомостей їх рекомендується вказати, щоб отримати найбільш повні результати пошуку. Після введення даних натискаємо кнопку знайти і отримуємо результат (рис. 4).

При пошуку на сайті Федеральної податкової служби з'являються результати в форматі pdf. Документи доступні для скачування і містять повну інформацію про реєстрацію компанії: дані про засновників, керівників, про дату реєстрації, зареєстрованих видах діяльності, адресні дані та ін. (Рис. 5).

Ресурс податкової служби зручний також тим, що надає можливість пошуку по інших баз даних, яким можна скористатися безкоштовно, натиснувши на одне з посилань і ввівши необхідні для запиту вихідні дані. Асистент керівника легко знайде інформацію про дискваліфікованих осіб, юридичних осіб, які мають заборгованість зі сплати податків, і інші корисні дані.

Варто зазначити, що для пошуку може знадобитися додаткова інформація, наприклад, для пошуку по заборгованостях - ІПН платника податків (рис. 6). У разі якщо спочатку ІПН відомий не був, його можна подивитися в відомостях про реєстрацію юридичних осіб, отриманих за результатами пошуку по найменуванню компанії.

Ознаки компаній-одноденок

витяг
з Загальнодоступних критеріїв самостійної оцінки ризиків для платників податків, які використовуються податковими органами в процесі відбору об'єктів для проведення виїзних податкових перевірок,
затверджених наказом ФНС Росії від 30.05.2007 № ММ-3-06 / [Email protected]
«Про затвердження Концепції системи планування виїзних податкових перевірок»

(В ред. Від 10.05.2012)

[...] При оцінці податкових ризиків, які можуть бути пов'язані з характером взаємовідносин з деякими контрагентами, платнику податків рекомендується досліджувати наступні ознаки:

Відсутність особистих контактів керівництва (уповноважених посадових осіб) компанії-постачальника і керівництва (уповноважених посадових осіб) компанії-покупця при обговоренні умов поставок, а також при підписанні договорів;

Відсутність документального підтвердження повноважень керівника компанії-контрагента, копій документа, що засвідчує його особу;

Відсутність документального підтвердження повноважень представника контрагента, копій документа, що засвідчує його особу;

Відсутність інформації про фактичне місцезнаходження контрагента, а також про місцезнаходження складських і / або виробничих і / або торгових площ;

Відсутність інформації про спосіб отримання відомостей про контрагента (немає реклами в ЗМІ, немає рекомендацій партнерів або інших осіб, немає сайту контрагента і т.п.). При цьому негативність даної ознаки посилюється наявністю доступної інформації (наприклад, в ЗМІ, зовнішня реклама, Інтернет-сайти і т.д.) про інших учасників ринку (в тому числі виробниках) ідентичних (аналогічних) товарів (робіт, послуг), в тому числі пропонують свої товари (роботи, послуги) за нижчими цінами;

Відсутність інформації про державну реєстрацію контрагента в ЕГРЮЛ (загальний доступ, офіційний сайт ФНС Росії www.nalog.ru).

Наявність подібних ознак свідчить про високий ступінь ризику кваліфікації подібного контрагента податковими органами як проблемного (або «одноденки»), а угоди, зроблені з таким контрагентом, сумнівними.

Додатково підвищують такі ризики одночасна присутність таких обставин:

Контрагент, який має вищевказані ознаки, виступає в ролі посередника;

Наявність в договорах умов, що відрізняються від існуючих правил (звичаїв) ділового обороту (наприклад, тривалі відстрочки платежу, поставка великих партій товарів без передоплати або гарантії оплати, непорівнянні з наслідками порушення сторонами договорів штрафними санкціями, розрахунки через третіх осіб, розрахунки векселями і т. п.);

Відсутність очевидних свідчень (наприклад, копій документів, що підтверджують наявність у контрагента виробничих потужностей, необхідних ліцензій, кваліфікованих кадрів, майна і т.п.) можливості реального виконання контрагентом умов договору, а також наявність обґрунтованих сумнівів у можливості реального виконання контрагентом умов договору з урахуванням часу, необхідного на доставку або виробництво товару, виконання робіт або надання послуг;

Придбання через посередників товарів, виробництво і заготівля яких традиційно проводиться фізичними особами, які не є підприємцями (сільгосппродукція, вторинну сировину (включаючи металобрухт), продукція промислу і т.п.);

Відсутність реальних дій платника (або його контрагента) щодо стягнення заборгованості. Зростання заборгованості платника (або його контрагента) на тлі продовження поставки на адресу боржника великих партій товарів або істотних обсягів робіт (послуг);

Випуск, купівля / продаж контрагентами векселів, ліквідність яких не очевидна або не досліджена, а також видача / отримання позик без забезпечення. При цьому негативність даної ознаки ускладнює відсутність умов про відсотки за борговими зобов'язаннями будь-якого виду, а також терміни погашення зазначених боргових зобов'язань більше трьох років;

Істотна частка витрат по угоді з «проблемними» контрагентами в загальній сумі витрат платника податку, при цьому відсутність економічного обґрунтування доцільності такої угоди при одночасній відсутності позитивного економічного ефекту від її здійснення і т.п.

Як перевірити компанію-контрагента на «реальність»?

  1. Скористатися електронними сервісами на сайті ФНС Росії(Http://www.nalog.ru/):
  • « Відомості про осіб, щодо яких факт неможливості участі (здійснення керівництва) в організації встановлено (підтверджено) в судовому порядку »(https://service.nalog.ru/svl.do). За свідоцтво про Державну або ІПН організації можна дізнатися, чи не заявляло чи особа, яка, за даними ЕГРЮЛ, є керівником або засновником організації, про те, що воно не має ніякого відношення до неї;
  • « Відомості, опубліковані в журналі "Вісник державної реєстрації", про прийнятих реєструючими органами рішеннях про майбутнє виключення недіючих юридичних осіб з Єдиного державного реєстру юридичних осіб (http://www.vestnik-gosreg.ru/publ/fz83/). Таке рішення податкова може прийняти, якщо компанія протягом року не уявляла податкову звітність і не проводила операцій хоча б по одному банківському рахунку. Виняток компанії з ЕГРЮЛ прирівнюється до її ліквідації, а значить, вона не може укладати і виконувати договори.

Наша порада: роздрукуйте або збережіть на своєму комп'ютері інтернет-сторінки (скріншоти) з інформацією про компанії. Це допоможе в подальшому довести, що ви проводили перевірку.

  1. Запитайте завірені копії таких документів:
  • статуту організації;
  • свідоцтва про державну реєстрацію організації;
  • свідоцтва про постановку організації на облік в податковому органі за місцем її знаходження;
  • рішення про обрання (призначення) керівника організації;
  • паспорта керівника організації (с. 2, 3);

До речі: дійсність паспорта можна перевірити за його серією та номером, скориставшись сервісом «Перевірка за списком недійсних російських паспортів» на сайті ФМС Росії ( http://services.fms.gov.ru/info-service.htm?sid\u003d2000).

  • ліцензії, якщо угода з організацією полягає в рамках ліцензованої діяльності. Крім того, інформацію про ліцензії, видані компанії, можна перевірити на сайтах видають ліцензії;
  • бухгалтерської звітності за рік, що передує року укладання угоди. Дані бухгалтерської звітності організації за будь-який період також можна безкоштовно отримати в Росстат (за умови, що компанія здає бухзвітність в органи статистики). Для цього потрібно направити в будь-який територіальний орган Росстату запит за затвердженою формою.

Результати проведеної перевірки можна оформити у вигляді довідки і подати керівнику.

ВІДЕОінструкція з перевірки контрагента - на сайтіhttp://egrul.nalog.ru/.

  • www. fssprus. ru . Офіційний сайт Федеральної служби судових приставів Росії надає користувачам можливість ознайомитися з банком виконавчих проваджень та здійснити пошук, використовуючи просту форму (http://fssprus.ru/iss/ip/) (рис. 7).

База даних містить відомості по юридичним, фізичним особам. Для того щоб здійснити пошук, необхідно ввести відповідно дані фізичної, юридичної особи або в окремій вкладці форми пошуку - номер виконавчого провадження, якщо він відомий (рис. 8).

Зверніть увагу!На відміну від сайту Федеральної податкової служби введення даних про територіальних органах на сайті ФССП є обов'язковим.

Якщо компанія або фізична особа має будь-які заборгованості і в їх відношенні порушено виконавчі провадження, то в результатах пошуку асистент керівника отримає наступні дані: повне найменування компанії і адресу місцезнаходження, номер і дата порушення виконавчого провадження, реквізити виконавчого документа, а також суму непогашеної заборгованості. У прикладі видалені деякі дані таблиці, проте графи збережені для наочності відображення результатів пошуку.

  • www. rusprofile. ru . Проект «РусПрофайл» є довідкову систему по компаніям, якою можна скористатися для швидкого пошуку організації, контактних даних та відомостей про реєстрацію.

У розділі «Компанії» необхідно ввести найменування підприємства і отримати результати пошуку (рис. 9).

Надіслати свою хорошу роботу в базу знань просто. Використовуйте форму, розташовану нижче

Студенти, аспіранти, молоді вчені, які використовують базу знань в своє навчання і роботи, будуть вам дуже вдячні.

подібні документи

    Зберігання даних в мережі Internet. Гіпертекстові документи, види файлів. Графічні файли, їх види та особливості. Пошукові системи і правила пошуку інформації. Огляд пошукових систем мережі Internet. Все про пошукових системах Yandex, Google, Rambler.

    курсова робота, доданий 26.03.2011

    Засоби пошуку інформації в мережі Інтернет. Основні вимоги та методика пошуку інформації. Структура і характеристика пошукових сервісів. Глобальні пошукові машини WWW (World Wide Web). Планування пошуку і збору інформації в мережі Інтернет.

    реферат, доданий 02.11.2010

    Характеристика методів пошуку інформації в Інтернеті, а саме - з використанням гіпертекстових посилань, пошукових машин і спеціальних засобів. Аналіз нових інтернет ресурсів. Історія виникнення і опис західних і російськомовних пошукових систем.

    реферат, доданий 12.05.2010

    Структура і принципи побудови мережі Інтернет, пошук і збереження інформації в ній. Історія появи і класифікація інформаційно-пошукових систем. Принцип роботи та характеристики пошукових систем Google, Yandex, Rambler, Yahoo. Пошук за адресами URL.

    курсова робота, доданий 29.03.2013

    Характеристика пошукових систем Yandex, Google, Rambler: подібності та відмінності, переваги та недоліки. Пошук визначення ряду термінів, програмних продуктів. Пошук інформації за напрямками: письменники і поети, їх твори, доктора наук для Самари.

    контрольна робота, доданий 22.08.2011

    Поняття і принципи роботи, внутрішня структура та елементи, історія формування і розвитку пошукової системи "Rambler". Дослідження і аналіз, а також оцінка ефективності даної пошукової системи для пошуку економічної інформації в інтернеті.

    курсова робота, доданий 10.05.2015

    Методи та інструментарій зберігання даних у Всесвітній мережі. Поняття і різновиди гіпертекстових документів і графічних файлів. Принципи роботи пошукових систем і правила пошуку потрібної інформації. Характеристика деяких пошукових систем Мережі.

    курсова робота, доданий 18.04.2010