Сбор и анализ информации из открытых источников


Анализ сайта компании
Сайт любой компании - это ее визитная карточка и бесплатная рекламная площадка. Поэтому относиться к данной информации нужно соответствующим образом. Наиболее полно
о              том, что и как можно почерпнуть с сайта изучаемой организации, можно прочитать в работах Е.Л. Ющука. Ниже приводятся выдержки из его работ.
Исследование технической составляющей сайта
Доменное имя
Доменное имя — это то, что пишется в адресной строке браузера, когда нужно попасть на определенный сайт. В конце этого имени есть сочетание символов, которое обычно пользователи отождествляют со страной (для России это «.ги»). На самом деле это домен первого уровня. Он отделен точкой от всего остального. Именно точки отделяют друг от друга домены разного уровня.
Важно обратить внимание на то, какого уровня доменное имя у исследуемого сайта.
Домен второго уровня требует некоторых финансовых расходов и может расцениваться как некий показатель, характеризующий его владельца. Домен третьего уровня, как правило, бесплатный. Но нужно быть осторожным в своих выводах. В интернете много сайтов, зарегистрированных с доменными именами третьего уровня. В основном это сайты частных лиц или некоммерческие проекты. Поэтому, если изучаемый сайт принадлежит якобы большой коммерческой организации и при этом использует домен третьего уровня, это настораживающий момент.
При исследовании доменного имени нужно обратить внимание и на написание самого доменного имени. Здесь кроется своя особенность. Заключается она в том, что нередко компа
нии регистрируют доменные имена известных марок или производителей с изменением одного символа так, чтобы смысл искажался незначительно. В результате получается доменное имя с ошибкой. Расчет очень простой: кто-то введет домен известного бренда с ошибкой и попадет к ним, а уж попав к ним, с высокой вероятностью будет думать, что попал на сайт того самого известного бренда. Если такой момент выявлен, необходимо задуматься о причинах такого поступка.
Для дальнейшего исследования доменного имени необходимо воспользоваться сервисом «\УНО18». Воспользоваться этим сервисом можно на страничке «1Ш сеШег» (\у\уЛ шс.ги/\уЬо18) или «А1еха» (ут\кГаёапПпс!ег.сот/иг1тЛgt;) либо «У-Ппе» (УЛУУ уНпе.ги). Фактически это база данных доменов второго уровня, в которой есть информация о том, на кого или на какую организацию зарегистрирован домен, когда, контактные данные этого лица или этой организации (адрес, телефон, электронная почта). Согласитесь, есть с чем поработать. Например, некая компания везде преподносит определенный сайт как свой. И действительно, на указанном сайте есть контактные данные этой организации, схема проезда к ней и т.п. Но вот при использовании сервиса \уНо18 выясняется, что сайт зарегистрирован на другое юридическое лицо. Возможны разные объяснения такой ситуации, а говоря иначе — версии для дальнейшей проверки. Во-первых, та компания, что указана в качестве владельца сайта, может оказаться действительным и единоличным владельцем всех ресурсов исследуемой организации, а ее руководитель и учредитель является реальным собственником указанных активов. Во-вторых, может оказаться, что компания, на которую зарегистрировано доменное имя, является лишь разработчиком сайта по заказу исследуемой организации, но из-за халатности после разработки сайта и передачи результатов этих работ заказчику права на доменное имя переданы не были. А может оказаться и другая причина такого положения дел.
Изучение структуры сайта
Во-первых, нужно отметить, что лучше всего изучать сайт не в оп-Нпе режиме, а скачав его целиком на жесткий диск и
спокойно делая с ним все что нужно. В этом случае вы можете использовать любые способы исследования, не рискуя повредить объект или быть замеченным, а также вы увидите служебные странички, ссылок на которые нет на самом сайте. Эти страницы могут нести самую разнообразную информацию.
Затем необходимо посмотреть инструкции системного администратора для поисковых роботов, что индексировать на сайте, а что нет. Для этого необходимо посмотреть содержимое страницы «ГОЬО1amp;1Х1» на исследуемом сайте. Чтобы увидеть эту страницу, нужно добавить в конце адреса сайта следующую запись «/гоЬо18.1х1». Для сайта 1Т2В это выглядит так: \у\у\\и12Ъ. ШГОЬО181Х1 И позволяет увидеть, какие страницы системный администратор захотел сделать невидимыми для поисковых систем. Не у всех сайтов есть такая инструкция, но если есть, то вас может ждать удача. Используя указанные на данной странице ссылки, можно войти в невидимую (служебную) часть сайта. Что там найдется, можно только гадать. Возможно, эта часть сайта используется региональными и местными менеджерами для ведения общей базы данных, а может быть, там хранятся пароли...
Изучение истории изменений программной части серверов компании
На первый взгляд это покажется невероятным. Но нет — изучить историю изменений программной части сервера исследуемого сайта можно. И делается это с помощью сервиса ЫЕТСКАРТ (\тлу.пе\У8.пе1сгай.сош). Введя адрес сайта и нажав кнопку «Ьоокир», вы получите данные об изменениях 1Р-адре- са, оси сервера и его составляющих, когда и какие изменения производились. Эти данные могут помочь для дальнейшего, более глубокого изучения сайта и сервера. Также эти данные косвенно указывают на то, как относится руководство компании к информационной составляющей своей компании, а также о финансовом благополучии компании по тому, насколько оборудование соответствует современным реалиям и как часто обновляется.

Изучение ссылок на сайт и с него
Выявление ссылок на сайт можно осуществить несколькими способами. Можно непосредственно в поисковых системах (Яндекс, Рамблер, Ооо§1е и т.п.), задав соответствующий оператор. Для Яндекса это Нпк=»...*» и для других поисковиков свои операторы. А можно с помощью одного из сервисов Ра§ап Ртёег. В этом случае необходимо пройти по вкладке Ьлпкз на сайте \у\\ЛГа§апГ1пс1ег.сот/игПпГо, предварительно введя в окно «1ЛШпГо» адрес исследуемого сайта и нажать на ссылку интересующего вас поисковика (для У5Ы это выглядит так: Оепега1 gt; 1лпк$ gt; М81Ч). Найденные ссылки требуют индивидуального и всестороннего изучения. Это могут оказаться странички партнеров по бизнесу, бывших или настоящих сотрудников, частных консультантов и т.п. Непаханое поле для изучения предмета вашего интереса.
Анализ трафика сайта
Это позволяет сделать сетевой сервис Ра§ап Ртдег Га§апГтс1ег.сот/иг1тГо (Сепега1 gt; А1еха gt; ТгаШс ОелаУз).
Данный сервис не дает стопроцентную информацию о трафике, поскольку основывается на результатах обработки статистических данных собранных с помощью пользователей установивших себе соответствующее ПО. В России не много людей знают об этом и еще меньше установило себе софт. Поэтому результаты по российской части Интернета не совсем корректные. Но это не мешает использовать его для первичного анализа сайтов. Введя адрес сайта и нажав кнопку «Ое1 ТгаШс Ое1аУз», вы получите график изменения обращений к сайту, с каких сайтов или страниц люди попадают на исследуемый сайт (\\Ъеге до реор1е §о оп...) и тому подобное.
Изучение архива сайта
Архивированием информации в Интернете занимается сервис «1п1егпе1 АгсЫуе \УауЬаск МасЫпе» (\у\улу.теЪ.агсЫуе.ог§).
Благодаря этому сервису мы можем увидет, как часто менялось содержимое исследуемого сайта и в чем заключались эти изме
нение. А можем посмотреть, как выглядел сайт в определенный момент времени и какая информация на нем находилась. Исследуя архив определенного сайта, можно понять, в какой момент времени произошла смена стратегической линии компании, когда появились определенные партнеры, когда были произведены интересующие вас приобретения. Можно найти документы, когда-то опубликованные, но впоследствии удаленные с сайта. Даже просто подтвердить наличие сайта в прошлом бывает весьма полезно.
Отзывы по форумам (блогам)
Люди общаются между собой, обмениваются впечатлениями, мнениями, знаниями, опытом. В том числе это происходит и в Интернете. В глобальной Паутине такой обмен возможен самыми разными способами. Это и электронная почта, и интернет- пейджеры, и форумы, и чаты, и живые журналы... В нашем случае исследованию подвергнем форумы. Наиболее приемлемым инструментом в этой области для русскоязычной части сети является соответствующий сервис Яндекса (\у\л.Ыо§5.уапс!ех.ги). Он дает достаточно возможностей для поиска интересующей вас информации об исследуемом сайте и компании. Для англоязычной части Интернета можно воспользоваться одним из сервисов уже описанного ресурса Ра§ап Ртёег (Оепега1 gt; В1о§$/Реес1$ gt; ТгаШс ОегаПз). Внимательно изучив содержимое форумов с упоминанием исследуемого сайта (компании или лица), вы можете получить массу дополнительной информации. Главное, не забывайте, что вся эта информация требует дополнительной проверки, а не является истиной в последней инстанции, ведь вся блогсфера, по сути, аналог российского ОБС («одна баба сказала»).
Перевод сайта ресурсами Интернета
Данное действие позволяет осуществить один из сервисов Ооо§1е — «Языковые инструменты» (Лту.§оо§1е.ги/1ап§иа§е_ 1оо18?Ы=пд). Онлайновый перевод также возможен и на сайте \у\у\уТа§апЯпlt;1ег.сот/игИп{о, и на сайте \\ЛлЛ.8у51;гап8ой.сот.

Мониторинг изменения сайта
Самый простой способ — это каждый раз заходить и смотреть, что же изменилось, выискивать интересное. Но это может быть оправдано, только если подконтрольный сайт один. Чаще всего таких сайтов много, и необходима автоматизация процесса. Такую автоматизацию можно организовать программно. В общем виде подобные решения можно разделить на онлайновые и индивидуальные. Онлайновые — это сервисы, предлагаемые на разных сайтах, таких как Яндекс или \у\у\у.Га§апПпс1ег. сот во вкладке Тгаск gt; СЬап§еОе1ес1юп. Их преимущество в возможности отсылки информации об изменениях на любой почтовый ящик и соответственно доступ к этой информации из любой точки планеты. К индивидуальным относятся программы, устанавливаемые на персональный компьютер. Такие, как \УеЪ5И-\Уа1сЬег.
Исследование контента сайта
Грамматические ошибки.
Грамматические ошибки могут усложнить поиск необходимой информации. Поэтому при автоматизированном поиске того или иного слова не забывайте о возможности иного его написания.
Грамматические ошибки в тексте сайта могут появиться в силу разных причин: случайная опечатка при вводе информации; безграмотность автора или того, кто вводил информацию; намеренные ошибки для облегчения обнаружения сайта пользователями, которые неверно вводят искомое слово в поисковую строку сервера-поисковика; сетевые традиции написания слова; принадлежность автора к некой субкультуре и соответствующий сленг.
Сами по себе грамматические ошибки могут говорить о разном. Если это тенденция — об уровне образования лица, ответственного за наполнение сайта, об отношении к сайту руководства компании и т.п. Если это сленг — об отождествлении себя
все тех же лиц или о желании показать общность с некой субкультурой. Но необходимо четко понять, что за тип ошибок перед вами. Для этого необходимо внимательно изучить тексты на сайте. Если ошибки редки, а слова, в которых они допущены, в основном пишутся правильно — скорее всего это случайная опечатка. Если слова пишутся всегда с одной и той же ошибкой — намеренное написание.
Миссия компании.
Тоже достаточно информативная составляющая, если с ней правильно поработать. Главное, помнить, что миссия — это основа идеологии, поэтому наибольшее внимание нужно уделять не заботе о сотрудниках и обществе, а цели компании и методам ее достижения.
История развития компании.
Ее часто вывешивают на сайт. Понятно, что она «вылизана», но тем ни менее благодаря истории компании можно узнать, откуда что пошло, с кем компания пересекалась, какие успех и провалы у нее были. В общем, богатый материал для дальнейшей работы.
РК-материалы.
Все, что связано с формированием соответствующего представления об изучаемой компании, можно отнести к РК-мате- риалам. Это и новости, соответствующим образом подобранные, и статьи о компании и ее продукции, и интервью клиентов, и «вопросы и ответы», и еще многое другое. При изучении таких материалов следует обратить внимание на то, кто их автор или какое издательство их готовило. Чаще всего это одно или несколько лиц. Выявив этих лиц, можно понять уровень затрат изучаемой компании на их содержание, отношение к своему имиджу. Можно связаться с редакцией и получить дополнительную информацию, соответствующим образом завуалировав свой интерес. Сам контент таких публикаций тоже имеет ценность. Из содержимого можно узнать о планах компании, о ее связях, сделать выводы о трудностях, хотя их и пытаются скрывать.
услуги компании.
Любая компания рассматривает свой сайт как одно из средств продвижения своего товара. Поэтому о своем товаре компания должна написать все, что только есть хорошего. Чаще всего ин
формация о продукте представлена в соответствующем разделе и достаточно глубоко структурирована. Поэтому изучение продуктовой линейки не представляет особого труда. Здесь же можно получить информацию об официальной ценовой политике компании. Причем если компания не является производителем, то по продуктовой линейке компании можно составить представление и о ее поставщиках. По объемам продукции той или иной марки можно понять приоритеты, которые изучаемая компания расставила для себя.
Контактная информация.
Эта информация поможет ответить на вопрос, где собственно находится компания, кто с ней расположен под одной крышей, а то и в соседнем кабинете. Под каким видом можно приблизиться к сотрудникам компании.
Инвестиционная деятельность компании.
Данный раздел даст понимание того, на что нацелена компания сейчас, как изменились ее приоритеты.
Поиск специалистов.
Это не что иное, как потребности компании в персонале. Такие потребности могут указать на высокую текучесть, которая присутствует постоянно или возникла недавно (сразу вопрос ПОЧЕМУ?), на новые направления в работе компании, на ее проблемы с персоналом.
Маркетинговая стратегия предприятия.
То, как продвигает компания свой товар или свои услуги, тоже дает богатую пищу для размышлений.
Раскрытие информации.
Это та часть официальной информации о компании, которую юридическое лицо обязано раскрывать в соответствии с законом. Много интересного порой узнаешь при изучении таких материалов.
<< | >>
Источник: И.Ю. Нежданов. Аналитическая разведка для бизнеса. 2008

Еще по теме Сбор и анализ информации из открытых источников:

  1. Сбор и анализ закрытой информаци
  2. Сбор информации из закрытых источников
  3. Сбор и анализ регистрационной информации
  4. Источники открытой информации
  5. Сбор информации
  6. Сбор информации о конкурентах
  7. Сбор информации
  8. Сбор информации. Методы маркетинговых исследований
  9. Сбор информации под прикрытием
  10. 1.9.7. Сбор и анализ копий протоколов и жалоб
  11. 4.3.2 Сбор и анализ исходных данных для сегментирования промышленных потребителей
  12. 8.2.3. Сбор и обработка информации при помощи показателей и систем показателей
  13. III - Сбор и анализ дополнительных данных для уточнения поставленной задачи и ее точная формулировка