Сколько хранится информация в интернете

Сколько хранится информация в интернете

Долго ли хранится в сети информация о человеке или сайте ?

Любой пользователь персонального компьютера, хоть раз зарегистрировавшийся на любом сайте, так или иначе задался вопросом: а долго ли хранится информация о человеке в сети? Достаточно ли просто удалить страничку, стереть личные данные и забыться? Такой вопрос становится особенно насущным для тех, кому, продвигаясь по карьерной лестнице, стала предъявлять требования корпоративная этика.

Для тех, кто уже немного стесняется бурного прошлого, у меня нехорошие вести. Тем, кто только начинает свою сетевую деятельность, посоветую прислушаться: не стоит делать того, о чём, возможно, пожалеете. По крайней мере, под настоящим именем.

Потому что информация о человеке в интернете хранится вечно.

Сейчас я вам объясню, каким путём можно пойти, чтобы попасть в прошлое и настоящее, где все ещё молоды, безрассудны и немного наивны.

Интернет обладает возможностью вернуть прошлые годы, и глобальная сеть представляет собой настоящую машину времени, которую можно запустить с помощью нехитрых сервисов, без специальных навыков владения командами и сложными операндами поисковых систем.

Любая информация о человеке или сайте с момента появления оных хранится на серверах поисковых систем. И не только в них. Да и одних только поисковиков по всей сети наберётся десятка два – немало, правда. Среди них есть старожилы, возраст которых превышает возраст некоторых современных активных пользователей сети.

Это значит, как только поисковой робот обнаружил (проиндексировал) ваше появление, вы уже навечно остались в сетевой памяти. Причём некоторые интернет-сервисы могут напомнить вам пошагово, что появлялось на вашей страничке, что изменялось, а что вами стёрто. Будь это информация о человеке или веб-ресурсе, не важно.

Хватит лирики, переходим к делу.

Самый большой сетевой справочник и помощник «следователя» – это, конечно, поисковые системы. Для России самыми популярными из них являются Яндекс и Google. Яндекс наиболее популярен на просторах бывшего СССР, Google – просто самый популярный в мире. Есть и другие. И живут они за счёт того, что собирают любую уникальную информацию, которую мы нарочито или не специально выкладываем в сеть. Всё, эта информация уже серверы поисковика не покинет. Хотите вы этого или нет.

По объёму индексирования (читай – по объёму хранящейся о нас информации) пальму первенства удерживает Google. C ней и будем работать.

«Но я не пользуюсь Google, я ищу в Яндексе!». Да неважно )) Вас, как в мультфильме про козлёнка, который умел считать, уже запомнили. Вот как эту информацию выудить…

Перед тем, как приступить к работе, вооружитесь специальным инструментом: браузер Tor. Он позволит вам анонимно гулять по сети и получать информацию со всех ресурсов, запрещённых в тех или иных странах.

Шаг первый. Операнды в поисковых системах.

Goggle помнит всё. Яндекс тоже помнит многое. Как и для браузера, в котором вы путешествуете по сети, так и для поисковика есть понятие кэша. Кэш (от англ. cache – тайник), та часть памяти, которая позволяет хранить данные, что, возможно, ещё понадобятся. В компьютере, в браузере, в Google. В полиции.

Как найти сайт, которого нет? Как посмотреть на него в том виде, каком он был месяц, год назад? Когда только появился?

Возможно, самая простая из задач.

Кэш Google доступен и вам. Вот что говорит об этом способе сам Google: про кэш Google. Откройте поисковик Google и наберите в строке адреса:

http://www.google.com/search?q=cache:адрес-интересующего-сайта

Адрес лучше указывать полным, с http://. Трюк сработает, если Google успел заметить этот сайт. Или автор специально не подготовился и не запретил кэшировать страницы поисковым роботам. Например, через файл robots.txt.

Другое дело, если сайт на плаву, но страницы сайта удалены. Кэш Google отлично выручит вас. Вот, что выдал Google по запросу на мой блог:

Это снимок главной страницы сайта – той, что я попросил Google. Google всегда покажет последнюю версию кэша, и если сайт рабочий, она, эта версия, будет датирована не самым давним числом.

Переход же по ссылкам кэша сайта вас огорчит – они уведут в никуда (если страницы нет, так что поиском в прошлом кэш умеет пользоваться лишь ограниченно); если вам же известна конкретная страница сайта, смело используйте её после указанного адреса https://www.google.com/search?q=cache: и кэш Google отобразит страницу, которой нет. Вам может повезти.

Шаг второй. Специальные ресурсы.

Познакомлю с сайтами, коими пользуюсь сам. Это инструменты куда серьёзнее. Нашего внимания достойны:

CachedPages.com

(она использует сразу несколько сервисов, в том числе и второй, мною указанный ниже).

Читайте также:  Урна для колумбария размеры

web.archive.org

Конкретно по трудностям, с которыми можно столкнуться.

  • Скорее всего, эти сайты в России заблокированы. Tor вам в помощь.
  • Скрипты социальных сетей (а копать чаще можно именно там), ведут теперь обычно в одно и то же место – на страницу регистрации. Она не имеет срока давности. Однако в некоторых случаях вам может повезти, если копнуть подальше.

Запустим Tor и заглянем, например, в прошлое одно из самых знаменитых сайтов знакомств mamba.ru. Заходим на web.archive.org и введём знакомый многим адрес:

нажимаем Enter, видим вот это:

Ресурс на буржуинском, однако всё интуитивно понятно. Стрелка 1 показывает, сколько сайт кэшировался раз в течение срока существования, а под цифрой 2 я указал дату появления этого сайта знакомств. Информация по сайту и появляющихся изменениях представлена в виде календаря. Окно интерактивно и вы можете не спеша “прогуляться” по старым страницам сайта, щёлкая по столбцам с годами или конкретным дням. Дальше сами Не зацикливайтесь только на указанном ресурсе, попробуйте и другие.

Эта информация будет полезна, скорее, тем, кто ищет авторов и участников конкретных ресурсов в сети. Если вас интересует информация о человеке , о котором вы уже что-то знаете, вам сюда.

Теперь информация о человеке .

Всё зависит от причин, по каким из них вы хотите его найти. Человек может быть вам только что представлен, вы знакомы с ним вживую и хотите узнать о нём больше. Тогда лучше социальных сетей и ресурсов государственных органов (штрафы, выигранные патенты, судебные решения) вам не найти. Однако, чтобы не тратить времени даром и не просто вбивать в строку поиска имя и фамилию, воспользуемся специальными операторами Google и Яндекс.

Напомню, что среди поисковых систем, наиболее обширной базой является Google. И операторы Google нам в помощь. Для начала откройте в браузере поисковую систему Google и вбейте имя жертвы, но в таком формате:

intext:иван сидоров

оператор intext заставит искать сочетание иван сидоров по всем сайтам, где встречается или встречалось это словосочетание. В поисковой выдаче сверху вниз пойдут самые ранжируемые сайты. Но…

Вся прелесть операторов Google заключается в том, что чем больше мы знаем о человеке, тем больше мы можем сузить район поиска человека. То есть операторами мы можем продолжить поиск, отсеивая или, наоборот, включая параметры поиска. Например, после команды intext:иван сидоров можно добавлять команду “-” (отсеять). Например, наш Иван Сидоров после поверхностной проверки точно не Дмитриевич. Значит, не выходя из страницы поисковой выдачи добавим оператор “-” с просьбой не учитывать Дмитриевичей:

Все результаты с ненужным человеком исчезнут. По мере отсева самых заядлых участников-однофамильцев интернет сообщества можно полностью исключить, минусуя (без пробела) их “характеристики”. Учтите, опять же, что множественные запросы Google встретит проверкой капчей, так что советую подготовить список исключений сразу.

Самый первый компьютер разменял восьмой десяток лет, но по сравнению даже с самым простым современным телефоном он не умел ничего. Он тратил на простые математические операции по несколько секунд и всю информацию получал с перфорированных лент, не имел собственной оперативной и встроенной памяти. Сегодня мы в мгновение ока обмениваемся сообщениями и даже мультимедийными файлами через крошечное устройство — смартфон, который не привязан ни к чему.

Мы даже не задумываемся, какой объем данных генерируем в течение дня, и где все эти данные хранятся. Благодаря интернету в 2017 году Google в день обрабатывает больше данных, чем было написано во всех литературных работах на всех языках до появления интернета, и это при том, что к паутине подключена только половина планеты.

Безусловно, стремительный рост данных подтолкнул к появлению сайтов и распространению интернета — ведь одно дело копить информацию, другое — иметь возможность ею делиться. Первый сайт появился в 1990 году и содержал исключительно текстовую информацию — описание технологии World Wide Web.

Первые годы количество сайтов в интернете росло в два раза за каждые три месяца. К июню 1993 года в мире существовало уже 130 сайтов. А к декабрю — 623. К началу 1996 года количество сайтов в интернете достигло 100 000. В 2014 году их стало больше миллиарда, а к нынешнему времени — 1,2 млрд. Это примерно в шесть раз меньше, чем людей на Земле, и в три раза меньше, чем интернет-пользователей (3,6 млрд). То есть, грубо говоря, на каждый сайт в интернете приходится 3 интернет-пользователя.

Если первое время интернет был местом для интеллектуалов и снобов, хакеров и пионеров технологий, которые потребляли и создавали контент, то сегодня интернет — это социальные сети, YouTube-видео, сайты для взрослых и другие не самые узкоспециализированные активности.

Читайте также:  Обязательно ли подписывать обходной лист при увольнении

Сайт internetlivestats.com рассказывает о том, что происходит в интернете в режиме реального времени — за последнюю секунду, день или год.

Но вернемся к трафику. По данным Google, в 2008 году компания обрабатывала 20 петабайт данных в день. Сегодня аналогичный результат достигается меньше чем за 8 минут. За последний год эта цифра достигла 636 эксабайтов! На это было потрачено 554 524 478 мегаватт-часов.

Для сравнения все сезоны сериала «Игра престолов» весят около 70 Гб в разрешении видео 1024х576 — столько трафика обрабатывается Google за пару секунд.

Количество поисковых запросов, обрабатываемых Google:

  • 1998 г. — 9800 в день, 3,2 млн в год;
  • 2007 г. — 1,2 млрд в день, 438 млрд в год;
  • 2016 г. — 3 млрд в день, 1,2 трлн в год.

Предполагается, что к 2020 году на планете будет 50 млрд подключенных устройств, из них 6,1 млрд — смартфоны. Население Земли достигнет 7,75 млрд (то есть в 6,5 раз меньше), и каждый житель будет генерировать 1,7 Мб информации в секунду. Примерно треть всех данных будет храниться в облаке. В 2013 общий объем данных в интернете составлял 4,3 зеттабайта, каждые два года он удваивается.

Предположительно, к 2020 году этот показатель возрастет до 44 зеттабайтов. Сложно сравнить это с чем-то осязаемым. Но попробуйте представить, что разместить их все можно будет, например, на 4,4 млрд 10-терабайтных накопителях.

Интернет-гиганты строят огромные дата-центры для хранения информации. Обычно данные об их расположении, оснащении и размерах хранятся в секрете. В лучшем случае, в интернете можно найти фотографии фасадов. Но Google три года назад приоткрыли завесу тайны над одним из своих дата-центров и объемами инвестиций в него.

Дата-центр Google, где находятся серверы с Youtube-роликами и где обрабатываются поисковые запросы, об объемах которых мы уже писали выше, занимает 10 000 квадратных метров. Но Google — огромная корпорация с миллиардными доходами, которая может себе позволить столько дата-центров и такого размера, как ей нужно.

На новый дата-центр в Орегоне площадью 15 240 кв. м компания потратила $600 млн в 2015 году. К 2020-му году, несмотря на удешевление технологий, скорее всего расходы будут еще выше. Apple строит дата-центр в Ирландии стоимостью $1 млрд и площадью 500 акров. От тепла, которое он будет вырабатывать, будут отапливаться близлежащие дома. В компании планируют покрыть этим дата-центром потребности по обеспечению своими сервисами европейских пользователей на ближайшие 10-15 лет.

Но для обычных пользователей, которые как раз и генерируют основной объем, эта информация едва ли важна. Кто задумывается о том, где конкретно YouTube хранит видео, а Instagram – фотографии, сколько это весит и во сколько обходится компаниям? Разработчики уже подумали об этом, чтобы пользователи комфортно занимались своими делами в их сервисах.

Другое дело бизнес – сами сервисы, торговые сети, интернет-магазины. Развитие технологий идет рука об руку с ростом объема данных, и чем дальше, тем больше их будет. И тут речь идет не только о картиночках, сообщениях и прочем UGC, но и о данных о поведении пользователей, Big Data.

Big Data — это нефть нашего времени, она позволяет делать многие вещи, среди которых — адаптация сервисов и даже городской инфраструктуры под потребности людей (об этом мы писали, например, тут), производить более точные измерения (например, фактического потока туристов в городе, о чем мы рассказывали тут), анализировать поведение пользователей и делать на основании этих данных более точные прогнозы. Во всех примерах выше речь идет не о заморских странах, а об украинских государственных проектах и стартапах, которые уже становятся более эффективными и в будущем оставят конкурентов далеко позади.

Несмотря на то, что Big Data — это уже реальность и в Украине, многие бизнесы до сих пор думают, что это дорого и для этого нужен некий суперкомпьютер. По факту есть две разные статьи расходов. Первая — это место под хранение данных. Оно нужно постоянно, но стоит сравнительно недорого. Вторая — анализ данных. Для этого нужны большие вычислительные мощности, которые как раз стоят дорого. Но при этом потребность в них нерегулярная — только на этапе анализа, а все остальное время ресурсы просто простаивают.

Современные технологии позволяют обрабатывать Big data в облаке, комбинируя публичные и частные облака — то есть используя гибридное облако. Частные облака подходят в том случае, когда доступ к ресурсу должен быть постоянным — например, когда речь идет о хранении данных. В таком случае есть смысл в том, чтобы строить свою инфраструктуру. Публичные — когда ресурсы требуются время от времени. В частности, их анализе и построении прогнозов. Их выгоднее «покупать» в публичном облаке, оплачивая только используемый ресурс.

Читайте также:  Задания по трудовому праву

Успех работы с облачными мощностями зависит не столь от производительности и мощности оборудования, на котором размещены данные, сколько в грамотно разработанной стратегии. Важно правильно поставить цель и определиться со стратегией работы в облаке — как на данном облаке будут работать аппликации, базы данных, какая сетевая и физическая инфраструктура сможет реализовать облачные нагрузки и работать без простоев, какими процессами будет управлять технический персонал провайдера, а какими-собственные сотрудники.

Гибридное облако является удобным решением для тех компаний, которые по какой-то причине не могут или не хотят отказаться от частного облака (например, по причинам безопасности), но в какой-то момент появляется необходимость выделить задачи с повышенной производительностью в публичное облако для быстрого наращивания мощностей. Такая модель облака помогает компаниям без предварительного опыта не только быстрее адаптироваться к облачной среде, но и подстраховаться на случай неожиданного роста больших данных. В среднем бизнес, максимально использующий возможности арендованного облака вне зависимости от его типа, может в течение 5 лет достичь снижение общих IT-расходов на 40%.

Информация в Сети действительно может храниться вечно. Пока что это – теория, которую предстоит подтвердить на практике, ведь Интернет существует немногим больше 20 лет, и пика своего развития он точно не достиг.

Если описывать Сеть простыми словами, то она держится на огромном количестве компьютеров, в том числе и пользовательских, и серверах. Информация содержится на последних. Серверы – это мощные компьютеры, которые установлены в центрах данных, или дата-центрах. Такие информационные узлы, которые расположены в разных странах, обеспечивают сохранность данных. Услуги по сбережению оплачивают владельцы ресурсов.

Нет сложностей в том, чтобы установить сервер у себя дома, но такие локальные точки будут уступать по надежности дата-центрам. Если вовремя, при малейшем проявлении ошибок в системе, сохранять информацию на внешних носителях и возвращать ее в память компьютера после переустановки системы, то долго хранить данные можно и дома. Но в таких условиях трудно соблюсти точность работы, поэтому персональные серверы уступают по надежности дата-центрам.

Там информация постоянно курсирует между серверами в разных уголках планеты, которые объединены благодаря современным «облачным» технологиям. Благодаря постоянному «облаку» – связи между дата-центрами, сейчас действительно можно говорить о вечном хранении информации, попавшей в Сеть.

Смотрите также:

Также вам может быть интересно

Топ 5 читаемых

Все права на материалы, опубликованные на данном ресурсе, принадлежат ООО «Издательский Дом УМХ». Какое-либо использование материалов без письменного разрешения ООО «Издательский Дом УМХ» запрещено. При правомерном использовании материалов с данного ресурса, прямая гиперссылка на www.aif.ua обязательна.

Материалы с пометками ОБРАТИТЕ ВНИМАНИЕ, НОВОСТИ КОМПАНИЙ, КОМПАНИИ, БУДЬТЕ ЗДОРОВЫ, ПОЛЕЗНЫЙ ВЫБОР, ЛЮДИ ДЕЛА, МНЕНИЯ, ВЫБОРЫ, ПРЕСС-РЕЛИЗ, СМОТРИМ ЛУЧШЕЕ публикуются на коммерческой основе.

Редакция не несет ответственности за достоверность информации, содержащейся в рекламных объявлениях. Редакция не предоставляет справочной информации.

Адрес редакции: 04080, Киев, ул.Кирилловская, 104 телефон: (044) 205-43-04

Правила комментирования

Эти несложные правила помогут Вам получать удовольствие от общения на нашем сайте!

Для того, чтобы посещение нашего сайта и впредь оставалось для Вас приятным, просим неукоснительно соблюдать правила для комментариев:

Сообщение не должно содержать более 2500 знаков (с пробелами)

Языком общения на сайте АиФ является русский язык. В обсуждении Вы можете использовать другие языки, только если уверены, что читатели смогут Вас правильно понять.

В комментариях запрещаются выражения, содержащие ненормативную лексику, унижающие человеческое достоинство, разжигающие межнациональную рознь.

Запрещаются спам, а также реклама любых товаров и услуг, иных ресурсов, СМИ или событий, не относящихся к контексту обсуждения статьи.

Не приветствуются сообщения, не относящиеся к содержанию статьи или к контексту обсуждения.

Давайте будем уважать друг друга и сайт, на который Вы и другие читатели приходят пообщаться и высказать свои мысли. Администрация сайта оставляет за собой право удалять комментарии или часть комментариев, если они не соответствуют данным требованиям.

Редакция оставляет за собой право публикации отдельных комментариев в бумажной версии издания или в виде отдельной статьи на сайте www.aif.ru.

Если у Вас есть вопрос или предложение, отправьте сообщение для администрации сайта.

Ссылка на основную публикацию
Сколько стоит замена счетчика газа в квартире
Как и любое техническое оборудование газовые счетчики имеют определенный срок эксплуатации. Он зависит от типа и марки прибора. Меры по...
С какого времени начинается день
Если 4:00 - четыре утра, а 12:00 половина дня; получаетcя: 4:00-20:00 день. 20:00-4:00 ночь. Этот ответ исходит из логики 12:00...
С какого года 5 лет в собственности
Если вы владеете имуществом дольше минимального срока, то вам не нужно платить налог с продажи, заполнять декларацию 3-НДФЛ и уведомлять...
Сколько стоит заверить согласие у нотариуса
Стоимость нотариальных действий складывается из нотариального тарифа (он установлен законом и един для всех нотариусов) и стоимости правовой и технической...
Adblock detector