Google, занимающий сегодня лидирующие позиции среди поисковых систем всего мира, стартовал как тема для диссертации студента Стенфордского университета Ларри Пейджа. Его научный руководитель посоветовал студенту выбрать тему, касающуюся математических свойств Инетернета. В качестве основной задачи для разработки Пейдж выбрал показатель ценности той или иной интернет-страницы исходя из количества и качества внешних и внутренних ссылок. Этот проект под названием «BackRub» вызвал интерес у друга Пейджа, Сергея Брина, стенфордского аспиранта, и уже вместе они стали заниматься данной темой. Вся эта история с диссертацией, происходившая в 1996 году, в конце концов, привела к созданию поисковой системы BackRub. Попытка Пейджа и Брина объять необъятное (то есть упорядочить безграничные объемы информации, хранящейся в интернете) быстро привела к тому, что университетский интернет-канал не выдержал огромного трафика, и друзьям пришлось искать для развития своих идей новые сервера. И 4 сентября 1998 года в штате Калифорния регистрируется компания Google – с тремя сотрудниками, стартовым капиталом в 100 тысяч долларов и офисом в гараже.
История развития
Само название Google - это несколько переиначенный математический термин гугол, огромное число, обозначающееся единицей со ста нулями, что символизирует безграничность Сети и информации, которую в ней можно найти. Под таким названием компания и начинает свою работу. Будучи еще нигде не зарегистрированной, Google Inc получает первое финансовое вливание в размере 100 тысяч долларов от Энди Бехтольштейма, одного из основателей Sun Microsystems, компани по производству программного обеспечения.
Поисковую систему Google заметили достаточно быстро - уже в конце 1998 года она попадает в топ-100 сайтов по версии журнала PC Magazine как поисковая система с "высокорелевантными результатами поиска". За первый год своего существования Google проиндексировал более 60 миллионов страниц - благодаря разработанному Педжем и Брином алгоритму PageRank поиск соответственно запросам был намного более точным, нежели у существующих поисковиков. Новшество PageRank заключалось в том, что оценивалось не только количество повторений слова-запроса, а и число обратных ссылок на конкретный адрес, что значительно повысило качество поиска.
В июне 1999 года Google берет в кредит 25 миллионов долларов, переезжает из гаража в настоящий офис и нанимает еще троих сотрудников. Штат компании быстро расширяется (сегодня в корпорации работает уже более 30 тысяч человек). Растет и количество пользователей сервиса – кроме релевантного поиска многих интернет-пользователей привлекает простой дизайн без излишеств и абсолютно понятный интерфейс. В 2000 году Google разрабатывает региональные версии поисковой системы для Германии, Франции, Италии, Швеции, Испании, Португалии, Нидерландов, Норвегии, Дании, Китая, Кореи и Японии на соответствующих языках. В этом же году Google получает сразу две своих первых премии – международную профессиональную интернет-премию Webby, которая присуждается по решению жюри, и карьерную премию People’s Voice, присуждаемую по результатам голосования среди интернет-пользователей. В конце года Google предоставляет своим пользователям осуществлять поиск в интернете, не заходя на саму страницу гугла, с помощью "панели инструментов Google" для браузера.
В следующем году Google становится все более многоязычным – поиск доступен уже на 72 языках. Таким образом, к концу 2001 года Google проиндексировал уже более 3 миллиардов интернет-страниц. Тогда же к поиску добавляются и первые дополнительные сервисы – Google.Новости, сразу объединивший около 4 тысяч новостных источников, и Google.Покупки, изначально известный как Froogle. Популярность Google не только как поисковой системы, но и как тренда вообще набирает обороты настолько, что в 2003 году Американское диалектологическое сообщество присуждает слову "Google" звание "слова года". Сам же Google в этом году организовывает конкурс для программистов с солидными денежными премиями – Code Jam. Кроме того, запускается новый сервис, позволяющий производить поиск по фрагментам литературных произведений (Google.Книги).
К 2004 году Google проиндексировал уже 8 миллиардов веб-элементов – не только собственно веб-страниц, но и изображений. В 2005 году разработчики Google запускают сервис Карты - со спутником и возможностью построения маршрутов, и тогда же – Google.Earth, предоставляющий возможность просматривать не только картографические материалы, но и реалистичные снимки со спутника. Кроме того, начинает свою работу и Google.Talk – достаточно простой мессенджер, который, если бы не Skype, вполне смог бы набрать серьезную популярность. Под конец 2005 года Google запускает еще два сервиса – Google.Аналитик, позволяющий анализировать посещаемость интернет-ресурсов и эффективность рекламных и маркетинговых кампаний, и мобильную версию почтового сервиса Gmail. С 2006 года Google начинает искать еще и по такой категории запросов как патенты – в рамках разработки данного приложения было проиндексировано более 7 миллионов патентов начиная с XVIII века. А со следующего года Google открывает свободную регистрацию в почте Gmail – до этого создать свой почтовый адрес можно было только по приглашению уже зарегистрированного пользователя.
В мае 2007 года Google представляет универсальную технологию поиска, которая позволяет отображать на странице поисковых результатов одновременно и веб-ресурсы, и изображения, и видео, а также соответствующие новости и книги. Еще один сервис Google, получивший достаточно широкое распространение и быстро завоевавший популярность многих интернет-пользователей – браузер Chrom – был запущен в сентябре 2008 года, причем, уже с первого сентября по Сети начали "ходить" комиксы, посвященные данному браузеру. В 2010 году стартует первая телевизионная рекламная кампания Google. Так как первый ролик вышел в феврале, в преддверии дня Святого Валентина, то посвящен он был романтической истории, рассказанной с помощью поисковых запросов. В дальнейшем рекламисты развили эту идею, используя поисковые запросы для повествования о различных жизненных ситуациях.
Ежегодно Google продолжает обновлять свои сервисы и расширять количество дополнительных служб. И в январе 2012 года решает максимально объединить всю информацию – создана "Твоя Вселенная в поиске Google", которая в ответ на поисковые запросы выдает информацию любого вида и типа, а также производит поиск по социальным сетям и профайлам. Тогда же Google проходит сертификацию по охране труда и окружающей среды ISO 14001 и OHSAS 18001 и становится первой интернет-компанией, соответствующей мировым стандартам в этой сфере.
Принцип работы
Индексацию сайтов для Google производит поисковый робот Googlebot, а также несколько дополнительных роботов, которые сканируют сайты для мобильных приложений (Googlebot-Mobile), для индексации изображений (Googlebot-Image), для сканирования на содержание контекстной рекламы (Mediapartners-Google) и для аппаратно-программного комплекса Search Appliance (Google Search Appliance (Google) gsa-crawler).
При отборе сайтов для показа на странице результатов поисковая система Google использует алгоритм, учитывающий несколько факторов: долговременность ресурса, количество и качество обновлений контента на сайте, результаты анализа PageRank, данные о домене, хостер, на котором размещен сайт. Что касается долговременности ресурса, то данный фактор можно назвать наиболее важным при обработке запросов в Google – активное существование ресурса в течение длительного времени практически дает "зеленый свет" для попадания на страницу результатов. Для распознавания давно действующих сайтов Google использует фильтр Sandbox, известный как Песочница - своеобразный "перевалочный пункт", куда попадают новые сайты, а также сайты с часто меняющимися владельцами. Кроме того, Google работает по схеме TrustRank, сравнивая эталонные сайты (те, которые созданы вручную или частично вручную) с остальными по качеству ссылок. Таким образом отсеиваются новые и так называемые "плохие" ресурсы. Таким образом, для того, чтобы сайт гарантировано попал в поиск Google, он должен существовать долго и обладать контентом, который цитируется на максимально возможном количестве других ресурсов (при этом учитывается и дата цитирования).
Если говорить об обновлениях, то Google достаточно жестко отслеживает содержание сайтов – частоту и объемы обновлений, отсутствие уникального контента при наличии внешних ссылок, перемены в использовании ключевых слов, изменения количества страниц и т. д. Главным образом, такой контроль за наполнением ресурсов направлен на борьбу со спамом – для того, чтобы портал, позиционирующий себя в качестве, например, новостного ресурса не направлял пользователей на рекламные страницы. Кроме того, для того, чтобы сайт адекватно индексировался в Google, на него не должно быть чрезмерно много ссылок с менее популярных сайтов либо с "плохих" (по мнению Google) ресурсов. Также при формировании списка результатов Google анализирует и данные о домене и хостинге – информация о бывших владельцах домена и сроке его приобретения нынешним владельцем может играет важную роль, так как купленные на короткий срок домены Google доверия не внушают. Также и хостинг-компании, которые без ограничений размещают у себя порталы, например, с запрещенным контентом не проходят "проверку" Google – даже если данный конкретный сайт оперирует вполне законной информацией.
Кроме того, Google предоставляет некоторую "фору" сайтам при первой индексации – например, если на ресурс ведут несколько ссылок с уже хорошо зарекомендовавших себя сайтов. Такому ресурсу временно присваивается высокий показатель PageRank и, соответственно, обеспечивается хорошее место на странице результатов поиска.
Основные сервисы и инструменты Google
Система Google предоставляет своим пользователям доступ к десяткам сервисам, как общим, так и персонифицированным, а также предлагает для пользования достаточно много инструментов. Среди наиболее используемых сервисов, такие как статистика поиска, сервис контекстной рекламы, платформа для ведения блогов, закладки, документы, переводчики и словари, почта, карты и снимки со спутника, мобильные приложения, новости, история поисковых запросов и корреляция заданных слов с наиболее частыми поисковыми запросами на ту же тему. Кроме того, в системе Google существуют и такие относительно мало используемые сервисы как собственная социальная сеть Google+, закрытый ныне за ненадобностью Google Wave – сайт, объединяющий в себе почту, мессенджер и соцсеть, личная медицинская карта, интернет-телефония, возможность привязки принтера к интернет-сети для удаленного доступа, сервис для трехмерного моделирования, а также закрытая вики-энциклопедия и еще множество других. Полный и постоянно обновляющийся список сервисов Google можно найти на главной странице сайта.
Кроме того Google предлагает пользователям использовать различные инструменты. Наиболее известный из них – это интернет-браузер Chrom, который осуществляет сбор и поиск информации исключительно с помощью роботов Google. Также Google представляет следующий инструментарий:
- Google Deskbar – инструмент для осуществления поиска прямо с рабочего стола компьютера
- Google Desktop – инструмент для поиска различных данных на компьютере (не только по "файлам и папкам" как стандартный "Поиск", но и по содержанию электронной почты, истории поисковых запросов и переходов в браузере, а также по сообщениям в "гугловском" мессенджере)
- Google Code – сайт для разработчиков открытого программного обеспечения со списком исходных кодов и публичных API
- Project Hosting – бесплатный хостинг
- Google Earth – реалистичные трехмерные изображения Земли, сделанные со спутника
- Google Pack – совокупность нескольких продуктов, так называемый "установочный пакет", состоящий из нескольких сервисов и инструментов Google
- Picasa – сервис для работы с фотографиями
- Hello – приложение к Picasa для распространения фотографий среди друзей без использования электронной почты
- Google Web Accelerator – специальная программа, которая увеличивает скорость работы браузеров за счет того, что заранее скачивает информацию, которая возможно будет интересна данному пользователю
- Google Toolbar – поисковая панель Google для различных браузеров
Кроме того, сегодня Google помимо стандартного веб-поиска осуществляет поиск информации по литературным произведениям и научными публикациям, блогам, изображениям и видеофайлам, патентам, коммерческим предложениям, адресам и телефонам, а также открытым исходным кодам. Также в систему Google интегрирован калькулятор и конвертер валют.
Google и первоапрельские розыгрыши
С 2000 года Google активно "празднует" первое апреля – запускает различную заведомо ложную информацию о своих сервисах и обновлениях. Так, первой шуткой "от Google" стало заявление о новой функции Google, находящейся в стадии разработки – MentalPlex – позволяющей производить поиск, считывая мысли пользователя (он в этот момент должен максимально реалистично представить себе результаты поиска). В качестве следующей шутки в 2001 году Google объявил, что будет использовать голубей для сбора информации – так как в то время экологическая ориентированность компании, козы и ульи на лужайке еще были в далеком будущем, первоапрельской "новости" не поверили. В отличие, кстати, от первоапрельской шутки 2004 года, когда Google объявил о подготовке к открытию исследовательского центра на Луне Googlunaplex. В дальнейшем Google предлагал своим пользователям пить специальный напиток для повышения умственных способностей, помощь в выборе партнера для личной жизни, бумажные архивы Google и прочие интересные вещи. Последний на момент 2012 года розыгрыш Google – это "разработка" многозадачного браузера Chrom, в котором можно работать одновременно двумя руками, подключив к компьютеру несколько мышей, к каждой из которых будет привязан отдельный курсор.