Что это

DuckDuckGo - это довольно известная поисковая система с открытым исходным кодом. Серверы находятся в США. Кроме собственного робота, поисковик использует результаты других источников: Yahoo, Bing, «Википедии».

Чем лучше

DuckDuckGo позиционирует себя как поиск, обеспечивающий максимальную приватность и конфиденциальность. Система не собирает никаких данных о пользователе, не хранит логи (нет истории поиска), использование файлов cookie максимально ограничено.

DuckDuckGo не собирает личную информацию пользователей и не делится ею. Это наша политика конфиденциальности.

Гэбриел Вайнберг (Gabriel Weinberg), основатель DuckDuckGo

Зачем это вам

Все крупные поисковые системы стараются персонализировать поисковую выдачу на основе данных о человеке перед монитором. Этот феномен получил название «пузырь фильтров»: пользователь видит только те результаты, которые согласуются с его предпочтениями или которые система сочтёт таковыми.

Формирует объективную картину, не зависящую от вашего прошлого поведения в Сети, и избавляет от тематической рекламы Google и «Яндекса», основанной на ваших запросах. При помощи DuckDuckGo легко искать информацию на иностранных языках, тогда как Google и «Яндекс» по умолчанию отдают предпочтение русскоязычным сайтам, даже если запрос введён на другом языке.


Что это

not Evil - система, осуществляющая поиск по анонимной сети Tor. Для использования нужно зайти в эту сеть, например запустив специализированный .

not Evil не единственный поисковик в своём роде. Есть LOOK (поиск по умолчанию в Tor-браузере, доступен из обычного интернета) или TORCH (один из самых старых поисковиков в Tor-сети) и другие. Мы остановились на not Evil из-за недвусмысленного намёка на Google (достаточно посмотреть на стартовую страницу).

Чем лучше

Ищет там, куда Google, «Яндексу» и другим поисковикам вход закрыт в принципе.

Зачем это вам

В сети Tor много ресурсов, которые невозможно встретить в законопослушном интернете. И их число будет расти по мере того, как ужесточается контроль властей над содержанием Сети. Tor - это своеобразная сеть внутри Сети со своими социалками, торрент-трекерами, СМИ, торговыми площадками, блогами, библиотеками и так далее.

3. YaCy

Что это

YaCy - децентрализованная поисковая система, работающая по принципу сетей P2P. Каждый компьютер, на котором установлен основной программный модуль, сканирует интернет самостоятельно, то есть является аналогом поискового робота. Полученные результаты собираются в общую базу, которую используют все участники YaCy.

Чем лучше

Здесь сложно говорить, лучше это или хуже, так как YaCy - это совершенно иной подход к организации поиска. Отсутствие единого сервера и компании-владельца делает результаты полностью независимыми от чьих-то предпочтений. Автономность каждого узла исключает цензуру. YaCy способен вести поиск в глубоком вебе и неиндексируемых сетях общего пользования.

Зачем это вам

Если вы сторонник открытого ПО и свободного интернета, не подверженного влиянию государственных органов и крупных корпораций, то YaCy - это ваш выбор. Также с его помощью можно организовать поиск внутри корпоративной или другой автономной сети. И пусть пока в быту YaCy не слишком полезен, он является достойной альтернативой Google с точки зрения процесса поиска.

4. Pipl

Что это

Pipl - система, предназначенная для поиска информации о конкретном человеке.

Чем лучше

Авторы Pipl утверждают, что их специализированные алгоритмы ищут эффективнее, чем «обычные» поисковики. В частности, приоритетными являются профили социальных сетей, комментарии, списки участников и различные базы данных, где публикуются сведения о людях, например базы судебных решений. Лидерство Pipl в этой области подтверждено оценками Lifehacker.com, TechCrunch и других изданий.

Зачем это вам

Если вам нужно найти информацию о человеке, проживающем в США, то Pipl будет намного эффективнее Google. Базы данных российских судов, видимо, недоступны для поисковика. Поэтому с гражданами России он справляется не так хорошо.

Что это

FindSounds - ещё один специализированный поисковик. Ищет в открытых источниках различные звуки: дом, природа, машины, люди и так далее. Сервис не поддерживает запросы на русском языке, но есть внушительный список русскоязычных тегов, по которым можно выполнять поиск.

Чем лучше

В выдаче только звуки и ничего лишнего. В настройках можно выставить желаемый формат и качество звучания. Все найденные звуки доступны для скачивания. Имеется поиск по образцу.

Зачем это вам

Если вам нужно быстро найти звук мушкетного выстрела, удары дятла-сосуна или крик Гомера Симпсона, то этот сервис для вас. И это мы выбрали только из доступных русскоязычных запросов. На английском языке спектр ещё шире.

Если серьёзно, специализированный сервис предполагает специализированную аудиторию. Но вдруг и вам пригодится?

Что это

Wolfram|Alpha - вычислительно-поисковая система. Вместо ссылок на статьи, содержащие ключевые слова, она выдаёт готовый ответ на запрос пользователя. Например, если ввести в форму поиска «сравнить население Нью-Йорка и Сан-Франциско» на английском, то Wolfram|Alpha сразу выведет на экран таблицы и графики со сравнением.

Чем лучше

Этот сервис лучше других подходит для поиска фактов и вычисления данных. Wolfram|Alpha накапливает и систематизирует доступные в Сети знания из различных областей, включая науку, культуру и развлечения. Если в этой базе находится готовый ответ на поисковый запрос, система показывает его, если нет - вычисляет и выводит результат. При этом пользователь видит только и ничего лишнего.

Зачем это вам

Если вы, например, студент, аналитик, журналист или научный сотрудник, то можете использовать Wolfram|Alpha для поиска и вычисления данных, связанных с вашей деятельностью. Сервис понимает не все запросы, но постоянно развивается и становится умнее.

Что это

Метапоисковик Dogpile выводит комбинированный список результатов из поисковых выдач Google, Yahoo и других популярных систем.

Чем лучше

Во-первых, Dogpile отображает меньше рекламы. Во-вторых, сервис использует особый алгоритм, чтобы находить и показывать лучшие результаты из разных поисковиков. Как утверждают разработчики Dogpile, их системы формирует самую полную выдачу во всём интернете.

Зачем это вам

Если вы не можете найти информацию в Google или другом стандартном поисковике, поищите её сразу в нескольких поисковиках с помощью Dogpile.

Что это

BoardReader - система для текстового поиска по форумам, сервисам вопросов и ответов и другим сообществам.

Чем лучше

Сервис позволяет сузить поле поиска до социальных площадок. Благодаря специальным фильтрам вы можете быстро находить посты и комментарии, которые соответствуют вашим критериям: языку, дате публикации и названию сайта.

Зачем это вам

BoardReader может пригодиться пиарщикам и другим специалистам в области медиа, которых интересует мнение массовой по тем или иным вопросам.

В заключение

Жизнь альтернативных поисковиков часто бывает скоротечной. О долгосрочных перспективах подобных проектов Лайфхакер спросил бывшего генерального директора украинского филиала компании «Яндекс» Сергея Петренко .


Сергей Петренко

Бывший генеральный директор «Яндекс.Украины».

Что касается судьбы альтернативных поисковиков, то она проста: быть очень нишевыми проектами с небольшой аудиторией, следовательно без ясных коммерческих перспектив или, наоборот, с полной ясностью их отсутствия.

Если посмотреть на примеры в статье, то видно, что такие поисковики либо специализируются в узкой, но востребованной нише, которая, возможно только пока, не выросла настолько, чтобы оказаться заметной на радарах Google или «Яндекса», либо тестируют оригинальную гипотезу в ранжировании, которая пока не применима в обычном поиске.

Например, если поиск по Tor вдруг окажется востребованным, то есть результаты оттуда понадобятся хотя бы проценту аудитории Google, то, конечно, обычные поисковики начнут решать проблему, как их найти и показать пользователю. Если поведение аудитории покажет, что заметной доле пользователей в заметном количестве запросов более релевантными кажутся результаты, данные без учёта факторов, зависящих от пользователя, то «Яндекс» или Google начнут давать такие результаты.

«Быть лучше» в контексте этой статьи не означает «быть лучше во всём». Да, во многих аспектах нашим героям далеко до и «Яндекса» (даже до Bing далековато). Но зато каждый из этих сервисов даёт пользователю нечто такое, чего не могут предложить гиганты поисковой индустрии. Наверняка вы тоже знаете подобные проекты. Поделитесь с нами - обсудим.

Поисковая система (или «поисковик») – это специальная компьютерная система, которая разработана и предназначена для поиска необходимой информации, соответственно поисковым запросам пользователей.

Ключевой параметр работы поисковых систем – запрос. Именно в соответсвии с поисковыми запросами поисковики мира выдают пользователям нужную информацию посредством генерации поисковой выдачи.

Чтобы точно отвечать на как можно большее количество запросов пользователей, поисковые боты (например, ) выполняют 3 обязательных этапа.

  1. Сканируют страницы. Следят, какие новые страницы / сайты появляются, и как обновляются старые.
  2. Индексируют страницы. Распознают содержание страницы и добавляют их в свою огромную базу данных.
  3. Ранжируют страницы. В зависимости от запроса пользователя, поисковая система генерирует выдачу, произведя отбор лучших результатов из своей базы по определенному алгоритму.

Если вы создали сайт, и хотите, чтобы ваша аудитория вас нашла и выбрала среди конкурентов, вам нужно выполнить ряд правил . В разных поисковых системах они могут отличатся в деталях, но основные принципы работы похожие.

Как вывести сайт в ТОП Google?

Запустите бесплатный аудит сайта и узнайте, какие страницы вы закрыли от Google и какие технические ошибки отдаляют вас от ТОПа

Google

Согласно данным Statcounter за май 2019 года, Google занимает 92.04% рынка поисковых систем. Эти данные не включают социальные сети (Facebook, YouTube, Twitter и т.д.).

Google старается дать наилучший ответ на запрос пользователя. Именно с этой целью и происходит регулярная эволюция его алгоритмов. Но этот процесс завел Google к интересному результату.

Часто факторы связанные с авторитетом домена, трастом сайта, количеством имеют большее значение, чем ценность информации для пользователя. Как результат, сайты, которые лучше отвечают на запрос пользователя, но не обладают большим «авторитетом» в глазах поисковой системы, остаются вне внимания пользователя. Удивительно, но одна из самых инновационных компаний в мире делает свои алгоритмы консервативнее. Продвинутые пользователи (как читатели, так и авторы контента) замечают это и их всё больше раздражает монополия Google среди поисковых систем.

Кроме того, многие знают, что Google детально отслеживает каждый шаг пользователя. Кроме понимания, как улучшать свои продукты, это также дает возможность Google создавать лучшие условия для таргетинга в рекламной системе Google Ads. Кто-то из нас не обращает на это внимания. Но все больше растет количество пользователей, которые хотят использовать поисковые системы без рекламных объявлений, или же искать информацию по другим алгоритмам. К счастью, существует множество альтернатив для Google. Каждая из них имеет определенные преимущества и особые сферы применения.

Важно уточнить, что данная статья создана не для того, чтобы занизить значение гугла в глазах активных пользователей всей сети. Её цель, лишь показать большое количество инструментов и вариантов поиска информации, которые сейчас существуют. Google не был первопроходцем на рынке поисковых систем, но он (а именно Сергей Брин и Ларри Пейдж) создал самый совершенный для своего времени алгоритм ранжирования сайтов. И на протяжении всей истории развития рынка поисковых систем, он определял и определяет правила игры на этом рынке.

Bing

Bing является самой популярной поисковой системой после Google (Yahoo был выкуплен компанией Microsoft в 2009 году). Это единственная поисковая система Microsoft, которая была разработана специально для систем Windows.

У Bing есть отличные возможности поиска видео, которые даже лучше, чем у Google. Здесь больше параметров автозаполнения, при введении запросов пользователя. Он отслеживает больше взаимосвязей между отдельными веб-сайтами, и благодаря этому поиск в интернете похожих вариантов упрощается.

Yandex

Яндекс – одна из наиболее популярных поисковых систем в России. Обычно пользователи называют Яндекс российским аналогом Google, поскольку у него похожий интерфейс и дополнительные сервисы. Этот сервис известен хорошо продуманным логическим алгоритмом, который распределяет результаты с некоторыми дополнительными функциями. Сейчас, известно, что Яндекс лучше понимает смысл текста. Молодой сайт, который продвигается в СНГ, может достигнуть ТОПа в Яндексе значительно быстрее, чем в . Но только в том случае, если упор сделан на качество контента и удобство сайта, а не на ссылки.

DuckDuckGo

DuckDuckGo – еще один популярный вариант поиска, который предустановлен в некоторых популярных браузерах (например Firefox). Это один из лучших вариантов для тех, кто не хочет, чтобы их данные отслеживались. Обычно DuckDuckGo противопоставляется Google, который похож на «Большого брата» и следит за каждым шагом пользователя.

Boardreader

Boardreader понравится тем, кто интересуется необычными поисковыми системами. Он разработан как простая доска объявлений и ищет результаты исключительно на форумах по всему миру, где реальные люди делятся своим опытом по указанной теме.

Dogpile

Dogpile – настоящий комбайн для сбора данных, поскольку он сканирует результаты поиска трех популярных поисковых систем (Google, Yandex и Yahoo), и выбирает лучшие результаты из каждой. Простота интерфейса и отсутствие рекламных объявлений позволяет лучше сосредоточиться на поиске.

Creative Commons Search

Creative Commons Search или в сокращенном варианте CC Search – уникальная анонимная поисковая система. Она дает возможность получать авторские материалы с правами для повторного использования в личных целях. Если вы планируете создать персональную веб-страницу, CC Search станет отличным местом для сбора дизайнерских материалов.

Giphy

Giphy – идеальная поисковая система для тех, кто увлечен анимационными картинками в формате GIF. Она была специально разработана для поиска миниатюрных видеороликов. Здесь можно получить много положительных эмоций, при поиске смешных котят или веселых ситуаций с бесконечным повторением.

Quora

Quora больше похожа на информационный портал, чем на поисковую систему. Здесь можно общаться с людьми на разнообразные темы и получать ответы на важные вопросы от пользователей по всему миру. Более того, на сайте есть специальная категория тематических вопросов, которые задавались раньше. Русскоязычным аналогом такого сервиса является Thequestion . У них разный дизайн и структура, но суть одна – пользователь хочет получить лучший ответ на свой вопрос от реальных людей.

Vimeo

YouTube – это подразделение Google, наполненное множеством рекламных объявлений.

StartPage – еще один анонимный сервис для людей, которые помешаны на своей конфиденциальности и негативно воспринимают политику передачи секретных данных Google для коммерческого использования. Он не только позволит провести абсолютно безопасный поиск, но также скроет ваши данные, такие как IP и MAC-адреса. Это позволяет заходить на любые веб-сайты через специальный прокси-сервер и не оставлять следов присутствия пользователя на сайтах.

Ask.com

Ask.com – сервис, который объединяет все популярные поисковые системы и генерирует специальные тематические страницы, где пользователи могут добавлять в закладки наиболее интересные результаты поиска. Кроме того, здесь вы можете попросить людей о дополнительном совете.

SlideShare

SlideShare станет отличным источником для поиска полезных материалов: презентаций, инфографик, документов. У этого сайта есть неограниченная база презентаций, которая доступна для всех зарегистрированных пользователей (и она постоянно обновляется).

Здравствуйте, уважаемые читатели блога сайт. , то его немногочисленным пользователям было достаточно собственных закладок. Однако, как вы помните, происходил в геометрической прогрессии, и совсем скоро ориентироваться во всем ее многообразии стало сложнее.

Тогда появились каталоги (Яху, Дмоз и другие), в которых их авторы добавляли и сортировали по категориям различные сайты. Это сразу же облегчило жизнь тогдашним, еще не очень многочисленным пользователям глобальной сети. Многие из этих каталогов живы и до сих пор.

Но через некоторое время размеры их баз стали настолько большими, что разработчики сначала задумались о создании поиска внутри них, а потом уже и о создании автоматизированной системы индексации всего содержимого интернета, чтобы сделать его доступным всем желающим.

Основные поисковики русскоязычного сегмента интернета

Как вы понимаете, идея эта реализовалась с ошеломительным успехом, но, правда, все сложилось хорошо только для горстки избранных компаний, которым удалось не сгинуть на просторах интернета. Почти все поисковые системы, которые появились на первой волне, сейчас либо исчезли, либо прозябают, либо были куплены более удачными конкурентами.

Поисковая система представляет из себя очень сложный и, что немаловажно, очень ресурсоемкий механизм (имеются в виду не только материальные ресурсы, но и людские). За внешне простой , или ее аскетичным аналогом от Гугла, стоят тысячи сотрудников, сотни тысяч серверов и многие миллиарды вложений, которые необходимы для того, чтобы эта махина продолжала работать и оставалась конкурентоспособной.

Выйти на этот рынок сейчас и начать все с нуля — это скорее утопия, чем реальный бизнес проект. Например, одна из богатейших в мире корпораций Микрософт десятилетиями пыталась закрепиться на рынке поиска, и только сейчас их поисковик Бинг начинает потихоньку оправдывать их ожидания. А до этого была целая череда провалов и неудач.

Что уж говорить о том, чтобы выйти на этот рынок без особых финансовых влияний. К примеру, наша отечественная поисковая система Нигма имеет много чего полезного и инновационного в своем арсенале, но их посещаемость в тысячи раз уступает лидерам рынка России. Для примера взгляните на суточную аудиторию Яндекса:

В связи с этим можно считать, что список основных (лучших и самых удачливых) поисковиков рунета и всего интернета уже сформировался и вся интрига заключается только в том, кто кого в итоге сожрет, ну или каким образом распределится их процентная доля, если все они уцелеют и останутся на плаву.

Рынок поисковых систем России очень хорошо просматривается и тут, наверное, можно выделить двух или трех основных игроков и парочку второстепенных. Вообще, в рунете сложилась достаточно уникальная ситуация, которая повторилась, как я понимаю, только еще в двух странах в мире.

Я говорю о том, что поисковик Google, придя в Россию в 2004 году, не смог до сих пор захватить лидерства. На самом деле, они пытались примерно в этот период купить Яндекс, но что-то там не сложилось и сейчас «наша Раша» вместе с Чехией и Китаем являются теми местами, где всемогущий Гугл, если не потерпел поражение, то, во всяком случае, встретил серьезное сопротивление.

На самом деле, увидеть текущее положение дел среди лучших поисковиков рунета может любой желающий. Достаточно будет вставить этот Урл в адресную строку вашего браузера:

Http://www.liveinternet.ru/stat/ru/searches.html?period=month;total=yes

Дело в том, что большая часть использует на своих сайтах , а данный Урл позволяет увидеть статистику захода посетителей с различных поисковых систем на все сайты, которые принадлежат доменной зоне RU.

После ввода приведенного Урла вы увидите не очень приглядную и презентабельную, но зато хорошо отражающую суть дела картинку. Обратите внимание на первую пятерку поисковых систем, с которых сайты на русском языке получают трафик:

Да, конечно же, не все ресурсы с русскоязычным контентом размещаются в этой зоне. Есть еще и SU, и РФ, да и общих зонах типа COM или NET полно интернет проектов ориентированных на рунет, но все же, выборка получается довольно-таки репрезентативная.

Эту зависимость можно оформить и более красочно, как, например, сделал кто-то в сети для своей презентации:

Сути это не меняет. Есть пара лидеров и несколько сильно и очень сильно отстающих поисковых систем. Кстати, о многих из них я уже писал. Иногда бывает довольно занимательно окунуться в историю успеха или, наоборот, покопаться в причинах неудач когда-то перспективных поисковиков.

Итак, в порядке значимости для России и рунета в целом, перечислю их и дам им краткие характеристики:

    Поиск в Гугле стал для многих жителей планеты уже нарицательным — о том, вы можете прочитать по ссылке. Мне в этом поисковике нравился вариант «перевод результатов», когда ответы вы получали со всего мира, но на своем родном языке, однако сейчас он, к сожалению, не доступен (во всяком случае на google.ru).

    Так же в последнее время меня озадачивает и качество их выдачи (Search Engine Result Page). Лично я всегда сначала использую поисковую систему зеркала рунете (там есть , ну и привык я к ней) и только не найдя там вразумительного ответа обращаюсь к Гуглу.

    Обычно их выдача меня радовала, но последнее время только озадачивает — порой такой бред вылазит. Возможно, что их борьба за повышение дохода с контекстной рекламы и постоянная перетасовка выдачи с целью дискредитировать Seo продвижение могут привести к обратному результату. Во всяком случае в рунете конкурент у этого поисковика имеется, да еще какой.

    Думаю, что вряд ли кто-то специально будет заходить на Go.mail.ru для поиска в рунете. Поэтому трафик на развлекательных проектах с этой поисковой системы может быть существенно больше, чем десять процентов. Владельцам таких проектов стоит обратить внимание на эту систему.

Однако, кроме ярко выраженных лидеров на рынке поисковых систем русскоязычного сегмента интернета, существует еще несколько игроков, доля которых довольно низка, но тем не менее сам факт их существования заставляет сказать о них пару слов.

Поисковые системы рунета из второго эшелона


Поисковые системы масштаба всего интернета

По большому счету в масштабах всего интернета серьезный игрок только один — Гугл . Это безусловный лидер, однако некоторая конкуренция у него все же имеется.

Во-первых, это все тот же Бинг , который, например, на американском рынке имеет очень хорошие позиции, особенно, если учитывать, что его движок используется так же и на всех сервисах Яху (почти треть от всего рынка поиска США).

Ну, а во-вторых, в силу огромной доли, которую составляют пользователи из Китая в общем числе пользователей интернета, их главный поисковик под названием Baidu вклинивается в распределение мест на мировом олимпе. Он появился на свет в 2000 году и сейчас его доля составляет около 80% процентов от всей национальной аудитории Китая.

Трудно о Байду сказать еще что-то вразумительное, но на просторах интернета встречаются суждения, что места в его Топе занимают не только наиболее релевантные запросу сайты, но и те, кто за это заплатил (напрямую поисковику, а не Сео конторе). Конечно же, это относится в первую очередь к коммерческой выдаче.

В общем-то, глядя на статистику становится понятно, почему Google там легко идет на то, чтобы ухудшать свою выдачу в обмен на увеличение прибыли с контекстной рекламы. Фактически они не боятся оттока пользователей, ибо в большинстве случаев им уходить особо и некуда. Такая ситуация несколько печалит, но посмотрим, что будет дальше.

К слову сказать, чтобы еще больше усложнить жизнь оптимизаторам, а может быть, чтобы поддержать спокойствие пользователей этого поисковика, Google с недавних пор применяет шифрование при передаче запросов из браузера пользователей в поисковую строку. Скоро уже нельзя будет увидеть в статистике счетчиков посетителей, по каким запросам приходили к вам пользователи с Гугла.

Конечно же, кроме озвученных в этой публикации поисковых систем, существует еще не одна тысяча других — региональных, специализированных, экзотических и т.д. Пытаться их все перечислить и описать в рамках одной статьи будет не возможно, да и, наверное, не нужно. Давайте лучше скажу пару слов о том, как не легко создать поисковик и как не просто и не дешево его поддерживать в актуальном состоянии.

Подавляющее большинство систем работают по схожим принципам (читайте о том, и про ) и преследуют одну и ту же цель — дать пользователям ответ на их вопрос. Причем ответ этот должен быть релевантным (соответствующим вопросу), исчерпывающим и, что не маловажно, актуальным (первой свежести).

Решить эту задачу не так-то уж и просто, особенно учитывая, что поисковой системе нужно будет налету проанализировать содержимое миллиардов интернет страниц, отсеять лишние, а из оставшихся сформировать список (выдачу), где вначале будут идти наиболее подходящие под вопрос пользователя ответы.

Эта сверхсложная задача решается предварительным сбором информации с этих страниц с помощью различных индексирующих роботов . Они собирают ссылки с уже посещенных страниц и загружают с них информацию в базу поисковой системы. Бывают боты индексирующие текст (обычный и быстробот, который живет на новостных и часто обновляемых ресурсах, чтобы в выдаче всегда были представлены самые свежие данные).

Кроме этого бывают роботы индексаторы изображений (для последующего их вывода в ), фавиконок, зеркал сайтов (для их последующего сравнения и возможной склейки), боты проверяющие работоспособность интернет страниц, которые пользователи или же через инструменты для вебмастеров (тут можете почитать про , и ).

Сам процесс индексации и следующий за ним процесс обновления индексных баз довольно времязатратный. Хотя Гугл делает это значительно быстрее конкурентов, во всяком случае Яндекса, которому на это дело требует неделя-другая (читайте про ).

Обычно текстовое содержимое интернет страницы поисковик разбивает на отдельные слова, которые приводит к базовым основам, чтобы потом можно было давать правильные ответы на вопросы, заданные в разных морфологических формах. Весь лишний обвес в виде Html тегов, пробелов и т.п. вещей удаляется, а оставшиеся слова сортируются по алфавиту и рядом с ними указывается их позиция в данном документе.

Такая шняга называется обратным индексом и позволяет искать уже не по вебстраницам, а по структурированным данным, находящимся на серверах поисковой системы.

Число таких серверов у Яндекса (который ищет в основном только по русскоязычным сайтам и чуток по украинским и турецким) исчисляется десятками или даже сотнями тысяч, а у Google (который ищет на сотнях языков) — миллионами.

Многие сервера имеют копии, которые служат как для повышения сохранности документов, так и помогают увеличить скорость обработки запроса (за счет распределения нагрузки). Оцените расходы на поддержание всего этого хозяйства.

Запрос пользователя будет направляться балансировщиком нагрузки на тот серверный сегмент, который менее всего сейчас нагружен. Потом проводится анализ региона, откуда пользователь поисковой системы отправил свой запрос, и делается его морфологически разбор. Если аналогичный запрос недавно вводили в поисковой строке, то пользователю подсовываются данные из кеша, чтобы лишний раз не грузить сервера.

Если запрос еще не был закеширован, то его передают в область, где расположена индексная база поисковика. В ответ будет получен список всех интернет страниц, которые имеют хоть какое-то отношение к запросу. Учитываются не только прямые вхождения, но и другие морфологические формы, а так же , и т.п. вещи.

Их нужно отранжировать, и на этом этапе в дело вступает алгоритм (искусственный интеллект). Фактически запрос пользователя размножается за счет всех возможных вариантов его интерпретации и ищутся одновременно ответы на множество запросов (за счет использования операторов языка запросов, некоторые из которых доступны и обычным пользователям).

Как правило, в выдаче присутствует по одной странице от каждого сайта (иногда больше). сейчас очень сложны и учитывают множество факторов. К тому же, для их корректировки используются и , которые вручную оценивают реперные сайты, что позволяет скорректировать работу алгоритма в целом.

В общем, дело ясное, что дело темное. Говорить об этом можно долго, но и так понято, что удовлетворенность пользователей поисковой системой достигается, ох как не просто. И всегда найдутся те, кому что-то не нравится, как, например, нам с вами, уважаемые читатели.

Удачи вам! До скорых встреч на страницах блога сайт

Вам может быть интересно

Яндекс Пипл - как искать людей по социальным сетям Апометр - бесплатный сервис по отслеживанию изменений выдачи и апдейтов поисковых систем DuckDuckGo - поисковая система, которая не следит за тобой
Как проверить скорость Интернета (Спидтест, Интернетометр от Яндекса)
Виджеты Яндекса - как настроить и сделать главную страницу более информативной и удобной именно вам
Яндекс и Гугл картинки, а так же поиск по файлу изображения в Tineye (тинай) и Google Сравнение сайтов в SEObuilding.RU для бесплатного анализа потенциальных доноров при покупке ссылок Google Alerts - что это такое и как его использовать, примеры создания полезных оповещений
Мое дело - обзор онлайн бухгалтерии или электронный документооборот через интернет
Бесплатные файлообменники - как залить фото и получить ссылку на картинку

Как вы думаете, какой поисковик самый крупный в мире? Гугл конечно. Ну а кто идет следом за ним? Yandex, Bing, Baidu? Далее смотрим рейтинг поисковых систем в мире, по состоянию на 1 мая 2017 года.

Среди компьютеров.

  1. Google – Global — 79.79%
  2. Bing — 7.13%
  3. Baidu — 6.77%
  4. Yahoo – Global — 5.20%
  5. Ask – Global — 0.14%
  6. AOL – Global — 0.05%
  7. Excite – Global — 0.01%

Вот как это выглядит в виде диаграммы.

А вот как доли поисковиков менялись в течении года.


Среди мобильных.

  1. Google – Global — 96.10%
  2. Yahoo – Global — 1.65%
  3. Bing — 0.88%
  4. Baidu — 0.60%
  5. Ask – Global — 0.04%
  6. AOL – Global — 0.00%

А вот и диаграмма


А вот среди мобильников, в годовом выражении, почти ничего не поменялось. Хотя это и так понятно. Гугл тут абсолютный лидер.


На начало периода доля Гугл составляла 95,37%, на конец периода 96,1%. Теперь видно, для чего гугл так активно продвигает свою мобильную платформу. Поскольку она позволяет ему лидировать по количеству поисковых запросов в мобильном сегменте.

Однако, интересна статистика по отдельным поисковым сайтам в версии для компьютеров.

  • 1.Google — 23,82%
  • 2.Google India — 15,15%
  • 3.Bing — 7,13%
  • 4.Baidu — 6,77%
  • 5.Yahoo! Web Sites — 4,25%
  • 26.Google Russia — 0,71%
  • 82.Yandex (Russia) — 0,043%

10 место в мире — Google Russia — 1,46%

74 место в мире — Yandex (Russia) — 0,06%

Самые популярные русскоязычные поисковики.

Но то была статистика общая для всего мира. А вот в русскоязычном интернете, ситуация совсем другая. Ситуация другая, но тенденции те же. А именно, гугл и в этом сегменте интернета стал лидером. Правда пока отрыв совсем небольшой. Для сравнения, я приведу цифры годичной давности, то есть за май 2016, и сегодняшние цифры, за май 2017 года. Данные по информации Liveinternet

Май 2017 года.

  1. Google — 49.7%
  2. Yandex – 45.0%
  3. Mail.ru — 4.6%
  4. Rambler — 0.3%
  5. Bing – 0.2%
  1. Yandex – 50.0%
  2. Google – 43.0%
  3. Search.Mail.ru — 6.0%
  4. Rambler — 0.4%
  5. Bing — 0.4%

В этой статистике, одновременно учитывается и версия для компьютера, и для мобильных телефонов.

Заключение.

Поиск в интернете, это бизнес на десятки миллиардов долларов в годовом выражении. И конкуренция здесь очень жесткая. И хотя Google является общемировым лидером, но у него есть сильные как региональные конкуренты, так и обще мировые. Ярко выраженным региональным конкурентом является Yandex, который правда в этом месяце уступил свое лидерство.

Есть и другой региональный конкурент – китайский Baidu. Который за счет того, что является лидером в Китае, занимает высокие позиции и в мировом рейтинге.

Все мы привыкли, что за поиском информации следует обращаться к поисковой системе Google или в крайнем случае «Яндекс», если вы ищете что-то именно в российском интернет-пространстве. Всё-таки в июне 2015 года этот поисковик занимал первое место в Рунете по количеству переходов - 57,51 % против 34,76 % у Google.

А как обстоит дело в мире?

Google

Ясно, что монополии Google нет конца, это характерно и для СНГ, в частности, у украинского и казахстанского сегмента интернета. В США 64,5 % запросов выполняется через этот поисковик. Да и смартфоны на Android с соответствующим браузером ещё больше помогают распространению Google. Исключение составляют Россия (на первом месте Яндекс) и Китай (уверенно лидирует Baidu).

Bing

Альтернатива у Google хоть и существует, но не такая, как на постсоветском пространстве в лице Яндекса или Рамблера. Например, вторая по популярности система Bing, созданная в 2009 году компанией Microsoft, занимает всего лишь 16% поискового рынка. Однако у неё есть некоторые преимущества, например, она чаще предлагает автозаполнение, предлагает удобно оформленный список видеозаписей, которые быстрее загружаются. Усовершенствованный поиск по картинкам позволяет лучше понять пользовательские запросы и исключить дублированные изображения.

Также эта система с 2011 года владеет Yahoo - ещё одним из наиболее популярных поисковиков мира, но в основном за счёт сервиса электронной почты. Обе системы занимают примерно 33% доли западного интернета.

DuckDuckGo

Как известно, наиболее крупные поисковики вроде Google, Bing и Yahoo часто обвиняют в сборе пользовательских данных. Поэтому повышается интерес к системе DuckDuckGo (DDG ), которая их не сохраняет, не отслеживает ваше местоположение и не выдаёт результаты поиска в зависимости от предпочтений пользователя. То есть вы сохраняете анонимность. Справа вверху видна ключевая фраза системы: «We don"t track you ». Поисковик сделан на свободном коде, а самое любопытное то, что он является коммерческим партнёром Яндекса , о чём говорит ссылка внизу «In partnership with Yandex ».

Ask.com

3 % поисковых запросов приходится на поисковую систему Ask.com, которая раньше называлась Ask Jeeves . Особенность сайта в том, что он функционирует в формате «вопрос-ответ», причём ответы присылают пользователи. По качеству он значительно уступает более именитым поисковикам.

AOL

Система AOL Search Engine с 2005 года частично (5% ) встроена в Google, пик её популярности пришёлся на конец 90-х, после чего её перестали активно использовать. Собственной базы данных у системы нет, используются результаты поиска ODP и Inktomi .

Baidu

Говоря о зарубежных поисковых системах, нельзя не забывать о китайском веб-сервисе baidu.com, который за счёт наличия японской версии находится на втором месте по количеству обрабатываемых запросов - 18,03% доли глобального поиска, что больше, чем у Bing. У него есть собственная онлайн-энциклопедия, которая популярнее китайской Википедии, и антивирусная программа.

MyWebSearch.com

Если вы пользовались когда-нибудь браузером Internet Explorer, то наверняка замечали панель инструментов MyWebSearch, которая встраивается автоматически. Также она может появиться в результате установки бесплатных программ, что крайне нежелательно, потому что удалить её не так просто. Тем не менее, каждый месяц сайт посещают примерно 60 миллиионов человек (у Ask - 145 млн, у DDG - 13 млн).

Quora

Это система для обмена знаниями, где ответы на вопросы предлагает эрудированное сообщество. Рейтинг ответа каждого пользователя меняется в зависимости от оценок других посетителей. Напоминает социальную сеть, интегрирована с Google и Facebook.

Ixquick

Одна из немногих поисковых систем, сервер которой расположен не в США, а в Нидерландах. Первой удалила конфиденциальные данные пользователей, IP-адреса с 2009 года вообще не записываются, используются только куки - preferences. Однако он всё равно использует базы данных Bing, Yahoo и Ask. С русским языком дружит не ахти, поэтому лучше использовать английский

WayBackMachine

Последнее место нашего списка мы отдадим не совсем поисковику, а веб-архиву, по которому можно узнать, как выглядели интернет-страницы того или иного сайта раньше. Своеобразная интернет-машина времени . В строке поиска набирается не запрос из одного или нескольких слов, а адрес сайта. Архив сохраняет копии веб-страниц, видеозаписи, аудиофайлы, изображения и ПО. Часто это бывает важно для SEO-оптимизаторов, чтобы знать, как выглядели их сайты раньше.

Альтернатива у Google есть, но далеко не равная. Большинство других поисковых систем используют базы данных тех же Google, Bing, Yahoo. Особняком стоит китайская Baidu и российский Яндекс.



Эта статья также доступна на следующих языках: Тайский

  • Next

    Огромное Вам СПАСИБО за очень полезную информацию в статье. Очень понятно все изложено. Чувствуется, что проделана большая работа по анализу работы магазина eBay

    • Спасибо вам и другим постоянным читателям моего блога. Без вас у меня не было бы достаточной мотивации, чтобы посвящать много времени ведению этого сайта. У меня мозги так устроены: люблю копнуть вглубь, систематизировать разрозненные данные, пробовать то, что раньше до меня никто не делал, либо не смотрел под таким углом зрения. Жаль, что только нашим соотечественникам из-за кризиса в России отнюдь не до шоппинга на eBay. Покупают на Алиэкспрессе из Китая, так как там в разы дешевле товары (часто в ущерб качеству). Но онлайн-аукционы eBay, Amazon, ETSY легко дадут китайцам фору по ассортименту брендовых вещей, винтажных вещей, ручной работы и разных этнических товаров.

      • Next

        В ваших статьях ценно именно ваше личное отношение и анализ темы. Вы этот блог не бросайте, я сюда часто заглядываю. Нас таких много должно быть. Мне на эл. почту пришло недавно предложение о том, что научат торговать на Амазоне и eBay. И я вспомнила про ваши подробные статьи об этих торг. площ. Перечитала все заново и сделала вывод, что курсы- это лохотрон. Сама на eBay еще ничего не покупала. Я не из России , а из Казахстана (г. Алматы). Но нам тоже лишних трат пока не надо. Желаю вам удачи и берегите себя в азиатских краях.

  • Еще приятно, что попытки eBay по руссификации интерфейса для пользователей из России и стран СНГ, начали приносить плоды. Ведь подавляющая часть граждан стран бывшего СССР не сильна познаниями иностранных языков. Английский язык знают не более 5% населения. Среди молодежи — побольше. Поэтому хотя бы интерфейс на русском языке — это большая помощь для онлайн-шоппинга на этой торговой площадке. Ебей не пошел по пути китайского собрата Алиэкспресс, где совершается машинный (очень корявый и непонятный, местами вызывающий смех) перевод описания товаров. Надеюсь, что на более продвинутом этапе развития искусственного интеллекта станет реальностью качественный машинный перевод с любого языка на любой за считанные доли секунды. Пока имеем вот что (профиль одного из продавцов на ебей с русским интерфейсом, но англоязычным описанием):
    https://uploads.disquscdn.com/images/7a52c9a89108b922159a4fad35de0ab0bee0c8804b9731f56d8a1dc659655d60.png