Система поиска

Всемирная паутина растет и ширится. Информация в ней — как снежный ком. Ее становится все больше — с каждым днем, с каждым часом, с каждой секундой. Печальнее всего то, что процент ценных для конечного пользователя сведений при этом скорее уменьшается. Объемы информационного мусора — напротив, возрастают со скоростью лавины, и добывать плоды древа познания в джунглях глобальной Сети все сложнее. С другой стороны, человечество постоянно совершенствуется в укрощении накопленных знаний. Действительно, чтобы мы сейчас делали без Google, Яндекс и других поисковиков? Конечно, они несовершенны и далеко не всегда выдают нужные результаты.

Нужные — это зависит от личных запросов. У одного пользователя — одни, у другого — другие, а у поисковой машины, как бы ни старались разработчики подстраивать алгоритмы их работы под человека, — все-таки третьи.

Поэтому предлагаем для начала определиться, что будем искать. Затем станет ясно, где это лучше сделать, а уж потом — как именно.

ТАКИЕ РАЗНЫЕ ПОИСКОВИКИ

Разные поисковики — разные результаты. Интересно, а что имел в виду сам пользователь?

Сегодня заглавные странички yandex.ru и google.com вполне заслуженно могут считаться правой и левой руками любого пользователя — от школьника начальных классов до профессионального программиста. Но, во-первых, так было не всегда. А во-вторых, существует множество альтернативных методов поиска, зачастую гораздо более эффективных.

Знаменитый поисковик Google был запущен в глобальной Сети не так давно — в 1998 году, и возник он не на пустом месте. Недалекий предок существующих ныне систем назывался World Wide Web Wanderer, буквально — «странник по Всемирной паутине». В этом движке впервые был использован поисковый робот — программа, которая автоматически выполняла индексацию (или, проще говоря, учет) веб-страниц. Прежде опись сетевых ресурсов составлялась вручную. База сайтов, собранная при помощи первого робота, получила название Wandex. Да, представьте себе, Яндекс, родимый, тоже не с потолка упал!

Почему же поисковая система Wandex образца 1993 года не дожила до наших дней? С течением времени эта база становилась все менее пригодной для поиска, и постепенно утратила актуальность для пользователей. Поисковые роботы первого поколения были крайне медлительными и попросту не успевали за ростом всемирной Сети, а кроме того, своими обращениями банально мешали работе веб-серверов, раздувая входящий трафик. Проблемы с автоматическим сбором информации привели к появлению принципиально иной концепции поисковой системы. Так возник Aliweb.com первый глобальный каталог (или директория) ресурсов Всемирной паутины. Миссия наполнения его базы данных была возложена не на программу-робота, а на хозяев сайтов и веб-страниц.

Сегодня ресурсы в каталогах регистрируются, как правило, их владельцами или веб-мастерами (бесплатно или за деньги — зависит от специфики директории), а вот конкретная позиция определяется при участии поисковика. Современные поисковые машины используют собственные системы оценки качества содержимого веб-страницы или, как говорят профессионалы, контента. У Яндекса это индекс цитирования, у Google подобная система называется PageRank. Один из критериев — количество и «авторитетность» ссылок на данную страницу с других ресурсов — впервые был применен в Google, и теперь без него не обходится, пожалуй, ни один приличный поисковик.

Время шло, и на смену неповоротливым роботам-ищейкам пришли более шустрые. Мало помалу поисковые базы стали удовлетворять запросам пользователей, и сейчас удобство поиска в интернете по ключевым словам переоценить трудно. Каталог же будет полезен в том случае, если вы ищете наиболее популярные ресурсы определенной тематики. Как и в поиске по ключевым словам, здесь лидируют Яндекс ( yaca.yandex.ru) и Google ( directory.google.ru и англоязычный directory.google.com) — их каталоги наиболее полны, и действительно стоящие сайты обязательно в них найдутся. В таких каталогах ресурсы сгруппированы по темам: Бизнес, Компьютеры, Отдых, СМИ, Спорт, Общество, Интернет и т. д. Но будьте бдительны — по умолчанию сайты отсортированы согласно их рейтингу в данной поисковой системе. А «топовость» того или иного ресурса в хит-параде вышеупомянутого Яндекса вовсе не обязательно означает его фактическую полезность для конкретного пользователя. Например, заглянув в yaca.yandex.ru в раздел Hi-tech — Hardware — Драйверы, среди первых строк можно обнаружить ссылки на странички техподдержки крупных «железных» производителей Samsung или Epson, а популярный архив driver.ru будет лишь на пятом месте.

Амбициозное название Google означает астрономического масштаба число, которое записывается как единица и сто нулей. И символизирует оно не что иное, как огромное количество ссылок, удовлетворяющих вашему поисковому запросу. Мол, найдется все и даже сверх того. Но есть здесь и обратная сторона медали: просмотреть и первые 10 страниц результатов рискнут не многие — долго, нудно, утомительно. Спрашивается — нужна ли такая масштабность пользователю? Отвечаем: никак нет. Наиболееэффективными из всех каталогов и поисковиков являются узкоспециальные. Например, market.yandex.ru объединяет разношерстные прилавки интернет-магазинов рунета в один виртуальный рынок. Здесь, помимо собственно перечня торговых точек Сети, можно найти информацию о практически любом «несъедобном» товаре — будь то КПК, диван, пылесос или автомобильные шины. ЯндексМаркет помогает сориентироваться в ценах, а также предоставляет краткие характеристики товара. Единственное условие удачного поиска — желательно точно знать наименование модели. Другим удачным примером узкой специализации являются сервисы по поиску графических файлов images.google.ru и images.yandex.ru. Конечно, те же самые картинки, скорее всего, можно обнаружить и через обычный запрос в Яндексе, но сколько ненужных рулонов текста придется при этом пролистать...

В эпоху Web 2.0 одним из мощнейших инструментов поиска стали, как ни странно, социальные сети. Интересуют музыкальные новинки? Загляните на myspace.com. Ищете видеоклипы или забавные ролики? Смотрите на (или на youtube.ru, который начал работать в ноябре этого года). Потеряли первую любовь? Добро пожаловать на сайт vkontakte.ru. А ljplus.ru — поисковик по сетевым журналам и сообществам — поможет найти единомышленника в любом деле. По сути социальные сети — это те же каталоги, но с увеличенной долей интерактивности. Однако в самом принципе построения этих систем заложена более точная фокусировка на том или ином контенте, в чем можно легко убедиться на практике.

Как видим, за относительно недолгий промежуток времени глобальная Сеть накопила обширный арсенал для поиска буквально всего, что только может понадобиться человеку. Главное теперь — правильно им распорядиться.

СОВЕТЫ ПО ПОИСКУ

Чтобы эффективно пользоваться конкретной поисковой системой, нужно понимать, в чем заключается ее специфика. Несмотря на то, что принципы работы поисковиков похожи — в ответ на ваш запрос они выдают ссылки на страницы, где встречается данное слово, — у каждой машины есть свои особенности. Узнать о них можно из справочных материалов, которыми разработчики, как гроздьями бананов, «увешивают» свои творения. Но так уж повелось, что инструкции, руководства и прочие мануалы мало кто читает — скучно это все, да и зачем? Возможно, когда речь идет о простейшей технике вроде монитора или сканера, можно обойтись и без инструкции — и так понятно, куда какой провод втыкать и какую кнопку нажимать. Но в случае с поисковыми системами эта лень может выйти боком, точнее ненужными ссылками, которые не будут содержать важной информации.

Для того чтобы вам не пришлось вдумчиво вчитываться в мануалы по поиску, мы поговорили со специалистами двух самых известных в России поисковых систем — Google и Яндекс.

Google

«Поисковая философия» Google основана как раз на понимании того факта, что разветвленную систему помощи по поиску мало кто из пользователей просматривает. Поэтому поисковая система должна быть простой и интуитивно понятной. Ведь редко кто-то из нас, задавая поисковый запрос, задумывается дольше, чем на пару секунд о том, как его правильно сформулировать и какой результат хотелось бы получить. Обычно в поисковую строку забивается первое предложение или слово, которое взбрело в голову. Конечно, есть пользователи-программисты или просто люди с математическим мышлением, которые разбираются в сложном синтаксисе запросов и формулируют их на языке, «понятном» компьютерной системе. Но большинство из нас все же не обладает специальными знаниями, и именно под таких пользователей «заточен» поисковик.

Google — это глобальная поисковая система, в ней осуществляется поиск более чем на ста языках. Поэтому если требуется найти что-то специфическое — скажем, значение латинского термина из области медицины или цитату на латыни из произведения древнего классика, — то и это можно сделать без особых проблем. Но для русскоязычного пользователя важен в первую очередь поиск именно на родном языке — на русском. Чуть менее популярен поиск на английском, затем идут французский, немецкий и все остальные языки. Именно поэтому во время отображения результатов поиска наиболее релевантными будут именно те сайты, на которых не просто встречается искомое слово, но и которые созданы на русском языке. Похожая ситуация будет, если вы отправитесь в путешествие — в Италии при обращение к поисковику будут выдаваться результаты на итальянском языке, в Великобритании — на английском, причем конкретно на британском английском, который довольно сильно отличается от американского.

На первый взгляд, такая логика кажется не очень верной. Скажем, надо найти официальный глобальный сайт Nokia или Apple, но в ответ на запрос система будет выдавать русскоязычные «мусорные» сайты вроде интернет-магазинов, каталогов ссылок и т. п. Но на практике получается немного по-другому: система анализирует, на каком языке сформулирован запрос, и уже на основании этого анализа формирует список релевантных результатов. Поэтому вывод первый: помогайте системе понимать, на каком языке вы с ней говорите. Скажем, фразу «правила игры в преферанс» поисковик поймет и без подсказки, а вот запрос «Sony» или «bluetooth» он может идентифицировать неправильно. Поэтому если в поисковом запросе содержится название технологии, бренда и пр., запрос не должен состоять из одного слова. Лучше написать «Sony Global» или «история версий bluetooth», т. е. поставить своеобразную языковую метку, и тогда вам не придется вручную отсеивать ненужные результаты.

Поисковая система Google

Вывод второй: переключаться между Google.com и Google.ru для поиска англоязычной или русскоязычной информации не нужно. Нет, конечно, это можно сделать, если, скажем, вас интересуют только зарубежные сайты по той или иной тематике, или же требуется найти какие-то глобальные информационные источники. Но для большинства из нас это неактуально — зачем продираться сквозь дебри иностранного языка на сайте производителя, когда все те же технические характеристики телефона можно найти на локальной версии?

Вообще все поисковые запросы можно разделить на несколько видов. Есть навигационные запросы, когда пользователь точно знает, что ему нужно, поэтому результатом поиска должна стать ссылка на конкретный сайт. Есть запросы коммерческие, когда велика вероятность того, что вы хотите что-то купить. Все остальные запросы тематические: пользователь просто ищет информацию по тому или иному вопросу. Так вот, для основной массы запросов — информационных — лучше пользоваться именно русской версией поисковика. Для коммерческих — тем более, кроме тех случаев, когда планируется приобрести товар в зарубежном магазине или на интернет-аукционе. Навигационные запросы — штука более сложная. Тут все-таки надо более четко понимать, что нужно найти, и в соответствии с этим изменять форму запроса. Скажем, если вы ищете официальный сайт 3GSM World Congress, то можно обратиться к глобальной странице Google, если же вам интересны новости об этом мероприятии или публикации о новинках, представленных на Конгрессе, лучше пользоваться русской страницей Google. Хотя, скорее всего, на первой странице результатов поиска через локальную версию Google будет представлена и англоязычная информация, ведь задача поисковой системы — показать пользователю максимально все результаты, которые ему могут быть интересны.

Разобравшись с тем, где искать, самое время определить, как именно это делать. И тут совет простой: говорите с системой так, как если бы вы разговаривали о чем-то с другом или коллегой по работе. Речь в данном случае идет, понятное дело, не о фразах вроде «Эй, чувак, прикинь, надо найти клевую прогу-читалку для мобильной винды!». В данном случае мы имеем в виду использование слов для поискового запроса в нормальной разговорной форме. Совершенно нет необходимости вспоминать школьный курс русского языка вообще и правила морфологии в частности, пытаясь привести слова к «общему знаменателю» — одинаковому числу, роду, падежу. Особенно это касается сложных запросов, для формулировки которых используется не одно слово, а целая фраза или предложение. Лучше написать в поисковой строке «передача данных по электропроводке», нежели коверкать слова в неудобоваримое «передача данные электропроводка». Конечно, в некоторых случаях в зависимости от формы слова результаты поисковых запросов могут меняться, поскольку верхние строки будут отданы той первоначальной форме слова, которую вы употребили. Но фактически это означает только «перемену мест слагаемых», от чего, как известно, сумма не меняется. Зачем усложнять себе жизнь, пытаясь пролезть через дымоход, когда можно спокойно пройти через парадные двери?

в Google с использованием вопросной формы

Правда, формулируя поисковый запрос, не надо забывать о том, что использовать вопросную форму стоит с большой осторожностью в зависимости от того, что вы ищете. Скажем, если необходима информация справочно-энциклопедического характера, можно в поисковой строке просто написать «что такое usb» или «кто такой пушкин». В результатах такого поиска первая строчка будет содержать ссылку на определения этого термина в интернете. Во всех остальных случаях использование вопросной формы неэффективно, лучше переформулировать вопрос в короткое предложение: например, вместо запроса «как обновить прошивку телефона nokia n95» правильнее будет написать «обновление прошивки nokia n95». Еще вопросная форма хороша для поиска перевода слов с одного языка на другой, но для российского пользователя этот сервис Google пока не локализован.

Помимо слов-вопросов, следует с большой осторожностью употреблять слова-приманки вроде «скачать бесплатно» и других подобных. Многие пользователи поисковых систем ругаются, когда вместо нужного результата поисковик выдает им груду «мусора» и ненужных ссылок, — мол, что это за поисковик такой, что даже не умеет отфильтровать спамерские сайты? Но в большинстве случаев причиной таких нерелевантных результатов является некорректный запрос. В самом деле, что мы планируем увидеть в результатах, вводя в поисковой строке «скачать windows vista бесплатно»? Отсюда вывод (далеко не новый, надо сказать): бесплатный сыр бывает только в мышеловке. И запросы со словами-приманками очень часто могут заставить поисковик выдать не просто нерелевантные результаты, но и небезопасные в смысле вирусной активности.

Расширенный поиск в Google

Как и в других поисковых системах, в Google предусмотрена возможность расширенного поиска. Кстати, обратите внимание: на главной странице сайта ссылка на расширенный поиск, расположенная справа от поисковой строки, набрана очень мелким шрифтом. И это неслучайно — реально расширенным поиском пользуется очень малое количество людей, поскольку такой необходимости почти не возникает. Конечно, можно попробовать поискать и с более точными условиями, чем предлагает обычный поиск: например, если необходимо, чтобы в результатах поиска не содержалось конкретного слова, или, наоборот, поисковый запрос обрабатывался системой с точностью до буквы. Но такая ситуация довольно редка.

Поиск в Google по картинкам

Помимо обычного текстового поиска, Google в соответствии со своей концепцией универсального поиска предлагает пользователю и другие сервисы. Основной из них — поиск картинок. Здесь Google лидирует, так что если необходимы изображения любых размеров, лучше искать именно через эту поисковую систему. База картинок формируется довольно сложно (по словам представителя компании, на разработке алгоритма поиска была написана не одна кандидатская диссертация). Поисковые роботы, индексируя страницу, выделяют на ней картинку и сопровождающий ее текст. Затем текст оценивается на предмет того, с какой вероятностью он относится к картинке, после чего выделяются ключевые слова, по которым изображение можно будет найти. Если необходимо отыскать достаточно популярное изображение — скажем, пользователю интересно посмотреть на концепт-кары или узнать, как выглядел Лев Толстой, — можно использовать поиск на русском языке. Для поиска более редких изображений лучше поисковый запрос задавать на английском, поскольку база англоязычного интернета гораздо обширнее, и вероятность найти нужную картинку сильно увеличивается.

Также есть поиск по новостям, по блогам, по картам. Есть версия поиска для мобильного устройства, который в принципе работает так же, как и «большой» поиск, но с той лишь разницей, что в результатах поиска преимущественно отображаются сайты, оптимизированные под просмотр на небольшом экране.






Рекомендуемый контент




Copyright © 2010-2019 housea.ru. Контакты: info@housea.ru При использовании материалов веб-сайта Домашнее Радио, гиперссылка на источник обязательна.