Средствам всемирной паутины. Работа с поисковыми серверами. Способы активного отображения информации во Всемирной паутине

Всемирная паутина (англ. World Wide Web) - глобальное информационное пространство, основанное на физической инфраструктуре Интернета и протоколе передачи данных HTTP. Всемирная паутина вызвала настоящую революцию в информационных технологиях и бум в развитии Интернета. Часто, говоря об Интернете, имеют в виду именно Всемирную паутину. Для обозначения Всемирной паутины также используют слово веб (англ. web) и аббревиатуру «WWW».

Всемирную паутину образуют миллионы веб-серверов сети Интернет, расположенные по всему миру. Веб-сервер - программа, запускаемая на подключённом к сети компьютере. В простейшем виде такая программа получает по сети HTTP-запрос на определённый ресурс, находит соответствующий файл на локальном жёстком диске и отправляет его по сети запросившему компьютеру. Более сложные веб-серверы способны динамически формировать ресурсы в ответ на HTTP-запрос.

Для просмотра информации, полученной от веб-сервера, на клиентском компьютере применяется специальная программа-клиент - веб-бра́узер (web-browser) . Основная функция веб-браузера - отображение гипертекста .

Всемирная паутина неразрывно связана с понятиями гипертекста. Гипертекст (Hypertext) – это документ или система документов с перекрестными ссылками (гиперссылками ). По такому документу можно перемещаться не последовательно, а, активируя гиперссылки, переходить по ним к связанным со ссылками текстам или файлам.

Для создания, хранения и отображения гипертекста используется язык HTML (англ. HyperText Markup Language) , язык разметки гипертекста. Работа по разметке гипертекста называется вёрсткой, специалисты по разметке называются веб-мастерами .

HTML-файл является самым распространённым ресурсом Всемирной паутины. HTML-файл доступный веб-серверу, называют «веб-страницей ». Набор связанных тематикой, дизайном или владельцем веб-страниц образует веб-сайт .

Информация в вебе может отображаться как пассивно (то есть пользователь может только считывать её), так и активно - тогда пользователь может добавлять информацию и редактировать её. К способам активного отображения информации во Всемирной паутине относятся:

Гостевые книги,

Wiki-проекты,

Системы управления контентом.

HTML-разметка

HTML (HyperText Markup Language) не является языком программирования, он является языком форматирования, т.е. придания внешнего вида web-странице, при ее присмотре в браузере. Для разметки документа используются теги . Теги заключаются в угловые скобки, и, за редким исключением, являются парными, т.е. существует открывающий и закрывающий тег. Например, чтобы отметить начало нового абзаца в документе ставится тег

(от paragraph ). Тогда в конце абзаца обязательно должен ставиться закрывающий тег

.


При расстановке тегов соблюдается правило: закрываются теги в порядке обратном их появлению. Например, если слово в тексте должно быть выделено жирностью (тег от bold ) и одновременно курсивом (тег от italic ), то это может быть сделано одним из следующих способов: слово , или слово.

Ниже приводится текст некоторого html-документа и результат его отображения в браузере:

Доброе время суток, уважаемый посетитель!

Надеюсь, вы попали как раз туда, куда хотели.

Здесь вы найдете стихи , песни и сценарии для организации любых праздников.

А теперь специальный подарок к 1 сентябряb>

Он к "пятерочкам" привык -

Русский пять и пение.

Мне всегда его дневник

Портит настроение.

Структура и принципы Всемирной паутины

Всемирная паутина вокруг Википедии

Всемирную паутину образуют миллионы веб-серверов сети Интернет , расположенных по всему миру. Веб-сервер является программой , запускаемой на подключённом к сети компьютере и использующей протокол HTTP для передачи данных. В простейшем виде такая программа получает по сети HTTP-запрос на определённый ресурс, находит соответствующий файл на локальном жёстком диске и отправляет его по сети запросившему компьютеру. Более сложные веб-серверы способны динамически распределять ресурсы в ответ на HTTP-запрос. Для идентификации ресурсов (зачастую файлов или их частей) во Всемирной паутине используются единообразные идентификаторы ресурсов URI (англ. Uniform Resource Identifier ). Для определения местонахождения ресурсов в сети используются единообразные локаторы ресурсов URL (англ. Uniform Resource Locator ). Такие URL-локаторы сочетают в себе технологию идентификации URI и систему доменных имён DNS (англ. Domain Name System ) - доменное имя (или непосредственно -адрес в числовой записи) входит в состав URL для обозначения компьютера (точнее - одного из его сетевых интерфейсов), который исполняет код нужного веб-сервера.

Для обзора информации, полученной от веб-сервера, на клиентском компьютере применяется специальная программа - веб-браузер . Основная функция веб-браузера - отображение гипертекста. Всемирная паутина неразрывно связана с понятиями гипертекста и гиперссы́лки . Большая часть информации в Вебе представляет собой именно гипертекст. Для облегчения создания, хранения и отображения гипертекста во Всемирной паутине традиционно используется язык HTML (англ. HyperText Markup Language ), язык разметки гипертекста. Работа по разметке гипертекста называется вёрсткой, ма́стера по разметке называют веб-мастером или вебмастером (без дефиса). После HTML-разметки получившийся гипертекст помещается в файл , такой HTML-файл является основным ресурсом Всемирной паутины. После того, как HTML-файл становится доступен веб-серверу, его начинают называть «веб-страницей». Набор веб-страниц образует веб-сайт . В гипертекст веб-страниц добавляются гиперссылки. Гиперссылки помогают пользователям Всемирной паутины легко перемещаться между ресурсами (файлами) вне зависимости от того, находятся ресурсы на локальном компьютере или на удалённом сервере. Гиперссылки веба основаны на технологии URL.

Технологии Всемирной паутины

Для улучшения визуального восприятия веба стала широко применяться технология CSS , которая позволяет задавать единые стили оформления для множества веб-страниц. Ещё одно нововведение, на которое стоит обратить внимание, - система обозначения ресурсов URN (англ. Uniform Resource Name ).

Популярная концепция развития Всемирной паутины - создание семантической паутины . Семантическая паутина - это надстройка над существующей Всемирной паутиной, которая призвана сделать размещённую в сети информацию более понятной для компьютеров. Семантическая паутина - это концепция сети, в которой каждый ресурс на человеческом языке был бы снабжён описанием, понятным компьютеру. Семантическая паутина открывает доступ к чётко структурированной информации для любых приложений, независимо от платформы и независимо от языков программирования . Программы смогут сами находить нужные ресурсы, обрабатывать информацию, классифицировать данные, выявлять логические связи, делать выводы и даже принимать решения на основе этих выводов. При широком распространении и грамотном внедрении семантическая паутина может вызвать революцию в Интернете. Для создания понятного компьютеру описания ресурса, в семантической паутине используется формат RDF (англ. Resource Description Framework ), который основан на синтаксисе XML и использует идентификаторы URI для обозначения ресурсов. Новинки в этой области - это RDFS (англ.) русск. (англ. RDF Schema ) и SPARQL (англ. Protocol And RDF Query Language ) (произносится как «спа́ркл»), новый язык запросов для быстрого доступа к данным RDF.

История Всемирной паутины

Изобретателями всемирной паутины считаются Тим Бернерс-Ли и в меньшей степени, Роберт Кайо . Тим Бернерс-Ли является автором технологий HTTP, URI/URL и HTML. В 1980 году он работал в Европейском совете по ядерным исследованиям (фр. Conseil Européen pour la Recherche Nucléaire, CERN ) консультантом по программному обеспечению. Именно там, в Женеве (Швейцария), он для собственных нужд написал программу «Энквайр» (англ. Enquire , можно вольно перевести как «Дознаватель»), которая использовала случайные ассоциации для хранения данных и заложила концептуальную основу для Всемирной паутины.

Первый в мире веб-сайт был размещён Бернерсом-Ли 6 августа 1991 года на первом веб-сервере доступном по адресу http://info.cern.ch/, (). Ресурс определял понятие Всемирной паутины , содержал инструкции по установке веб-сервера, использования браузера и т. п. Этот сайт также являлся первым в мире интернет-каталогом, потому что позже Тим Бернерс-Ли разместил и поддерживал там список ссылок на другие сайты.

На первой фотографии во Всемирной паутине была изображена пародийная филк -группа Les Horribles Cernettes . Тим Бернес-Ли попросил их отсканированные снимки у лидера группы после CERN Hardronic Festival.

И всё же теоретические основы веба были заложены гораздо раньше Бернерса-Ли. Ещё в 1945 году Ванна́вер Буш разработал концепцию Memex (англ.) русск. - вспомогательных механических средств «расширения человеческой памяти ». Memex - это устройство, в котором человек хранит все свои книги и записи (а в идеале - и все свои знания, поддающиеся формальному описанию) и которое выдаёт нужную информацию с достаточной скоростью и гибкостью. Оно является расширением и дополнением памяти человека. Бушем было также предсказано всеобъемлющее индексирование текстов и мультимедийных ресурсов с возможностью быстрого поиска необходимой информации. Следующим значительным шагом на пути ко Всемирной паутине было создание гипертекста (термин введён Тедом Нельсоном в 1965 году).

  • Семантическая паутина предполагает улучшение связности и релевантности информации во Всемирной паутине через введение новых форматов метаданных .
  • Социальная паутина полагается на работу по упорядочиванию имеющейся в Паутине информации, выполняемую самими пользователями Паутины. В рамках второго направления наработки, являющиеся частью семантической паутины, активно используются в качестве инструментов (RSS и другие форматы веб-каналов , OPML , микроформаты XHTML). Частично семантизированные участки Дерева категорий «Википедии» помогают пользователям осознанно перемещаться в информационном пространстве, однако, очень мягкие требования к подкатегориям не дают основания надеяться на расширение таких участков. В связи с этим интерес могут представлять попытки составления атласов Знания.

Существует также популярное понятие Web 2.0 , обобщающее сразу несколько направлений развития Всемирной паутины.

Способы активного отображения информации во Всемирной паутине

Информация в вебе может отображаться как пассивно (то есть пользователь может только считывать её), так и активно - тогда пользователь может добавлять информацию и редактировать её. К способам активного отображения информации во Всемирной паутине относятся:

Следует отметить, что это деление весьма условно. Так, скажем, блог или гостевую книгу можно рассматривать как частный случай форума, который, в свою очередь, является частным случаем системы управления контентом. Обычно разница проявляется в назначении, подходе и позиционировании того или иного продукта.

Отчасти информация с сайтов может также быть доступна через речь. В Индии уже началось тестирование системы, делающей текстовое содержимое страниц доступным даже для людей, не умеющих читать и писать.

World Wide Web иногда иронично называют Wild Wild Web (дикий, дикий Web) - по аналогии с названием одноименного фильма Wild Wild West (Дикий, дикий Запад) .

См. также

Примечания

Литература

  • Филдинг, Р.; Геттис, Дж.; Могул, Дж.; Фристик, Г.; Мазинтер, Л.; Лич, П.; Бернерс-Ли, Т. (Июнь 1999). «Hypertext Transfer Protocol - http://1.1 » (Information Sciences Institute).
  • Бернерс-Ли, Тим; Брэй, Тим; Конноли, Дэн; Коттон, Пол; Филдинг, Рой; Джекл, Марио; Лилли, Крис; Мендельсон, Ной; Оркард, Дэвид; Уолш, Норман; Уиллиамс, Стюарт (Декабрь 15, 2004). «Architecture of the World Wide Web, Volume One » (W3C).
  • Поло, Лучано World Wide Web Technology Architecture: A Conceptual Analysis . New Devices (2003). Архивировано из первоисточника 24 августа 2011. Проверено Июль 31 2005.

Ссылки

  • Официальный сайт Консорциума Всемирной паутины (World Wide Web Consortium (W3C)) (англ.)
  • Tim Berners-Lee, Mark Fischetti. Плетя паутину: истоки и будущее Всемирной паутины = Weaving the Web: The Original Design and Ultimate Destiny of the World Wide Web. - New York: HarperCollins Publishers (англ.) русск. . - 256 p. - ISBN 0-06-251587-X , ISBN 978-0-06-251587-2 (англ.)
Другие организации, занимающиеся развитием Всемирной паутины и Интернета в целом

Официальным годом рождения всемирной паутины считается 1989 год, когда всемирный гипертекстовый проект был предложен Тимом Бернерсом-Ли. Суть данного проекта заключалась в публикации гипертекстовых документов, связанных между собой гиперссылками, с целью облегченного поиска документов учеными CERN, где и работал на тот момент Тим. Им были разработаны идентификаторы URI, протокол HTTP и язык HTML- все то, без чего уже современный интернет и представить нельзя. А гипертекстовые документы и есть те самые многочисленные сайты. Первый же в мире веб-сайт был размещен Тимом Бернерсом-Ли 6 августа 1991 года на первом веб- сервере. Он объяснял само понятие всемирной паутины и инструкции по установке серверов.

Структура

Всемирная паутина включает в себя миллионы веб-серверов, расположенных по всему миру, обозначаемых хорошо знакомой аббревиатурой WWW (World Wide Web). Веб-сервер – это компьютерная программа, предназначенная для передачи данных с использованием протокола HTTP. Данная программа запускается на подключенном к сети компьютере.

Принцип работы веб-сервера в следующем: получив http-запрос, программа находит на жестком локальном диске запрашиваемый ресурс и пересылает его на компьютер запросившего пользователя. Просмотреть полученную информацию он может с помощью специальной программы веб-браузера, основной функцией которого является отображение гипертекста.

Принцип работы всемирной паутины

Гипертекстовые документы есть ни что иное, как веб-страницы. А такое привычное сегодня понятие, как веб-сайт – это несколько веб-страниц, объединенных общей темой, гиперссылками и хранящимися, как правило, на одном сервере. Для удобства размещения, хранения, доступа к данным ресурсам используется язык HTML, без которого просто невозможно представить современное сайтостроение. Перемещаться между сайтами и документами одного сайта пользователи могут при помощи гиперссылок.

Но прописанный файл HTML сам по себе сайтом не является, пока не размещен в сети интернет. Для существования каждого сайта ему необходим хостинг, т.е. место хранения данных на сервере и доменное имя, необходимое для нахождения и идентификации определенного сайта в мировой паутине.

Отражение информации

Выделяют два способа отражения информации в вебе: активный и пассивный. Пассивное отображение позволяет пользователю лишь считывать информацию, активное же подразумевает возможность добавления и редактирование данных. К активному отображению можно отнести: гостевые книги, форумы, чаты, блоги, wiki-проекты, социальные сети, системы управления контентом.

Свободный доступ к информации, невзирая на границы и расстояния, стал возможен благодаря World Wide Web (WWW, Web) - всемирному хранилищу информации, существующему на технической базе сети Интернет.

WWW или Всемирная паутина:

Представляет собой множество информационных ресурсов, организованных в единое целое;
- объединяет многочисленные ресурсы, размещённые в компьютерах по всему миру;
- организована так, что в ней информационные ресурсы представлены не в линейной последовательности, а снабжены ссылками (гиперссылками), явно указывающими возможные переходы, связи между ресурсами.

Всемирная паутина - это мощнейшее информационное хранилище; содержащийся в ней объём информации не поддаётся точному измерению. WWW содержит информацию самого разного характера; там можно найти:

  • самые свежие новости - политические, экономические, культурные, спортивные;
  • научную, техническую, образовательную и справочную информацию абсолютно любого рода;
  • рекламу разнообразных товаров и услуг;
  • ресурсы для досуга и развлечений - книги, музыку, фильмы, игры и многое другое.

Любой человек, имеющий доступ к Интернету, может разместить в сети свою информацию.

Информация в WWW организована в виде страниц (web-страниц ). В свою очередь, страницы могут объединяться в более крупные составляющие - сайты (англ. site - место, участок).

Web-сайт - это несколько web-страниц, связанных между собой по содержанию.

Сайты есть у государственных структур, общественных организаций, предприятий, фирм и компаний, музеев и библиотек, газет, образовательных учреждений, в том числе у многих школ.

Каждый сайт и каждая страница имеют свой адрес , по которому к ним можно обратиться. Web-сайты сильно отличаются друг от друга по оформлению, но чаще всего они имеют похожую структуру.

Каждый web-сайт имеет главную страницу , которая аналогична странице с оглавлением в книге. В текстах, размещённых на страницах сайтов, могут быть выделены некоторые слова - гиперссылки , от которых идут гиперсвязи .

Они выделяются цветом или подчёркиванием.

Щёлкнув мышью на таком слове, мы переходим к просмотру другого документа, причём этот документ может находиться на другом компьютере, в другой стране, на другом континенте.

В качестве гиперссылок может использоваться не только текст, но и любое графическое изображение. Такую организацию информации называют гипертекстом .

Перемещаться пользователю по «паутине» помогают специальные программы (web-браузеры , англ. browse - осматривать, изучать).

Логотипы наиболее распространенных браузеров:

На первый взгляд Всемирную паутину можно представить как библиотеку, книги в которой расположены без видимого порядка: нет ни единой системы каталогов, ни библиотекарей. При этом посетители «библиотеки» по собственному усмотрению добавляют новые тома или безвозвратно их забирают. Для того чтобы извлечь полезную информацию из Всемирной паутины, нужно знать, где и как вести поиск, нужен опыт поисковой работы.

Поиск нужного документа в WWW происходит с помощью браузера разными способами:

    путём указания адреса документа;

    путём перемещения по паутине гиперсвязей;

    путём использования поисковых систем.

Поисковые системы

Все системы поиска информации во Всемирной паутине располагаются на специально выделенных компьютерах с мощными каналами связи. Ежеминутно они обслуживают огромное количество клиентов.

Действие поисковых систем основано на постоянном, последовательном изучении всех страниц всех сайтов Всемирной паутины. Для каждого документа составляется его поисковый образ - набор ключевых слов, отражающих содержание этого документа. В связи с постоянным обновлением информации поисковые системы периодически возвращаются к ранее изученным страницам, чтобы обнаружить и зарегистрировать изменения. Информация о ключевых словах исследованных таким образом страниц сохраняется в поисковой системе.

При поступлении запроса от пользователя поисковая система на основании имеющейся в ней информации формирует список страниц, соответствующих критериям поиска. Найденные документы, как правило, упорядочиваются в зависимости от местоположения ключевых слов (в заголовке, в начале текста), частоты их появления в тексте и других характеристик.

Существует множество поисковых систем. Несмотря на общий принцип работы, поисковые системы различаются по языкам запроса, зонам поиска, глубине поиска внутри документа, методам упорядочивания информации и другим характеристикам. На данный момент самой популярной в мире поисковой системой является Google . Крупнейшие отечественные поисковые системы - Яндекс, Rambler .

Адрес: www.google.com

Самая быстрая и самая большая поисковая система. Содержит информацию более чем о полутора миллиардах страниц. Имеется возможность выбора языка. Оценивает популярность ресурса по количеству ссылок, ведущих к нему с других страниц.

Адрес: www.yandex.ru

Мощная отечественная поисковая система. Обеспечивает поиск в основном среди русскоязычных ресурсов, при этом по возможностям не уступает зарубежным системам. Проводит качественный анализ информации с учётом словоформ русского языка.

Адрес: www.rambler.ru

Одна из первых русских поисковых систем. Кроме стандартных возможностей поиска на сайте имеется рейтинг-каталог ресурсов.

Изначально интернет представлял собой компьютерную сеть для передачи информации, разработанную по инициативе Министерства обороны США. Повод дал запущенный Советским Союзом в 1957 году первый искусственный спутник Земли. Американские военные решили, что в таком случае им необходима сверхнадежная система связи. ARPANET недолго была тайной и вскоре стала активно использоваться различными отраслями науки.

Первый удачный сеанс удаленной связи был проведен в 1969 году из Лос-Анджелеса в Стэнфорд. В 1971 году была разработана мгновенно обретшая популярность программа для отправки электронной почты по сети. Первыми иностранными организациями, подключившимися к сети, находились в Великобритании и Норвегии. С проведением трансатлантического телефонного кабеля в эти страны ARPANET стала международной сетью.

ARPANET была, возможно, более совершенной, но не единственной системой связи. И только к 1983 году, когда американская сеть наполнилась первыми новостными группами, досками объявлений и перешла на использование TCP/IP протокола, позволившего интегрироваться в другие компьютерные сети, ARPANET стал Интернетом. Буквально через год это звание стало постепенно переходить к NSFNet - межуниверситетской сети, имевшей большую пропускную способностью и набравшей в годовой период 10 тыс. подключенных компьютеров. В 1988 появился первый интернет-чат, а в 1989 Тим Бернерс-Ли предложил концепцию всемирной паутины.

World Wide Web

В 1990 году ARPANET окончательно проиграла NSFNet. Стоит заметить, что обе они разрабатывались одними и теми же научными организациями, только первая - по заказу оборонных служб США, а вторая - по собственной инициативе. однако эта конкурентная пара повлекла за собой научные разработки и открытия, сделавшие реальностью всемирную паутину, которая в 1991 году стала общедоступна. Предложивший ее концепцию Бернерс Ли в течение следующих двух лет разработал протокол HTTP (гипертекст), язык HTML и идентификаторы URL, которые более знакомы обычным пользователям как интернет-адреса, сайты и страницы.

Всемирная паутина - это система, предоставляющая доступ к файлам компьютера-сервера, подключенного к интернету. Отчасти поэтому сегодня понятия паутины и интернета часто подменяют друг друга. На самом же деле, интернет является технологией связи, неким информационным пространством, а всемирная паутина наполняет его. Состоит эта паучья сеть из многих миллионов веб-серверов - компьютеров и их систем, отвечающих за работу веб-сайтов и страниц. Для доступов к ресурсам паутины (загрузки, просмотра) с обычного компьютера используется программа браузер. Веб, WWW - синонимы Всемирной паутины. Пользователи WWW исчисляются миллиардами.