![Extracting a URL from a Python String](https://i.ytimg.com/vi/0dxZ75kGRtw/hqdefault.jpg)
Содержание
- Определение - Что означает унифицированный указатель ресурса (URL)?
- Введение в Microsoft Azure и Microsoft Cloud | Из этого руководства вы узнаете, что такое облачные вычисления и как Microsoft Azure может помочь вам перенести и запустить свой бизнес из облака.
- Techopedia объясняет унифицированный указатель ресурса (URL)
Определение - Что означает унифицированный указатель ресурса (URL)?
Унифицированный указатель ресурса (URL) - это адрес ресурса в Интернете. URL указывает местоположение ресурса, а также протокол, используемый для доступа к нему.
URL содержит следующую информацию:
- Протокол, используемый для доступа к ресурсу
- Расположение сервера (по IP-адресу или доменному имени)
- Номер порта на сервере (необязательно)
- Расположение ресурса в структуре каталогов сервера
- Идентификатор фрагмента (необязательно)
Также известен как универсальный указатель ресурса (URL) или веб-адрес. URL - это тип универсального идентификатора ресурса (URI). В обычной практике термин URI не используется или используется как синоним URL-адреса, хотя это технически неверно.
Введение в Microsoft Azure и Microsoft Cloud | Из этого руководства вы узнаете, что такое облачные вычисления и как Microsoft Azure может помочь вам перенести и запустить свой бизнес из облака.
Techopedia объясняет унифицированный указатель ресурса (URL)
Тим Бернерс-Ли и рабочая группа Internet Engineering Task Force приписывают разработку URL в 1994 году. Он официально указан в RFC 1738.
Все URL-адреса представлены в следующем порядке:
- Название схемы
- Двоеточие и две косые черты
- Расположение сервера
- Порт (необязательно) и местоположение ресурса на сервере
- Идентификатор фрагмента (необязательно)
Итак, формат будет выглядеть так:
Схема: // местоположение: порт / файл-на-server.htm QueryString = 1
Это выглядит сложнее, чем есть. Наиболее распространенными схемами (протоколами) являются HTTP и HTTPS, которые распознает любой пользователь WWW. Расположение сервера обычно является доменным именем. Учитывая это, следующие URL гораздо проще для понимания:
http://www.google.com/default.htm
https://www.google.com/default.htm
Оба эти URL-адреса указывают на наличие файла с именем default.htm на сервере с адресом «google.com». Один использует обычный HTTP, а другой использует безопасную версию этой схемы.
Два общих элемента путаницы в URL:
- «Www» на самом деле не является частью технического протокола. Веб-сайты только начали использовать это, чтобы указать, что пользователь использует World Wide Web. Вот почему, если вы переходите на http://google.com, он перенаправляет на http://www.google.com.
- Большинство пользователей получают доступ к Интернету через веб-браузер, который вставляет порт 80 в соединения HTTP за кулисами. Вот почему, если вы перейдете на страницу http://www.google.com:80, вы увидите тот же веб-сайт, как если бы не было номера порта.
Наконец, следующий URL-адрес демонстрирует идентификатор фрагмента, более известный как строка запроса:
http://www.google.com/some-page?search=hello
Это говорит о том, что использовать протокол HTTP для запроса к веб-сайту на google.com (через порт 80) и запросить «some-page» и в поисковой переменной «hello». Вот почему иногда вы видите очень длинный URL-адрес, так как многие переменные отправляются на веб-сервер в более интерактивных веб-приложениях.