Escola
AULAS
ACTIVIDADES

Cursinhos

HTML
JAVA

Recursos 
SOFTWARE 
SITES A VISITAR

  HOME

  Introdução

O que é a World Wide Web

A World Wide Web (WWW), ou Web, foi a responsável pela enorme divulgação da Internet.
Desde 1983 que o número de computadores ligados à "Rede" duplica anualmente. No entanto, o grande público só começou a ouvir falar da Internet a partir de 1991, quando surgiu a Web, e só a partir de 1994/95 a Web passou a ser o serviço mais utilizado da Internet. Muitos confundem, hoje em dia, a Web com a própria Internet. Trata-se no entanto de conceitos diferentes. A Internet é uma rede de redes de computadores, que comunicam entre si utilizando uma linguagem (protocolo) comum, o TCP/IP (Transmission Control Protocol/Internet Protocol). A Web é um serviço da Internet que possibilita o acesso e a difusão de uma grande diversidade de recursos informativos de diversos tipos, como texto, gráficos, imagens, som e vídeo.
A grande facilidade de acesso que a Web possibilita a um espaço informativo mundial e a um conjunto diversificado de serviços, bem como a possibilidade de disseminar, de forma imediata, a milhões de cidadãos em todo o mundo, recursos informativos de diferentes tipos, abriu perspectivas inimagináveis.

O que é o HTML

É cada vez mais frequente o cidadão comum disponibilizar na Web informações pessoais na sua página de acolhimento (home page). A criação destas páginas é bastante simples, bastando possuir alguns conhecimentos básicos de HTML. A sigla HTML é acrónimo de HyperText Markup Language. É a linguagem da Web. Trata-se de uma linguagem para apresentação de documentos e especificação de hiperligações. Define a sintaxe e o posicionamento de marcas especiais, que não são visualizadas quando se consulta um documento na Web, mas indicam à aplicação que permite essa consulta (navegador Web ou browser) como deve apresentar o documento, incluindo texto, imagens ou outro tipo de recursos. A linguagem também especifica como tornar um documento interactivo através de ligações hipermédia, possibilitanto a interligação de documentos, locais ou remotos. Os documentos interligados podem ser de tipos diversos e podem também fazer-se ligações a serviços, como ao serviço FTP (transferência de ficheiros).

O HTML é um subconjunto da linguagem mais geral SGML (Standard General Markup Language).

A sintaxe básica e a semântica do HTML estão definidas no padrão HTML. A especificação da versão 4.0 foi recentemente aprovada. Novas versões, que acrescentam novas capacidades, surgem com relativa rapidez. Saliente-se que a Web nasceu em 1991, no CERN.
Os programadores de aplicações para a navegação na Web baseam-se no padrão para desenvolverem os browsers, que formatam e permitem a visualização dos documentos. Os autores de documentos HTML baseam-se no padrão para terem a certeza que os documentos que escrevem estão correctos e podem ser vistos usando qualquer browser.

Informações sobre o desenvolvimento do HTML e de outras tecnologias com ele relacionadas podem obter-se no World Wide Web Consortium (W3C). Há também grupos de notícias (news) sobre a Web, nomeadamente os da hierarquia comp.infosystems.www . Informações de carácter mais técnico e mais abrangentes podem obter-se no sítio do IETF, Internet Engineering Task Force, responsável por definir toda a tecnologia da Internet. Estas definições são publicadas em documentos chamados RFCs (Requests for Comments).

Editores HTML

Para criar um documento HTML usa-se um editor. Existem vários, uns mais completos e fáceis de utilizar do que outros. No entanto, pode usar-se um simples editor de texto, como o Notepad, para criar documentos HTML, uma vez que os ficheiros HTML são simples ficheiros de texto. Podem igualmente utilizar-se processadores de texto como o Microsoft Word ou o WordPerfect, desde que se gravem os ficheiros criados, com as marcas HTML apropriadas, em formato texto. Versões recentes de processadores de texto, como a versão do Word do Office97, incluem a opção de gravar o texto no formato HTML. Esta facilidade só é útil para criar documentos bastante simples e, por outro lado, a geração do código HTML faz-se segundo regras pré-definidas, que nos dão pouco ou nenhum controlo sobre o mesmo (é sempre possível editar o código manualmente, usando um editor como o Notepad). Idênticas considerações podem fazer-se relativamente à grande variedade de macros e máscaras que permitem gerar código HTML a partir, por exemplo de folhas Excel ou apresentações PowerPoint. Mesmo o Internet Assistant, que é uma ferramenta do domínio público que acrescenta novas facilidades aos menus e barras de tarefas do Word para inserir marcas e ligações, não é garantidamente uma ferramenta produtiva na construção de páginas mais complexas, que não incluam essencialmente texto. Uma ferramenta para o Word razoavelmente útil é o shareware HTML Author. Permite, por exemplo, dividir um documento Word em secções que correspondem a páginas separadas.

A edição eficiente de documentos HTML é possibilitada por editores HTML dedicados e ferramentas de autoria relacionadas. Estes dividem-se, essencialmente, nos que facilitam a geração do código HTML, permitindo a visualização dos documentos num navegador instalado na máquina, e os programas WYSIWYG em que a produção do código é escondida do utilizador, que frequentemente não o pode editar dentro desse programa.

Dos primeiros salienta-se o HomeSite, utilizado na construção de páginas Web da FEUP.
Dos segundos, aconselha-se os que permitem facilmente o acesso ao código HTML e, simultaneamente, produzem código inteligível que permita uma edição rápida. O PageMill, da Adobe, satisfaz ambos os requisitos.
Antes de optar por um programa, em particular WYWIWYG, deve assegurar-se que suporta a última versão do padrão HTML.

Informações detalhadas sobre editores.

Extensões HTML não padronizadas

A concorrência entre os criadores de browsers tem originado a disputa pela melhor aplicação, nomeadamente através da inclusão de capacidades adicionais. Daí têm resultado extensões ao padrão vigente tendo em vista melhorar a linguagem. Muitas vezes estas extensões são incorporadas na versão seguinte do padrão. Enquanto tal não sucede resulta alguma incompatibilidade ou diferença de comportamento dos browsers face ao mesmo documento HTML, quando este contém extensões não padronizadas. Isto passa-se sobretudo com os browsers Navigator, da Netscape, e Internet Explorer, da Microsoft.

Arquitectura Cliente-Servidor

A arquitectura cliente-servidor não se limita aos serviços da Internet. É a base da chamada computação distribuída. Neste modelo os dados e a capacidade de processamento distribuem-se por máquinas diversas, ligadas em rede, em oposição a um modelo centralizado.

O modelo cliente-servidor exige que os programas sejam escritos de forma a encorporar duas componentes separadas de código, que geralmente se executam em máquinas diferentes, mas que operam como uma única aplicação.

É importante não esquecer que:
 

  1. São os programas que comunicam. Não são realmente os computadores que comunicam entre si, mas os programas residentes nesses computadores. Assim se explica que um só computador possa estabelecer “múltiplas conversações” com outros computadores.
  2. Os computadores podem executar vários programas simultâneamente. Na realidade, o sistema operativo tem a capacidade de comutar rapidamente entre os programas atribuindo a cada um deles um pequeno tempo de execução. Devido à velocidade dos processadores parece-nos que tudo se passa como se os vários programas estivessem a ser executados simultaneamente.

Os programas que comunicam entre si podem classificar-se numa de duas categorias. Os que oferecem um serviço, chamados servidores, e os que chamam ou contactam um serviço, chamados clientes.

Geralmente as pessoas que acedem à Internet executam programas cliente.

Ao contrário dos programas cliente, os programas servidores têm de estar constantemente preparados para receber pedidos. Um cliente pode contactá-los em qualquer altura, sem aviso prévio. Geralmente os programas servidores são executados em computadores potentes que permitem a execução de múltiplos programas servidores.

Como Funciona a Web

A Web usa o modelo cliente-servidor. O browser ou navegador é a aplicação cliente que usa a Rede (Internet) para comunicar com um servidor remoto pedindo-lhe uma cópia do recurso desejado. O servidor responde, fornecendo ao cliente essa cópia.

Para identificar o recurso informativo desejado é necessário fornecer ao navegador o URL (Uniform Resource Locator), isto é o endereço, desse recurso. Cada URL identifica uma página de informação, indicando o protocolo de acesso ao servidor, o nome deste, e a localização e o nome do recurso desejado.

    Exemplo: http://www.fe.up.pt/~lmr/projFOCO/index.html

O HTTP (HiperText Transfer Protocol) é a linguagem utilizada entre o cliente e o servidor para trocarem informação na Web.

O URL http tem basicamente dois formatos:

  • http://servidor:porta/caminho#fragmento
  • http://servidor:porta/caminho?pesquisa

Geralmente, porém, ocorre na forma mais simples http://servidor/caminho

O servidor é o nome da máquina que contém os recursos Web. Geralmente, essa máquina tem o "nome próprio" www, seguido do nome do domínio. Isto é apenas uma questão de conveniência. O nome www é, muitas vezes, um nome alternativo da máquina, que tem outro nome próprio, por exemplo alf.

A porta é o número da porta de comunicação que o navegador (cliente) usa para se ligar ao servidor (por omissão, é a porta 80. A porta 443 é também usada por alguns servidores).

O caminho especifica a localização e o nome do ficheiro que contém o recurso informativo, no servidor. Note-se a extensão .html do ficheiro HTML index.html.

O fragmento refere-se a uma secção específica dentro de um documento (recurso informativo). Os nomes identificativos desses fragmentos definem-se, em HTML, com a marca <a>.

A componente pesquisa, quando existe, indica um recurso pesquisável ou executável, no servidor. A componente pesquisa faz a passagem de parâmetros para o servidor, parâmetros estes que controlam a pesquisa ou execução. Por exemplo o URL http://www.fe.up.pt/exec?3%2f4, referencia o recurso chamado exec, no servidor www.fe.up.pt, e passa-lhe o parâmetro 3/4.
Saliente-se que a "/" está codificada no hexadecimal 2f, precedido de %. Esta é a sintaxe usada para os caracteres não ASCII (7 bit).

Alguns navegadores (como o Navigator, da Netscape) admitem que o URL contenha tanto a componente fragmento como a componente pesquisa. Esta facilidade deve, porém, evitar-se ou usar-se com cautela.

O URL pode especificar outros protocolos, como o FTP (File Transfer Protocol), para a transferência de ficheiros. Isto significa que o mesmo browser pode usar-se para comunicar com o serviço ftp, ou outros serviços da Internet.
Todos os URLs apresentam a sintaxe objecto:parte_específica_do_objecto. O síbolo ":" figura sempre como separador.

É importante não esquecer que o computador onde é executada a aplicação cliente pode apresentar hardware com características muito diversas. Sendo o browser a seleccionar o modo como a página é apresentada, ela pode ter aspectos diferentes em computadores diferentes, mesmo que usem o mesmo browser.

    Ajude a divulgar esta página 
Copyright © 1997/98 Adelino Amaral