Conceptos básicos

Quizás te parezca aburrido este capitulo ya que es puramente teórico, pero es necesario para que entiendas a fondo y parte del curso que dicto a mis alumnos de primer ciclo de ingeniería informática en la Universidad Alas Peruanas. Puedes saltar entre los términos con los cuales aun no estas familiarizado y dejar los demás para mas adelante como referencia.

1. Qué es Internet ?

Es una red mundial de redes de computadoras, que permite la comunicación directa y transparente para compartir información y servicios entre usuarios.

Un computador que forme parte de esta red de redes puede comunicarse con otro en cualquier parte del mundo, con tal que este otro computador también este conectada a Internet en ese momento.

2. Qué es Protocolo ?

Para que la comunicación entre dos computadoras sea posible es indispensable que ambas hablen el mismo idioma, es decir usen el mismo protocolo de comunicación.

Protocolo entonces es el conjunto de reglas que determinan cómo se realizará el intercambio de información entre dos computadores.

3. Qué es TCP/IP ?

Transmission Control Protocol/Internet Protocol. Dos protocolos de comunicaciones diseñado originalmente para la red ARPA, proyecto de comunicación de computadoras del Departamento de Defensa de USA que posteriormente ha adoptado Internet.

Transmission Control Protocol (TCP): Divide la información en paquetes de tamaño adecuado, los numera, añade cierta información para su posterior decodificación y para detectar posibles errores luego de ser transmitidos.

Internet Protocol (IP): Este protocolo se encarga de la transmisión de los paquetes previamente preparados por el TCP, proporcionando la dirección de origen y destino.

Dos variaciones de este protocolo son SLIP (Serial Line/Internet Protocol) y PPP (Point to Point Protocol).

4. Servicios de Internet

Existen muchos servicios a disposición de los usuarios en Internet, los más importantes son:

  1. Hipertexto: WWW
    El World Wide Web o simplemente Web (telaraña) fue desarrollado por el Laboratorio Europeo de Física de Partículas, para facilitar el manejo de información.
    Está basado en el Hyper Text Transport Protocol (HTTP) que permite el intercambio de documentos de texto en un formato especial llamado Hyper Text Markup Language (HTML), el cual posee la característica de poder formatear el texto (Tipos, tamañs y colores de letras, atributos como negrita, itálica, subrayado, estilos, listas, tablas, formularios, marcos etc), fácil enlace de documentos de forma que un simple clic de mouse sobre una palabra nos muestra otro documento asociado, además soporta multimedia (imágenes, audio y video) y aplicaciones en línea.
    Para poder acceder a estos documentos se requiere un navegador, software de cliente que es capas de interpretar el lenguaje HTML.
  2. Correo electrónico: CORREO
    Este es uno de los servicios más importantes y se trata de el intercambio de documentos (en texto puro) usando el protocolo SMTP (Simple Mail Transfer Protocol) que define el formato del mensaje y la manera como será manejado en la red. Para usar el correo cada usuario deberá tener asignado un buzón en algún servidor de correo, ya que el intercambio es solo entre servidores y no entre clientes. Para leer su buzón el usuario debe acceder a su servidor de correo vía un programa cliente de correo y luego identificarse ante el servidor.
  3. Listas de interés: USENET
    Son foros de debate sobre algún tema en común, donde se puede discutir e intercambiar información sobre algún tema. Cada usuario envía al servidor su correo dirigido al grupo y este es almacenado para que en cualquier momento este y otros mensajes sean recogidos por los interesados en la lista.
  4. Noticias: NEWS
    Uno se inscribe es una lista (normalmente son servicios pagados), cada nueva noticia o articulo sobre el tema es transferido al servidor quien se encarga de la distribución enviando el material como mensaje de correo a cada uno de los usuarios inscritos en la lista.
  5. Transferencia de archivos: FTP
    Servicio con el que puedo transferir todo tipo de archivos usando el File Transfere Protocol, el cual permite que computadores con sistemas operativos distintos intercambien información sin problemas. Ademas de tener la dirección del servidor FTP debemos tener un código de acceso aunque muchos aceptan el modo anónimo (anonymous) el cual es un modi de acceso publico.
  6. Acceso remoto: Telnet
    El protocolo TErminaL EmulaTion fue creado por ARPA y permite accesar a una computadora situada en un lugar remoto, como si estuviesemos frente a ella. Ademas de conocer la dirección de dicha computadora, tendremos que tener un código de acceso a ella, aunque muchos aceptan el modo invitado (guest).
  7. Chat o IRC - Internet Relay Channel
    Un servicio en el cual los usuarios establecen comunicación en tiempo real, las cuales pueden ser privadas o entre un grupo de personas. Los métodos de comunicación pueden ser el teclado, el audio y el video.
  8. En el mas común y sencillo de los casos los usuarios acceden a un servidor IRC que les presentara una pizarra donde podrán leer lo que escriba cualquier persona del grupo en forma instantánea, estableciéndose casi una conversacion escrita. Lógicamente la comunicación es limitada (no transmite tonos ni inflexiones de voz), un poco impersonal ya uno no ve a sus interlocutores y lenta por la velocidad de escritura.
  9. Gopher:
    Diseñe en la Universidad de Minesota es el primer intento de facilitar la consulta de documentos por un sistema de menús. Solo soporta texto y actualmente esta dejando de usarse dándole paso a la Web.

File Transfer Protocol (FTP): Permite el intercambio de archivos. Simple Mail Tranfer Protocol (SMTP): Permite el intercambio de correo. El protocolo TELNET: permite la emulación de terminal para todo tipo de computadoras.

5. Que es Word Wide Web ?

El mas poderoso servicio de Internet llamada la telaraña mundial también conocida como WWW, W3 o simplemente Web, apoya el hipertecto y la multimedia via lo que llamamos paginas Web.

6. Que son paginas Web ?

Son paginas de hipertexto que pueden ser consultadas mediante un navegador (Browser) en modo gráfico y contienen texto formateado, imágenes, sonido, video y conexiones para manejar de forma fácil e interactiva la información.

7. Direcciones IP

Para establecer la comunicación es necesario que cada computador sea identificado de forma única en la red, para ello se usa la dirección o número IP que esta formado por cuatro números que pueden tomar valores entre 0 y 255, separados por puntos. Estos números son asignados por una organización internacional, para evitar cualquier duplicidad.

8. Dominio

Las computadoras necesitan el número IP para establecer contacto entre sí, pero ese número es muy difícil de recordar para nosotros los humanos y es por eso que usamos el dominio.

Un dominio es un conjunto de códigos literales, separados por puntos, llamados subdominios. Cada subdominio identifica un grupo de computadoras. Si leemos el dominio de izquierda a derecha, cada subdominio será más vasto que el subdominio ubicado a su izquierda. Por ejemplo el dominio uap.edu.pe, identifica a la Universidad ALAS Peruanas en internet, donde: uap es el nombre que hemos elegido, edu identifica a las organizaciones educativas y pe a nuestra ubicación geográfica, el Perú. Para ver una lista de dominios clic AQUI

IdDescripciónIdDescripción
comComercialesEspaña
eduEducaciónclChile
orgOrganización sin fines de lucropePerú
gobGobierno no militarmxMéxico
milMilitarcoColombia
netRecurso de red USA

9. Que es URL ?

URL (Uniform Resource Locator=localizador uniforme de recursos), es la dirección de un archivo escrito en un formato que el servidor de Web puede interpretar, para lograr acceder al archivo. Usualmente esta esta formado de la siguiente manera:

[protocolo://][dominio][:puerto][/ruta/]archivo

9.1 Protocolo:// Es opcional, por omisión se asume http://, es el protocolo usado para transmitir archivos en Internet. Para el acceso a servidores Web, el protocolo suele ser http, pero se admiten otros protocolos (ftp, gopher, news, file...).

9.2 Dominio Es opcional y define el nombre del servidor que contiene el objeto buscado (como: www.uap.edu.pe). Por omisión asume el mismo que el de la ultima dirección usada.

9.3 :puerto Es opcional y solo es necesaria cuando se usa un numero de puerto TCP no estándar.

9.4 /ruta/ Es opcional y define la ruta por donde deberá buscarse el archivo. Por omisión se asume el mismo que el de la ultima dirección usada. Nota que es necesario usar la / como en UNIX y no \ como en DOS.

9.5 archivo Este parámetro es obligatorio e indica el nombre del archivo que quieres abrir.

La razón de este convenio es precisamente que la mayor parte de los servidores de Web que hay en Internet están basados en UNIX. Esto se nota también en que por lo general los nombres de los archivos son largos y pueden contener varios puntos. También debemos tener en cuenta que en UNIX las mayúsculas y las minúsculas son distintas en los nombres de archivo.

Una URL relativa es una URL incompleta, en la que por ejemplo falta el protocolo, dominio y hasta parte de la ruta, que el navegador puede deducir segun las definidas para el documento en uso.

10. Servidor DNS - Domain Name Server

Son unas computadoras cuya misión es traducir los nombres de dominio (ej: empresa.com) a sus correspondientes números IP.

11. Hosting

Es un servidor que almacena contenidos a cambio de un pago anual.

12. Que es hipertexto ?

Son básicamente archivos tipo texto, que mediante etiquetas HTML, que son interpretados por el navegador como etiquetas de formateo de texto, es decir, texto presentado de forma estructurada y agradable, con enlaces (hyperlinks) que conducen a otras fuentes de información relacionadas y con objetos multimedia (imágenes, sonido, video...).

13. Como funciona el hipertexto ?

La tecnología hipertexto funciona gracias a que para especificar de manera uniforme el objeto al que apunta nuestro enlace, se usa una forma estandarizada que se denomina URL, asi cada archivo tiene una dirección única, de forma que puede ser ubicado.

14. Que son las etiquetas HTML ?

HTML (Hypertext Markup Language = lenguaje con marcas de hipertexto) es un lenguaje muy sencillo que permite diseñar hipertexto.

La descripción se basa en especificar en el texto la estructura lógica del contenido (títulos, párrafos de texto normal, enumeraciones, definiciones, citas, enlaces, listas, tablas, etc) y dejar que luego la presentación final de dicho hipertexto se realice por un programa especializado, llamado navegador (Chrome, FireFox, Safari, iExplorer o Mosaic).

15. Que es el estilo CSS ?

Tomando como base que el contenido de un documento debe estar separado de su formato, es decir los diferentes efectos que se quieren dar (tipos de letra, tamaño y color de letra, cursiva, negrita, alineamiento, color de border, fondos, etc)

La mayoría de efectos se especifican poniendo etiquetas al rededor de lineas de texto, para indicar al navegador como debe lucir cierta parte del texto.

Ejemplo: Hola <B>Tiburón</B> como estas hoy ?

Se vera así: Hola Tiburón como estas hoy ?

Todos los etiquetas están encerrados entre los signos < y >, y con la barra / cuando se trata del fin de un etiqueta, aunque algunos etiquetas no requieren cierre.

A veces es necesario ofrecer datos adicionales a cada etiqueta en forma de parámetros. Por ejemplo, cuando se define un hiperenlace hay que especificar su destino. Estos parámetros siempre se ponen en la apertura de la etiqueta y tienen el formato <etiqueta parmetro1=valor1 parametro2=valor2...>, el texto afectado se encontrara inmediatamente después hasta encontrar la etiqueta de cierre, con el formato </etiqueta>.

Más adelante en este DEMO mostrare el efecto de los etiquetas más usados en la creación de un documento HTML. Como un ejemplo es mejor que mil palabras en muchas etiquetas casi no explico nada y voy de frente al ejemplo del efecto que produce dicho etiqueta.

16. Que tipos de archivo soporta HTML ?

Eso depende del navegador que use cada cliente en particular y del grado de avance de implementacion de las recomendaciones de la W3C de dicho navegador.

TXT
texto
HTM
Pagina Web
PS
Script
JPG, TIP
imágenes
GIF
Imágenes y animaciones
WAV, MP3, AU, AIF
Sonidos
AVI, MOV, MPG, JPEG
Videos
También debes tener en cuenta que para que se pueda mostrar un cierto tipo de letra, esta debe estar cargada en el Windows del cliente.

17. Hits, cookies y visitantes

Es muy interesante saber para el que tiene una pagina Web, el numero de visitantes de la pagina, que hacen ellos en la pagina etc.

17.1 HIT
Se denomina así a un pedido del navegador respecto a un archivo, dicho de otra manera el clic de un usuario en un enlace. Inmediatamente después del clic el navegador contacta la URL y transfiere el archivo HTML (el texto) y luego transfiere los otros archivos como imágenes, sonido Appletes de JAVA etc y en las estadísticas cada uno de estos archivo transferido es un HIT.

17.2 VISITA
Se denomina así a un único navegante que genera múltiples pedidos de carga sobre el mismo sitio desde una única ubicación, en un tiempo prudencial (por lo general 30 minutos).

17.3 VISITANTE
Es el hecho de registrar el numero de visitantes distintos, lo que implica que hay que identificarlos para no contar un navegante que regresa. Normalmente esta identificación se hace con un COOKIE o pidiendo registro.

17.4 COOKIE
Es un pequeño archivo de texto plano almacenado en la carpeta de temporales del disco duro del cliente, para poder identificarlo, lo que le permitirá posteriormente rastrearlo, para determinar como se mueve en la pagina.

18. HTML = HyperText Markup Language

Formato de documento estándar para manejo de paginas Web. HTML es una aplicación de SGML.

18.1 SGML

Estándar internacional para describir la estructura de un documento Markup. La idea básica del SGML es hacer la información independiente de cualquier software o hardware particular. Esto se logra guardando todos los documentos como texto puro y hacer referencia a otros documentos en otros formatos como formatos, estilos, imágenes, sonido etc cuando se requieran. SGML fue definido por el estándar ISO 8879 en 1986.

18.2 Markup

Código especial en un documento que especifica que parte del documento debe ser procesado por una aplicación. En un procesador de palabras, Markup especifica como el texto deberá ser formateado; en un documento HTML, Markup especifica la estructura del documento (encabezado, títulos, párrafos, etc)

18.3 Hypertext = hipertexto

Texto que contiene conexiones con otros documentos. Los documentos HTML son un ejemplo de hipertexto.

18.4 Browser = navegador

Un programa visualizador cliente que trabaja en modo gráfico comúnmente usado en Web, para ver y manejar documentos HTML. Estos programas por ser gráficos solo funcionan bajo Win 3.1, 95 o 98. Ej: Netscape Navegator, Internet Explorer, Mosaic, Lynx, Cello etc

18.5 Line-mode browser

Navegador HTML que puede ser usado en el modo de terminal como VT100 o una PC con un software de comunicaciones. Los mas comunes son Lynx y WWW de CERN.

18.6 Home page = pagina principal

Documento de presentación o caratula de un servicio o grupo de paginas HTML en un servidor Web.

18.7 CERN

Laboratorio Europeo para Fisica de Particulas, ubicado en Ginebra, donde se invento el World Wide Web. Para mas información consulta: http://www.cern.ch

18.8 NCSA = National Center for Supercomputing Applications

Localizado en la Universidad de Illinois en Urbana-Champaign. El NCSA fue fundado por el gobierno de U.S. para hacer mas accesible las computadoras. Aqui fue creado el Mosaic el primer navegador para paginas Web y en el que están basados todos los navegadores modernos.

18.9 CGI = Common Gateway Interface

Es una característica de los servidores Web, que permite a los navegadores cliente correr aplicaciones instaladas como scripts en el servidor. Los scripts CGI pueden ser creados en cualquier lenguaje de programación que corra en el servidor.

18.10 POP - Post Office Protocol

Un protocolo usado para mensajes de correo. La antigua versión POP2 (1980) era solo para recibir mensajes y era necesario el uso de SMTP para el envío de mensajes de correo. Hoy tenemos la POP3 que ya supero este problema y se puede usar en conjunto con SMTP o sola.

18.11 SMTP - Simple Mail Transfer Protocol

Protocolo estándar Internet usado para el envío de mensajes de correo. Un intento de expandirlo para envío/recepcion se frusto, por lo que es muy comun que trabaje en pareja con el POP. Soportado por Pegasus Mail 2.4, MS Internet Mail 3.0, Eudora Pro 2.2 etc

18.12 IMAP - Internet Mail Access Protocol

Nuevo estándar similar al POP, pero con caracteristicas de busqueda entre los mensajes del servidor usando palabras claves sin necesidad de almacenarlos vocalmente. La versión IMAP4 soporta envío de archivos no ASCII y MIME. Aun no soportado por la mayoría. Lo soportan Embla 1.2 y Simeon 4.0

18.13 IMSP - Interactive Mail Support Protocol

Un protocolo aun en desarrollo en la Carnegie-Mellon, que ha prometido superar a IMAP4 para suscribirse a listas de interesa, buzones de correo y buscar direcciones en agendas.

18.14 MIME - Multipurpose Internet Mail Extensions (RFC-1510)

Codificación usada para transportar archivos no ASCII (ejecutables, Word, Excel, imágenes, video etc). Soporta multiparte, es decir que puedes dividir el archivo y enviarlo en varios mensajes. Actualmente soportado por IMAP4. Es también el formato usado por los servidores Web y navegadores (browser) para transferir archivos. MIME le dice a los navegadores el tipo de archivo y como procesarlo.

18.15 UUencode/UUdecode

Unix to Unix. Es un algoritmo de codificación/decodificacion para el envío de archivos no ASCII a través del correo. El remitente convierte el archivo en ASCII y luego el receptor lo decodifica reconstruyendo los datos originales.

18.16 MailTo

Esquema que permite a un navegador (browser) enviar un formulario (form) a una dirección de correo electrónico (E-mail) o generar la ventana de edicion de correo.

18.17 HTTP= HyperText Transfer Protocol

Protocolo usado para transferir documentos HTML por la red, entre el servidor Web y el navegador cliente.

18.18 Servidor Web

Programa de red que responde a los requerimientos locales o remotos de documentos HTML. Solo hay que proporcionar el nombre del archivo en el formato URL y el servidor responde el archivo que puede estar en cualquier formato como texto, binario etc.

18.19 Firewall

En redes, es un computador dedicado a prevenir el acceso de intrusos a través de Internet hacia la red interna o intranet. Si tu tienes un Firewall en tu sitio, normalmente no podrás conectar directamente a un servidor en Internet. Necesitaras de un agente llamado servidor proxy, que haga la conexión por ti. La mayoría de firewalls tiene un proxy asociado a cada protocolo ej: HTTP, FTP y Telnet.

18.20 Servidor Proxy

Los proxys típicos aceptan conexiones de usuarios, toman decisiones y completan, a nombre del usuario, una conexión en un destino remoto.

18.21 FTP = File Transfer Protocol

Uno de los esquemas que puede ser especificado en las direcciones URL. Tradicionalmente el mas usado de los servicios y te permite obtener una copia del archivo desde la computadora remota o conectarte a esta usando TCP/IP.

18.22 W3C

La organización WWW en el MIT es una organización sin fines de lucro que promueve el X Windows proporcionando códigos de ejemplo. Para mas información consulta: http://www.w3C.org

18.23 IETF = Internet Engineering Task Force

Responsables del manejo tecnico de Internet. El IETF coordina con los diseñadores los estándares HTML.

18.24 ICADD = International Committee for Accessible Document Design

Tecnica creada por ICADD y documentada en las especificaciones ISO 12083, que transforma de forma automática archivos SGML (incluso archivos HTML) a Braille o sistemas de sintetizacion de voz. Todos los documentos HTML creados con HoTMetaL son compatibles ICADD y pueden ser leídos por conversores usando las técnicas ICADD.

ISO = International Organization for Standardization

18.25 ISO 8859/1 character set

This is the character set for `special' or `accented' characters supported by HTML. This character set is also called `ISO Latin 1'. It includes characters required for most western European languages: Dutch, English, French, German, Italian, Irish, the `Iberian' languages, and the `Nordic' languages. This character set is one of several in the ISO 8859 standard: others support, for example, eastern European languages and Cyrillic-based languages. Only ISO 8859/1 is currently supported by HTML, however.

18.26 URI = Uniform Resource Identifier

Es el nombre generico para cualquier clase de identificador de recipiente en Internet. Hay tres tipos basicos:
URL (Uniform Resource Locator)
URC (Uniform Resource Classification)
URN (Uniform Resource Name)

La implementacion de URC y URN están aun en etapa experimental.

La idea básica es que la fuente (por ejemplo un documento) es identificado por un URN, un tipo de identificador publico en el SGML. El URN esta sujeto al URC, que es una colección de información sobre la fuente (que puede incluir, por ejemplo, el precio y uno o mas URL).

19. Algo mas...

Conviene que nos detengamos momentáneamente en la estructuración habitual de un servidor Web. Para empezar, siempre hay una página de bienvenida (home page) que podría compararse con la caratula de una revista, si no sabemos exactamente qué es lo que buscamos, o no sabemos dónde encontrarlo, la caratula es lo primero que vemos. Para acceder al HOME PAGE de cualquier servidor de Web, basta con escribir una barra en el lugar de la ruta (es decir, reclamamos al servidor el directorio raíz). La mayoría de servidores responderán con una pagina de nombre index.htm, index.html, index.php otros usan default en lugar de index.

El resto de la información que se puede encontrar en un servidor Web se distribuye a partir de ese directorio raíz en distintos subdirectorios y archivos. Un convenio muy habitual relativo al nombre de los ficheros es hacer que los archivos que contengan documentos HTML terminen en htm o html.

Para más información lee mis referencias