INTERNET: conjunto de redes interconectadas entre si.
WWW: Web 1.0 (No tiene RSS. Lo cual impide la comunicación o compartir con otras paginas o enlaces), Web 2.0 (Surge la RSS), Web 3.0.
Web superficial o surface Web
Web profunda o deep Web
CHAT: usa sincronización.
WEB SUPERFICIAL: se conoce como WWW, tiene acceso público, la información debe ser evaluada y revisada. ESTATICA
WEB INVISIBLE O PROFUNDA: se compone de: Contenidos dinámicos: paginas dinámicas que retornan en respuesta a una búsqueda solo por una vía. Contenidos no enlazados: páginas que no tienen vínculos entrantes desde otras páginas. No tiene RSS. Lo cual impide la comunicación o compartir con otras paginas o enlaces. Contenidos de acceso limitado: requiere registrarse o limitan el acceso a sus páginas, prohibiendo que los buscadores los incluyan en sus bases de datos. Contenidos “scripted”: solamente son accesibles a través de enlaces producidos por JavaScript y Flash, las cuales requieren un tratamiento especial. Contenidos no textuales: archivos multimedia en otro formato o “use Net”. JavaScript – Adobe – Flash Playerà son aplicaciones. Para que la maquina se vuelva dinámica y no estática.
Web Profunda (clasificación): PRIVADA, OPACA, PROPIETARIA y REALMENTE INVISIBLE.
WEB OPACA: COMPUESTA POR: Extensión de la indización: por economía, no todas las paginasde un sitio son indizadas en los buscadores.indizadas: Puesto por visitas, mas reciente, etc. Frecuencia de la indización: los buscadores indexan de forma periódica y la WWW cambia diariamente. Numero máximo de resultados visibles: se limita a los 200 y 1000 documentos, si bien el número de resultado es mayor. URL´s desconectados: los buscadores presentan los resultados en base a la cantidad de referencias a enlaces a los sitios, caso contrario la página no sea indizadas.
WEB PRIVADA: excluidas por algunas de estas causas:
- Se encuentran protegidas por contraseñas, se debe registrar para ingresar.
- Contienen archivos “robots.txt” para evitar ser indizadas.
- Contienen un campo “noindex” para evitar que el buscador indice la parte correspondiente al cuerpo de la pagina.
WEB PROPIETARIA: Incluye paginas en las que es necesario registrarse para tener acceso al contenido, ya sea de forma gratuita o pagada. Se dice que al menos el 95% de la web profunda contiene información de acceso publico y gratuito.
WEB REALMENTE INVISIBLE: incluye formatos como pdf, PostScript, Flash, Shockwave, programas ejecutables y archivos comprimidos.
Se generan dinámicamente a partir de datos q introduce el usuario.
Almacena información en base de datos, que no puede ser extraída a menos que se realice una petición especifica.
BUSQUEDA EN LA INVISIBLE: los buscadores tradicionales han añadido funcionalidades adicionales para la búsqueda en la llamada Web Profunda.
También existen buscadores especializados, busca en lo superficial y en lo invisible.
PARTES DE LA WEB PROFUNDA:
Bibliotecas:digitales,catalogos de bibliotecas, base de datos de biblioteca y bibliográficos
Bases de datos
Revistas electrónicas y archivos de documentos
Documentos en formatos no indizables
Catálogos de editoriales, directorios de publicaciones periódicas.
Archivos
Repositorios de articulos de revistas,tesis y literatura gratis.
Directorios de bases de datos.
Guias de sitios.revistas electronicas, obras de referencia:enciclopedias,diccionarios,tesauros
Foro, blogs, noticias
Sitios de remate, paginas blancas/amarillas, directorios.
Revistas electronicas, en las que es necesario un registro previo y que solo se puede recuperar la información mediante busqueda en base de datos.
Organismos publicos de gobiernos, ONG,etc. Que en sus sitios web disponen de consulta a sus base de datos.
LIBROS
DIRECCIONES DE BIBLIOTECA
DIRECTORIOS DE LA WEB INVISIBLE
EL ARCHIVO DE INTERNET:
- Asume el reto de preservar el pasado de Internet - La mayor parte de la información que contiene es estadounidense. - Se ingresa a través del sitio: http://www.archive.org/index.php - De sus secciones se destaca Wayback MAchine, que contiene miles de millones de páginas, grabadas desde 1996
WWW: Web 1.0 (No tiene RSS. Lo cual impide la comunicación o compartir con otras paginas o enlaces), Web 2.0 (Surge la RSS), Web 3.0.
Web superficial o surface Web
Web profunda o deep Web
CHAT: usa sincronización.
WEB SUPERFICIAL: se conoce como WWW, tiene acceso público, la información debe ser evaluada y revisada. ESTATICA
WEB INVISIBLE O PROFUNDA: se compone de:
Contenidos dinámicos: paginas dinámicas que retornan en respuesta a una búsqueda solo por una vía.
Contenidos no enlazados: páginas que no tienen vínculos entrantes desde otras páginas. No tiene RSS. Lo cual impide la comunicación o compartir con otras paginas o enlaces.
Contenidos de acceso limitado: requiere registrarse o limitan el acceso a sus páginas, prohibiendo que los buscadores los incluyan en sus bases de datos.
Contenidos “scripted”: solamente son accesibles a través de enlaces producidos por JavaScript y Flash, las cuales requieren un tratamiento especial.
Contenidos no textuales: archivos multimedia en otro formato o “use Net”.
JavaScript – Adobe – Flash Player à son aplicaciones. Para que la maquina se vuelva dinámica y no estática.
Web Profunda (clasificación): PRIVADA, OPACA, PROPIETARIA y REALMENTE INVISIBLE.
WEB OPACA: COMPUESTA POR:
Extensión de la indización: por economía, no todas las paginasde un sitio son indizadas en los buscadores.indizadas: Puesto por visitas, mas reciente, etc.
Frecuencia de la indización: los buscadores indexan de forma periódica y la WWW cambia diariamente.
Numero máximo de resultados visibles: se limita a los 200 y 1000 documentos, si bien el número de resultado es mayor.
URL´s desconectados: los buscadores presentan los resultados en base a la cantidad de referencias a enlaces a los sitios, caso contrario la página no sea indizadas.
WEB PRIVADA: excluidas por algunas de estas causas:
- Se encuentran protegidas por contraseñas, se debe registrar para ingresar.
- Contienen archivos “robots.txt” para evitar ser indizadas.
- Contienen un campo “noindex” para evitar que el buscador indice la parte correspondiente al cuerpo de la pagina.
WEB PROPIETARIA: Incluye paginas en las que es necesario registrarse para tener acceso al contenido, ya sea de forma gratuita o pagada. Se dice que al menos el 95% de la web profunda contiene información de acceso publico y gratuito.
WEB REALMENTE INVISIBLE: incluye formatos como pdf, PostScript, Flash, Shockwave, programas ejecutables y archivos comprimidos.
Se generan dinámicamente a partir de datos q introduce el usuario.
Almacena información en base de datos, que no puede ser extraída a menos que se realice una petición especifica.
BUSQUEDA EN LA INVISIBLE: los buscadores tradicionales han añadido funcionalidades adicionales para la búsqueda en la llamada Web Profunda.
También existen buscadores especializados, busca en lo superficial y en lo invisible.
PARTES DE LA WEB PROFUNDA:
LIBROS
DIRECCIONES DE BIBLIOTECA
DIRECTORIOS DE LA WEB INVISIBLE
EL ARCHIVO DE INTERNET:
- Asume el reto de preservar el pasado de Internet
- La mayor parte de la información que contiene es estadounidense.
- Se ingresa a través del sitio: http://www.archive.org/index.php
- De sus secciones se destaca
Wayback MAchine, que contiene miles de millones de páginas, grabadas desde 1996