martes, 6 de septiembre de 2016

Web Superficial y Web Profunda

HABLEMOS SOBRE LA WEB SUPERFICIAL Y LA WEB PROFUNDA

Los buscadores tradicionales sólo ofrecen acceso a una pequeña parte de lo que existe online, lo que se ha comenzado a llamar la Web superficial o visible. La Web profunda o invisible, es un amplio banco de información ubicado en catálogos, revistas digitales, blogs, entradas a diccionarios y contenido de sitios que demandan un login (aunque sea gratuito) y otros tipos de contenido que no aparecen entre los resultados de una búsqueda convencional. 

LA WEB SUPERFICIAL
La Web Superficial comprende todos aquellos sitios cuya información puede ser indexada por los robots de los buscadores convencionales y recuperada casi en su totalidad mediante una consulta en sus formularios de búsqueda.Las características principales de los sitios de la Web visible son:
  • Su información no está contenida en bases de datos 
  • Es de libre acceso 
  • No se requiere la realización de un proceso de registro para acceder a la información. 
  • Mayoritariamente está formada por páginas Web estáticas, es decir páginas o archivos con una URL fija y accesibles desde otro enlace.
 LA WEB PROFUNDA
Web invisible es el término utilizado para describir toda la información disponible en Internet que no se recupera interrogando a los buscadores convencionales. Generalmente es información almacenada y accesible mediante bases de datos. Parte de la información es "invisible" a los robots de los buscadores convencionales, ya que los resultados se generan en la contestación a una pregunta directa mediante páginas dinámicas (ASP, PHP, etc.) es decir páginas que no tienen una URL fija y que se construyen en el mismo instante (temporales) desapareciendo una vez cerrada la consulta.
Sherman y Price identifican cuatro tipos de contenidos invisibles en la Web: la Web opaca (the opaque Web), la Web privada (the private Web), la Web propietaria (the proprietary Web) y la Web realmente invisible (the truly invisible Web). 
  •      La Web opaca está compuesta por archivos que, si bien podrían estar incluidos en los índices de los buscadores, no lo están por alguno de los siguientes motivos: 
  •      Extensión de la indización: a veces, por economía, no todas las páginas de un sitio son indizadas en los buscadores. 
  •      Frecuencia de la indización: los buscadores no poseen la capacidad de indizar todas las páginas existentes; a diario se agregan y modifican muchas y la indización no se realiza al ritmo que permita incluirlas a todas. 
  •     Número máximo de resultados visibles: aunque los motores de búsqueda arrojan a veces un gran número de resultados, generalmente limitan el número de documentos que se muestran (entre 200 y 1000). 
  •    URL desconectadas: las generaciones más recientes de buscadores, presentan los documentos por relevancia basada en el número de veces que aparecen referenciados en otros. Si un documento no tiene un link a él, desde otro documento, será imposible que la página sea encontrada, pues no se encuentra indizada.
La Web privada consiste en las páginas Web que podrían estar indizadas en los buscadores pero son excluidas deliberadamente por alguno de estos motivos:
  •  Las páginas están protegidas por contraseñas. 
  •  Contienen un archivo “robots.txt” para evitar ser indizadas. 
  •  Contienen un campo “noindex” para evitar que el buscador pueda indizar la parte correspondiente al cuerpo de la página.
La Web propietaria incluye aquellas páginas en las que es necesario registrarse para tener acceso al contenido, ya sea de forma gratuita o arancelada.

La Web realmente invisible se compone de páginas que no pueden ser indizadas por limitaciones técnicas de los buscadores, programas ejecutables y archivos comprimidos, páginas generadas dinámicamente, es decir, que se generan a partir de datos que introduce el usuario, información almacenada en bases de datos relacionales, que no puede ser extraída a menos que se realice una petición específica.

Ejemplos de recursos  de búsqueda en la Web Profunda:
-The WWW Virtual Library
-Infoplease
-DeepWebTech
-TechXtra 

Aprender practicando

HABLEMOS SOBRE EL ARTE DE PREGUNTAR



En esta actividad tenemos que desarrollar una búsqueda de información mediante lo aprendido en el módulo 5 de éste curso, siguiendo los pasos que se desarrollan a continuación.

1) Lo primero que harán es escribir una pregunta espontánea vinculada a sus intereses profesionales, tal como se la formularíamos a una persona. Mi pregunta es: Cómo podemos protegernos de un hacker?
Lo que intentaré será buscar un artículo que hable sobre los gestores biliograficos para poder tener la máxima información posible sobre la cuestión.

2) Traducirla a los distintos tipos de palabras clave (de campo temático, de problema específico y de referencia autoral)
En campo temático tendríamos: gestores, blibliográficos,
En campo específico: protección zotero, mendeley, endnote
En campo autoral: Chema Alonso...


3) Realizar algunos intentos de búsqueda en el Google Académico.
Primero hago una búsqueda normal en Google y observamos que la cantidad de resultados es de mas de un millón de resultados.



Después realizo búsqueda en Google Academy y se puede mirar que la cantidad de resultados ha bajado, pero siguen habiendo muchos, así que reduciré aún más la búsqueda.



Con la búsqueda más reducida y concreta he reducido los resultados a 629 entre los cuales se encuentra un artículo sobre la información gestores bibliograficos.


Y aquí está la última información. Me ha parecido muy interesante las diferentes formas de preguntar ante una búsqueda para obtener el resultado más óptimo.


lunes, 5 de septiembre de 2016

Clasificación de las diferentes herramientas de búsqueda de información en Internet

Buscadores en la Web Los buscadores o motores de búsqueda utilizan tipos de software especiales que localizan e indexan, en forma automática, las páginas Web y además todos los documentos referenciados en ellas. Un buscador está compuesto por cuatro componentes básicos: un robot, un motor de indexación, los índices un motor de búsqueda.

La sobreabundancia de información


La  infoxicación y la problemática asociada a la gestión de la sobreabundancia de información que ofrece Internet.

Actualmente con el uso de herramientas como Internet, ahora existe la posibilidad de acceder a un inmenso mundo sobrecargado de grandes volúmenes de información; lo cual es una de las bondades, pero al mismo tiempo se ha convertido en uno de los mayores problemas para muchos usuarios, principalmente porque no pueden: realizar búsquedas efectiva o gestionar la información.




¿De dónde surge el término? 

  • INFO: Viene de la palabra Información
  • XICACION: Deriva de la palabra INTOXICACIÓN

Fue introducido por Alfons Cornella en 1996 y se refiere a la sobrecarga de información que se recibe, especialmente desde Internet, y nos puede causar gran angustia al no poder abarcarla, mucho menos gestionarla; ya que si prestamos atención a una gran cantidad de información y no finalizamos una tarea para continuar con otra diferente, esto dificulta la desconexión de la mente, y la obliga a realizar un sobreesfuerzo.


¿Cómo podríamos conseguir una mejora en nuestra productividad personal?
  • Realizando lista de información crítica para cada uno de los temas, manejándonos entre los cinco temas principales y secundarios; es decir, debo tener muy claro lo que realmente quiero conocer de ellos.
  • Saber buscar y dónde hacerlo, formulando las preguntas correctas.
  • Conocer las fuentes para poder recibir la información adecuada.
  • Tener un filtro personal para cada información: la que realmente nos es últil, la que pueda interesarnos en algún momento y la que no nos interesará por no tener nada que ver con el tema tratado.


¿Cómo puede la sobreabundancia de información afectar nuestro rendimiento?

Los problemas derivados de la sobre información pueden afectar nuestro rendimiento personal y profesional. Si prestamos demasiada atención a una gran cantidad de información de manera sostenida en el tiempo y no finalizamos una tarea para continuar con otra diferente, esto dificulta la desconexión de la mente, y la obliga a realizar un sobreesfuerzo. Es por esto que, debemos reflexionar acerca de cómo nos informamos y qué métodos y herramientas utilizamos para gestionar la información.




BIBLIOGRAFIA
http://hermanbenshimol.blogspot.com/2015/05/infoxicacion-y-la-problematica-asociada.html

http://elartedebuscarenlared.blogspot.com/2015/05/infoxicacion-y-la-problematica-asociada.html
http://francisco-javier-cervigon-ruckaver.blogspot.com/2015/06/infoxicacion-y-la-problematica-asociada_10.html
http://foravaencontrandotesoros.blogspot.com/2015/06/infoxicacion.html