Busquedas en Internet
Métodos de búsquedas activos y pasivos - Búsquedas
en el web - Motores de búsqueda geográfica - Motores de búsqueda
temática - Motores de búsqueda por palabras clave - Búsqueda
de direcciones de correo - Búsqueda de listas de distribución
- Búsqueda de servidores FTP - Búsqueda de foros de discusión
- Metodología de búsqueda - Búsqueda gente en Internet
Parte de las horas que pasamos delante del ordenador buscando
información se pueden ahorrar aprendiendo cómo obtenerla
y otra gran parte examinando y cribando datos completamente irrelevantes
para nosotros.
Las herramientas más utilizadas en Internet se basan en el empleo de patrones de búsqueda. Casi nadie accede a bases de datos utilizando complicadas sesiones Telnet, normalmente se hace mediante sistemas de consulta más potentes y cómodos. La experiencia y habilidad para usarlos correctamente es mucho mas importante si deseamos encontrar datos que nos sean útiles.
La crisis de la sobre información es bastante reciente y se debe a la incapacidad de una sola persona de retener ni siquiera una mínima parte de la información que le es útil. El problema se grava cuando la información útil es a su vez una parte ínfima de toda la que recibe e inapreciablemente a toda la que tiene a su disposición.
Hasta ahora, cuando surgía la necesidad de informarse o formarse sobre un tema, la obtención y selección de la información se solía hacer a través de una biblioteca comprando algún libro o, aunque es mas difícil, encontrando algún amigo que nos resolviera la duda. En Internet, sin embargo, la distancia se hace relativa y las fuentes suelen ser gratuitas.
Con tanta información disponible lo que debemos saber es cual nos interesa, donde encontrarla, como obtenerla y la mejor manera de administrarla. Con la ayuda de los navegadores de WWW se facilitan las tareas de localización y obtención, pero saber qué es lo que hay, lo que nos interesa y cómo utilizarlo son cuestiones más complejas.
Hay varios métodos de afrontar el problema; lejos del “divagar” por la Red, que consiste en ir de enlace en enlace sin rumbo fijo, se puede intentar “navegar “ utilizando guías, listas de recursos clasificados, recetarios, etc. con resultados muy diversos. Esto es probablemente lo que llevamos haciendo desde hace tiempo.
Una vez localizadas páginas que contienen referencias a aquellos items de mayor interés, es habitual que el usuario haga una lista de los mismos; de hecho, con la mayoría de navegadores de web , uno puede crearse una lista de enlaces o marcadores (denominada normalmente hotlist o boolmark list) accesible directamente desde el visor e incluso generar páginas HTML, a partir de ella.
Para facilitar la tarea, cada día hay mas sitios dedicados a la creación y mantenimiento de listas y directorios de recursos organizados según criterios geográficos o temáticos denominados generalmente “catálogos”. Pueden ser los puntos de partida ideales cuando buscamos información sobre un tema y queremos saber que hay en la Red o buscamos algún servicio siguiendo criterios geográficos. A partir de las entradas del catálogo podemos ir descendiendo hasta encontrar lo que realmente nos interesa, simplemente siguiendo la estructura lógica que define el servicio.
De todos modos, el empleo de los catálogos deja de ser adecuado cuando lo que buscamos es mas específico, ya que encontrarlo simplemente navegando puede resultar bastante difícil. Nos encontramos entonces con la necesidad de emplear herramientas para la búsqueda y selección de la información disponible en la Red. Estamos hablando de lo que hemos denominado “buscadores de información”.
Distinguiremos dos métodos de búsqueda en función
de la manera de interactuar con las herramientas:
Los sistemas de búsqueda mas usados actualmente son los basados en páginas de hipertexto (servicio WWW) donde se introducen patrones o palabras clave a buscar. Estas páginas actúan como intermediarias entre el usuario y una base de datos almacenada en el servidor o accesible para este. Algunos sistemas restringen la búsqueda al espacio WEB, pero la mayoría permiten buscar cualquier tipo de recursos accesible mediante un URL.
Los sistemas de búsqueda deben indexar en una base de datos propia parte de toda la información para no tener que recorrer toda la Red cada vez que se consulta. Los algoritmos utilizados en los programas de búsqueda se basan en estructurar la información de manera que optimice las búsquedas. El resultado es que los sistemas son prácticamente instantáneos, aunque contengan millones de entradas.
En poco tiempo han aparecido un gran número de sistemas de búsqueda basados en el WEB, con una presentación y posibilidades cada día más atrayentes. Los usuarios se percatan de su existencia por comentarios en la Red, en revistas o a partir de enlaces que aparecen en páginas muy visitadas. También ha contribuido mucho el hecho de que muchos navegadores permiten acceder directamente a algunos de ellos desde un submenú
Para incluir referencias a páginas personales, lo único
que debes hacer es seguir las instrucciones que se suele indicar en algún
lugar de las páginas de búsqueda (generalmente mediante formularios).
Así puede ir dándose de alta en aquellos sistemas que
le parezcan más interesantes, el problema es que enviar un
resumen de sus páginas a todos los buscadores se puede hacer
pesado.
En los buscadores que ofrecen el servicio gratuitamente, la causa de
sustento económico es la popularidad, que se traduce a efectos
comerciales en “audiencia” lo que les permite incluir publicidad en sus
páginas, y como no, cobrar por ello.
Cuando terminas una nueva página puede enviar un mensaje
anunciándolo a las listas de correo o anunciándolo en un
grupo de news y también puedes introducir la referencia en algunos
de los motores de búsqueda como www.yahoo.com ó www.ozu.com
Motores de búsqueda geográfica
Es posible buscar información por aproximación geográfica. Este tipo de motor resulta útil si se busca un servicio en un país que aún no cuenta con un gran número de servidores Web. Este tipo de búsqueda se utiliza raramente salvo cuando se conoce con cierta exactitud el nombre del organismo buscado y especialmente su localización.
La interfaz muestra un mapa o lista de países y solicita la zona deseada. La búsqueda se realiza entonces por acercamiento progresivo, sobre mapas o sobre listas cada vez más refinadas (países, regiones, ciudades) hasta llegar a una compilación de los servicios disponibles.
Existen un gran número de este tipo de servicios que recogen
geográficamente los recursos de la Web. Algunos están especializados
en un continente mientras otras son específicos de un país.
A continuación algunos ejemplos:
Son servicios que intentan recoger los recursos de la Web clasificados
por temas. La búsqueda se hace a través de rúbricas
cada vez más precisas, para llegar a una lista de sedes pertenecientes
a una categoría lo más precisa posible.
El Servicio Yahoo! (Yet Another Hierarchical Officious Oracle ó rústico) es el ejemplo más clásico de motor de búsqueda temática. En su página de bienvenida ofrece varias opciones:
La indexación previa de las páginas puede hacerse de dos formas distintas:
* Este servicio evita la declaración previa de un servicio, desde
el momento en que un enlace de hipertexto apunta hacia él en cualquier
parte del mundo. Sólo indexan información encontrada en las
páginas HTML y no tiene en cuentan la información contenida
en las bases de datos específicas de los organismos presentes
en la Web, accesibles mediante formularios.
Cuando un usuario introduce una palabra clave el sistema no se conecta en tiempo real a todos los servidores sino que efectúa sus búsquedas en el interior de las páginas que anteriormente ha almacenado en sus peregrinaciones por la Web. Puede ocurrir por tanto que una información actualizada diariamente en la Web esté presente en una sede Web, pero no se encuentre por medio del motor ya que este habrá capturado sus informaciones la semana anterior.
Los motores de búsqueda son más o menos potentes, bien por el número de páginas indexadas por adelantado, bien por la posibilidad de enlazar las palabras clave por medio de operadores booleanos distintos, o bien por un cierto número de opciones que veremos más adelante. Un Metaservidor no utiliza servicios booleanos específicos, sino los del servicio que indexa.
El Servicio Altavista es fruto de un proyecto iniciado en los Laboratorios Digital de Palo Alto en California. En 1996 ya indexaba más de 30 millones de páginas Web y recibía más de 12 millones de consultas diarias. Es el servicio que presenta más funcionalidades avanzadas, mientras que Lycos es el que propone el mayor número de páginas preindexadas. Altavista se muestra como el servicio más intuitivo, sin embargo a menudo es el menos pertinente ya que Lycos suele proporcionar con frecuencia un excelente resultado de las búsquedas.
La indexación de las páginas se efectúa a través de un robot lógico desarrollado por Digital. Se considera como palabra en una página todas serie de letras y/o cifras separada de otra palabra por un espacio, un signo de puntuación o un carácter no alfabético. Los signos de puntuación no se indexan.
Simple Search o búsqueda simple:
Búsquedas específicas:
- Búsqueda por un enlace hipertexto, anchor:page
- Búsqueda de applet Java, applet:javaclass10
- Búsqueda en el nombre del servidor, host: nombre.org
- Búsqueda de una imagen, image: logonodo50.gif
- Búsqueda en el URL de un enlace, link:nodo50.org
- Búsqueda únicamente en el texto, text:Nodo50
- Búsqueda por un título de página, title:homepage
- Búsqueda en el interior de un URL, url:tintin.html
Advanced Search o búsqueda avanzada:
Permite realizar búsquedas asociando palabras clavecon operadores booleanos y paréntesis. Son posibles los operadores AND (&), OR (|), NEAR (~) y NOT (¡). Además es igual escribir en mayúsculas que en minúsculas.
Lista de motores de búsqueda por palabras clave:
Altavista altavista.digital.com
Y (AND, -), O (or, -), Ady (NEAR)
AliWeb web.nexor.co.uk o www.cs.indiana.edu/aliweb
ninguno
All in One www.albany.net/allione
M.
BIWE biwe.cesat.es
¿Dónde? donde.uji.es
CUI WWW cuiwww.unige.ch
O (or),Y (and), Y NO (not), Par.
CUSI pubweb.nexor.cuuk/public/cusi/cusi.html
M.
ElNet Galaxy www.einet.net/search/html O (or),
Y (and), Y NO (not)
Excite www.excite.com
O (OR), Y (AND, +) Y NO (AND NOT, -), Par.
GOD www.god.co.uk Ninguno
HotBot www.hotbot.com
Y , O, Menús
Infoseek guide.infoseek.com
Lycos www.lycos.com ó www.lycos.cs.cmu.edu
Magellan www.mckinley.com
O , Y (+), NO (-)
MetaCrawler metacrawler.cs.washington.edu:8080
O, Y (+), Y NO (-)
Micrososft www.msn.net/search.html
Netopen www.netopen.com
¡Olé¡ www.ole.es o www.ole.com
Opentext www.opentext.com:8080
Y, O, Y NO, Ady. Prox.
Ozú www.ozu.com
Savvy Search guaraldi.cscolostate.edu:2000
M.
Search www.search.com
M., Y (AND), O (OR)
Sleuth www.isleuth.com
M.
Web Search www.web-search.com
M.
Wizard www.compuserve.com/wizard/wizard.html
WWW Worm www.cs.colorado.edu/www
Y, O, Menús.
Yellow Web www.yweb.com
Y, O (botones).
Búsqueda de direcciones de correo
Durante mucho tiempo se ha pensado que la búsqueda en la línea
de la dirección de correo de un usuario de Internet era una tarea
difícil, casi imposible. Las razones son muy numerosas.
Los principales servicios de búsqueda de direcciones de correo son:
Otros servicios interesantes son:
Si cree que el interlocutor de quien busca la dirección ha enviado alguna vez una contribución a los foros de discusión existe una base de datos de las coordenadas electrónicas de las personas que han efectuado este tipo de operaciones. Para obtener esta información envíe un mensaje a la dirección de correo mail-server@rtfm.mit.edu con el texto send usenet-addresses/nombre donde nombre representa el nombre de la persona buscada.
Transcurridos unos minutos recibirá un mensaje con una lista de un máximo de 40 direcciones que incluyen el nombre especificado. Si desea especificar más nombres hay que separarlos por comas y el servidor realizará una operación lógica O con los nombres. No hay distinción entre mayúsculas y minúsculas y puede escribir varias líneas de código. Para más información envíe el mensaje send usenet-addresses/help o consulte la página Web de la dirección usenet-addresses.mit.edu.
Existe un foro de discusión específico para la búsqueda de informaciones sobre una persona. Sin embargo está sometido a ciertas restricciones : soc.net-people.
Búsqueda de listas de distribución
El principio de las listas de distribución se basa en la mensajería electrónica, pero la diferencia principal es que no se envía ya un mensaje a una persona sino a una lista de distribución, que representa un grupo de usuarios que se han abonado previamente.
Cuando alguien dirige un mensaje a una lista, la información se distribuye a todos los abonados de está que pueden ser miles. Usted mismo recibirá en su buzón todos los mensajes enviados a una lista a la que se haya abonado.
Estas listas de mensajería están normalmente relacionadas con un tema concreto. Todo ámbito de reflexión es susceptible de ser objeto de una lista. Toda persona puede implementar una de estas listas sin ninguna restricción, contrariamente a los foros de discusión.
Una lista de distribución tiene dos direcciones de correo: una dirección administrativa que sirve para abonos, bajas, etc., y una dirección para las propias discusiones. Para abonarse a una lista envíe un mensaje de este tipo: subscribe lista apellido nombre, donde lista es el nombre de la lista a la que desea abonarse.
La lista de listas está disponible en la sociedad SRI que tiene al día una gran archivo de más de 1MB que describe la mayoría de las listas de distribución (nombre, dirección de suscripción, responsable, descripción). Está lista puedes obtenerla, por ejemplo en: www.liszt.com
Búsqueda de servidores FTP
Los programas de FTP permiten acceder a distancia a ordenadores llamados servidores FTP que ponen a disposición de la comunidad documentos o aplicaciones para su descarga. FTP permite conectarse a estos servidores mediante un login anónimo. Permite realizar transferencias desde el servidor remoto al disco local y en algunas ocasiones en sentido inverso., pero esto no es normal sobre todo por medidas de seguridad.
La lista comentada de la mayor parte de los servidores FTP están disponibles en Internet vía web en: http://www.hoohoo.ncsa.uiuc.edu/ft/
Búsqueda de foros de discusión
Los News o Foros de discusión se encuentran a menudo en paralelo con las listas de distribución. Los dos procedimientos permiten el intercambio de información entre personas, en el interior de comunidades interesadas por un mismo tema de reflexión más o menos vasto.
Las listas de distribución se basan en el correo electrónico mientras que los foros de discusión se basan en una red específica llamada Usenet.
En las listas de distribución los mensajes se almacenan las máquinas de los abonados y son estos los que deciden cuando borrarlos. En los foros los mensajes se archivan en los servidores y se borrarán cuando el servidor lo crea necesario. Hay que tener en cuenta que varias veces al día todos los servidores se intercambian los mensajes para estar al día. Cada propietario de servidores de News decide cuales son los temas y por tanto los grupos que difundirá. Hay aproximadamente unos 22.000 en todo el mundo.
Para obtener informaciones sobre el servicio News,por ejemplo: http://www.dejanews.com
Metodología de búsqueda
No tomar nunca una información encontrada en Internet al pie de la letra. La información mayoritariamente que se encuentra es gratuita y por ello tiene sus ventajas e inconvenientes. No existe un estándar en la definición de un documento en Internet: autor, fecha de creación , tamaño, techa de actualización, todos estos datos son difíciles de encontrar si el creador de la información no los proporciona.
INFORMACIONES SOBRE PERSONAS.
Si conoces su nombre:
Si realmente cree que una persona está en Internet y no es capaz de encontrarla, hay otras direcciones, trucos y utilidades para su localización. Existe un artículo en muchos grupos de debate denominado “How to find people´s E-mail address”, que nos proporciona una serie de pasos en orden de probabilidad para buscar a alguien. Este documento actualizado puedes encontrarlo en ftp ://rtfm.mit.edu/pub/usenet/news.answers/finding-addresses.
Algunos grupos de debate donde se envía la información periódicamente son :
Existe una lista en el MIT que registra la dirección de
cualquiera que envíe un mensaje a un grupo de debate USENET. Se
puede interrogar enviando un mensaje :
To : mail-server@rtfm.mit.edu
Subject : sent usenet-addresses / nombre apellido
quit
Buscando gente en una lista de distribución :
Lo primero es utilizar el comando who nombre lista o review nombre lista
que dan los usuarios de la lista especificada.
Otra opción es enviar un mensaje a la dirección de peticiones
de la lista y preguntar si hay alguna lista pública de suscriptores.
Buscando gente en un dominio determinado :
Sabemos que cierta persona pertenece a un sitio de Internet, cuya dirección
de dominio conocemos pero el resto no. Siempre podemos confiar en el administrador
del gestor de correo (postmaster) y enviarle un mensaje solicitando la
información.
Por ejemplo mensaje al administrador : postmaster@nodo50.org, con el
campo de asunto : Buscando a pepito y con el cuerpo del mensaje : Deseo
información sobre el usuario....