Busquedas en Internet
Métodos de búsquedas activos y pasivos - Búsquedas en el web - Motores de búsqueda geográfica - Motores de búsqueda temática - Motores de búsqueda por palabras clave - Búsqueda de direcciones de correo - Búsqueda de listas de distribución - Búsqueda de servidores FTP - Búsqueda de foros de discusión - Metodología de búsqueda - Búsqueda gente en Internet
 
 
Parte de  las horas que pasamos delante del ordenador buscando información se pueden ahorrar aprendiendo cómo obtenerla y otra gran parte examinando y cribando datos completamente irrelevantes para nosotros.

Las herramientas más utilizadas en Internet se basan en el empleo de patrones de búsqueda. Casi nadie accede a bases de datos utilizando complicadas sesiones Telnet, normalmente se hace mediante sistemas de consulta más potentes y cómodos. La experiencia y habilidad para  usarlos correctamente es mucho mas importante si deseamos encontrar datos que nos sean útiles.

La crisis de la sobre información es bastante reciente y se debe a la incapacidad  de una sola persona de retener ni siquiera una mínima parte de la información que le es útil. El problema se grava cuando la información útil es a su vez una parte ínfima de toda la que recibe e inapreciablemente a toda la que tiene a su disposición.

Hasta ahora, cuando surgía la necesidad de informarse o formarse sobre un tema, la obtención y selección de la información se solía hacer a través de una biblioteca comprando algún libro o, aunque es mas difícil, encontrando algún amigo que nos resolviera la duda. En Internet, sin embargo, la distancia se hace relativa y las fuentes suelen ser  gratuitas.

Con tanta información disponible lo que debemos saber es cual nos interesa, donde encontrarla, como obtenerla y la  mejor manera de administrarla. Con la ayuda  de los navegadores de WWW se facilitan las tareas de localización y obtención, pero saber qué es lo que hay, lo que nos interesa y cómo  utilizarlo son cuestiones más complejas.

Hay varios métodos de afrontar el problema; lejos del “divagar” por la Red, que consiste en ir de enlace en enlace sin rumbo fijo, se puede intentar “navegar “ utilizando guías, listas de recursos clasificados, recetarios, etc. con resultados muy diversos. Esto es probablemente lo que llevamos haciendo desde hace tiempo.

Una vez localizadas páginas que contienen referencias a aquellos items de mayor interés, es habitual que el usuario haga una lista de los mismos; de hecho, con la  mayoría de navegadores de web , uno puede crearse una lista de enlaces o marcadores (denominada normalmente hotlist o boolmark list) accesible directamente  desde el visor e incluso generar páginas HTML, a partir de ella.

Para facilitar la tarea, cada día hay mas sitios dedicados a la creación y mantenimiento de listas y directorios de recursos organizados según criterios geográficos o  temáticos denominados generalmente “catálogos”. Pueden ser los puntos de partida ideales cuando buscamos información sobre un tema y queremos saber que hay en la Red  o buscamos algún servicio siguiendo criterios geográficos. A partir de las entradas del catálogo podemos ir descendiendo hasta encontrar  lo que realmente nos interesa, simplemente siguiendo la estructura lógica que define el servicio.

De todos modos, el empleo de los catálogos deja de ser adecuado cuando lo que buscamos es mas específico, ya que encontrarlo simplemente navegando puede resultar bastante difícil. Nos encontramos entonces con la necesidad de emplear herramientas para la búsqueda y selección de la información disponible en la Red. Estamos hablando de lo que hemos denominado “buscadores de información”.

Distinguiremos dos métodos de búsqueda en función de la manera de interactuar con las herramientas:
 

Búsquedas en el Web

Los sistemas de búsqueda mas usados actualmente son los basados en páginas de hipertexto (servicio WWW) donde se introducen patrones o palabras clave a buscar. Estas páginas actúan como intermediarias entre el usuario y una base de datos almacenada en el servidor o accesible para este. Algunos sistemas restringen la búsqueda al espacio WEB, pero la mayoría permiten buscar cualquier tipo de  recursos accesible mediante un URL.

Los sistemas de búsqueda deben indexar en una base de datos propia parte de toda la  información para no tener que recorrer toda la Red cada vez que se consulta. Los algoritmos utilizados en los programas de búsqueda se basan en estructurar  la información de manera que optimice las búsquedas. El resultado es que los sistemas son prácticamente instantáneos, aunque contengan millones de entradas.

En poco tiempo han aparecido un gran número de sistemas de búsqueda basados en el WEB, con una presentación y posibilidades cada día más atrayentes. Los usuarios se percatan de su existencia por comentarios en la Red, en revistas o a partir de  enlaces que aparecen en páginas muy visitadas. También ha contribuido mucho el  hecho de que muchos navegadores permiten acceder directamente a algunos de ellos desde un submenú

Para incluir referencias a páginas personales, lo único que debes hacer es seguir las instrucciones que se suele indicar en algún lugar de las páginas de búsqueda (generalmente mediante formularios). Así puede  ir dándose de alta en aquellos sistemas que le parezcan más interesantes,  el problema es que enviar un resumen de sus páginas a todos los buscadores se puede hacer  pesado.
 
En los buscadores que ofrecen el servicio gratuitamente, la causa de sustento económico es la  popularidad, que se traduce a efectos comerciales en “audiencia” lo que les permite incluir publicidad en sus páginas, y como no, cobrar por ello.

Cuando terminas una nueva página  puede enviar un mensaje anunciándolo a las listas de correo o anunciándolo en un grupo de news y también puedes introducir la referencia en algunos de los motores de búsqueda como www.yahoo.com ó www.ozu.com
 

Motores de búsqueda geográfica

Es posible buscar información por aproximación geográfica. Este tipo de motor resulta útil si se busca un servicio en un país que aún no cuenta con un gran número de servidores Web. Este tipo de búsqueda se utiliza raramente salvo cuando se conoce con cierta exactitud el nombre del organismo buscado y especialmente su localización.

La interfaz muestra un mapa o lista de países y solicita la zona deseada. La búsqueda se realiza entonces por acercamiento progresivo, sobre mapas o sobre listas cada vez más refinadas (países, regiones, ciudades) hasta llegar a una compilación de los servicios disponibles.

Existen un gran número de este tipo de servicios que recogen geográficamente los recursos de la Web. Algunos están especializados en un continente mientras otras son específicos de un país. A continuación algunos ejemplos:
 

 
Motores de búsqueda temática

 
Son servicios que intentan recoger los recursos de la Web clasificados por temas. La búsqueda se hace a través de rúbricas cada vez más precisas, para llegar a una lista de sedes pertenecientes a una categoría lo más precisa posible.

 El Servicio Yahoo!  (Yet Another Hierarchical Officious Oracle ó rústico) es el ejemplo más clásico de motor de búsqueda temática.  En su página de bienvenida ofrece varias opciones:

Además de navegación por categorías y subcategorías ofrece la posibilidad de buscar información por palabras clave. Contrariamente a los Motores de búsquedas por palabras clave no efectúa búsquedas por texto completo sobre el contenido de las  páginas Web de todo el mundo. Sus búsquedas se limitan a comentarios proporcionados por las direcciones de las sedes y no son sensibles a mayúsculas y minúsculas.  Después de introducir la palabras clave separadas por espacios se indicarán: En las pantallas siguientes, un cierto número de iconos permiten saber más sobre un enlace determinado: Lista de motores de búsqueda temática:  Motores de búsqueda por palabras clave
 
El servicio indexa previamente un cierto número de páginas de la Web de todo el planeta. Esta indexación se efectúa por texto completo y todas las palabras de todas las páginas referenciadas se convierten en entradas del índice, potencialmente objeto de la búsqueda.

La indexación previa de las páginas puede hacerse de dos formas distintas:

El usuario introducirá una o varias palabras clave enlazadas entre sí por operadores booleanos y el motor le buscará las concurrencias de esas palabras en las páginas fuente. Se establece seguidamente una clasificación de las páginas más pertinentes y se presenta finalmente una lista de enlace hacia dichas páginas.
 

Cuando un usuario introduce una palabra clave el sistema no se conecta en tiempo real a todos los servidores sino que efectúa sus búsquedas en el interior de las páginas que anteriormente ha almacenado en sus peregrinaciones por la Web. Puede ocurrir por tanto que una información actualizada diariamente en la Web esté presente en una sede Web, pero no se encuentre por medio del motor ya que este habrá capturado sus informaciones la semana anterior.

Los motores de búsqueda son más o menos potentes, bien por el número de páginas indexadas por adelantado, bien por la posibilidad de enlazar las palabras clave por medio de operadores booleanos distintos, o bien por un cierto número de opciones que veremos más adelante. Un Metaservidor no utiliza servicios booleanos específicos, sino los del servicio que indexa.

El Servicio Altavista es fruto de un proyecto iniciado en los Laboratorios Digital de Palo Alto en California. En 1996 ya indexaba más de 30 millones de páginas Web y recibía más de 12 millones de consultas diarias. Es el servicio que presenta más funcionalidades avanzadas, mientras que Lycos es el que propone el mayor número de páginas preindexadas. Altavista se muestra como el servicio más intuitivo, sin embargo a menudo es el menos pertinente ya que Lycos suele proporcionar con frecuencia un excelente resultado de las búsquedas.

La indexación de las páginas se efectúa a través de un robot lógico desarrollado por Digital. Se considera como palabra en una página todas serie de letras y/o cifras separada de otra palabra por un espacio, un signo de puntuación o un carácter no alfabético. Los signos de puntuación no se indexan.

Simple Search o búsqueda simple:
 

Búsquedas específicas:

- Búsqueda por un enlace hipertexto, anchor:page
- Búsqueda de applet Java, applet:javaclass10
- Búsqueda en el nombre del servidor, host: nombre.org
- Búsqueda de una imagen, image: logonodo50.gif
- Búsqueda en el URL de un enlace, link:nodo50.org
- Búsqueda únicamente en el texto, text:Nodo50
- Búsqueda por un título de página, title:homepage
- Búsqueda en el interior de un URL, url:tintin.html

Advanced Search o búsqueda avanzada:

Permite realizar búsquedas asociando palabras clavecon operadores booleanos y paréntesis. Son posibles los operadores AND (&), OR (|), NEAR (~) y NOT (¡). Además es igual escribir en mayúsculas que en minúsculas.

Lista de motores de búsqueda por palabras clave:

Altavista     altavista.digital.com     Y (AND, -), O  (or, -), Ady (NEAR)
AliWeb     web.nexor.co.uk o www.cs.indiana.edu/aliweb     ninguno
All in One     www.albany.net/allione     M.
BIWE     biwe.cesat.es
¿Dónde?     donde.uji.es
CUI WWW     cuiwww.unige.ch     O (or),Y (and), Y NO (not),  Par.
CUSI     pubweb.nexor.cuuk/public/cusi/cusi.html     M.
ElNet     Galaxy www.einet.net/search/html O (or), Y (and), Y NO (not)
Excite     www.excite.com     O (OR), Y (AND, +) Y NO (AND NOT, -), Par.
GOD     www.god.co.uk     Ninguno
HotBot     www.hotbot.com     Y , O, Menús
Infoseek     guide.infoseek.com
Lycos     www.lycos.com ó www.lycos.cs.cmu.edu
Magellan     www.mckinley.com     O , Y (+), NO (-)
MetaCrawler     metacrawler.cs.washington.edu:8080     O, Y (+), Y NO (-)
Micrososft     www.msn.net/search.html
Netopen     www.netopen.com
¡Olé¡     www.ole.es o www.ole.com
Opentext     www.opentext.com:8080     Y, O, Y NO, Ady. Prox.
Ozú     www.ozu.com
Savvy     Search guaraldi.cscolostate.edu:2000     M.
Search     www.search.com     M., Y (AND), O (OR)
Sleuth     www.isleuth.com     M.
Web Search      www.web-search.com     M.
Wizard     www.compuserve.com/wizard/wizard.html
WWW     Worm www.cs.colorado.edu/www     Y, O, Menús.
Yellow Web      www.yweb.com     Y, O (botones).
 
 
Búsqueda  de direcciones de correo

Durante mucho tiempo se ha pensado que la búsqueda en la línea de la dirección de correo de un usuario de Internet era una tarea difícil, casi imposible. Las razones son muy numerosas.
 

Existen servicios actuales que proporcionan resultados muy satisfactorios: anuarios presentes en la red, foros de discusión, formularios de declaración voluntaria en el Web, etc., pero no hay que olvidar el derecho de todo usuario a que no se publique su dirección de correo.

Los principales servicios de búsqueda de direcciones de correo son:

Otros servicios interesantes son:

Si cree que el interlocutor de quien busca la dirección ha enviado alguna vez una contribución a los foros de discusión existe una base de datos de las coordenadas electrónicas de las personas que han efectuado este tipo de operaciones. Para obtener esta información envíe un mensaje a la dirección de correo mail-server@rtfm.mit.edu con el texto send usenet-addresses/nombre donde nombre representa el nombre de la persona buscada.

Transcurridos unos minutos recibirá un mensaje con una lista de un máximo de 40 direcciones que  incluyen el nombre especificado. Si desea especificar más nombres hay que separarlos por comas y el servidor realizará una operación lógica O con los nombres. No hay distinción entre mayúsculas y minúsculas y puede escribir varias líneas de código. Para más información envíe el mensaje send usenet-addresses/help o consulte la página Web de la dirección usenet-addresses.mit.edu.

Existe un foro de discusión específico para la búsqueda de informaciones sobre una persona. Sin embargo está sometido a ciertas restricciones : soc.net-people.

Búsqueda de listas de distribución

El principio de las listas de distribución se basa en la mensajería electrónica, pero la diferencia principal es que no se envía ya un mensaje a una persona sino a una lista de distribución, que representa un grupo de usuarios que se han abonado previamente.

Cuando alguien dirige un mensaje a una lista, la información se distribuye a todos los abonados de está que pueden ser miles. Usted mismo recibirá en su buzón todos los mensajes enviados a una lista a la que se haya abonado.

Estas listas de mensajería están normalmente relacionadas con un tema concreto. Todo ámbito de reflexión es susceptible de ser objeto de una lista. Toda persona puede implementar una de estas listas sin ninguna restricción, contrariamente a los foros de discusión.

Una lista de distribución tiene dos direcciones de correo: una dirección administrativa que sirve para abonos, bajas, etc., y una dirección para las propias discusiones. Para abonarse a una lista envíe un mensaje de este tipo: subscribe lista apellido nombre, donde lista es el nombre de la lista a la que desea abonarse.

 La lista de listas está disponible en la sociedad SRI que tiene al día una gran archivo de más de 1MB que describe la mayoría de las listas de distribución (nombre, dirección de suscripción, responsable, descripción). Está lista puedes obtenerla, por ejemplo en: www.liszt.com

Búsqueda de servidores FTP

Los programas de FTP permiten acceder a distancia a ordenadores llamados servidores FTP que ponen a disposición de la comunidad documentos o aplicaciones para su descarga. FTP permite conectarse a estos servidores mediante un login anónimo. Permite realizar transferencias desde el servidor remoto al disco local y en algunas ocasiones en sentido inverso., pero esto no es normal sobre todo por medidas de seguridad.

La lista comentada de la mayor parte de los servidores FTP están disponibles en Internet vía web en: http://www.hoohoo.ncsa.uiuc.edu/ft/

 
Búsqueda de foros de discusión

Los News o Foros de discusión se encuentran a menudo en paralelo con las listas de distribución. Los dos procedimientos permiten el intercambio de información entre personas, en el interior de comunidades interesadas por un mismo tema de reflexión más o menos vasto.

Las listas de distribución se basan en el correo electrónico mientras que los foros de discusión se basan en una red específica llamada Usenet.

En las listas de distribución los mensajes se almacenan las máquinas de los abonados y son estos los que deciden cuando borrarlos. En  los foros los mensajes se archivan en los servidores y se borrarán cuando el servidor lo crea necesario. Hay que tener en cuenta que varias veces al día todos los servidores se intercambian los mensajes para estar al día. Cada propietario de servidores de News decide cuales son los temas y por tanto los grupos que difundirá. Hay aproximadamente unos 22.000 en todo el mundo.

Para obtener informaciones sobre el servicio News,por ejemplo: http://www.dejanews.com
 
Metodología de búsqueda

No tomar nunca una información encontrada en Internet al pie de la letra. La información mayoritariamente que se encuentra es gratuita y por ello tiene sus ventajas e inconvenientes. No existe un estándar en la definición de un documento en Internet: autor, fecha de creación , tamaño, techa de actualización, todos estos datos son difíciles de encontrar si el creador de la información no los proporciona.

INFORMACIONES SOBRE PERSONAS.
 

 
BÚSQUEDA DE UNA ORGANIZACION

Si conoces su nombre:

Búsqueda gente en Internet

Si realmente cree que una persona está en Internet y no es capaz de encontrarla, hay otras direcciones, trucos y utilidades para su localización. Existe un artículo en muchos grupos de debate denominado “How to find people´s E-mail address”, que nos proporciona una serie de pasos en orden de probabilidad para buscar a alguien. Este documento actualizado puedes encontrarlo en ftp ://rtfm.mit.edu/pub/usenet/news.answers/finding-addresses.

Algunos grupos de debate donde se envía la información periódicamente son :

Buscando gente en USENET :

Existe una lista en el MIT  que registra la dirección de cualquiera que envíe un mensaje a un grupo de debate USENET. Se puede interrogar enviando un mensaje :
To : mail-server@rtfm.mit.edu
Subject : sent usenet-addresses / nombre apellido
quit
 
Buscando gente en una lista de distribución :

Lo primero es utilizar el comando who nombre lista o review nombre lista que dan los usuarios de la lista especificada.
 
Otra opción es enviar un mensaje a la dirección de peticiones de la lista y preguntar si hay alguna lista pública de suscriptores.
 
Buscando gente en un dominio determinado :

Sabemos que cierta persona pertenece a un sitio de Internet, cuya dirección de dominio conocemos pero el resto no. Siempre podemos confiar en el administrador del gestor de correo (postmaster) y enviarle un mensaje solicitando la información.
 
Por ejemplo mensaje al administrador : postmaster@nodo50.org, con el campo de asunto : Buscando a pepito y con el cuerpo del mensaje : Deseo información sobre el usuario....