Seminario de Buscadores

Transcript Seminario de Buscadores

UNIVERSIDAD DE VERANO
DE LA GOMERA - 2008
BUSQUEDA DE INFORMACIÓN Y
CONOCIMIENTO
Taller de Buscadores
29 de Julio de 2008
Prof. Luis Joyanes Aguilar
Catedrático de Informática
UNIVERSIDAD PONTIFICIA DE SALAMANCA EN MADRID
Facultad de Informática
1
ÍNDICE





Buscadores vs Buscadores
El Caso Google
La Revolución de GMAIL
¿Cómo nos ven los buscadores?
Etiquetas de Posicionamiento
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
BUSCADORES
INDICE
 Búsqueda de Información.
 Clasificación de Herramientas.
 Directorios vs. Motores de Búsqueda.
 Estudio Práctico de Directorios.
 Elección del Motor de Búsqueda.
 Motores de Búsqueda Especializados.
 Funcionamiento de los motores de búsqueda.
 El directorio Público DMOZ.
 Otros Motores de Búsqueda Destacados.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
UBICUIDAD DE LAS BÚSQUEDAS
Dispositivos móviles
Tecnologías RFID...
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Web Superficial
Web Invisible
Conocimiento Humano
PERSONALIZACIÓN
•Buscadores Contextuales
•Buscadores Sociales
•Buscadores que aprenden
....
“Poner al usuario al volante”
(Ramesh Jain)
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
ETIQUETAJE SEMÁNTICO
•Etiquetaje por parte de:
•Diseñadores (Web Semántica)
•Editores (Blogs)
•Usuarios (Folksonomies)
•Acceso a través de
•“Etiquetas semánticas”
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
CLASIFICACIÓN DEINDICE
HERRAMIENTAS
 Índices o Directorios.
 Motores de Búsqueda.
 Buscadores por categorías
 Buscadores por contenido
 Buscadores temáticos
 Meta - Buscadores.
 Multibuscadores.
 Buscadores de Portal.
 FFA – Enlaces Gratuitos para todos.
 P2P
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
CLASIFICACIÓN DEINDICE
HERRAMIENTAS (2)
Buscadores por categorías
Buscadores por contenido
Buscadores temáticos
Definición
Bases de datos de páginas
Web
estructuradas por categorías
BBDD que mantienen índices
a páginas web
Guía jerárquica que va de
los temas mas generales a
los mas particulares
Funcionamiento
Emplea un árbol jerárquico
organizado por categorías en el
que buscará la información
Un “programa” busca en la red
todas aquellas referencias a la
información solicitada
Iremos seleccionando por
la estructura de temas y
subtemas hasta llegar al
que nos proporcione la
información
Cuando son útiles
Cuando tenemos clara la
categoría de la información
Cuando queremos encontrar
poca información pero precisa
Cuando no se tiene clara la
categoría de la información
Cuando se quieren obtener un
gran número de resultados
Cuando tenemos
totalmente claro sobre que
tema queremos obtener
información
Ejemplos
Yahoo
LookSmart
Altavista
Google
Opositor
Capitanes
Animeassault
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
CLASIFICACIÓN DEINDICE
HERRAMIENTAS (3)
 META-BUSCADORES
 Debe soportar, de acuerdo con los requerimientos de los motores de
búsqueda, diferentes formatos de consultas y de salidas.
MetaCrawler como un claro ejemplo.
 Con el objetivo de filtrar la información de salida, los metabuscadores deben eliminar los resultados duplicados suministrados
por los diferentes buscadores y de alguna forma también conseguir
eliminar páginas “outdated” o desfasadas.
 Basándose en los resultados obtenidos un meta-buscador debería ser
capaz de post-procesar la información y realizar un nuevo ranking de
los resultados de acuerdo con la búsqueda inicial que propuso el
usuario.
 Por último el meta-buscador debería, según estos autores, presentar
una interfaz de usuario unificada que muestre los resultados de una
forma clara y sencilla.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
CLASIFICACIÓN DEINDICE
HERRAMIENTAS (4)
 META-BUSCADORES II - Ejemplos
 Metacrawler - www.metacrawler.com
 DogPile - Metabuscador de 13 motores de búsqueda, 6 Use2net y 2







buscadores FTP - www.dogpile.com
SurfWax – Busca en los más importantes motores de búsqueda,
incluidos directorios públicos. www.surfwax.com
All4one - Busca en 4 motores de búsqueda simultáneamente
www.all4one.com
Ixquick - Busca en 14 motores de búsqueda simultáneamente
http://ixquick.com
Mamma- Busca en más de 12 motores de búsqueda simultáneamente
www.mamma.com
MetaBusca – Busca en 21 motores de búsqueda
www.metabusca.com
Vivisimo – Busca en 5 buscadores ofreciendo un clúster de
resultados. http://vivisimo.com
Grokker – Busca en 3 buscadores ofreciendo un clúster de
resultados. www.grokker.com
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
CLASIFICACIÓN DEINDICE
HERRAMIENTAS (5)
 MULTIBUSCADOR vs META-BUSCADOR Ejemplos
 Search – www.search.com
 8C – www.8c.com
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
DIRECTORIOS VS. INDICE
MOTORES DE BÚSQUEDA
 Estudio Práctico de Directorios.
 Métodos de Búsqueda de Información en Directorios.
 Cuadros de Diálogo donde introducir el texto.
 Prueba 1: Obtener información acerca de coaching e inteligencia
emocional a través de Yahoo.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
INDICE DE BÚSQUEDA (2)
DIRECTORIOS VS. MOTORES
 Prueba 2: Obtener información acerca de coaching e inteligencia
emocional a través de Lycos
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
INDICE DE BÚSQUEDA (3)
DIRECTORIOS VS. MOTORES
 Recorrer las Categorías que nos ofrece el Directorio.
 Prueba 3: Obtener información acerca de casas rurales en la
provincia de Cantabria a través de Yahoo mediante sus categorías
• Seleccionamos Deportes y Ocio.
• Seleccionamos Turismo.
• Seleccionamos Turismo Rural.
• Seleccionamos Casas Rurales.
• Seleccionamos Cantabria.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
INDICE DE BÚSQUEDA (4)
DIRECTORIOS VS. MOTORES
 Estudio Práctico de Motores de Búsqueda.
 Los motores de búsqueda están compuestos por tres pilares
importantes:
 El mecanismo que identifica las páginas web que serán
introducidas en la base de datos del buscador.
 Un mecanismo que indexe los sitios.
 Un mecanismo de búsqueda dotado de una interfaz lo más
sencilla posible.
 Prueba 4: Obtener información acerca de casas rurales en la
provincia de Cantabria a través de Altavista.
2190 Resultados – Altavista.
23 Resultados – Directorio Yahoo
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
INDICE DE BÚSQUEDA (5)
DIRECTORIOS VS. MOTORES
Directorios
Ventajas
Inconvenientes
Cuando conocemos muy bien aquellos que
queremos buscar, presentan una gran precisión
Si no tenemos muy claro aquello que queremos
obtener nos podemos perder en la estructura
jerárquica
Los comentarios que el índice añade junto con
los enlaces nos proporcionan una información
muy valiosa
No se puede acceder mediante ellos a páginas
personales o que tengan muy poca relevancia
No incluyen en sus resultados información
“basura”
Como el proceso de indexación de páginas es
manual corren el riesgo de no estar muy
actualizados
Si la información buscada no se encuentra en el
directorio utilizará el motor que se encuentra por
debajo para ofrecer siempre resultados
En muchas ocasiones el método de búsqueda
por navegación se puede hacer lento y pesado
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
INDICE DE BÚSQUEDA (6)
DIRECTORIOS VS. MOTORES
Motores de búsqueda
Ventajas
Inconvenientes
Manejan grandes bases de
datos que nos permiten obtener
una gran cantidad de
información
Dependen de la forma de
operación de su componente
automática software para
encontrar información
El método de obtención de
información es extremadamente
sencillo
La información es presentada
sin tratamiento y muchas veces
incluye muchos enlaces
“basura”
Si queremos dar de alta una
página simplemente daremos la
dirección web de la misma, el
software inteligente se
encargara de visitarla e
indexarla
El gran número de resultados
que proporciona puede ser un
problema y deberemos conocer
como realizar de forma
adecuada la consulta
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
INDICEEL MOTOR DE BÚSQUEDA
CRITERIOS PARA SELECCIONAR
 Calidad de Interfaz

La interfaz es lo primero con lo que topamos al acceder a un
motor de búsqueda y para muchas personas es factor
determinante a la hora de decantarse por un buscador o por otro.
En la siguiente tabla podemos observar diferentes interfaces de
buscadores. La calidad del interfaz no puede en ningún caso
considerarse determinante para evaluar a un motor de búsqueda
frente a otro
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
INDICE
CRITERIOS PARA SELECCIONAR
EL MOTOR DE BÚSQUEDA (2)
 Número de resultados

En las pruebas realizadas nos hemos dado cuenta de que no por
ofrecer un número inmenso de resultados estos serán mejores o
más acertados. Por lo tanto a la hora de decantarnos por un
buscador u otro evaluando el número de resultados,
recomendamos elegir aquel que proporcione unos resultados que
no sean tan numerosos como para no identificar cual de ellos es
verdaderamente relevante ni tan escasos para no hallar la
información buscada. Siempre intentaremos por lo tanto elegir
aquel buscador que proporcione un número medio de resultados.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
INDICE
CRITERIOS PARA SELECCIONAR
EL MOTOR DE BÚSQUEDA (3)
 Exhaustividad

Un motor de búsqueda será mas exhaustivo que otro si
referencia en su base de datos el mayor número de referencias a
páginas web de Internet. Este criterio es de difícil apreciación por
parte de un usuario medio y por lo tanto muy pocos de estos
usuarios se decantaran por un buscador determinado teniendo
este dato en cuenta.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
INDICE
CRITERIOS PARA SELECCIONAR
EL MOTOR DE BÚSQUEDA (4)
 Calidad del lenguaje de consulta

Este criterio indica lo flexible que puede llegar a ser el lenguaje
mediante el cual el buscador consulta su base de datos. Cuanto
más flexible sea el lenguaje más se podrá mejorar los resultados
de nuestra búsqueda conociendo los operadores de los que
dispone el motor. Para los usuarios avanzados este criterio si que
puede ser importante a la hora de decantarse por un buscador u
otro ya que si se conoce la forma de operar del mismo se pueden
obtener resultados mucho más precisos, con la misma cadena de
búsqueda, en un buscador que en otro.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
INDICE
CRITERIOS PARA SELECCIONAR
EL MOTOR DE BÚSQUEDA (5)
 Servicios adicionales ofrecidos

Hoy en día muchas son las personas que buscan, con el acceso a
una sola url de Internet, obtener todos los servicios que
necesitan. Con esta idea surgieron los portales y la mayoría de
ellos ofrecían un buscador que junto con servicios de correo,
disco virtual, noticias… querían cubrir todo el espacio de
necesidades de un usuario. Es importante indicar que la mayoría
de portales al incluir un servicio de búsqueda de información se
fundamentan en el motor proporcionado por algunos de los
buscadores más importantes de la red. Por lo tanto si lo que
queremos es buscar información eficiente y de una forma rápida,
en nuestra opinión, no debemos acudir a portales, más indicados
para ofrecer a alguien que no dispone de mucho tiempo, una
gran cantidad de servicios que en la mayoría de los casos no son
de mucha calidad.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
INDICE
CRITERIOS PARA SELECCIONAR
EL MOTOR DE BÚSQUEDA (7)
 Velocidad

Para muchos usuarios sobre todo para los menos avezados en la
materia es el criterio que seleccionan a la hora de decantarse por
un buscador. Nos referimos con velocidad al tiempo que un
buscador tarda en ofrecernos el conjunto de resultados para una
consulta determinada. Si bien este criterio depende en gran
medida de la conexión de la que disponga el usuario, es cierto
que algunos buscadores ofrecen sus resultados extremadamente
deprisa. En nuestra opinión este hecho se debe precisamente a
que estos buscadores indexan en sus bases de datos una
información más bien escasa y nos ofrecerán pocos resultados en
un tiempo muy reducido, si eso es lo que se busca serán una
buena opción pero si pretendemos obtener un número elevado
de resultados no nos debemos decantar por ellos.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
MOTORES DE BÚSQUEDA ESPECIALIZADOS
Buscador de Buscadores
Especializados
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
MOTORES DE BÚSQUEDA ESPECIALIZADOS
INDICE (2)

Prueba 6: Búsqueda de imágenes en el buscador temático Ditto

Prueba 7: Búsqueda de información personal en el buscador
temático SwitchBoard
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
FUNCIONAMIENTO DE LOS MOTORES
DE BÚSQUEDA
INDICE
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
EL DIRECTORIO PÚBLICO DMOZ
INDICE
 OPEN DIRECTORY PROJECT
La meta de este proyecto es conseguir el directorio más completo
de la red gracias a la colaboración de lo que Dmoz denomina
editores y puede organizar una pequeña parte de la web,
filtrando los resultados incorrectos y obsoletos y ofreciendo de
este modo una información actualizada..
 Este proyecto surgió por la necesidad de aumentar el número de
personas encargadas de “vigilar” la web y de tener actualizada la
información de sus directorios y que mejor forma que proponer
una comunidad en la que cualquier persona del mundo realice
por muy pequeña que sea su aportación en esta causa.
 Netscape Communication Corporation, administra y aloja la gran
cantidad de información necesaria para llevar a cabo un proyecto
de estas características.

© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
EL DIRECTORIO PÚBLICO DMOZ
(1)
INDICE
Datos Dmoz a fecha de 08/12/2007
Nº editores
Categorías
Paginas web
75.151
590,000
4.830.584
http://dmoz.org
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
OTROS MOTORES DE BÚSQUEDA
DESTACASDOS (1)
INDICE
 Live - Microsoft www.live.com
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
OTROS MOTORES DE BÚSQUEDA
DESTACASDOS (2)
INDICE
 Live Microsoft www.live.com
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
OTROS MOTORES DE BÚSQUEDA
DESTACASDOS (3)
INDICE
 ASK www.ask.com
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
OTROS MOTORES DE BÚSQUEDA
DESTACASDOS (4)
INDICE
 ASK – DICTIONARY SEARCH
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
OTROS MOTORES DE BÚSQUEDA
DESTACASDOS (5)
INDICE
 CLUSTY – clusty.com
Buscador basado en Cluster
Propiedad de Vivísimo
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
OTROS MOTORES DE BÚSQUEDA
DESTACASDOS (6)
INDICE
 CLUSTY – clusty.com
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
OTROS MOTORES DE BÚSQUEDA
DESTACASDOS (7)
INDICE
 A9 - AMAZON www.a9.com
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
OTROS MOTORES DE BÚSQUEDA
DESTACASDOS (8)
INDICE
 A9 – AMAZON www.a9.com
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
OTROS MOTORES DE BÚSQUEDA
DESTACASDOS (9)
INDICE
 Noxtrum www.noxtrum.com
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
OTROS MOTORES DE BÚSQUEDA
DESTACASDOS (10)
INDICE
 Noxtrum www.noxtrum.com
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
OTROS MOTORES DE BÚSQUEDA
DESTACASDOS (11)
INDICE
 MSDEWEY www.msdewey.com
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
OTROS MOTORES DE BÚSQUEDA
DESTACASDOS (12)
INDICE
 MSDEWEY www.msdewey.com
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
OTROS MOTORES DE BÚSQUEDA
DESTACASDOS (13)
INDICE
 TAFITI www.tafiti.com
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
OTROS MOTORES DE BÚSQUEDA
DESTACASDOS (14)
INDICE
 TAFITI www.tafiti.com
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
OTROS MOTORES DE BÚSQUEDA
DESTACASDOS (15)
INDICE
 SEARCH MASH http://seachcmash.com
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
OTROS MOTORES DE BÚSQUEDA
DESTACASDOS (14)
INDICE
 SEARCH MASH http://searchmash.com
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
OTROS MOTORES DE BÚSQUEDA
DESTACASDOS (17)
INDICE
 UNIVERSIA http://www.universia.net
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
OTROS MOTORES DE BÚSQUEDA
DESTACASDOS (18)
INDICE









YubNub www.yubnub.org
Ujiko www.ujiko.com
Retrevo www.retrevo.com
Talk Digger www.talkdigger.com
Snap www.snap.com
Inquisitor www.inquisitorx.com
Alexa www.alexa.com
PodZinger, Pluggd
Powerset (Apuesta por el Lenguaje Natural)
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Contenedores de Información (1)
 Whathis
//whathis.techtarget.com
 Wikipedia
//www.wikipedia.com
 Webopedia
//www.pcWebopedia.com
 Netlingo
//netlingo.com/framexindex.html
 Tech Enciclopedia
//www.techWeb.com/encyclopedia
 Glosario Internet
//www.ati.es/novatica/glointv2.html
 Vocabulario
//jamillan.com/v_index.htm
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Contenedores de Información (2)
 Encontrar comentarios en weblogs
 Essential Blogging
//www.oreilly.com/catalog/essblogging
 Encontrar weblogs
 Movible Type
//www.movabletype.org
 Radio Userland //radiouserland.com
 Blogger
//www.blogger.com
 Radio Userland //radio.Weblogs.com
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Contenedores de Información (3)
 Blogger
 “powered by blogger” o bien site:blogspot.com
 Blosxom
 “powered ny nlosxom”
 Geeklog
 “powered by geeklog”
 Technorati
 Site:technorati.com
 MiWeblog
 Site:miweblog.net
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
CASO
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Por qué no se puede competir con Google (1)
 Una enorme infraestructura. La ventaja evidente de Google es su
gigantesca infraestructura, distribuida en más de 450.000 servidores
de todo el mundo. Eso reduce los retrasos y permite un servicio más
rápido (y mejor).
 Productos con los que Google aprende. Conocer a los usuarios se
traduce en una publicidad mejor dirigida. Los servicios avanzados de
Google (como Google Reader, por ejemplo), proporcionan información
sobre los usuarios de la que Google aprende.
 Fibra óptica y estrategia móvil. Por un lado, Google está
comprando fibra óptica para crear su propia red. Por otro, va
poniendo los principios en la navegación por Internet desde teléfonos
móviles.
 Contactos. Google está conectado con los grandes del sector de las
tecnologías y los grandes medios de comunicación. Por ejemplo, con
Apple, CBS o Viacom.
 Una marca omnipresente. Google es una de las marcas más
famosas del mundo, e incluso ha sido reconocida en el Diccionario de
Inglés de Oxford como verbo.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Por qué no se puede competir con Google (2)
 Acuerdos con distribuidores. Google tiene acuerdos con los
principales distribuidores para su software, como Dell, Mozilla, Adobe
o DivX.
 Una enorme cola de clientes base. Google le facilita la vida a
mucha gente normal.
 Alcance global. Además de tener casi 8.000 empleados repartidos
por todo el mundo, Google trata de ajustarse a diferentes idiomas y
culturas.
 Empresas. Además del buscador que todos conocemos, Google
también ofrece servicios de búsqueda para empresas.
 El avión de Sergey y Larry, los fundadores de Google. Que es
alucinante.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
GOOGLE: EL COMIENZO 1995
 Primavera 1995: Sergey Brin (23 años entonces) y Larry Page (24),
confundadores de Google y actualmente presidente y CEO, se
conocen en un acto que la Universidad de Stanford organiza para los
candidatos de su Doctorado en Informática.
 Otoño 1995: Larry y Sergey comienzan a trabajar en el 'Digital Library
Project' de la Universidad de Stanford. Larry Page, con experiencia en
diseño web y el título de Ingeniero Eléctrico, y Sergey Brin, un
experto en tratamiento de datos y Licenciado en Informática y
Ciencias Matemáticas, comienzan a crear un algoritmo para la
búsqueda de datos. Esta tecnología se convertirá mas tarde en el
corazón que hará funcionar a Google.
 El nombre que Larry Page da a esta tecnologia fue 'PageRank'. En su
pagina web personal de la Universidad de Stanford, colgará en 1997
una presentacion que lo explica: 'PageRank: Bringing Order to the
Web'.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
1996
 Enero 1996: Comienzan a desarrollar un buscador llamado 'BackRub'.
Este nombre se lo dan debido a que la mayor habilidad de este motor
de búsqueda es analizar los 'back links' (enlaces que apuntan a una
determinada página).
 Tal y como indican en su descripción, Backrub está escrito en Java y
Python (incluso Larry Page postea alguna duda en los 'newsgroups'),
y corre sobre varias máquinas Sun Ultra y Intel Pentium con Linux. La
Base de Datos está alojada en un ordenador Sun Ultra II con 28GB de
disco duro.
 Si tienes cualquier duda sobre el funcionamiento de este buscador, y
no está contestada en sus FAQ, puedes llamar al (415) 723-3154, y
preguntar por Larry. Los primeros usuarios son los alumnos y
profesores de Stanford, que disfrutan de la precisión con la que el
buscador encuentra datos en la web.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
1997
 1997: 'Backrub' se transforma en 'Google'. Le otorgan este peculiar
nombre por su parecido a la palabra 'googol', que en inglés es el
nombre que que se da a la cifra '10 elevado a 100' (un uno seguido
de 100 ceros). Ya tienen indexadas 24 millones de páginas. Mucho
antes, ya han tenido problemas de capacidad en sus discos duros, y
han tenido que idear ingenios basados en Lego.
 En los comienzos de Google (en el dominio google.stanford.edu), su
diseño es aún más austero de lo que será posteriormente. En esta
antigua versión se incluyen fotografías de los equipos que utilizan.
 1997: Larry y Sergey han registrado el dominio 'google.com'. Además,
han dado a conocer su tecnología a la 'Office of Technology Licensing'
(OTL) de la Universidad de Stanford, que será la encargada de
contactar con diferentes compañías de Internet que puedan estar
interesadas en Google.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Evolución en el tiempo
•Anuncios textuales (Enero 2000)
•AdWords (Octubre 2000)
•Subasta palabras clave y pago por click (2002)
•Servicios especializados (a partir de 2003)
•1998: Google es un proyecto universitario
•Se ofrece por 1,6M$, Excite ofrece 0,75M$
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
2004: Google sale a Bolsa
Google vale unos 130.000M$
casi del doble que Telefónica
(24-04-2006)
GOOGLE
 Para buscar y encontrar en Internet normalmente sólo se
necesita el buscador Google.
Ventajas:
 Dispone de un sistema sencillo de búsqueda pero muy potente.
 Busca no sólo las páginas principales sino dentro de todas las
páginas de millones de webs.
“Si no está en Google no está en Internet”
 Ordena los resultados por importancia. Basándose en el principio
de que las páginas más referenciadas son las mejores
 Presenta en primer lugar las páginas que mejor pueden responder
a la búsqueda del usuario.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
GOOGLE – ALGORIMO DE BÚSQUEDA (0)
 PageRank: Algoritmo de búsqueda utilizado por Google
hasta ahora.
 Su finalidad es asignar un valor numérico a las páginas
web según el número de veces que otras las recomiendan
y según el PageRank que estas tienen a su vez.
 Lógica: si una página web enlaza con otra página, es que
la está recomendando, y si la recomienda, es que debe
ser importante en el ámbito del tema que trata la primera
página web. Una recomendación que proviene de una
página que a su vez está muy recomendada vale más que
una recomendación que provenga de una página que casi
nadie recomienda.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
GOOGLE – ALGORITMO DE BÚSQUEDA (1)
PageRank
Un vínculo de A a B es un "voto" de A a B. La importancia de una página
depende de los "votos" que recibidos, pero Google también analiza las
páginas que emiten los votos. Los votos emitidos por páginas que son en
sí mismas "importantes" tienen más peso y ayudan a su vez a hacer que
otras páginas sean importantes
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
GOOGLE – ALGORITMO DE BÚSQUEDA (2)
 Transmisión del Pagerank
 El valor del PageRank que observamos si tenemos
instalada la barra de Google es un valor comprendido
entre 0 y 10. Pero en realidad, el PageRank es un valor
numérico mucho más alto, calculado en función de los
enlaces que reciben nuestras páginas.
 El valor real suele ser del orden de miles de unidades. Sin
embargo, Google coge su valor logarítmico para hacerlo
visible a los usuarios. La base de este logaritmo es
desconocida.
 Por ejemplo, para una base 7, tendríamos los siguientes
valores:
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
GOOGLE – ALGORITMO DE BÚSQUEDA (3)
PR Barra
0
1
2
3
4
5
6
7
8
9
10
PR Real
0-3
O3-19
19 - 130
130 - 907
907 - 6351
6351 - 44458
44458 - 311209
311209 - 2178466
2178466 - 15249262
15249262 - 106765607
> 106765607
 Si una página tiene un PageRank real -por
ejemplo- de 500000, ¿qué valor le trasmitiría a
otra a la cual enlaza?.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
GOOGLE – ALGORITMO DE BÚSQUEDA (4)
 La respuesta a esta pregunta se contesta en el ya famoso texto de
Sergey Brin y Larry Page (fundadores de Google), llamado 'The
Anatomy of a Large-Scale Hypertextual Web Search Engine'.
 En él, planteaban la siguiente fórmula para calcular el PageRank de
una página web llamada 'A':
PR(A) = (1-d) + d * [ PR(T1)/C(T1) + ... + PR(Tn)/C(Tn) ]

Donde:
 'd' es el factor de atenuación. Un valor podría ser 0,85
 'Ti' es cada página que enlaza a 'A'. 'i' toma los valores 1, 2, ...
hasta 'N'
 'N' es el número de páginas que enlazan a 'A'.
 'PR(Ti)' es el PageRank de cada una de las páginas que enlazan a
'A'.
 'C(Ti)' es el número de enlaces que salen desde cada página 'Ti'.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
GOOGLE – ALGORITMO DE BÚSQUEDA (5)
 Por lo tanto, nuestra página de 500000 de PageRank
transmitirá a otra en caso de tener un único enlace, un valor
de 0,85*500000 = 425000. Generalmente las páginas
poseen más de un enlace dentro de ellas, así que este valor
habría que dividirlo entre el número de enlaces.
 Como se puede comprobar, el valor del PageRank de cada
página no es constante en el tiempo, ya que depende de los
enlaces que vayamos recibiendo y, a su vez, del PR de las
páginas que nos enlazan.
 Por ello, una vez al mes aproximadamente, Google recalcula
el valor de este PageRank en lo que viene a llamar la
'Google Dance'.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
GOOGLE – ALGORITMO DE BÚSQUEDA (6)
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
GOOGLE – ALGORITMO DE BÚSQUEDA (7)
 Google desea que en las primeras posiciones de los
resultados de búsqueda encontremos páginas de cierta
relevancia y que estén siendo recomendadas por otras
páginas que a su vez también tengan relevancia.
 Para determinar el PageRank, Google analiza el número
de enlaces que provienen de otras páginas web y su
PageRank.
 Problemas: SPAM a Buscadores. Los Webmasters
crean miles de páginas con el único propósito de enlazar
con sus páginas principales y con esto hacer subir su
PageRank en el caso de Google.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
GOOGLE – ALGORITMO DE BÚSQUEDA (8)
 ETIQUETA <NOSCRIPT>, ayuda a este objetivo.
 Permite incluir texto dentro del código fuente de nuestra
web que no será publicado por el navegador.
 Su uso es penalizado por el buscador Google, ya que
permite incluir referencias ocultas a otras webs dentro de
nuestra página, aumentando así la probabilidad de
mejorar su posicionamiento.
 Ejemplo a estudiar: http://www.webpositer.com/
 Ver su código fuente y observar el contenido de la etiqueta
<noscript>. Esto facilita la creación de granjas de enlaces
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
GOOGLE – ALGORITMO DE BÚSQUEDA (9)
 Solución proporcionada por Google, nuevo algoritmo de
búsqueda Trust Rank.
 El algoritmo Trust Rank, parte de la misma base, que el
anterior, pero en lugar de valorar la importancia de una
recomendación en función del PageRank de la página que
recomienda, lo hace a partir de una serie de páginas web
que han sido consideradas importantes por humanos en
lugar de por algoritmos.
 A las páginas web que los humanos han determinado
como importantes se las considera "web semilla" y a sus
enlaces se les asigna un valor. Y será ese valor el que se
irá transmitiendo por toda la red.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
GOOGLE – ALGORITMO DE BÚSQUEDA (10)
 Ejemplo: Supongamos que disponemos de una web
semilla A. A trasmitirá un valor de 100 Trust Rank a todas
las webs a las que enlace. Estas páginas, a su vez,
transmitirán un Trust Rank de 99 a todas las webs a las
que enlacen. Y éstas últimas, transmitirán un Trust Rank
de 98 a las que ellas enlacen.
 Para mitigar la degradación del Trust Rank a medida que
se distancia de las webs semilla, en el algoritmo se ha
incluido un corrector que tiene en cuenta el número de
grados que hay entre la web semilla y la web que recibe el
Trust Rank, sin anular completamente la distancia que las
separa de la semilla.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
GOOGLE – ALGORITMO DE BÚSQUEDA (11)
 De la misma manera que las webs semilla van a transmitir
Trust Rank, las webs consideradas spam por los humanos
que evalúan las webs, van a transmitir Trust Rank
negativo. Según este documento ciertas webs van a restar
Trust Rank y cuando una página web sitúe su nivel de
Trust Rank por debajo de una determinada cifra, va a
convertirse automáticamente en una web que transmite
Trust Rank negativo en lugar de positivo.
 La idea del Trust Rank parece buena, pero hay ciertas
cuestiones que deben tenerse en cuenta.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
GOOGLE – ALGORITMO DE BÚSQUEDA (12)
 ¿Quiénes van a ser las Web Semilla?
 A este respecto hay discrepancias El documento de Stanford habla
de un algoritmo que determinará las webs que pueden ser semilla.
En ciertos foros especializados en posicionamiento en buscadores
se afirma que serán las webs gubernamentales y de universidades
las que empezarán a transmitir el Trust Rank semilla, y en otros
foros se afirma que Google hace meses que está contratando
gente de todos los países para que evalúen de forma manual las
webs más representativas de su país. Esta última posibilidad
parece la más plausible, ya que hay indicios de que efectivamente,
Google ha contratado evaluadores de webs.
 ¿Se realizará Spam a la inversa?
 Manipulación de páginas web positivas enlazadas con aquellas que
transfieren Trust Rank negativo.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
GOOGLEBOT (0)
 Googlebot es el robot que utiliza Google para 'rastrear' los
sitios de Internet. No solamente indexa páginas web (HTML),
sino que también extrae información de ficheros PDF, PS,
XLS, DOC y algunos otros más.
 La frecuencia con la que Googlebot accede a un sitio web
depende de PageRank de éste. Cuanto mayor sea este
valor, el robot accederá más asiduamente a sus páginas.
 Por ejemplo, podemos comprobar que los sitios con PR10 (el
valor más alto) como yahoo.com o usatoday.com, han sido
'rastreados' por Googlebot ayer o incluso hoy mismo,
mientras que otros han sido accedidos hace varias semanas.
Esto se puede comprobar accediendo a la 'cache' de esta
página.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
GOOGLEBOT (1)
 Para comprobar si
Googlebot ha
accedido a nuestro
sitio web, deberemos
echar un vistazo a
los logs de nuestro
servidor. En ellos,
deberemos observar
si hay registros de
accesos en los que
aparezca 'googlebot‘
Generalmente
aparecerá el nombre
del servidor, el cual
podrá ser alguno de
estos:
SERVIDOR
crawl1.googlebot.com
crawl2.googlebot.com
crawl3.googlebot.com
crawl4.googlebot.com
…
crawl9.googlebot.com
crawler1.googlebot.com
crawler2.googlebot.com
…
crawler14.googlebot.com
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
DIRECCION IP
216.239.46.20
216.239.46.39
216.239.46.61
216.239.46.82
…
216.239.46.234
64.68.86.9
64.68.86.55
…
64.68.82.138
GOOGLEBOT (2)
 Googlebot intentará acceder, como hacen la mayoría de los
robots de los motores de búsqueda, al fichero 'robots.txt'. En
este archivo se deberán indicar las zonas de nuestro sitio web
donde no queremos que entre ni Googlebot ni el resto de los
buscadores. Para conocer más sobre 'robots.txt‘ existe un
magnífico recurso: www.robotstxt.org.
 Una vez que Googlebot haya 'rastreado' nuestra página, seguirá
los enlaces que en ella encuentre (los HREF y los SRC).
 Por lo tanto, si quieres que Googlebot indexe tu página web,
solamente es necesario que algún otro sitio tenga un
hiperenlace al tuyo. Si no es así siempre puedes añadir
directamente tu URL.
 Además de este robot GoogleBot, existe otro, llamado
FreshBot que 'rastrea' con mayor frecuencia los sitios webs
con las noticias 'más frescas'.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Mil y un Googles en un mismo Google
 Google esconde un sinfín de aplicaciones, herramientas y servicios. Y
un día sí y otro también compra una empresa para meter el pie el
algún pingüe negocio.
 Buscador de Imágenes.
 Buscador de Vídeos.
 Directorio.
 News de 4500 fuentes con 700 en español.
 Compras
 Traductor.
 Escolar, para búsquedas académicas.
 Búsqueda dentro de los libros de universidades académicas.
 Mapas, Planos, Carreteras, etc.
 Respuestas a Preguntas desde SMS
 Respuestas a Preguntas por Académicos.
 Hasta tienda de artículos de propaganda
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Otros Servicios de Google I



















Compras – froogle.google.com
Traductor – translate.google.com
Académico – scholar.google.com
Librería – print.google.com
Mapas – maps.google.com
Videos – video.google.com
SMS – sms.google.com
Expertos – answer.google.com
Laboratorios – labs.google.com
Store – www.googlestore.com
Noticias Email – Google Alerts
Servicio de Mensajería – www.google.com/talk
Google Notebook
Google Accesible - http://labs.google.com/accessible/
Google Transit - http://www.google.com/transit
Google Reader – http://www.google.com/reader
Google CodeSearch - http://www.google.com/codesearch
Google Finance – http://finance.google.com
Google Base – http://base.google.com/base
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Otros Servicios de Google II




















Grupos - groups.google.com
Directorio – directory.google.com
Catálogos catalogs.google.com
Histórico de Búsquedas – www.google.com/searchhistory
API de Google: code.google.com
Home Personal de Google – www.google.com/ig
Google Web Accelerator - webaccelerator.google.com
Google Ride Finder - labs.google.com/ridefinder
Google Suggest - http://www.google.com/webhp?complete=1&hl=en
Google Compute - http://toolbar.google.com/dc/offerdc.html
Google Sets - http://labs.google.com/sets
Calculadora y Definiciones de Google
Google y Mozilla Firefox (Prefecht)
Google Earth – http://earth.google.com
Documentos con Google http://docs.google.com
Google Mars. http://www.google.com/mars/
Google Related Links. http://www.google.com/relatedlinks/
Google Trends. http://www.google.com/trends
Google Analitycs. http://www.google.com/analytics
Google Sitemaps – http://www.google.com/webmasters/sitemaps
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Otros Servicios de Google III
 Búsqueda Vocal. http://labs.google.com/goog411/
 Búsqueda Experimental. http://www.google.com/experimental/
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Búsqueda de Información (1)
 Para ingresar una consulta en Google, simplemente tipee
algunas palabras descriptivas y presione la tecla "Intro" (o
haga clic en el botón de búsqueda en Google) para ver la
lista de resultados relevantes.
 Google usa sofisticadas técnicas de búsqueda de texto
que encuentran páginas que son importantes y relevantes
para su búsqueda. Por ejemplo, cuando Google analiza
una página, comprueba el contenido de las páginas
vinculadas con esa página. Google también prefiere las
páginas en las que los términos buscados están cerca
unos de otros.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Búsqueda de Información (2)
Página Principal
 Búsqueda
Avanzada
 Preferencias
 Herramientas del idioma
 Imágenes
 Grupos
 Directorios
 News
…
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Búsqueda de Información (3)
 Búsqueda avanzada
 Palabras de la consulta
 Idioma
 Formato de archivo
 Fecha
 Presencia
 Dominios
 Búsqueda segura
 Propiedades adicionales de Google
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Búsqueda de Información (4)
 Revisión Ortográfica: Céser, Tombona
 Las Palmas de Gran Canaria filetype:ppt
 Búsqueda en sitios: site: msn.com
 Búsquedas relativas: related:google.es
 Búsqueda de frases : Ser o no ser, “Ser o no ser”
 Booleanos básicos:
 Predeterminado “Y”
 OR: Agaete OR Galdas OR El Dedo de Dios, Agaete (Telde OR
Maspalomas)
 Negación
 Inclusión explícita
 Comodines
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Búsqueda de Información (5)
 Sintaxis especial
 Allintitle: Muestra las páginas que tienen todas las palabras especificadas en su
título. allintitle: palabra1 palabra2 Devuelve las páginas que tienen palabra1 y
palabra2 en su título
 Allintext: Páginas que tengan todas las claves especificadas dentro de su body
 Allinanchor: Páginas que tengan en el texto que las apuntan, las palabras
especificadas.
 Allinurl: Muestra todas las páginas indexadas de un dominio indicado, o bien, las
páginas que tienen todas las palabras especificadas en su url. Su sintaxis es:
allinurl:www.dominio.com
 Site: site:loc.gov site:edu
site:ya.com
 Inurl: Busca la palabra que le especifiquemos en la url.
 Intitle: Busca la palabra que le especifiquemos en el título, pero no es necesario
que todas estén en el título. Por ejemplo intile:clave1 clave2 Busca clave1 en la url.
 Link: Lista todos los enlaces, que teniendo page rank 4 o más, apuntan a nuestra
página. Su uso es sencillo: link:www.direccion.com
 Info:Nos muestra información sobre la página principal de un dominio
especificado. info:www.dominio.com
 Daterange: Fechas Julianas http://www.24hourtranslations.co.uk/dates.htm
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Búsqueda de Información (6)
 Filetype: Busca un tipo de documento especificado, por ejemplo:




filetype:doc clave Busca ficheros '.doc' relacionados con 'clave'.
Related:Según google nos muestra sitios relacionados con la
dirección que le especifiquemos, los resultados más que malos,
son nulos. No merece la pena usarlo.
Stocks:Nos lleva a Yahoo Finance y nos muestra información de
tipo financiero relacionada con la marca que le indiquemos.
Define: Este es el comando más reciente; busca la definición de
una palabra indicada. Uso: define:mouth.
Calculadora: Calculadora Científica y de números romanos.
 Combinar la sintaxis
 Como no se debe mezclar la sintaxis
 Como combinar la sintaxis
 Los elementos de sintaxis antisociales
 Todas las posibilidades
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Búsqueda de Información (7)
 El directorio Google proporciona un método
extremadamente útil que permite acotar la búsqueda
basándose en un tema determinado. Por ejemplo, si
busca "saturno" en la categoría Ciencia > Astronomía del
directorio Google, encontrará páginas solamente acerca
del planeta Saturno. No muestra páginas del auto
Saturno, del sistema de juegos Saturno ni de cualquier
otro significado del término.
 Buscar dentro de una categoría de interés permite
rápidamente acotar la búsqueda a las páginas que son
relevantes para el usuario.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Búsqueda de Información (8)
 Consultas automáticas que incluyen "and"
 Google sólo le muestra aquellas páginas que incluyen
todos los términos de la búsqueda. No es necesario incluir
"and" entre sus términos. Para acotar la búsqueda un
poco más, agregue más términos.
 Buscar: PERROS AND GATOS
 Buscar: PERROS GATOS
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Búsqueda de Información (9)
 Google ignora las palabras y caracteres comunes,
conocidos como términos superfluos. Google
automáticamente descarta términos como "http" y
".com,", así como ciertos dígitos o letras, porque
raramente estos términos ayudan a acotar la búsqueda y
pueden demorarla en forma significativa.
 Use el signo "+" para incluir términos superfluos en su
búsqueda. Asegúrese de incluir un espacio antes del signo
"+".
 Buscar: googlemania +com
Buscar: googlemania com
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Búsqueda de Información (10)
 Cada resultado de búsqueda Google contiene uno o más
fragmentos de la página web que le muestra como sus
términos se usan en el contexto de esa página.
 Si buscamos "coches", parecerían resultados como: Volver
al Inicio de Coches. Coches Nuevos. ...
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Búsqueda de Información (11)
 Para proporcionarle los resultados más exactos, Google
no usa "búsquedas parciales" ni realiza búsquedas con
"comodines". En otras palabras, Google busca
exactamente los términos que ingresa en la casilla de
búsqueda. Buscar "sal" o "sal*" no devolverá búsquedas
que contengan "salero" o "salamandra". Si tiene dudas,
pruebe varias formas distintas: "calle" y "calles", por
ejemplo.
 Buscar: calle
Buscar: calle*
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Búsqueda de Información (12)
 Las búsquedas Google no distinguen entre mayúsculas y
minúsculas. Todas las letras, independientemente de
como estén escritas, se consideran minúsculas.
 Buscar: google, GoOgLe, GOOGLE.
 Las búsquedas Google en español en forma
predeterminada no distinguen los acentos diacríticos,
diéresis ni la letra eñe.
 Buscar: Martín
Buscar: Martin
 Si desea distinguir estas dos palabras, use el signo +.
caña
Buscar: +caña
 Buscar:

© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Búsqueda de Información (13)
 Puede excluir una palabra de la búsqueda colocando un
signo menos ("-") inmediatamente antes del término que
quiere excluir. (Asegúrese de dejar un espacio antes del
signo menos.)
 Buscar: radio online
Buscar: radio -online
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Búsqueda de Información (14)
 Google permite buscar frases agregando comillas. Las
palabras entre comillas dobles ("como esto") aparecerán
juntas en todos los documentos encontrados (a menos
que sean palabras superfluas, palabras especiales que
requieren un signo "+"). La búsqueda de frases mediante
comillas es útil para buscar dichos populares o nombres
específicos.
 Ciertos caracteres sirven como conectores de frases.
Google reconoce guiones, barras oblicuas, puntos, signos
igual y apóstrofes como conectores de frases.
 Buscar: Puerta de Alcalá
Buscar: "Puerta de Alcalá"
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Búsqueda de Información (15)
 Algunas palabras, cuando se anexan con dos puntos,
tienen un significado especial para Google. Una de esas
palabras es el operador "site:". Para buscar en un sitio o
dominio específico, use la sintaxis
"site:ejemplodedominio.com" en la casilla de búsqueda
Google.
 Por ejemplo, para encontrar información de artículos en el
sitio Google, ingrese:
 Buscar: artículos site:www.google.com
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Búsqueda de Información (16)
 Google permite realizar búsquedas, en las que podemos
encontrar una determinada palabra u otra. Para ello
usaremos "OR" ó "|".
 Por ejemplo, para buscar páginas en los que aparezca
'tienda' y 'bolígrafos', o bien 'tienda' y 'lápices'.
 Buscar: tienda (bolígrafos OR lápices)
Buscar: tienda (bolígrafos | lápices)
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Búsqueda de Información (17)
 Si buscamos una Frase Exacta, pero, queremos incluir
palabras entre nuestra búsqueda, Google permite el uso
de unos comodines.
 Por ejemplo, si buscamos frases tipo "los tres días", "los
tristes días", "los tristes oscuros días"...
 Buscar: "los * días“
 Buscar: "los * * días"
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Búsqueda de Información (18)
 Puesto que Google sólo encuentra las páginas web que
contienen todas las palabras de la consulta, para acotar la
búsqueda basta con agregar más palabras a los términos
de búsqueda que ya ha ingresado. Al agregar más
palabras, los resultados contendrán un subconjunto
específico de las páginas devueltas por la consulta inicial
que era "demasiado amplia".
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Voy a Tener Suerte™...
 Aquí te presentamos una lista (con la web original "por si acaso") de
las búsquedas en las que Voy a Tener Suerte™...
 I'm Feeling Lucky™: worst president
 I'm Feeling Lucky™: bastards
 I'm Feeling Lucky™: exit
 I'm Feeling Lucky™: under 18
 I'm Feeling Lucky™: leave now
 Voy a Tener Suerte™: ladrones
 I'm Feeling Lucky™: failure
 I'm Feeling Lucky™: great president
 I'm Feeling Lucky™: out of touch executives
 I'm Feeling Lucky™: miserable failure
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
HERRAMIENTAS GOOGLE
 Google ToolBar – El cajetín de búsqueda se integra en el
Navegador.
 Google Talk – Servicio de mensajería instantánea.
 Google DeskBar – El cajetín de búsqueda se integra en el
escritorio.
 Google Desktop Search – El motor de Búsqueda Aplicado
a tu PC.




Mini Base de Datos de tu PC.
Búsquedas Instantáneas del Contenido que tienes y has tenido.
Resultados con Formato Google.
Múltiples tipos de archivos clasificados por formatos:
 Outlook, Excel, PowerPoint, Internet Explorer, Pdf, Música,
 Imágenes, Vídeo, Netscape, Firefox, Mozilla, etc.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
PUBLICIDAD CON GOOGLE (1)
 ADWORDS: Con AdWords de
Google podrá llegar a los
usuarios en el preciso momento
en que estos busquen ciertos
productos o servicios. De esta
manera, obtendrá visitantes y
clientes segmentados. El
sistema de precios de coste por
clic implica que sólo se pagará
cuando los usuarios hagan clic
en su anuncio. De esta manera,
se podrán controlar los costes
con facilidad.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
PUBLICIDAD CON GOOGLE (2)
 ADSENSE: AdSense™ de Google
publica automáticamente
anuncios de texto y anuncios
gráficos orientados de forma
precisa en función de su sitio y el
contenido de éste. La
incorporación de AdSense para
búsqueda a su sitio, también
publicará anuncios orientados en
las páginas de resultados de la
búsqueda.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
En Resumen…
 BUSCADORES: Buscador web - Buscador de imágenes - Buscador de
blogs - Google News - Google Video - Buscador de libros - Google Local
- Google Groups - Google Scholar - Google Answers - Buscador de
catálogos - Google Maps - Froogle - Google Base - Directorio Google Google Finance - Google para móviles, Google Voice Local Search…
 APLICACIONES: Picasa - Google Toolbar - Google Desktop - Google
Earth - Google Deskbar - Google Talk.
 PUBLICIDAD: AdWords – AdSense.
 UTILIDADES: Gmail - Google Calendar - Traductor - Google Reader Google Alerts - Orkut - Dodgeball - Web Accelerator - Página de inicio
personalizada - Búsquedas personalizadas – Documentos Google –
SketchUp
 SISTEMAS OPERATIVOS: Google Phone - Android
 SERVICIOS PARA WEBMASTERS: Analytics – SiteMaps.
 MÁS: Google Search Appliance - Tienda Google - Google Code Laboratorio de Google.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Curiosidades Google
 PigeonRank ™:
http://www.google.com/technology/pigeonrank.html
 Huevos de Pascua:
http://www.google.com/Easter/feature_easter.html
 Archivo Histórico de Búsqueda:
http://www.google.com/press/zeitgeist/archive.html
 Tienes registrados dominios como: 466453.com,
gogle.com, googel.com, ggoogle.com o gogole.com.
 Tiene un curioso mirror: elgooG
http://www.alltooflat.com/geeky/elgoog/
 Google Fight: http://www.googlefight.com/
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Buscadores y motores de búsqueda
La Revolución de GMAIL
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
LA REVOLUCION DE GMAIL
 Primera Visita a GMail
 ¿Qué nos encontramos la primera vez que entramos en
GMail? Si todavía no tienes tu cuenta, o acabas de
conseguir una, aquí te explicaremos que es lo que te vas
a encontrar y cómo conseguir el máximo partido de tu
nueva cuenta de GMail.
 Lo primero que nos encontramos al llegar es un correo del
GMail Team. Aunque hay varias zonas de la pantalla que
has de tener en cuenta, porque te serán básicas para
sacarle todo el partido a tu cuenta.
 Arriba del todo tienes una lista de opciones juntamente a
tu cuenta de correo:
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
LA REVOLUCION DE GMAIL (2)
 ¿Qué significa cada una de las opciones?
 [email protected]: Es tu cuenta de correo... aunque no la única... más
adelante sabrás porqué :)
 Report bug: GMail está en fase Beta y por tanto, si encuentras un error en
el sistema, has de enviárselo a Google para que lo revise y lo solucione.
 Contacts: es la Libreta de Direcciones de GMail. Cada vez que contestes un
correo, se añadirá la cuenta a la lista.
 Settings: Te permiten configurar tu cuenta de GMail. Más adelante
explicaremos cómo configurar correctamente y que es cada opción.
 Help: La ayuda de GMail
 Sign Out: Antes de cerrar el navegador, si ya has acabado, desconecta de
GMail (por seguridad).
 Lo siguiente que encuentras, es el buscador de GMail. Aquí, a parte de
buscar entre tus correos, puedes buscar por Internet como si de una
búsqueda de Google se tratara
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
GMAIL: CORREO INTELIGENTE
 A parte de las búsquedas tradicionales que se pueden
realizar para buscar algún texto en los mensajes, GMail
nos ofrece unas búsquedas específicas para el correo.
 Mensajes DE - from:
 Nos permitirá buscar por quién nos ha enviado el mensaje. Por
ejemplo: from:Juan nos mostraría todos los mensajes de Juan.
 También podemos ampliar la búsqueda por correo. Por
ejemplo: from:[email protected] donde nos mostraría los
mensajes recibidos desde esa cuenta.
 Podemos hacer búsquedas también del tipo:
from:*@gmail.com, from:juan@* o from:*.*.com.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
GMAIL: CORREO INTELIGENTE (2)
 Mensajes PARA - to:
 Funciona exactamente igual que el from: pero esta vez nos
permitirá buscar en las direcciones de llegada.
 Copia ó Copia Oculta - cc: ó bcc:
 Funciona exactamente igual que el from: pero esta vez nos
permitirá buscar en las direcciones de copia y copia oculta.
 Asunto del Mensaje - subject:
 Si queremos buscar algún mensaje o algun texto en el asunto de
un mensaje... Por ejemplo: subject:cena, por ejemplo, para
buscar mensajes que lleven la cena en el asunto.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
GMAIL: CORREO INTELIGENTE (3)
 Etiquetas de Clasificación - label:
 Si queremos buscar únicamente entre alguna de las etiquetas que
hemos creado, labels, podremos hacerlo por ejemplo:
label:trabajo, nos buscaría todos los mensajes que tengamos con
la etiqueta trabajo.
 Con adjuntos - has:attachment
 Para encontrar mensajes con adjuntos, simplemente haremos
búsquedas e indicaremos has:attachment
 Fichero adjunto - filename:
 Si buscamos algú fichero adjunto en concreto entre todos
nuestros mensajes, lo podremos hacer indicándolo así:
filename:factura.xls si buscásemos el fichero factura.xls.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
GMAIL: CORREO INTELIGENTE (4)
 En una carpeta - in:anywhere ó in:inbox ó in:trash ó in:spam
 GMail agrupa por defecto los mensajes en unas carpetas... si queremos
buscar algún mensaje en una carpeta podremos hacerlo mediante estos
comandos.
 Tenemos mensajes en cualquier carpeta (anywhere), en la bandeja de
entrada (inbox), en la papelera (trash) o en la carpeta de correo no deseado
(spam).
 Estado del mensaje - is:starred ó is:unread ó is:read
 También podemos buscar entre mensajes que estén marcados para
seguimiento (starred), no leidos (unread) o leidos (read).
 Antes o Después de una fecha - before: ó after:
 Podemos indicar en la búsqueda los rangos de fechas entre los que buscar. Si
queremos buscar mensajes entre dos fechas, lo haremos indicando:
after:2003/12/15 before:2004/1/15 y nos mostraría los mensajes entre el 15
de diciembre de 2003 y el 15 de enero de 2004.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
GMAIL: ALMACENAMIENTO
 Con todo el lio que se armo con GMail y su giga de espacio gratuito, era de esperar q al
poco tiempo sucedieran estas cosas.. un tipo se creo un driver para montar tu cuenta de
GMail, como si fuera una unidad virtual de tu PC, por lo tanto podes usar el espacio de esa
cuenta, como si fuera otro disco rigido.
Si, como leyeron, primero, apareció una versión para Linux y poco después, apareció la
versión para Windows.
 Instalando este driver, nuestra cuenta de GMail para a ser una especie de disco rígido
remoto, en el cual podemos almacenar todo tipo de archivos, hasta llenar el Giga de espacio
que GMail nos da. Esto quiere decir que si vamos a 'Mi PC', nos vamos a encontrar con una
nueva unidad, en la cual vamos a poder copiar, pegar, crear y eliminar tanto carpetas como
archivos, usar drag'n'drop para todas esas operaciones, ver propiedades de los archivos, etc,
como hacemos normalmente con cualquier disco.Cuando copiamos un archivo a este disco,
lo que en verdad hace es enviar un mail a nuestra cuenta, con el archivo que subimos como
adjunto a un mail. Por lo tanto si entras a tu cuenta de Gmail, como haces normalmente, vas
a ver todos los archivos que copiaste en tu disco virtual, como mails con archivos adjuntos.
Por otro lado, periódicamente el GmailFS chequea la cuenta para ver si se agrego algo
nuevo, y automáticamente actualiza toda la estructura de archivos y carpetas.Bueno, para el
que quiera probarlo:GmailFS for Linux
Gmail Drive for Windows
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
GMAIL: ALMACENAMIENTO (2)
 GMail Drive shell extension
 GMail Drive is a Shell Namespace
Extension that creates a virtual
filesystem around your Google GMail
account, allowing you to use GMail as a
storage medium.
 GMail Drive creates a virtual filesystem
on top of your Google GMail account
and enables you to save and retrieve
files stored on your GMail account
directly from inside Windows Explorer.
GMail Drive literally adds a new drive to
your computer under the My Computer
folder, where you can create new
folders, copy and drag'n'drop files to.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Buscadores y Motores de Búsqueda
Etiquetas META
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Etiquetas META - Definición
 Informan a los Motores de Búsqueda cómo deben
tratar la página web para la indexación en sus bases
de datos, que contenido tiene y de que tipo.
 Envían una serie de cabeceras HTTP al navegador
del usuario con el fin de mejorar el rendimiento de
la página.
 Son el medio de que disponemos para dar a conocer
nuestra página y nuestro sitio web al mundo
exterior
 Estas etiquetas se deben situar dentro de la
cabecera de nuestras páginas, normalmente entre la
etiqueta </TITLE> y la etiqueta </HEAD>
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Etiquetas META – Tipos
 Existen dos tipos de etiquetas META:
 HTTP-EQUIV: Enviadas por como cabeceras HTTP
independientes cuando la página es enviada por un
servidor.
 NAME: Suministran información adicional de nuestra página
web, bien para aquella que vea el código fuente o para que
los motores de búsqueda indexen nuestra página.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Etiquetas META – HTTP-EQUIV
 <META HTTP-EQUIV="expires" CONTENT="fecha de caducidad de la página">
 <META HTTP-EQUIV="pragma" CONTENT="no-cache">
 <META HTTP-EQUIV="Refresh" CONTENT="URL=dirección_web">
 <META HTTP-EQUIV="Set-Cookie" CONTENT="cookievalue=val; expires=fecha; path=ruta">
 <META HTTP-EQUIV="Content-Type" CONTENT="tipo; charset=juego de carcateres">
 <META HTTP-EQUIV="Content-Script-Type" CONTENT="text/javascript">
 <META HTTP-EQUIV="Content-Style_Type" CONTENT="text/css">
 <META HTTP-EQUIV="Content-Language" CONTENT="idioma-variante">
 <META HTTP-EQUIV="Window-target" CONTENT="target">
 <META HTTP-EQUIV="Ext-cache“ CONTENT="name=/ruta_carp/fich.ext; instruction="">
 <META HTTP-EQUIV="Cache-Control" CONTENT="Public,Private,…">
 <META HTTP-EQUIV="Vary" CONTENT="Content-language">
 <META HTTP-EQUIV="Page-Enter" CONTENT="RevealTrans (Duration=4, Transition=15">
 <META HTTP-EQUIV="Page-Exit" CONTENT= "RevealTrans(Duration=4,Transition=15">
 <META HTTP-EQUIV="Site-Enter" CONTENT= "RevealTrans(Duration=4,Transition=15">
 <META HTTP-EQUIV="Site-Exit" CONTENT="RevealTrans (Duration=4, Transition=15">
 <META HTTP-EQUIV=“Pics" CONTENT='(PICS-1.1 "http://www.p.org/ratingsv1.1"(SS 000 1)'>
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Etiquetas META – NAME (i)
 Etiqueta "description“: Indica una breve descripción de la página.
<META NAME="description" CONTENT="HTMLWeb, diseño web, manuales
de HTML, DHTML, JavasCript y articulos sobre diseño grafico y programacion
web en general">
 Etiqueta “keywords“: Indica frases o palabras clave de nuestra página.
<META NAME="keywords" CONTENT="HTMLWeb, HTML, DHTML, JavaScript,
diseño web, programacion">
 Etiqueta “abstract“: Define una segunda descripción para el sitio.
<META NAME="Abstract" CONTENT="El diseño web proyecta arte y
tecnología a un espacio universal">
 Etiqueta “revisit-after“: Indican a los motores de búsqueda cada cuanto
tiempo deben volver a visitar nuestra página web para volver a indexarla en
sus bases de datos.
<META NAME="revisit-after" CONTENT="10 Days">
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Etiquetas META – NAME (ii)
 Etiqueta “Robots“: Se usa para indicar a los motores de
búsqueda de qué forma deben indexar las páginas que
componen nuestro sitio web.
<META NAME="ROBOTS" CONTENT="parametros">
 ALL: indica a los robots que indexen todas las páginas de nuestro
sitio web.
 NONE: indica a los robots que no indexen ninguna de las páginas
de nuestro sitio web.
 INDEX: indica a los robots que indexen la página en sus bases de
datos.
 NOINDEX: indica a los robots que no indexen la página en sus
bases de datos.
 FOLLOW: indica a los robots que indexen en sus bases de datos la
página actual y todas las que se encuentran enlazadas con ella.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Etiquetas META – NAME (iii)
 NOFOLOW: indica a los robots que indexe en sus bases de
datos la página actual pero no las que se encuentran
enlazadas con ella.
 IMAGEINDEX: indica a los motores que indexen las
imágenes de la página en sus bases de datos.
 NOIMAGEINDEX: indica a los motores que no indexen las
imágenes de la página en sus bases de datos, pero que sí
pueden indexar el texto de la misma.
 IMAGECLICK: indica a los robots que indexen los enlaces
que tengan las imágenes de la página.
 NOIMAGECLICK: indica a los robots que no indexen los
enlaces que tengan las imágenes de la página.
<META NAME="ROBOTS" CONTENT="INDEX,FOLLOW">
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Etiquetas META – NAME (iv)
 Etiqueta “author“: Especifica el autor de la página
 Etiqueta “Generator“: Indica con que programa se generó la página web
 Etiqueta “copyright“: Establece información de copyright
 Etiqueta “clasification“: Usada por muchos motores de búsqueda para
categorizar nuestra web.
 Etiqueta “owner“: Indica quien es el propietario de la web.
 Etiqueta “reply-to“: Especifica la dirección de contacto del responsable de la
página. Se recomienda indicar el nombre de la persona.
<META NAME="Reply-to" CONTENT="[email protected] (Luciano
Moreno)">
 Etiqueta “distribution“: Indica quien tiene derecho a ver la página:
• GLOBAL: disponible para todo Internet.
• LOCAL: indica que se trata de una página de uso local, por lo que el servidor puede
que no sirva la página a peticiones fuera de la máquina local.
• IU: (Internal Use), disponible sólo para una Intranet, por lo que el servidor no
atenderán peticiones de máquinas fuera de la red local (no disponibles para Internet).
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Etiquetas META – NAME (v)
 Etiqueta “rating“: Especifica la clasificación del contenido de la página:
<META NAME="Rating" CONTENT="clasificación">
 14 Years: apta para mayores de 14 años. Equivale al valor PG-13 de la etiqueta
PICS.
 General: apta para todos los públicos. Equivale aproximadamente al valor PG de la
etiqueta PICS.
 Mature: apta sólo para adultos. Equivale aproximadamente al valor R de la etiqueta
PICS.
 Restricted: con contenido que puede resultar inmoral o dañino. Equivale al valor X
de la etiqueta PICS.
 Safe For Kids: no apta bajo ningún concepto para niños. Equivale al valor G de la
etiqueta PICS.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Buscadores y motores de búsqueda
¿Cómo nos ven los
buscadores?
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Buscadores y motores de búsqueda
 Para saber como nos ven los buscadores existen
diferentes páginas web que emulan a los spiders o
arañas tipo Google.
 Poodle Emulator nos permite ver que es lo que ve
Google a la hora de indexar nuestra página
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Referencias Bibliográficas (i)
 elgooG: ¿Google al revés? (http://www.alltooflat.com/geeky/elgoog/)
 Archivo Google (I): Google antes de sus inicios... ¿Qué es BackRub?
(http://web.archive.org/web/*/http://backrub.stanford.edu/)
 Archivo Google (II): Google desde sus inicios... ¿Google en la Universidad de
Standford? (http://web.archive.org/web/*/http://google.stanford.edu/)
 Archivo Google (III): Google desde sus inicios... ¿Cómo evoluciona Google?
(http://web.archive.org/web/*/http://www.google.com)
 Así era Google: Estas son las fotos que muestran el primer ordeanador donde
Google estuvo metido. (http://wwwdb.stanford.edu/pub/voy/museum/pictures/display/0-4-Google.htm)
 Larry Page: Uno de los creadores de Google. Antes
(http://web.archive.org/web/19981202114029/http://www-pcd.stanford.edu/~page/) y
Ahora (http://www-pcd.stanford.edu/~page/)
 Sergey Brin: El otro de los creadores de Google. Antes
(http://web.archive.org/web/19980418143602/http://www-db.stanford.edu/~sergey/)
y Ahora (http://www-db.stanford.edu/~sergey/)
 The Best Search Engines on the Web
http://websearch.about.com/od/enginesanddirectories/p/websearch101.htm
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Referencias Bibliográficas (ii)
 7 de Enero de 1996: ¿Qué hacia Larry Page preguntando sobre
"robots"? (http://groups.google.com/groups?selm=page0701962007020001%40qwerty.stanford.edu&output=gplain)
 Search-This: ¿Qué recibe y a quién ofrece resultados Google?
(http://www.search-this.com/search_engine_decoder.asp)
 Fotos de Google: GooglePlex, así es.
(http://www.aaronsw.com/photos/google/)
 Google Set-Vista (http://www.langreiter.com/space/google-setvista)
 TouchGraph GoogleBrowser
(http://www.touchgraph.com/TGGoogleBrowser.html)
 RooDolf (http://nutria.cs.tu-berlin.de/roodolf/index.html)
 Random WebSearch (http://www.randomwebsearch.com/)
 Googlism (http://www.googlism.com/)
 Poodle (http://www.google.es/search?hl=es&q=poodle&spell=1)
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Referencias Bibliográficas (iii)
TIWANA, Amrit. The Knowledge Management
Toolkit. Upper Saddle River: Prentice Hall, 2000
SCHREIBER, Guus et al. Knowledge
Engineering and Management. The CommonKADS
Methodology. Cambridge, Massachusetts: The
MIT Press, 2000.
Joyanes Aguilar, Luis. Las redes sociales: de la
mensajería instantánea a los Weblogs. Sociedad y
Utopía, Núm 24, 2004
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Referencias Bibliográficas (iv)
HERREROS DE LAS CUEVAS, Carlos. La
sucesión del lider. Granica: Barcelona, 2003
JOYANES AGUILAR, Luis. Cibersociedad 2.0:
Hacia un mundo inalámbrico y a la sociedad del
conocimiento. 2ª edición (1ª ed, 1997) . En
preparación (McGraw-Hill: Madrid, 2003)
DRUCKER, Peter. La empresa en la sociedad
que viene. Urano: Barcelona, 2003.
Google. Acerca de Google.
http://www.google.com/about.html
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Referencias Bibliográficas (v)
 WALLACE, Patricia . The Internet in the Workplace. Cambridge
University Press, 2004
 CARR, Nicholas G. Does IT Matter? Harvard Business Schools,
2004
 ALONSO, Andoni y ARZOZ, Iñaki. Carta al Homo
Ciberneticus. Madrid: EDAF Ensayo, 2003
 JOYANES, Luis. Innovaciones Tecnológicas. Retos y
Oportunidades en Sociedad y Utopía, UPSA Madrid, Octubre
2004.
 JOYANES, Luis. Cibersociedad 2010. McGraw-Hill, Madrid 2005
 CALISHAIN, Tara y DORNFEST, Rael. Google. Los mejores
trucos. Anaya/O. Reilly. Madrid, 2004
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Referencias Bibliográficas (vi)
 Joyanes. Cibersociedad (McGraw-Hill, 1997)
 Marina, Joyanes y otros. Educación e Internet (Santillana,
1999)
 Joyanes , El futuro del conocimiento (en preparación)
 Joyanes . Cibersociedad , 2ª edición (prevista 1T 2005)
 Joyanes . Comercio electrónico: fundamentos y modelos (en
preparación)
 Joyanes. “Historia de la Sociedad de la Información. Hacia la
sociedad del Conocimiento” en R-evolución tecnológica. U. de
Alicante: Alicante, 2003
 Joyanes. “Biotecnología e Informática” en Estudios, nº 1,
Fundación Pablo VI: Madrid, 2003.
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Prensa









Cinco Días ….. Viernes
Expansión ….. Viernes
Gaceta de los Negocios ….. Viernes
Financial Times (www.ft.com ...
www.ft.com/ftit..../fttelecoms )
Wall Street Journal (www.wsj.com)
Les Echos (www.lesechos.com)
BusinessWeek (www.businessweek.com)
Business 2.0 (www.business2.com)
Suplementos de Economía y de Tecnología semanales de: El País, El
Mundo, ABC y La Vanguardia…jueves, domingo, miercoles,
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Prensa









Intelligent Enterprise (www.intelligententerprise.com)
www.newsweek.com
Red Herring (www.redherring.com)
Upside (www.upside.com)
The Standard Industrie (www.thestandard.com)
Advisor (www.advisor.com)
SIGS (www.sigs.com)
ACM (www.acm.org)
The Economist (www.economist.com)
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid
Vocabularios online
 Vocabulario especializado: argot y terminología
 Jergas
 //probertencyclopedia.com/slang.htm
 //www.prevish.co.uk/slang
 //www.spraalservce.net/slangportal
 Vocabulario especializado. Argot profesional
 //glosarist.com
 The OnlineMedical Dictionary//cancerweb.ncl.ac.ul/omd
 MedTerms.com
 Diccionario legal //dictionary.law.com/lookup2.asp
© Luis Joyanes Aguilar, Rubén González Crespo
Facultad de Informática
Universidad Pontificia de Salamanca, campus de Madrid

Seminario de Buscadores

Transcript Seminario de Buscadores

Directory