martes 14 de julio de 2009

Hadoop al alcance de la billetera



El otro día no podía dormir y me puse a ver qué era hadoop y por qué había tanta alaraca en internet.

También busqué aplicaciones reales. O sea leí que yahoo lo usa, que estaba basado en algo de google, que estaba hecho en java y que ganó la GraySort competition ordenando 1 terabyte de datos en 209 segundos.

Lo que necesitaba saber era qué aplicación real tenía. Para qué lo usan Facebook y yahoo?

Vi varias webpages. Parece primero Google innovó resolviendo la necesidad de tener cada vez más grandes y mejores computadoras que no se caigan ni rompan nunca, dando vuelta el problema y apostar por computadoras baratas, que gasten menos energía, quizá se rompan más, pero con un software que tolere todos esos fallos.

A eso lo ví en este video (muy recomendable para entender qué es google como un todo, qué busca, y cómo se relaciona con la innovación): Innovation at google de Douglas Merrill 51'47''.

Computación Distribuída como la entiendo yo
Bastante quilombo se me hace cuando pienso en términos de threads en java. El tema distribución de servers, instancias, clusters, comunicación, etc, etc. Es como para marearse. Pero si en cambio en algún momento estudiamos o aplicamos algo de programación funcional. Se puede entender el map y reduce donde:
map(F, L) -> L'
aplica a cada elemento de la lista L la función F y retorna la lista de resultados.
reduce(F,L) -> R
aplica F, una función de 2, a los elementos de L tal que luego de obtener el resultado de aplicar a 2 elementos, se aplica al siguiente elemento con el resultado obtenido. Y así hasta obtener un solo resultado.

En un ejemplo
map(quad,[1, 2, 3]) = [1, 4, 9]
reduce(sum, [1, 4, 9]) = 14

Una vez entendido esto se pone un ejemplo: Si yo tuviese una lista de 100.000.000 de elementos terminaría de aplicar un map mucho más rápido si tuviese en vez de una pc varias, haciendo la computación al mismo tiempo sobre un subconjunto local de la lista. Con reduce ocurriría algo similar, algunos agarrarían los elementos de la lista, otros reduce los resultados de aplicar 1 o más veces reduce a los elementos originales, y así siguiendo.

Google desarrolla el famoso MapReduce haciendo algo similar a lo que expliqué pero esta tecnología es privada. Así también como la solución de storage distribuído que tolera fallos de hard.

Pero publicó unos papers los cuales fueron suficientes como para que Doug Cutting desarrolle su propia versión.
seguir leyendo...

Me resulta fascinante cómo Cutting desarrolla una tecnología y no la puede probar con varios teras hasta que por fin lo llaman de Yahoo.

Luego, como para ir redondeando, yahoo enriquece hadoop, luego facebook.

Luego se juntaron 3 ingenieros. 1 de google, otro de yahoo, otro de facebook y ahí nació Cloudera.

No tiene sentido que explique lo genial que es el sitio y lo accecible que es toda la información así como los training sobre hadoop y las tecnologías circundantes (pig, hive, hdfs...).

También cuentan con un configurador de imágenes de hadoop. Hadoop en distintas versiones.

Lo que más me fascinó es que lo primero que viene a la mente al escuchar computación distribuida, clusters, etc es "voy a estudiar mucha teoría pero dónde mongo me prestan un cluster para probar???"

Y la respuesta es: en amazon. Sus webservices contienen todo lo necesario. Y además es barato.

Acá cuentan con lujo de detalle cómo Tom White procesa 6 semana de logs (100gb) en un job escrito en java que tarda 35 minutos en 20 instancias. Utiliza EC2 y S3 y termina pagando 2 U$S + costo de transferencia externa y storage (para llevar los 100gb a S3).


Ahora lo que falta es tener un problema grande a mano como para probar esta tecnología.


Impresionante uso de hadoop por parte de facebook



jueves 2 de julio de 2009

Descubrimentos musicales

Tengo ganas de probar como todos los meses algo nuevo a nivel gastronómico:
hace un mes fue el sake, que no me gustó.
Otro mes fue los tacos ya hechos con los frijoles negros, que eran pasables.
Este mes me quiero comprar una Amarula.
Entonces busco cómo prepararla y luego a ver si hay algún video en youtube.
Y me encuentro con esto:

realemnte genial esta sueca Amanda Jenssen. No solo tiene esa voz preciosa y media ronca sino que es muy linda.
Inperdible el Allelujha para el American (o swedish) Idol Sueco:


Luego buscando la publicidad de Coka cola en la biblioteca que me encantó:

Encontré esta otra banda que me gustó mucho también:


Descubrir música es lo mejor de la aleatoriedad de internet.

domingo 7 de junio de 2009

Mejorando Firefox 3

Primero instalamos un addon de firefox para shortcuts aca

Una vez instalado y reiniciado vamos a la pag de shortwave.

Click derecho en el boton del bookmarklet y "add Shortcut2Url this link"

Agregamos una letra. Yo elegí la R-

Aceptamos todo y listo

Para empezar hacemos CTRL+Q R (primero ctrl+q y luego R)

Tipeamos help y vamos a todos los comandos copados de shortwave.

Por ejemplo
yt se lo que hiciste

Y ves se lo que hiciste en youtube

miércoles 20 de mayo de 2009

Recital de Negrita (como banda soporte de la bersuit)

Compré la entrada para probar una aplicación de pago. 40 morlacos y ya fuí sabiendo que probablemente el sonido sea malo y que el recital también.

La seguridad era buena, creo, había muchos policías y revisaban a todos.
No se vendía alcohol así que veía cómo algunos pasaban del agua mineral al faso diectamente.

Me gustan algunos temas de la bersuit pero no soy para nada fanático (menos para cantar hasta quedar afónico y aturdido, y ménos para querer que cordera sea presidente solo porque dice que la política es una mierda).

Lo que me sorprendió del recital fui la banda soporte: Negrita, una banda italiana que tiene su myspaces acá. Que pasada por un gtranslate es esto (que mucho no se entiende pero es mejor si no sabés italiano como yo)

Mientras me curaba la angina que me dejó el recital busqué un cacho en internet, sobre todo una canción que grabé del recital con el celular (se escuchaba pésimo), que creo que es rotolando verso sud (rodando hacia el sur).

Y acá dejo una lista que me armé con las canciones que me gustaron de la banda.

Cake php en windows

Al final no pude hacer andar mi idea de un super sitio, que al final entre una cosa y la otra quizá fui muy exigente en cuanto a lo que debería haber tenido antes...
Según unos cálculos a ojo-porciento (u OjO%) en horas hay que dedicarle el %20 de tu tiempo a una pseudo bosquejo de startup. En una semana eso suma unas 33.6 horas por semana y unas 4.8 horas por día.
Si estas se suman a las 40 horas que laburo, más las 14 horas que viajo (ida y vuelta al laburo), más 21 horas que uso para comer. Es decir
laburo: %23
viajar: %8
comer: %12
dormir: %33
estudio: %8
me queda un %16 para otras cosas

El %20 no lo veo por ningún lado. Y no voy a usar por ahora al menos %16 de ocio en otra cosa que viene a ser como un laburo pero con mucha más pasión y mucho menos urgencia.

Más urgente es terminar la licenciatura. Esa es mi startup en estos tiempos que corren.

En fin.

El tema es que NO recomiendo Dattatec con servidor windows (me pensé que cake php andaba igual que en casa) para programas en Cake php ya que el rewrite no está activo y no lo va a estar para IIS en una cuenta normal. Para acceder a eso necesitás un servidor dedicado. Y una vez comprada la cuenta por un año me quedó inutilizada ya que tampoco dattatec se encarga de migrar de server por vos. Tenés que comprar una cuenta nueva sin que se le clavés mal la uña cuando elegís el servidor.

Lugmen 09 allá voy

Expo2009 Software Libre
Si me hubiese enterado antes hubiese mandado mi disertación sobre Mercurial. Pero bue, me enteré recién hoy. Habrá que estar más en sintonía con los lugs en el futuro...

sábado 16 de mayo de 2009

Buena música

Estos temas escucho últimamente

International Love
Está bueno, para estar pensando en alguien. Igual se nota que Fidel no llega a ciertas notas y hace la gran daft punk. Pero queda bueno.
Subite a la palmera y bajame los cocos



Florence and The Machine - Girl With One Eye (live)

Este es genial. Parece que todavía no es muy conocido, igual mucho no investigué.
este es el myspaces. Me encanta la onda y el arte de la pag web. Parece un cacho a Frida

Este también me gusta, pero se me hace que la letra es más bien ir por la rima que por el sentido: