CategorÃa: Programacion
Geolocalizar números de IP

Hace un par de años, cuando intenté retomar mi carrera, en un TP (si, me tocó hacer un TP) quise aprovechar el tráfico de este site para armar el proyecto, básicamente habÃa que hacer un sistema que tomase datos reales (las stats de un sitio son un lindo ejemplo de ello) y realizase varas operaciones. Eso servÃa como dato, pero lo que querÃa hacer en el proyecto involucraba detectar de qué paÃs era cada número de IP de ustedes.
Lindo problema, nunca me habÃa encontrado con la necesidad, pero hoy por hoy es algo más que necesario, desde campañas de publicidad hasta estadÃsticas más o menos fieles, la geolocalización te permite mostrar contenido preferencial para algún paÃs, ocultarlo para otro o simplemente avisarle al usuario que hay algo especial si viene de X destino, algo que tan sólo con el número de IP no se puede obtener, hace falta algo más.
Ese algo más es lo que les explicaré en este post con la solución que hay dando vueltas y cómo implementarla en cualquier proyecto.
PHP: Detectar los spiders de los buscadores
Un poquito de programación rápida para comenzar la semana. El otro día me di cuenta que estaba creando sesiones a lo pavote para TODOS los que entraban al blog, algo normal para contabilizar de donde, cuantos activos y esas cosas que sirven a modo estadístico.
Con usuarios normales no es un problema, salvo ataques DDOS donde ese sería el último de mis problemas, jeje, pero con los bots de los buscadores... ah, eso sí que es un drama.
Cuando tu site recibe mucho tráfico o se actualiza seguido los spiders de los buscadores pasan también más seguido, así que te revisan cada rincón, aumenta el tráfico y las sesiones, lo que hice fue buscar una función (aquí en PHacks) para detectarlos y evitar tanto peso en el servidor, en PHP, es sencillo:
Tan sólo cuando entra pregunto si es un bot, ¿Por qué no guardar la lista en una DB? justamente porque lo que quiero eliminar son requests a la base de datos, con un hermoso y cochino if enorme podemos contener la mayoría de los bots que andan dando vueltas.
Contra toda la teoría de sistemas que te enseñan en la facultad, el "hardcodeo" es necesario cuando buscás performance, no está mal, es que hay que saber usarlo, en este caso es algo que se modifica rara vez y para aquellos que modificamos nuestro propio código, es más eficiente. En términos de eficiencia pura esto apenas consume un poquito más de memoria (unos bytes) en el script pero te quita una conexión TCP al servidor MySQL y la posible congestión de este, si la lista fuese más grande, bueno, sería otra historia.
Con esta pequeña función me ahorré un 90% de requests inútiles a la base de datos por parte de los buscadores cuando pasan a explorar el blog, a continuación les dejo una lista de muchos nombres posibles, yo sólo le cargué al mío los más comunes, Google y Bing, más otros tantos.
Update: Con el tiempo me armé mi propia función y, luego de diez años, ha acumulado una enorme cantidad de datos de buscadores y spiders varios, la pueden descargar libremente de mi GitHub
Un Feed Reader para los Links de Viernes

El lunes pasado llegué de vacaciones y me puse a programar cual adolescente con ideas, si, esas ideas que seguro ya tuvieron todos antes que vos, pero lo que estaba buscando era, como siempre pasa cuando programo, una solución a un problema mÃo que, por extensión, seguramente iba a beneficiar a otros.
Aun existiendo ofertas por todos lados como Feedly para reemplazar Google Reader (próximo a cerrar) querÃa tener mi propia solución dentro del site de Links de Viernes porque es el lugar lógico donde la gente pueda intercambiar enlaces interesantes. La cuestión es sencilla, yo siempre puedo disponer de mi propio código y no tengo que depender de la decisión caprichosa de un tercero, a la vez, por razones obvias, quien use mi sistema se encontrará igualmente desprotegido que si usase el de google, pero bueno, no puedo con todo tampoco

En mi caso tal vez pueda liberar el código algún dÃa, primero tengo que hacerlo funcionar bien. A continuación les cuento qué hice, qué funciona y qué queda por delante (mucho).
Enumerando y actualizando posts en MySQL
El otro día me puse a contar posts de Ruleta Rusa y Links de Viernes, resulta que Google en ese afán de querer decirnos cómo debemos bloguear y no respetar un cuerno que a nosotros nos pasemos por el traste sus "reglas" optó por penalizar a cada site cuyos posts tengan el mismo nombre.
He aquí que con más de 400 posts que compartían el nombre tuve que hacer algo para renombrarlos y, al menos, enumerarlos.
No tenía ganas de hacer tablas temporales ni nada por el estilo, así que opté por una forma un tanto cochina que permite MySQL, primero hice una prueba para ver si más o menos podía hacerlo, como si uno estuviese programando en PHP pero esta vez dentro del MySQL, creamos una variable, la seteamos a cero y ésta será nuestro contador, es fácil:
SET @inc :=0;
Nótese el ; (punto y coma) para separar instrucciones, no se lo olviden porque no va a funcionar, el SET es una función separada del SELECT.
De esta manera @inc será una variable que incremente, su valor inicial será cero, ahora hagamos un SELECT de prueba, para ello en el primer campo agrego uno al contador, en el segudo muestro el título, tercero la noticia y cuarto uno que concatene el título, un guión y numeral (porque me place) y luego el número. Como verán usé CONCAT para armar el string final pero también CAST para pasar el número a char porque si no en algunos casos hacía cualquier cosa.
SELECT @inc := @inc +1 AS a, title, id_noticia, CONCAT( title, ' - #' ,CAST(@inc AS CHAR)) AS titulomejorado
FROM `posts`
WHERE title LIKE 'Links de Viernes%' and title <> 'Links de Viernes toda la semana'
ORDER BY time ASC
LIMIT 0 , 300
Busqué todos los LDV y de paso dejé afuera el post donde hablaba del nuevo sitio de los LDV, porque claro, no era lo mismo y me iba a quedar mal numerado.
Una vez que vi que estaba todo ok le agregué una columna temporal a la tabla, a veces hago esta grasada, sirve bastante, algunos hacen toda una tabla paralela y luego la renombran, preferí este cochino método. Obviamente antes de hacer algo así recomiendo hacer backup de la base, uno nunca sabe cuando se olvida de poner el WHERE en el UPDATE
Ahora con la idea encaminada me dispuse a actualizar ese nuevo campo, creo un VARCHAR del mismo tamaño que los títulos, con el nombre "titulomejorado" y me dispongo a rellenarlo con lo que corresponda:
SET @inc :=0;
UPDATE posts A
INNER JOIN (
SELECT @inc := @inc +1 AS a, title, id_noticia, CONCAT( title, ' - #' ,CAST(@inc AS CHAR)) AS titulomejorado
FROM `posts`
WHERE title LIKE 'Links de Viernes%' and title <> 'Links de Viernes toda la semana'
ORDER BY time ASC) X
ON X.id_noticia = A.id_noticia
SET A.titulomejorado = X.titulomejorado;
En este caso hago un join con la búsqueda anterior, la razón es simple, al ya tener todos los ID de noticia ya puedo actualizar uno por uno, funciona bien, es rápido y sólo afecto a las filas de los posts que me interesan, el resto ni se entera.
A muchos les cuesta un poco hacer querys dentro de querys pero donde le tomás la mano sale muy bien, el problema es cuando estás practicando y arruinás todo
Una vez ejecutado este UPDATE deja en el campo "titulomejorado" el nuevo título, podemos chequear que todo esté bien y ahí disponernos a usarlo definitivamente:
UPDATE posts
SET title = titulomejorado
WHERE titulomejorado IS NOT NULL;
Obviamente la condición es importante una vez más, si no ponemos ese where dejando afuera todos los otros posts básicamente les vamos a borrar el título a todas las notas, algo que nos haría entrar en pánico
Luego de esto podemos borrar la columna temporal "titulomejorado", ahora todos los posts de Links de Viernes y Ruleta Rusa estan perfectamente numerados, por ahí hay otros posts más viejos que usaron otro título, pero esos no afectan en Google.
Para ver el tema de posts con títulos duplicados usen Webmaster Tools y ahí les dirá donde hay un problemita
Ah ¿se pensaban que ya no posteaba estas cosas en el blog? no se olviden de donde vengo mis muchachos , se aceptan correcciones e ideas más performantes a lo que sugiero, esto tan sólo me dio resultado
Una ayudita con expresiones regulares
A ver, que a veces me toca a mà pedirles una ayudita a los lectores programadores.
Resulta que estoy trabajando con el código del blog para que las urls del mÃsmo no aparezcan duplicadas para Google, actualmente el buscador me voló del Ãndice unos 3000 posts, como se imaginarán no me pone muy contento. Una de las posibles razones son los duplicados, no es algo intencional, sólo que desde que puse la posibilidad de que los posts se vean como: http://www.fabio.com.ar/5014 esto generó un problema
La url original era más bien fea: http://www.fabio.com.ar/verpost.php?id_noticia=5014 y por eso la idea fue acortarla a algo más sencillo.
El tema es que Google ve dos ahora, http://www.fabio.com.ar/verpost.php?id_noticia=5014 y http://www.fabio.com.ar/5014 para una misma nota, considera que estoy haciendo algo sucio duplicando contenidos aun cuando ambos son exactamente el mismo.
Para ello ahora hago un redirect en php y le envÃo un código 301, éste implica que es contenido "movido" y no duplicado. OK, hasta ahà bárbaro y si hacen click en una url larga y vieja los llevará a la corta simplificada.
Pero aquà tengo un problema, herencia del código viejo de mi blog, esta es la regla que ajusta la url:
RewriteRule ^([0-9_]+)$ verpost.php?id_noticia=$1&vieja=1 [L]
Hasta ahà todo perfecto, Apache se encarga de pasarle el parámetro si es que viene un numerito (el id del post) y se lo pasa a la vieja estructura.
El problema es cuando, por ejemplo, para emitir un mensaje de error (onda, escribiste una palabra spammera o te equivocaste el código de seguridad) le pasaba un parámetro, la url quedarÃa asÃ:
http://www.fabio.com.ar/5014&mensaje=4
El problema con esto es que 5014&mensaje=4 no significa nada para esa expresión regular y directamente me lo desecha como error 404, un despropósito.
Por esto necesito cambiar:
RewriteRule ^([0-9_]+)$ verpost.php?id_noticia=$1&vieja=1 [L]
de manera tal que contemple no sólo el número de ID del post si no los parámetros extra como "mensaje" y lo pase a la vieja url, de esta manera yo serÃa un blogger muy feliz y, tal vez algún dÃa, Google considere este blog digno nuevamente en su totalidad y no sólamente para 1800 posts
¿Mi problema? nunca entendà bien las expresiones regulares, asà es, soy bastante burro con las malditas y no sabrÃa como hacer para que me genere el parámetro $2 para mensaje, no es difÃcil, lo se, pero zoy ezpezial ¿me ayudan?
Cuantas palabras tienen tus posts
Hoy estaba pensando en esto ¿como cuernos cuento las palabras en mis posts? es que nunca me puse a hacerlo y de pronto me di cuenta que en MySQL no hay funciones para esto ¡hay que googlear! ya mismo, pásenme la googlera.
Asà fue que encontré una forma, pero resulta que no sólo tengo que contar palabras si no que tengo que, primero, sacarle todo el HTML que yo le agrego a mis posts.
Asà es, en el viejo y querido PostRev el código se agrega a mano lo que complica identificar una palabra y los números no me daban, asà que a crear dos funciones, wordcount y strip_tags.
La cuestión también está en que una base de datos no es precisamente para hacer cuentas, esas deberÃa hacerlas aparte, pero salvo que sean sumatorias estas eran cosas para hacer aparte. ¿como hacerlo y seguir dentro de MySQL? creando funciones y utlizándolas en la consulta.
Es un poco intensivo y recomiendo hacerlo solamente con una copia local de la base de datos, asà si tienen que esperar no bloquean el blog durante un rato.
A continuación se las comento
Stardust, pequeño experimento

Estaba con necesidad de "programar algo", vieron, para el dÃa del programador, asà que publiqué ayer a la tarde un nuevo site, no es que pretenda actualizarlo muy seguido, pero era un experimento para crear una especie de "youtube" propio sin las restricciones impuestas en dicho servicio de video.
No es código pensado para difundir, apenas hay una base de datos de fondo para guardar los videos, no hay ni tags ni comentarios, sólo videos que me gustaron, bajo el mp4, lo preparo, lo subo, cito la fuente y lo alojo.
Más de una vez me encuentro con videos que me gustan y a la semana Youtube bajó por alguna regla idiota o le bloquean el poder distribuÃrlo o compartirlo entre sitios, todo para forzarnos a ver una cierta cantidad de publicidad o un canal de video en particular. O te censuran el audio porque en 10 minutos de video hay un sólo minuto de una canción, algo ridÃculo y que, al menos en la mayorÃa de los paÃses del mundo (estoy incluye a los EEUU) es completamente legal porque entra en el esquema de "Fair use".
Bueno, pero no era sólo por cuestión de principios si no para ver si podÃa hacerlo, le dediqué unas 3-4 horitas algo espaciadas para ver si lo hacÃa de tal o cual manera, escribà un poco de código y me fue gustando la idea. Asà publiqué Stardust.
Repito, la idea no es usarlo demasiado fuerte, ya tengo demasiados proyectos activos, Fabio.com.ar, Tecnogeek.com (mis dos blogs principales), Cake Division (mi agencia digital de publicidad), LinksDeViernes.com (comunidad online), Elección Argentina (wiki), PicPetz (imagenes de animales), No Al Canon (muy desactualizado blog de protesta), y un largo etcétera, la idea no es sumar más quilombo pero fue un divertido ejercicio de programación rápida "a las patadas" como me divierte hacer.
Asà que disfrútenlo, cada tanto actualizaré videos y sumaré más, no hay nada ilegal, no se trata de un cuevana ni nada que contenga material "protegido", la idea es más bien boludeces y cosas entretenidas para ver.
Como siempre se aceptan sugerencias, ideas, aportes de código y crÃticas.
Arreglando el problema (parcialmente) de los Like de Facebook

Las redes sociales sumaron sus botoncitos para republicar/recomendar contenido en ellas mÃsmas pero esos botoncitos no siempre funcionan bien, más bien, apestan.
El de Twitter nunca muestra los resultados hasta tres o cuatro dÃas después, el de Google ahora está andando mejor pero el "like" no se refleja en ningún lado, ni en el timeline de Google+ (hay que entrar en un submenú de cada usuario, WTF?) y el de Facebook venÃa funcionando bien hasta hace unas semanas.
¿que pasó? ni idea, definitivamente no es un error de nuestros sitios ya que sin hacer cambios por este lado comenzó a fallar, pero en tres-cuatro semanas nadie de Facebook se molestó en arreglarlo y, como siempre, en estos casos hay que recurrir a algún vericueto para solucionarlo "a medias".
Como buen Argentino siempre atamos todo con alambre y buscando por ahà encontré una forma de apaliar el tema, primero que nada el problema se parece al de un ping que no llega a destino. "algo" en Facebook identifica mal nuestra URL y por ende no accede a darle el "like".
El botón de "like" dispara ciertos mecanismos dentro de Facebook, va hasta el sitio que lo solicita, toma la url, la descarga, identifica encabezados, busca la imagen del post, la public en tu muro. Todo eso debe hacer el botoncito que como verán es mucho más que un simple botón.
El primer tip es, entonces, que la URL sea fácil de identificar para Facebook y si son de programar en PHP como yo, hay que convertirla con urlencode:
urlencode(the_permalink()); // para Wordpress urlencode($url); // para PostRev![]()
Al menos esto solucionarÃa una parte del problema pero no lo es todo, el segundo son los encabezados y acá la culpa es TODA de Facebook pretendiendo que en nuestros blogs sumemos headers que no son estándar.
El Open Graph Protocol. ¿necesidad? ninguna! el HTML ya cuenta con todas las propiedades que Facebook require duplicar, algo absolutamente ridÃculo. Pero es asÃ, primero es un protocolo abierto, segundo, sirve para identificar cosas, asà que si queremos ser "Facebook Like" deberÃamos implementarlos en el blog.
Tercero, si todo falla, hay una opción más: forzarlo. Entre las herramientas de Facebook está el URL Linter que permite cargar tu url, analizarla y "habilitarla" para Facebook. Cualquier URL que previamente fallase, la cargan en el Linter, Lint y listo, ya se encuentra "catalogada".
Ahà mÃsmo verán cómo te muestra los "errores" o faltantes (de ahà confirmé lo del Open Graph) y cómo ve Facebook tu blog.
Y listo, más información no sabrÃa darles, con esto funciona aunque suele fallar también, seguramente en este blog termine implementando los headers de Open Graph al menos en una versión simplificada pero suficiente.
Frases para programadores

Como soy de los enfermos que disfrutan de programar un viernes a la noche, y cuando digo disfrutar, es que anoche tenÃa como opciones ver tele, masacrar gente jugando un FPS, navegar aburridamente o programar y elegà esto último.
Navegando por ahà encontré hace un tiempo esta extensa lista con grandes frases de programadores para programadores y, sepan disculpar los que no comprenden demasiado el tema, hoy tengo un post para nardogeeks de buena ley

Junté aquà las que más me gustaron, si no siempre pueden consultar la fuente que tiene 50 grandes citas.
Posts Favoritos
Funcionalidad que me pidieron hace años y siempre me dio fiaca programar.
Ahora la importé desde el código de Links de Viernes.com y pueden marcar como favoritos los posts que más le gusten.

Al pie de cada nota hay una pequeña estrellita, sólo se ve cuando estás dentro de una nota, no en la portada del sitio, allà pueden marcar o desmarcar un post que les guste.

En el menú de usuario, ya que esta funcionalidad sólo es para usuarios registrados, tendrán un link a los post marcados y allà podrán ver un listado con todo lo que les gustó.

No es la gran cosa pero al menos funciona!