Yo me prendo fabio, a quien hay que pegarle?
Algún programador suicida
Hay algún programador con ganas de experimentar un poco? quiero ver si se puede "chorear" un xml de Clarín partiendo de los titulares y notas de tapa de su web.
En teoría no sería tan difícil porque todo está cerrado por divs con tres nombres principales: tme que tiene la hora y el subtítulo, tig que es el título en grande, tim que es el título más chiquito, y tex el texto (cuando hay uno), el link a la nota está en tim que no es un div es un a href.
es decir, hay que despachurrar el código de la web de clarín, jeje, todo está encerrado en el div id=cen es decir "centro", el diseñador podría haber utilizado nombres más grandes de 3 letras para el CSS, jejeej, es un paja.
¿Alguno se prende en semejante boludez?, yo voy a ver si se puede robar haciendo un parseador con PHP
Otros posts que podrían llegar a gustarte...
Comentarios
-
al que edita digitalmente los diarios argentinos, son unos cuantos webmasters, si les hacés el aguante
<br />
<br />
es que ninguno pone a disposición las noticias, es decir, si quiero ponerlas vía Superkaramba o GDesklets en mi escritorio no puedo porque no hay un puto archivito xml con los titulares, hasta esta página tiene uno! xx.com.ar/backend.php de donde pueden sacar los titulares y ponerlos tanto en sus webs o programas o feedreaders... pero los diarios argentinos no tienen un joraca de eso...<br />
<br />
pensaba que tal vez se podía "chorear" un poco del diario...
-
fabio es nada más que un experimento totalmente extraoficial, pero:<br />
<br />
http://www.weblogs.com.ar/test/clarinrss.php
-
por otro lado, La Nación tiene versión RSS disponible:<br />
<br />
http://www.lanacion.com.ar/varios/otrosformatos/rss.asp
-
gracias guillebe!<br />
<br />
me encantó ese, si algún día abren el código de eso me gustaría verlo!!!porque no es joda laburar con cadenas tan complejas, el parse es bastante difícil si uno no está acostumbrado a hacerlo.<br />
<br />
el de la nación lo voy a probargracias!!
-
lejos del proyecto en cuestion, pero quizas les sea simpatico un bloquecito que "chorea" dia a dia el chiste de tapa del Pagina / 12.
lo que hace es muy simple, a las 2 AM actualiza la url de la imagen que es siempre igual solo que un subdirectorio es la fecha por ejemplo
pagina12web.com.ar/.../20040131/...
lo pueden ver en "El chiste del dia" en el
<a href="http://www.cdclubaltovalle.com.ar"> CD CLUB ALTO VALLE</a>
-
Vean esa pagina Web y saquen concluciones de la vida Real !!!, comparen y descarten lo discriminatorio de lo REAL !
Tengan un Buen dia y una buena lectura ......
-
jujujua dijo:
Aun estas interesado en ese parse?
hace rato que ya clarín sacó su propio RSS, no es necesario