Algún programador suicida

Hay algún programador con ganas de experimentar un poco? quiero ver si se puede "chorear" un xml de Clarín partiendo de los titulares y notas de tapa de su web.

En teoría no sería tan difícil porque todo está cerrado por divs con tres nombres principales: tme que tiene la hora y el subtítulo, tig que es el título en grande, tim que es el título más chiquito, y tex el texto (cuando hay uno), el link a la nota está en tim que no es un div es un a href.

es decir, hay que despachurrar el código de la web de clarín, jeje, todo está encerrado en el div id=cen es decir "centro", el diseñador podría haber utilizado nombres más grandes de 3 letras para el CSS, jejeej, es un paja.

¿Alguno se prende en semejante boludez?, yo voy a ver si se puede robar haciendo un parseador con PHP

Si te gustó esta nota podés...
Invitame un café en cafecito.app

Categoría: Programación Etiquetas:  

Otros posts que podrían llegar a gustarte...

Comentarios

  • Anónimo     21/01/2004 - 04:34:40

    Yo me prendo fabio, a quien hay que pegarle?

  • Fabio     21/01/2004 - 09:48:13

    al que edita digitalmente los diarios argentinos, son unos cuantos webmasters, si les hacés el aguante :D:D:D<br />
    <br />
    es que ninguno pone a disposición las noticias, es decir, si quiero ponerlas vía Superkaramba o GDesklets en mi escritorio no puedo porque no hay un puto archivito xml con los titulares, hasta esta página tiene uno! xx.com.ar/backend.php de donde pueden sacar los titulares y ponerlos tanto en sus webs o programas o feedreaders... pero los diarios argentinos no tienen un joraca de eso...<br />
    <br />
    pensaba que tal vez se podía "chorear" un poco del diario...

  • Anónimo     21/01/2004 - 17:48:14

    fabio es nada más que un experimento totalmente extraoficial, pero:<br />
    <br />
    http://www.weblogs.com.ar/test/clarinrss.php

  • Anónimo     21/01/2004 - 17:49:58

    por otro lado, La Nación tiene versión RSS disponible:<br />
    <br />
    http://www.lanacion.com.ar/varios/otrosformatos/rss.asp

  • Anónimo     21/01/2004 - 17:50:26

    y quién dejó estos comentarios es GuilleBe

  • Fabio     21/01/2004 - 19:44:36

    gracias guillebe!<br />
    <br />
    me encantó ese, si algún día abren el código de eso me gustaría verlo!!! ;) porque no es joda laburar con cadenas tan complejas, el parse es bastante difícil si uno no está acostumbrado a hacerlo.<br />
    <br />
    el de la nación lo voy a probar ;) gracias!!

  • Anónimo     01/02/2004 - 01:31:09

    lejos del proyecto en cuestion, pero quizas les sea simpatico un bloquecito que "chorea" dia a dia el chiste de tapa del Pagina / 12.
    lo que hace es muy simple, a las 2 AM actualiza la url de la imagen que es siempre igual solo que un subdirectorio es la fecha por ejemplo
    pagina12web.com.ar/.../20040131/...

    lo pueden ver en "El chiste del dia" en el
    <a href="http://www.cdclubaltovalle.com.ar"> CD CLUB ALTO VALLE</a>

  • Los Protocolos de los Sabios de Sion     02/07/2004 - 20:19:05

    Vean esa pagina Web y saquen concluciones de la vida Real !!!, comparen y descarten lo discriminatorio de lo REAL !
    Tengan un Buen dia y una buena lectura ......

  • Virginia     13/07/2005 - 21:51:55

    Clarin tambien tiene rss
    http://www.clarin.com/shared/v7/rss/index.html

    No se si te sirve de mucho

  • jujujua     02/01/2008 - 20:53:04

    Aun estas interesado en ese parse?

  • Fabio     03/01/2008 - 08:36:55


    jujujua dijo:

    Aun estas interesado en ese parse?


    hace rato que ya clarín sacó su propio RSS, no es necesario

Deje su comentario:

Tranquilo, su email nunca será revelado.
La gente de bien tiene URL, no se olvide del http/https

Negrita Cursiva Imagen Enlace


Comentarios ofensivos o que no hagan al enriquecimiento del post serán borrados/editados por el administrador. Los comentarios son filtrados por ReCaptcha V3.