Algún programador suicida

Hay algún programador con ganas de experimentar un poco? quiero ver si se puede "chorear" un xml de Clarín partiendo de los titulares y notas de tapa de su web.

En teoría no sería tan difícil porque todo está cerrado por divs con tres nombres principales: tme que tiene la hora y el subtítulo, tig que es el título en grande, tim que es el título más chiquito, y tex el texto (cuando hay uno), el link a la nota está en tim que no es un div es un a href.

es decir, hay que despachurrar el código de la web de clarín, jeje, todo está encerrado en el div id=cen es decir "centro", el diseñador podría haber utilizado nombres más grandes de 3 letras para el CSS, jejeej, es un paja.

¿Alguno se prende en semejante boludez?, yo voy a ver si se puede robar haciendo un parseador con PHP

Categoría: Programación Etiquetas:  
Otros posts que podrían llegar a gustarte...

Comentarios

  • Anónimo    

    Yo me prendo fabio, a quien hay que pegarle?

    • Responder
    • Citar
    • Comentado:
  • Fabio    

    al que edita digitalmente los diarios argentinos, son unos cuantos webmasters, si les hacés el aguante :D:D:D<br />
    <br />
    es que ninguno pone a disposición las noticias, es decir, si quiero ponerlas vía Superkaramba o GDesklets en mi escritorio no puedo porque no hay un puto archivito xml con los titulares, hasta esta página tiene uno! xx.com.ar/backend.php de donde pueden sacar los titulares y ponerlos tanto en sus webs o programas o feedreaders... pero los diarios argentinos no tienen un joraca de eso...<br />
    <br />
    pensaba que tal vez se podía "chorear" un poco del diario...

    • Responder
    • Citar
    • Comentado:
  • Anónimo    

    fabio es nada más que un experimento totalmente extraoficial, pero:<br />
    <br />
    http://www.weblogs.com.ar/test/clarinrss.php

    • Responder
    • Citar
    • Comentado:
  • Anónimo    

    por otro lado, La Nación tiene versión RSS disponible:<br />
    <br />
    http://www.lanacion.com.ar/varios/otrosformatos/rss.asp

    • Responder
    • Citar
    • Comentado:
  • Anónimo    

    y quién dejó estos comentarios es GuilleBe

    • Responder
    • Citar
    • Comentado:
  • Fabio    

    gracias guillebe!<br />
    <br />
    me encantó ese, si algún día abren el código de eso me gustaría verlo!!! Guiño porque no es joda laburar con cadenas tan complejas, el parse es bastante difícil si uno no está acostumbrado a hacerlo.<br />
    <br />
    el de la nación lo voy a probar Guiño gracias!!

    • Responder
    • Citar
    • Comentado:
  • Anónimo    

    lejos del proyecto en cuestion, pero quizas les sea simpatico un bloquecito que "chorea" dia a dia el chiste de tapa del Pagina / 12.
    lo que hace es muy simple, a las 2 AM actualiza la url de la imagen que es siempre igual solo que un subdirectorio es la fecha por ejemplo
    pagina12web.com.ar/.../20040131/...

    lo pueden ver en "El chiste del dia" en el
    <a href="http://www.cdclubaltovalle.com.ar"> CD CLUB ALTO VALLE</a>

    • Responder
    • Citar
    • Comentado:
  • Vean esa pagina Web y saquen concluciones de la vida Real !!!, comparen y descarten lo discriminatorio de lo REAL !
    Tengan un Buen dia y una buena lectura ......

    • Responder
    • Citar
    • Comentado:
  • Virginia    

    Clarin tambien tiene rss
    http://www.clarin.com/shared/v7/rss/index.html

    No se si te sirve de mucho

    • Responder
    • Citar
    • Comentado:
  • jujujua    

    Aun estas interesado en ese parse?

    • Responder
    • Citar
    • Comentado:
  • Fabio    


    jujujua dijo:

    Aun estas interesado en ese parse?


    hace rato que ya clarín sacó su propio RSS, no es necesario

    • Responder
    • Citar
    • Comentado:

Deje su comentario:

Tranquilo, su email nunca será revelado.
La gente de bien tiene URL, no se olvide del http/https
Para evitar bots, si se tardó mucho en leer la nota seguramente no sirva y tenga que intentar dos veces

Negrita Cursiva Imagen Enlace


comentarios ofensivos o que no hagan al enriquecimiento del post serán borrados/editados por el administrador