Algún programador suicida

Hay algún programador con ganas de experimentar un poco? quiero ver si se puede "chorear" un xml de Clarín partiendo de los titulares y notas de tapa de su web.

En teoría no sería tan difícil porque todo está cerrado por divs con tres nombres principales: tme que tiene la hora y el subtítulo, tig que es el título en grande, tim que es el título más chiquito, y tex el texto (cuando hay uno), el link a la nota está en tim que no es un div es un a href.

es decir, hay que despachurrar el código de la web de clarín, jeje, todo está encerrado en el div id=cen es decir "centro", el diseñador podría haber utilizado nombres más grandes de 3 letras para el CSS, jejeej, es un paja.

¿Alguno se prende en semejante boludez?, yo voy a ver si se puede robar haciendo un parseador con PHP

Si te gustó esta nota podés...
Invitame un café en cafecito.app

Categoría: Programación Etiquetas:  

Otros posts que podrían llegar a gustarte...

Comentarios

  • Anónimo     21/01/2004 - 04:34:40

    Yo me prendo fabio, a quien hay que pegarle?

  • Fabio     21/01/2004 - 09:48:13

    al que edita digitalmente los diarios argentinos, son unos cuantos webmasters, si les hacés el aguante :D:D:D<br />
    <br />
    es que ninguno pone a disposición las noticias, es decir, si quiero ponerlas vía Superkaramba o GDesklets en mi escritorio no puedo porque no hay un puto archivito xml con los titulares, hasta esta página tiene uno! xx.com.ar/backend.php de donde pueden sacar los titulares y ponerlos tanto en sus webs o programas o feedreaders... pero los diarios argentinos no tienen un joraca de eso...<br />
    <br />
    pensaba que tal vez se podía "chorear" un poco del diario...

  • Anónimo     21/01/2004 - 17:48:14

    fabio es nada más que un experimento totalmente extraoficial, pero:<br />
    <br />
    http://www.weblogs.com.ar/test/clarinrss.php

  • Anónimo     21/01/2004 - 17:49:58

    por otro lado, La Nación tiene versión RSS disponible:<br />
    <br />
    http://www.lanacion.com.ar/varios/otrosformatos/rss.asp

  • Anónimo     21/01/2004 - 17:50:26

    y quién dejó estos comentarios es GuilleBe

  • Fabio     21/01/2004 - 19:44:36

    gracias guillebe!<br />
    <br />
    me encantó ese, si algún día abren el código de eso me gustaría verlo!!! Guiño porque no es joda laburar con cadenas tan complejas, el parse es bastante difícil si uno no está acostumbrado a hacerlo.<br />
    <br />
    el de la nación lo voy a probar Guiño gracias!!

  • Anónimo     01/02/2004 - 01:31:09

    lejos del proyecto en cuestion, pero quizas les sea simpatico un bloquecito que "chorea" dia a dia el chiste de tapa del Pagina / 12.
    lo que hace es muy simple, a las 2 AM actualiza la url de la imagen que es siempre igual solo que un subdirectorio es la fecha por ejemplo
    pagina12web.com.ar/.../20040131/...

    lo pueden ver en "El chiste del dia" en el
    <a href="http://www.cdclubaltovalle.com.ar"> CD CLUB ALTO VALLE</a>

  • Los Protocolos de los Sabios de Sion     02/07/2004 - 20:19:05

    Vean esa pagina Web y saquen concluciones de la vida Real !!!, comparen y descarten lo discriminatorio de lo REAL !
    Tengan un Buen dia y una buena lectura ......

  • Virginia     13/07/2005 - 21:51:55

    Clarin tambien tiene rss
    http://www.clarin.com/shared/v7/rss/index.html

    No se si te sirve de mucho

  • jujujua     02/01/2008 - 20:53:04

    Aun estas interesado en ese parse?

  • Fabio     03/01/2008 - 08:36:55


    jujujua dijo:

    Aun estas interesado en ese parse?


    hace rato que ya clarín sacó su propio RSS, no es necesario

Deje su comentario:

Tranquilo, su email nunca será revelado.
La gente de bien tiene URL, no se olvide del http/https

Negrita Cursiva Imagen Enlace


Comentarios ofensivos o que no hagan al enriquecimiento del post serán borrados/editados por el administrador. Los comentarios son filtrados por ReCaptcha V3.