Tuesday, May 15, 2007

Parsing html

Estudiando el "parsing" de tablas en html.

demo de Tcllib (oreilly-oscon2001)

1er problema:
Aparece un error que dice que el proc "struct::tree" esta siendo llamado con un numero incorrecto de parametros.

Causa:
el demo estaba hecho para Tcllib 1.5, la opcion -key era entonces valida
pero la distribucion que tengo es Tcllib 1.9

Solucion:
Eliminar todas las apariciones de "-key" por ""

2do problema:
No veo los mensajes de debug, tuve que leer algo en el wiki, en la pagina "log"
incluso la edité.

Estos son los niveles:
emergency
alert
criticalerror
warning
notice <--- logLevel variable
info........x
debug.......x

Tuve que ponerle lo siguiente al script demo:
log::lvSuppressLE emergency 0; #habilita todos los niveles
log::lvSuppressLE $logLevel 1; # deshabilita todo lo que esté por debajo de este nivel
log::lvSuppress $logLevel 0; # restablece el nivel de interés

siendo logLevel = debug en este caso

  • si se corre el script con tclsh, aparecen los mensajes en la consola de DOS.
  • si se corre el script con wish, aparecen los mensajes en la consola de Tk. (console show)


Sab 12 de diciembre 2009:
Pude utilizar el programa LemonTree para adaptarlo al demo de O'Reilly de modo que se pueda navegar el arbol (struct::tree) de manera interactiva y usarlo como herramienta para entender la estructura de una pagina web que se quiera "parsear".