05 mayo, 2008

Parseador HTML y "navegador virtual" en el servidor con Javascript

John Resig, el autor de jQuery ha creado un parseador de HTML con Javascript. Es decir, un programa capaz de leer un documento en HTML que no cumpla el estándar XHTML y convertirlo en un documento XML válido.

Gracias a que ha hecho mención de ello he descubierto el fruto de su trabajo durante un fin de semana de Julio del 2007, en el que creó algo más importante: una librería para permitir trabajar con documentos XHTML en el lado del servidor.

Se trata de un archivo llamado env.js que cargado desde Rhino (el intérprete Java para ejecutar código Javascript) permite hacer cosas como cargar la librería Prototype en el servidor:

$ java -jar build/js.jar
 Rhino 1.6 release 6 2007 06 28
js> load('build/runtest/env.js');
js> window.location = 'test/index.html';
 test/index.html
js> load('prototype.js');
js> $$('div p')
 <p#firstp>,<p#ap>,<p#sndp>,<p#en>,<p#sap>,<p#first>
js> Object.toJSON({foo:'bar',baz:true});
 {'baz': true, 'foo': 'bar'}
js> var fn = (function(name,msg){
  print(name + ' ' + msg); }).curry('John');
js> fn('hello!');
 John hello!


...u obtener el último artículo de AListApart...

load("env.js");
window.location = "http://alistapart.com/";
window.onload = function(){
  load("dist/jquery.js");
  print("Newest A List Apart Posts:");
  $("h4.title").each(function(){
    print(" - " + this.textContent);
  });
};


La importancia de este trabajo es grande. De hecho, plataformas como Aptana Jaxer, sin duda han desarrollado esta idea hasta obtener un producto completo.

Publicar un comentario en la entrada

Últimos links en indiza.com