Archivo por meses: diciembre 2006

Un remake de UFO: Enemy Unknown

Cuando era joven me gustaba jugar al UFO: Enemy Unknown. En él, tu misión consistía en defender a la tierra del ataque de diversas hordas alien, creando bases, investigando nuevas tecnologías, capturando naves y fabricando nuevas armas. El juego tenía dos modos: uno de pura estrategia, en el que se controlan las distintas bases y se decide qué temas se investigan, qué dispositivos se fabrican, qué nuevos soldados o científicos se contratan, etc. También es este modo se detectan los ovnis y otras amenazas y se pueden lanzar ataques contra ellos.

El otro modo, al que se pasa cada vez que se derriba un ovni o se llega a una ciudad atacada o base alienígena, está basado en un sistema de combate por turnos. En él debes localizar a todos los aliens que hay y matarlos o capturarlos. Si lo consigues, te haces con toda la tecnología que hayan dejado, la cual se puede investigar (para replicarla) o vender (para ganar más dinero).

El juego era endiabladamente bueno, y gracias a sus excelentes gráficos e increíble música conseguía sumergirte de lleno en la historia, así como hacerte dar más de un respingo cuando, en alguna fase de combate por turnos, aparecía de pronto uno de los aliens y atacaba a tus hombres.

Todo ésto viene a cuento porque hace tres días me reencontré UFO: Alien Invasion, un remake del UFO original basado en el motor gráfico del Quake 2. Ya lo había visto hace un año, pero de aquella sólo estaba lista la parte de las misiones de combate. Ahora, sin embargo, toda la mecánica de estrategia está lista también, así como la música, y sólo falta pulir algunos detalles, añadir la UFOpaedia (u OVNIpedia) e implementar el hilo conductor de la historia original. Estuve jugando estos días y el resultado no puede ser mejor.

En la página hay versiones para Windows y para Linux, estas últimas en forma de paquete .DEB (para Debian testing e inestable). En Ubuntu, en principio no se puede instalar porque el paquete depende de la libasound2 versión 1.0.12 o superior, mientras que Ubuntu dispone de la versión 1.0.11. Sin embargo, basta con bajarse la libasound de Debian (añadiendo también, si es necesaria, la libasound2-dev de Debian) e instalarlas con DPKG.

Python, MySQL, UTF-8 y la madre que los parió

Errar es humano, pero para liar las cosas de verdad se necesita un ordenador… que trabaje con UTF-8.

Para los que no lo conozcan, UTF-8 es una codificación multibyte para la tabla de caracteres UNICODE. Un caracter UNICODE está representado por un número entre 0 y 1,114,111, y UTF-8 es un sistema para representar dicho número mediante una secuencia de bytes. Su característica más atractiva es que los primeros 128 caracteres se corresponden con los de la tabla ASCII y, además, ocupan un solo byte, lo que significa que un texto en ASCII estándar (de 7 bits) es, a la vez, un texto UTF-8; sin embargo, tan pronto comenzamos a usar otros caracteres más raros (como nuestra querida letra Ñ, o nuestras vocales acentuadas), ocuparemos dos, tres o hasta cuatro bytes por caracter.

En efecto, hagamos una pequeña prueba: abramos nuestro interprete de Python y escribamos:

Python 2.4.4c1 (#2, Oct 11 2006, 21:51:02)
[GCC 4.1.2 (Ubuntu 4.1.1-13ubuntu5)] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> cadena = u"Papá"
>>> print len(cadena)
4

Hasta aquí nada raro: hemos definido una cadena de tipo UTF-8 (la letra u antes de las comillas sirve para eso) y le hemos pedido al interprete que nos diga su longitud, que, efectivamente, es cuatro. Pero si cambiamos un poco el experimento llegan las cosas «raras»:

>>> cadena2 = "Papá"
>>> print len(cadena2)
5

Ahora la longitud es cinco, lo que no supone ningún misterio si nos damos cuenta de que la cadena la estamos definiendo como cadena normal, no cadena UTF-8, y por tanto nos devuelve el número de bytes que ocupa; y como la letra á (con tilde) necesita dos bytes (pues mi sistema utiliza UTF-8), el misterio queda resuelto.

Por desgracia las cosas se complican cuando uno tiene que usar Python para transmitir y recibir cadenas en UTF-8, byte a byte, por la red; cadenas de las que tomará trozos y compondrá con ellos peticiones para MySQL. Entonces es cuando llega la pesadilla… ¿Y por qué? Pues porque por defecto MySQL espera y entrega sus datos en Latin-1, y también los almacena en dicho formato; pero si yo meto una cadena UTF-8 sin decirle que es UTF-8, el la considera una secuencia el Latin-1, con lo que los datos que me entrega llegan bien, y los que yo le paso también… si no fuese porque el módulo de Python para trabajar con MySQL sabe que éste espera los datos en Latin-1 en intenta convertirlos, soltando a veces una excepción, o metiendo basura en la base de datos el resto.

Por todo ello debemos ser muy cuidadosos a la hora de trabajar con MySQL y Python en UTF-8, y aquí van las pistas que he ido recolectando después de varios días de sufrimientos varios:

Convertir las tablas a UTF-8 Es el primer paso: si creaste tus tablas en formato Latin-1, lo mejor es pasarlas a UTF-8 para evitarse problemas. Para ello usaremos

mysqldump --opt --password=miclave --user=miuser mibasededatos > archivo.sql

A continuación editaremos el código y cambiaremos la palabra latin1 por utf8, con lo que al recuperar los datos, las tablas se crearán en el nuevo formato. Ahora sólo queda volver a grabarlas con

mysql -u miuser -p miclave mibasededatos < archivo.sql

y listo, ya tenemos nuestras tablas en UTF-8.

Acceder a MySQL mediante UTF-8 Esta parte es sencilla también, pero la documentación es escasa y sólo la encontré después de bucear por muchas páginas de Internet y juntar resultados. Tenemos que usar la línea en python:

mibase=MySQLdb.connect(host="mihost", user="usuario", passwd="clave", db="basedatos", charset="utf8", init_command="set names utf8")

(atención a la negrita). Justo a continuación tenemos que añadir:

mibase.names="utf8"

y con ésto ya tendremos garantizado el acceso a la base de datos mediante UTF-8.

En principio con esto ya tendríamos todo listo para poder trabajar cómodamente con MySQL, Python y UTF-8, pero aún falta algo, y es que la cadena que contenga las peticiones no basta con que contenga secuencias UTF-8, sino que tiene que ser un string de tipo UTF-8. Sin embargo, puede ocurrir que tengamos las secuencias UTF-8 almacenadas en cadenas normales. En estos casos, el método encode(«utf-8») nos sacará del apuro. También nos será util si necesitamos mezclar cadenas normales con los resultados que nos devuelva, en UTF-8, la base de datos.