[Ovillo] codificacion UTF-8 y servidor web

David Pardo david en corunet.com
Jue Ene 10 20:55:29 UTC 2008


Carlos Revillo escribió:
> (...)Aparte, no entiendo del todo tu razonamiento. Si no quieres que el yugoslavo
> te mande variables raras ¿qué le dirías?. Le dirías "Oye, trata de poner
> variables para que nos entendamos todos?" (...)

Mi razonamiento se resume en dos cosas:

1.- Servir páginas en UTF8 ahorra muchos quebraderos de cabeza frente a
usar entidades con un encoding de 1 byte.
2.- Las herramientas actuales soportan UTF8 en su mayoría

Por tanto, creo que como personas que nos dedicamos a esto, debemos ir
pensando en migrar cuanto antes, si no lo hemos hecho ya.

el resto de mi correo (disculpad el offtopic) trataba de decir que, si
bien a la hora de programar no se me ocurre escribir variables del
estilo de "превосходная", si mi lenguaje de programación soporta UTF8,
podré hacer una expresión regular como m{превосходная} y me encontrará
las coincidencias. Por poner un ejemplo más cercano, si escribo en un
programa en perl que convierte un texto en mayúsculas:

#!/usr/bin/perl
use utf8;
print uc('añadió');

Me devolverá

AÑADIÓ

mientras que si tengo los textos guardados como entidad, por ejemplo en
LATIN-1,

print uc('añadió')

imprimirá

AñADIó

que, además de ser bastante incomprensible, es incorrecto, ya que se
representa como AñADIó en HTML. Por todo esto, creo que UTF8 es una
maravilla para los que tenemos idiomas con acentos, eñes y similares, y
más aún para internacionalizar sitios web.

Un saludo y disculpas por el coñazo,

	David


Más información sobre la lista de distribución Ovillo