¿Qué es %20 en HTML?

Por steve mcdonnell
¿Qué es %20 en HTML?
John Foxx/Stockbyte/Getty Images

El flujo de URL, las únicas direcciones jerárquicas asignadas a todos los objetos en Internet, es a veces interrumpido por grupos de números hexadecimales precedidos por signos de porcentaje. Estos son caracteres codificados exigidos por una discrepancia entre la URL y los conjuntos de caracteres HTML; uno de los más comunes, "% 20", no es más que una referencia codificada a un espacio en blanco.

HTML frente a URL

HTML, el lenguaje en el que están escritas las páginas de Internet, por necesidad implican trabajar con URL: cadenas de caracteres que actúan como direcciones de las páginas de Internet individuales. Aunque cualquier pedazo de código HTML puede contener referencias a muchas direcciones URL, el código HTML no se ajusta a los mismos estándares de formato que la URL; específicamente, utiliza un conjunto de caracteres distinto.

Conjunto de caracteres

Aunque la última versión de HTML soporta todo el conjunto de caracteres Unicode (un conjunto de letras, números y símbolos diseñados para abarcar el mayor número posible de lenguas del mundo), el conjunto de caracteres disponible para usar en las direcciones URL se limita al alfabeto inglés, los numerales latinos y una serie de símbolos de la clase que obtienes con la tecla Shift.

Caracteres codificados

Los caracteres no disponibles en el conjunto de caracteres URL, o los caracteres y secuencias de caracteres que puedan causar confusión, están representados en las direcciones URL con un código. Un carácter codificado aparece como un signo de porcentaje (%) seguido de un número, por lo general en base hexadecimal. Cuando una cadena contiene caracteres no válidos en el conjunto de URL, como una frase de búsqueda, tiene que ser transformada en una URL, y los caracteres no válidos pueden ser codificados; los programas como los navegadores, suelen hacer esto de forma automática.

El caracter de espacio

Uno de los códigos de caracteres URL, "% 20", simplemente se refiere a un espacio vacío. Las URL no siempre son capaces de manejar los espacios, sobre todo cuando existen varios de ellos en una misma fila; por lo tanto, cualquier espacio en una URL se reemplaza con el código "%20" para evitar confusiones.