Nombres de dominio internacionalizados (IDN)
¿Qué es un nombre de dominio internacionalizado (IDN)?
Los nombres de dominio internacionalizados (IDNs) son nombres de dominio que pueden ser:
- Escritos en idiomas/escrituras que utilizan letras latinas con diacríticos (marcas de acento como é o ü).
- O que no utilizan el alfabeto latino en absoluto.
Los IDNs permiten que los hablantes nativos de escrituras no basadas en el alfabeto latino accedan a Internet en su propio idioma. Dado que el uso de Internet está aumentando en todo el mundo y el mundo está lleno de muchos idiomas y escrituras diferentes, los IDNs ofrecen una excelente manera de conectarse con su mercado objetivo sin importar cuál sea su idioma.
¿Qué es ASCII?
ASCII, pronunciado ask-ee, significa Código Estándar Estadounidense para el Intercambio de Información. ASCII se basó originalmente en el alfabeto inglés y consta de 128 caracteres, que incluyen A-Z, 0-9, puntuación, espacios y otros códigos de control que se encuentran en un teclado estándar en inglés. A estos 128 caracteres se les asigna un número del 0 al 127 para representarlos en la transferencia de datos de una computadora a otra. Si bien el código ASCII se desarrolló originalmente para teletipos (un dispositivo utilizado para enviar y recibir mensajes), encontró una aplicación más amplia con el desarrollo de las computadoras personales.
¿Qué son los caracteres no ASCII?
Los caracteres no ASCII son aquellos que no forman parte del conjunto de caracteres ASCII. Estos caracteres incluyen letras, símbolos y caracteres de varios idiomas y escrituras de todo el mundo. A medida que los sistemas informáticos evolucionaron para admitir múltiples idiomas e internacionalización, las codificaciones de caracteres extendidas como UTF-8 (Formato de Transformación de Unicode de 8 bits) se hicieron más comunes. UTF-8 puede representar una gama mucho más amplia de caracteres en comparación con ASCII, lo que lo hace adecuado para una audiencia global.
¿Qué es UTF-8?
UTF-8 (Formato de Transformación de Unicode de 8 bits) es una codificación de caracteres diseñada para codificar una amplia gama de caracteres de varios idiomas y escrituras de manera estandarizada y eficiente. Forma parte del estándar Unicode, que tiene como objetivo proporcionar una codificación de caracteres universal que cubra todos los sistemas de escritura y caracteres del mundo. UTF-8 es una codificación de ancho variable, lo que significa que diferentes caracteres pueden representarse mediante diferentes cantidades de bytes. Utiliza de uno a cuatro bytes para representar caracteres. Los caracteres básicos de ASCII (los del conjunto de caracteres ASCII) se representan mediante un solo byte, lo que lo hace compatible con ASCII. Sin embargo, UTF-8 también puede codificar caracteres fuera del rango ASCII, como escrituras no latinas, emojis y más.
¿Qué es Unicode?
Unicode es un estándar de codificación de caracteres universal que se utiliza para admitir caracteres en escrituras no ASCII. Internet se construyó originalmente sobre ASCII, que se basa en el alfabeto inglés y consta solo de 128 caracteres. Unicode permite admitir todos los idiomas de todo el mundo y sus conjuntos de caracteres únicos; ¡Unicode puede admitir más de 1 millón de caracteres! La forma en que funciona Unicode es permitiendo más bits, que son unidades de información en una máquina. Los caracteres ASCII solo requieren alrededor de 7 bits, mientras que Unicode utiliza 16 bits. Esto es necesario porque se necesitan más bits para procesar idiomas como el chino, el árabe y el ruso. Hay diferentes tipos de Unicode, incluidos UTF-8 y UTF-16, los dos más comunes. UTF-8 se ha convertido en el estándar típico utilizado en la web porque ajusta la cantidad de bits utilizados según el carácter. Esto significa que los caracteres ASCII en UTF-8 solo ocupan los bits que necesitan para procesarse.
¿Qué es el punycode?
El punycode es una forma de representar nombres de dominio internacionalizados (IDN) con el conjunto limitado de caracteres (A-Z, 0-9) admitido por el sistema de nombres de dominio. Por ejemplo, "münich" se codificaría como "mnich-kva". Un IDN toma la codificación punycode y le agrega "xn--" al principio. Entonces, "münich.com" se convertiría en "xn--mnich-kva.com".
¿Cambian las reglas para las IDN de .COM y .NET?
Sí, hay nuevas reglas con respecto a los registros de nombres de dominio internacionalizados (IDN) de .COM y .NET. Estas reglas se cambiaron el 21/03/2005. A continuación, se enumeran las reglas que se implementaron:
1. Verisign, el registro central de .COM y .NET, está adoptando un enfoque más restrictivo en cuanto a qué caracteres se permiten en los registros de nombres de dominio internacionalizados (IDN) que contienen las etiquetas de idioma ENG y GER. Específicamente:
- Los dominios registrados con la etiqueta de idioma ENG solo se permitirán para registros que consistan en caracteres de la a-z, 0-9 y -. La razón por la que estamos reteniendo la tabla de ENG es que en el futuro podríamos agregar caracteres a la tabla que permitirían registros que los utilicen en un IDN. Sin embargo, en el ínterin, no se podrán registrar nuevos IDNs con una etiqueta de idioma que contenga el valor ENG.
- Los dominios registrados con la etiqueta de idioma GER solo permitirán registros que consistan en caracteres de la a-z, 0-9, -, ä, ö y ü. El carácter ß seguirá siendo desautorizado, tal como lo establecen actualmente las RFC de IDNA.
- En este momento, los registros existentes etiquetados como ENG o GER permanecerán en la zona y no se verán afectados por este cambio. No se prevén cambios en el futuro, excepto según se indica a continuación.
2. A excepción de los caracteres 0-9 y el guión, los dominios que mezclan caracteres latinos y cirílicos para cualquier etiqueta de idioma ya no serán permitidos. En este momento, Verisign no realizará cambios en los registros existentes que mezclen caracteres latinos y cirílicos. Sin embargo, podría ser necesario en el futuro colocar cualquier registro existente en ESTADO DE RETENCIÓN DEL REGISTRO, ya que es posible que ya no cumplan con las especificaciones del registro.