Centro de Información

Entrada de Caracteres Unicode

Por supuesto, la entrada de más de 140,000 posibles caracteres Unicode no se puede hacer fácilmente con un botón en un teclado convencional porque los teclados pueden proporcionar solo una pequeña selección de los caracteres más comunes; para todos los demás caracteres simplemente no hay espacio.

Pero, ¿qué podemos hacer para poder ingresar cualquier otro caracter que no encontremos en nuestro teclado? Hay varias posibilidades que se presentan a continuación.

Las opciones y notas con respecto a la entrada de caracteres Unicode presentados en este artículo se dividen en las siguientes secciones:

Ingrese usando el Código de Carácter

En muchos programas, como Microsoft Word o WordPad, los caracteres Unicode se pueden ingresar directamente usando su código de carácter (punto de código). Para eso, mantenga presionada la tecla ALT e ingrese el código decimal de su carácter en el Num Pad (teclado número). Por ejemplo, la combinación ALT + 142 daría como resultado la letra Ä o la combinación ALT + 8364 sería el signo del euro €.

Debe tenerse en cuenta que la entrada debe realizarse con el teclado numérico (no con los números que se encuentran arriba de las letras del teclado) y usted debe activar el teclado numérico (generalmente con la tecla NUM LOCK sobre el teclado numérico). Es más difícil hacer esto en computadoras portátiles que no tienen un teclado numérico separado. En este caso, normalmente la tecla FN se puede usar para acceder a un bloque numérico, ubicado en las letras del teclado.

Los códigos de caracteres de los caracteres puede obtener de las tablas correspondientes, por ejemplo, publicados por el Consorcio de Unicode en la página unicode.org/charts. Tenga en cuenta que muchas de estas tablas solo ofrecen la notación hexadecimal de los caracteres, pero debe usar la notación decimal con la tecla ALT para producir el signo correcto. Si es necesario, tiene que convertir el código hexadecimal para hacerlo.

También se debe tener en cuenta que no todos los programas admiten cada código de caracteres. En algunos programas, como las versiones antiguas del Bloc de Notas de Windows, solo se admiten códigos de hasta 255, todos los códigos superiores a 255 están divididos por 256 y se muestra el carácter que corresponde al remanente de la división. Por ejemplo, ¼ en lugar del signo € (8364 MOD 256 = 172).

Por supuesto, escribir caracteres Unicode utilizando el código de caracteres como se describe anteriormente no es muy cómodo, especialmente cuando las tablas están disponibles solo para códigos hexadecimales o si usa algunos caracteres con frecuencia. Un enfoque mejorado es seleccionar los caracteres directamente de mapas de caracteres o listas de caracteres, que están disponibles, por ejemplo, en todos los sistemas operativos grandes y también se incluyen en algunos programas como Microsoft Word, LibreOffice o OpenOffice. Al mismo tiempo, estos programas a menudo ofrecen la posibilidad de crear combinaciones clave para caracteres frecuentes, como es posible con Microsoft Word, por ejemplo. Una descripción de esta oportunidad, puede leer en la siguiente sección "Inserción a través de Mapas de Caracteres".

Otra posibilidad es crear su propia distribución de teclado, en la que sus símbolos y caracteres personales tengan su propia tecla y, por lo tanto, estén disponibles de inmediato en todas sus aplicaciones y software. En la siguiente, pero una sección, "Diseño de Teclado Personalizado" se le informará al respecto.

Inserción a través de Mapas de Caracteres

Además de la posibilidad de entrada de caracteres a través de su código, muchos sistemas operativos como Windows o macOS, así como algunos programas como Microsoft Word, LibreOffice o OpenOffice ofrecen la opción de insertar caracteres especiales directamente a través de mapas de caracteres. Esto elimina la búsqueda tediosa del código de caracteres correcto y los caracteres se pueden copiar e insertar fácilmente a través del portapapeles.

Para mostrar un mapa de caracteres, simplemente puede abrir el programa "Mapa de Caracteres" preinstalado en Windows. En macOS, el mapa de caracteres se llama "Caracteres" y se puede acceder desde muchos programas a través del menú "Editar > Emoji y Símbolos" (generalmente solo se muestran emojis después de abrir esta herramienta por primera vez y la vista de todos los caracteres debe ser habilitado a través del símbolo en la parte superior derecha). En programas como aplicaciones de oficina y otros programas de procesamiento de texto, generalmente puede llamar a la tabla de caracteres incorporada utilizando funciones como "Insertar > Carácter Especial" o "Insertar > Símbolo" en el menú, siempre que el programa respectivo proporcione un mapa de caracteres.

Por supuesto, el mapa de caracteres se ve diferente según el sistema operativo y el programa. Sin embargo, por lo general, es una ventana en la que se enumeran todos los caracteres disponibles o una selección de caracteres. Puede pasar por todos estos caracteres hasta que haya encontrado su carácter deseado o puede limitar su búsqueda utilizando la función de búsqueda o seleccionando ciertos tipos de caracteres en las opciones (por ejemplo, latín, símbolos matemáticos, signos de puntuación o letras cirílicas). Los filtros disponibles, naturalmente, también difieren de la implementación respectiva de la tabla de caracteres. Si ha encontrado su carácter, generalmente puede copiarlo en el portapapeles o insertarlo directamente.

Dependiendo de la implementación, también puede usar el mapa de caracteres para obtener una descripción general de qué caracteres están disponibles en qué fuentes. Además, dependiendo del sistema y el programa, a menudo existe la posibilidad de establecer combinaciones clave para caracteres específicos. Esto le permite acceder a caracteres de uso frecuente más rápido y más fácil en lugar de tener que acceder siempre a la tabla de caracteres.

Cabe señalar que algunos de estos mapas de caracteres no muestran todos los caracteres Unicode. A menudo, los caracteres se limitan a los glifos contenidos en la fuente seleccionada, otras tablas de caracteres solo muestran los caracteres del plano multilingüe básico (Basic Multilingual Plane, BMP). Un programa que muestra un mapa de caracteres con realmente todos los caracteres Unicode es BabelMap que se presenta en la sección del mismo nombre.

Encontrar Caracteres sin Mapas de Caracteres

Si no hay un mapa de caracteres disponible o no obtiene más con el uso de su mapa de caracteres, también puede simplemente buscar el nombre de un letrero, símbolo o carácter en Internet. Encontrará suficientes páginas que enumeren los caracteres y sus puntos de código Unicode. Los caracteres encontrados se pueden copiar directamente desde el navegador con CTRL + C y CTRL + V en otra aplicación.

Otro consejo es crear su propia tabla de caracteres. Un archivo de texto simple o un documento de oficina con una colección de sus caracteres Unicode utilizados con frecuencia es suficiente. Cada vez que se encuentre con un nuevo carácter que quiere usar nuevamente, puede copiar el carácter al archivo. Y si necesita caracteres que ya tiene en su archivo, ya no tiene que buscar extensamente, puede copiar y reutilizar directamente los caracteres del archivo.

Diseño de Teclado Personalizado

Un método elegante para hacer que los caracteres Unicode de uso frecuente estén disponibles en todos los programas es crear su propio diseño de teclado. Eso significa que es su elección cómo se usan las teclas de su teclado y que puede cambiar entre múltiples diseños de teclado si lo desea. Por ejemplo, simplemente puede establecer el signo de copyright en el acceso directo ALT GR + C o realizar cualquier otro cambio en la distribución de teclado actual. Eso ahorra mucho tiempo buscando caracteres en las tablas y es más cómodo que memorizar muchos códigos - especialmente si siempre usas los mismos caracteres Unicode nuevamente.

Su propio diseño de teclado puede crearse fácilmente con los programas como el Microsoft Keyboad Layout Creator (aquí encontrará la descarga) o el Keyboard Layout Manager. Ambos programas tienen básicamente el mismo propósito, el Keyboard Layout Manager es solo un programa mucho más simple que la alternativa de Microsoft.

Con los programas, es posible adaptar diseños existentes o crear diseños completamente nuevos. El programa creará automáticamente el paquete de instalación apropiado para su diseño de teclado personalizado.

Entrada en HTML y XML

Si desea utilizar un determinado carácter Unicode en HTML o XML, también puede usar directamente el código del carácter para ello. Para códigos decimales, la notación es � y � para códigos hexadecimales. El código se puede ingresar directamente en este formulario en el archivo HTML o XML, donde 0000 debe ser reemplazado por el código del carácter Unicode. Eso es, por ejemplo, © o © para el signo de derechos de autor ©.

En HTML, hay otra forma de ingresar caracteres especiales y caracteres Unicode. Esto se denomina entidades con nombre (named entities o HTML entities), lo que significa que puede ingresar un nombre para algunos caracteres en un archivo HTML. Por ejemplo, la codificación de Ä es Ä (A-Umlaut - ä es el ä en letras minúsculas), © significa el signo de derechos de autor © € significa el símbolo de moneda euro € o   significa un espacio no roto. Una lista de caracteres y códigos relacionados está disponible aquí. Sin embargo, por supuesto, no todos los caracteres Unicode tienen su propia entidad HTML.

Las entidades nombradas en HTML y XML también tienen un significado especial en caso de que los caracteres con un significado dentro de la sintaxis XML deben escribirse como un texto visible en el texto de origen HTML o en archivos XML. Específicamente, se trata de los corchetes puntiagudos < y >, así como la marca de cita " y el caractér & que se puede escribir como &lt; (lower than = más bajo que), &gt; (greater than = mayor que), &quot; (quote) y &amp; (ampersand) sin perturbar la sintaxis XML.

Sin embargo, la posibilidad de insertar caracteres Unicode en archivos HTML o XML a través de sus códigos de caracteres o con la ayuda de entidades nombradas se está volviendo menos importante hoy. A principios de la década de 2000, la mayoría de los sitios web usaban las codificaciones ASCII o ANSI como Latin-1, con las cuales solo se podía mostrar un número limitado de caracteres directamente. Si alguien quería usar caracteres Unicode con puntos de código fuera del rango compatible, no hubo otro cambio que usar entidades nombradas u otras soluciones. Hoy, casi todos los sitios web están utilizando la codificación UTF-8 con la que se pueden mostrar todos los caracteres Unicode. Por lo tanto, en la mayoría de los casos, las viejas ayudas ya no son necesarias porque los caracteres se pueden escribir directamente en el archivo. Por supuesto, con la excepción de los caracteres que tienen un significado en la sintaxis. Sus uso también es útil para caracteres que son difíciles de reconocer como tales en el código, como espacios no rotos o separaciones condicionales.

Unicode en Microsoft Word, WordPad y LibreOffice

A partir de Microsoft Word 2002, puede ingresar un carácter Unicode directamente a través de su código. Para hacer esto, solo ingrese el código hexadecimal del carácter directamente como texto en el documento de Word y luego presione la combinación de teclas ALT + C (ALT + X en los campos de diálogo). El carácter de Unicode solicitado que se esconde detrás de este código aparece automáticamente. La misma combinación clave también se puede usar para mostrar el código del signo o carácter que actualmente está frente al cursor. Entonces, con la prensa repetida de ALT + C, se puede cambiar entre el código y el carácter.

Del mismo modo, funciona con la aplicación WordPad de Microsoft, que generalmente se preinstala en los sistemas de Windows. Aquí, sin embargo, tenemos que usar la combinación clave ALT + X para convertir los códigos de caracteres Unicode en caracteres Unicode o caracteres Unicode en sus códigos de caracteres. Excepto por la combinación de clave diferente, la función funciona como en Microsoft Word.

También en el programa de oficina "Writer" de LibreOffice, podemos usar el atajo de teclado ALT + X. La única diferencia comparado con Microsoft Word y WordPad es que LibreOffice muestra el código hexadecimal en una forma diferente: mientras que Microsoft Word y WordPad muestran el código para el signo del euro (€) en la forma "20AC", LibreOffice usa el formulario "U+20AC" en su lugar. Desafortunadamente, OpenOffice actualmente no ofrece tal función.

Puede obtener una tabla de todos los códigos de caracteres en la página unicode.org/charts del consorcio Unicode. Además, hay mapas de caracteres en los programas de oficina que, por supuesto, también pueden usarse para ingresar caracteres unicode, a los que se puede acceder a través del menú "Insertar > Carácter Especial".

BabelMap

Finalmente, queremos que muestre un programa útil que también puede ayudar con la entrada de caracteres Unicode. Se llama BabelMap y puede descargarlo en la página babelstone.co.uk de forma gratuita.

BabelMap facilita la visualización y la búsqueda de caracteres Unicode cómodamente a través de sus números/puntos de código o sus nombres para usarlos en una aplicación diferente a través del portapapeles. En contraste con otros mapas de caracteres, BabelMap no solo muestra los caracteres del plano multilingüe básico (Basic Multilingual Plane, BMP), sino que también admite todos los demás planos Unicode (BMP, SMP, SIP, TIP, SSP, SPUA-A, SPUA-B) y, por lo tanto, permite al usuario navegar a través de todos los caracteres Unicode existentes. Además, existen numerosas funciones para la búsqueda de caracteres y el análisis de fuentes con respecto a sus apoyo a caracteres o bloques de caracteres que hacen esta programa una herramienta útil que va mucho más allá de las posibilidades de los mapas de caracteres convencionales. Una explicación de todas las características se puede encontrar en el sitio web de BabelMap.

Posibilidad de mostrar Caracteres

Independientemente de cuáles de los métodos presentados use para insertar caracteres Unicode, el resultado siempre depende de si el carácter o el letrero en cuestión también se pueden mostrar con la fuente utilizada. En particular, los caracteres inusuales pueden conducir rápidamente a problemas en este momento.

El fondo de esta problemática es que, para decirlo simple, cada fuente es una colección de imágenes que se almacenan en el archivo de fuente respectivo. Estas imágenes se llaman glifos. A cada uno de estos glifos se le asigna un carácter, por ejemplo, un glifo para el carácter "A", otro glifo para el carácter "a", un glifo para el carácter "." y así sucesivamente. Si ahora escribimos un carácter con una fuente, el sistema operativo o el programa utilizaron intentos para obtener el glifo para el carácter correspondiente del archivo de fuente para mostrarlo. Por lo tanto, siempre depende de si en realidad hay un glifo para el carácter deseado en la fuente relevante.

Si este no es el caso, puede ser que el programa intente presentar el carácter con la ayuda de una fuente diferente (que tiene un glifo para el carácter correspondiente) o el programa muestra un símbolo de reemplazo en lugar del carácter. Este símbolo de reemplazo también es un glifo que se almacena en un archivo de fuente (el glifo .notdef). Por lo general, esta es una caja vacía, una caja con una X o una caja con un signo de interrogación. Qué fuente se puede usar como reemplazo depende del sistema operativo y del software. Algunos programas solo usan ciertas fuentes como sustitución, otros pueden buscar un glifo adecuado en todas las fuentes instaladas.

Los formatos de archivo de fuente comunes como TrueType (TTF) o OpenType (OTF) pueden contener un máximo de solo 65,536 glifos. En contraste, hay más de 140,000 caracteres Unicode. Esto significa que incluso si un diseñador de fuentes hace el trabajo para producir una fuente con el número máximo posible de glifos, la fuente aún no contendrá la mitad de todos los caracteres unicode posibles. La mayoría de las fuentes disponibles contienen muchos menos caracteres y admiten solo unos pocos sistemas de escritura, muchas fuentes incluso contienen solo una selección de caracteres de un sistema de escritura. Puede determinar qué glifos para qué caracteres contienen una fuente, por ejemplo, a través de mapas de caracteres.