Formatos Soportados
Con el TextEncoder puede cambiar tanto la codificación como el tipo de saltos de línea utilizado en archivos de texto. En esta página hemos compilado para usted qué códecs y saltos de línea que el TextEncoder puede leer, escribir y cambiar.
Codificaciones
Las siguientes codificaciones se pueden leer y escribir con TextEncoder. En la columna "BOM", puede ver si la codificación admite una marca de orden de bytes (Byte Order Mark). En la columna parámetro, puede ver qué parámetro puede usar en la versión por lotes para convertir archivos al formato correspondiente a través de un script.
Codificación | Descripción | BOM | Parámetro |
ASCII | Codificación de 7 bits con 128 caracteres (00 a 7F) | no | ascii |
Latin-1 | Codificación de 8 bits según ISO 8859-1 | no | latin1 |
Latin-2 | Codificación de 8 bits según ISO 8859-2 | no | latin2 |
WIN-ANSI | Página de Códigos ANSI dependiente del idioma de su instalación de Windows | no | win-ansi |
WIN-1250 | Página de Códigos Windows 1250 (Centroeuropea) | no | win-1250 |
WIN-1251 | Página de Códigos Windows 1251 (Cirílico) | no | win-1251 |
WIN-1252 | Página de Códigos Windows 1252 (Europa Occidental) | no | win-1252 |
WIN-1253 | Página de Códigos Windows 1253 (Griego) | no | win-1253 |
CP437 | Code Page 437 (CP437, IBM437, OEM-US) | no | cp437 |
UTF-7 | Para usar Unicode en entornos que no sean de 8 bits | sí | utf7 |
UTF-8 | Codificación Unicode con variable de 1 a 4 bytes por carácter | sí | utf8 |
UTF-16 LE | Codificación Unicode con variable 2 o 4 bytes por carácter, Little Endian | sí | utf16le |
UTF-16 BE | Codificación Unicode con variable 2 o 4 bytes por carácter, Big Endian | sí | utf16be |
UTF-32 LE | Codificación Unicode con 4 bytes fijos por carácter, Little Endian | sí | utf32le |
UTF-32 BE | Codificación Unicode con 4 bytes fijos por carácter, Big Endian | sí | utf32be |
Obtenga más información sobre cada codificación en la introducción a los formatos de archivos de texto Unicode.
Saltos de Línea
Los siguientes tipos de saltos de línea se pueden leer y escribir con el TextEncoder. En la columna "Parámetro", puede ver qué parámetro puede usar en la versión de lote para cambiar el salto de línea de los archivos a través del script en el tipo correspondiente.
Salto de Línea | Sistema / Designación | Code Point | Parámetro |
CRLF | Windows, DOS, OS/2, CP/M, Symbian, Palm, Atari | U+000D + U+000A | crlf |
LF | Unix, Linux, macOS, Mac OS X, Android, AmigaOS, BSD | U+000A | lf |
CR | Classic Mac OS, Apple II, Commodore C64, OS-9 | U+000D | cr |
NL | EBCDIC New Line - IBM Mainframe Systems | U+0015 | nl |
RNL | EBCDIC Require New Line | U+0006 | rnl |
LF | EBCDIC Line Feed | U+0025 | lf_ebcdic |
EOL | ATASCII End Of Line | U+009B | eol |
GS | Group Separator | U+001D | gs |
RS | Record Separator | U+001E | rs |
US | Unit Separator | U+001F | us |
FF | Unicode Form Feed | U+000C | ff |
NEL | Unicode Next Line | U+0085 | nel |
LS | Unicode Line Separator | U+2028 | ls |
PS | Unicode Paragraph Separator | U+2029 | ps |
VT | Vertical Tab | U+000B | vt |
TAB | Horizontal Tab | U+0009 | tab |
FIXED | Longitud de línea fija (x = Número de Caracteres) | - | fixedlength-x |
NOCHAR | Ningún Carácter | - | nochar |
- | Salto de Línea en el Carácter x personalizado | - | customstr-x |
- | Salto de Línea en el Punto de Código x personalizado | - | customcp-x |
- | Salto de Línea en uno de los Caracteres x, y o z | - | customstrs-x,y,z |
- | Salto de Línea en uno de los Puntos de Código x, y o z | - | customcps-x,y,z |
Vea la introducción a las nuevas líneas para aprender sobre los diferentes tipos de saltos de línea. Además, le recomendamos el tutorial AskingBox sobre la reescritura de archivos de texto con longitud de línea fija con respecto a los tipos de salto de línea FIXED y NOCHAR.
Saltos de Línea personalizados
Además de los tipos de salto de línea preestablecida que se enumeran en la tabla anterior, cualquier caracteres y cadenas personalizados también se pueden usar como un salto de línea. Estos caracteres se pueden definir como texto o en forma de puntos de código en el TextEncoder. Para esto, en la interfaz gráfica de usuario, en "Leer como" y "Guardar como", puede seleccionar las opciones "Carácter personalizado" o "Punto de Código personalizado" e ingrese a los caracteres o puntos de código deseados en el campo de entrada a continuación. Los puntos de código se pueden especificar de tres maneras diferentes: hexadecimal (por ejemplo, #0D#0A), decimal (por ejemplo, 13 10) o en la forma U+X (por ejemplo, U+0D U+0A o U+000D U+000A)
Al controlar el TextEncoder a través de la línea de comandos, puede usar los parámetros customstr-x y customcp-x para los saltos de línea personalizados. El x significa los respectivos caracteres o los puntos de código definidos por el usuario, por ejemplo: customstr-a (el carácter de salto de línea es la letra a) o customcp-#0D#0A (salto de línea en la cadena definida por los puntos de código #0D#0A = Salto de Línea Windows CR LF).
Saltos de Línea en múltiples Caracteres
Para los saltos de línea en varios caracteres diferentes, las opciones "Salto de línea en cada uno de estos caracteres (separados por comas)" y "Salto de línea en cada uno de estos puntos de código (separados por comas)" o los parámetros customstrs-x y customcps-x puede ser usado.
Todos los caracteres que deben interpretarse como un salto de línea se pueden definir separados por una coma. Por ejemplo, "a,b" para los saltos de línea en ambos, en cada "a" y en cada "b". De manera similar, puede definir los parámetros de la línea de comandos: por ejemplo, customstrs-",",";" (salto de línea en cada coma y en cada punto de séptimo) o customcps-#0A,#0D (salto de línea en ambos puntos de código #0A o #0D = LF o CR).
Más información sobre este tema está disponible en el tutorial AskingBox sobre archivos de texto con saltos de línea mixtos.