TextEncoder

Formatos Soportados

Con el TextEncoder puede cambiar tanto la codificación como el tipo de saltos de línea utilizado en archivos de texto. En esta página hemos compilado para usted qué códecs y saltos de línea que el TextEncoder puede leer, escribir y cambiar.

Codificaciones

Las siguientes codificaciones se pueden leer y escribir con TextEncoder. En la columna "BOM", puede ver si la codificación admite una marca de orden de bytes (Byte Order Mark). En la columna parámetro, puede ver qué parámetro puede usar en la versión por lotes para convertir archivos al formato correspondiente a través de un script.

CodificaciónDescripciónBOMParámetro
ASCIICodificación de 7 bits con 128 caracteres (00 a 7F)
noascii
Latin-1Codificación de 8 bits según ISO 8859-1
nolatin1
Latin-2Codificación de 8 bits según ISO 8859-2
nolatin2
WIN-ANSIPágina de Códigos ANSI dependiente del idioma de su instalación de Windows
nowin-ansi
WIN-1250Página de Códigos Windows 1250 (Centroeuropea)
nowin-1250
WIN-1251Página de Códigos Windows 1251 (Cirílico)nowin-1251
WIN-1252Página de Códigos Windows 1252 (Europa Occidental)nowin-1252
WIN-1253Página de Códigos Windows 1253 (Griego)nowin-1253
CP437Code Page 437 (CP437, IBM437, OEM-US)nocp437
UTF-7Para usar Unicode en entornos que no sean de 8 bits
utf7
UTF-8Codificación Unicode con variable de 1 a 4 bytes por carácter
utf8
UTF-16 LE
Codificación Unicode con variable 2 o 4 bytes por carácter, Little Endian
utf16le
UTF-16 BE
Codificación Unicode con variable 2 o 4 bytes por carácter, Big Endian
utf16be
UTF-32 LE
Codificación Unicode con 4 bytes fijos por carácter, Little Endian
utf32le
UTF-32 BE
Codificación Unicode con 4 bytes fijos por carácter, Big Endianutf32be

Obtenga más información sobre cada codificación en la introducción a los formatos de archivos de texto Unicode.

Saltos de Línea

Los siguientes tipos de saltos de línea se pueden leer y escribir con el TextEncoder. En la columna "Parámetro", puede ver qué parámetro puede usar en la versión de lote para cambiar el salto de línea de los archivos a través del script en el tipo correspondiente.

Salto de LíneaSistema / Designación
Code Point
Parámetro
CRLF
Windows, DOS, OS/2, CP/M, Symbian, Palm, AtariU+000D + U+000Acrlf
LFUnix, Linux, macOS, Mac OS X, Android, AmigaOS, BSDU+000Alf
CRClassic Mac OS, Apple II, Commodore C64, OS-9U+000Dcr
NLEBCDIC New Line - IBM Mainframe SystemsU+0015nl
RNLEBCDIC Require New LineU+0006rnl
LFEBCDIC Line FeedU+0025lf_ebcdic
EOLATASCII End Of LineU+009Beol
GSGroup SeparatorU+001Dgs
RSRecord SeparatorU+001Ers
USUnit SeparatorU+001Fus
FFUnicode Form Feed
U+000Cff
NELUnicode Next Line
U+0085nel
LSUnicode Line Separator
U+2028ls
PSUnicode Paragraph Separator
U+2029ps
VTVertical Tab
U+000Bvt
TABHorizontal Tab
U+0009tab
FIXEDLongitud de línea fija (x = Número de Caracteres)
-fixedlength-x
NOCHARNingún Carácter
-nochar
-Salto de Línea en el Carácter x personalizado -customstr-x
-Salto de Línea en el Punto de Código x personalizado-customcp-x
-Salto de Línea en uno de los Caracteres x, y o z-customstrs-x,y,z
-Salto de Línea en uno de los Puntos de Código x, y o z-customcps-x,y,z

Vea la introducción a las nuevas líneas para aprender sobre los diferentes tipos de saltos de línea. Además, le recomendamos el tutorial AskingBox sobre la reescritura de archivos de texto con longitud de línea fija con respecto a los tipos de salto de línea FIXED y NOCHAR.

Saltos de Línea personalizados

Además de los tipos de salto de línea preestablecida que se enumeran en la tabla anterior, cualquier caracteres y cadenas personalizados también se pueden usar como un salto de línea. Estos caracteres se pueden definir como texto o en forma de puntos de código en el TextEncoder. Para esto, en la interfaz gráfica de usuario, en "Leer como" y "Guardar como", puede seleccionar las opciones "Carácter personalizado" o "Punto de Código personalizado" e ingrese a los caracteres o puntos de código deseados en el campo de entrada a continuación. Los puntos de código se pueden especificar de tres maneras diferentes: hexadecimal (por ejemplo, #0D#0A), decimal (por ejemplo, 13 10) o en la forma U+X (por ejemplo, U+0D U+0A o U+000D U+000A)

Al controlar el TextEncoder a través de la línea de comandos, puede usar los parámetros customstr-x y customcp-x para los saltos de línea personalizados. El x significa los respectivos caracteres o los puntos de código definidos por el usuario, por ejemplo: customstr-a (el carácter de salto de línea es la letra a) o customcp-#0D#0A (salto de línea en la cadena definida por los puntos de código #0D#0A = Salto de Línea Windows CR LF).

Saltos de Línea en múltiples Caracteres

Para los saltos de línea en varios caracteres diferentes, las opciones "Salto de línea en cada uno de estos caracteres (separados por comas)" y "Salto de línea en cada uno de estos puntos de código (separados por comas)" o los parámetros customstrs-x y customcps-x puede ser usado.

Todos los caracteres que deben interpretarse como un salto de línea se pueden definir separados por una coma. Por ejemplo, "a,b" para los saltos de línea en ambos, en cada "a" y en cada "b". De manera similar, puede definir los parámetros de la línea de comandos: por ejemplo, customstrs-",",";" (salto de línea en cada coma y en cada punto de séptimo) o customcps-#0A,#0D (salto de línea en ambos puntos de código #0A o #0D = LF o CR).

Más información sobre este tema está disponible en el tutorial AskingBox sobre archivos de texto con saltos de línea mixtos.