TextConverter

Formatos Soportados

Con el TextConverter, los textos y los archivos de texto arbitrarios se pueden editar independientemente de sus formatos. Esos pueden ser, por ejemplo, archivos de texto sencillos que usualmente tienen la extensión de archivo TXT, archivos CSV que usualmente tienen una de las extensiones de archivos CSV o TSV, archivos en formatos basados en XML que, por ejemplo, pueden tener las terminaciones de archivos XML, XHTML, HTML, HTM, RSS o SVG, archivos de código fuente como PHP, JS, BAT, CMD, SH, VBS, C, CPP, CS, PAS, PY o R, así como cualquier otro formato de texto como JSON, SQL, SQL, DIF, CSS o INI - solo para enumerar algunos de ellos. Documentos de PDF o documentos de oficina como Documentos de Microsoft Word (DOC, DOCX), Hojas de Cálculo de Microsoft Excel (XLS, XLSX) u otros archivos de oficina como ODT, ODS, PPT o PPTX no se pueden procesar con el TextConverter, porque esos formatos no son archivos de texto.

El TextConverter ofrece numerosas acciones para procesar textos y archivos de texto. Con las acciones para procesar todo el texto y con las acciones para editar líneas, se pueden editar todos los textos y archivos de texto de cualquier formato. Además, el TextConverter tambien proporciona algunas acciones específicas de formato para el procesamiento de archivos CSV y el procesamiento de archivos XML.

Independientemente del formato de un archivo de texto, un archivo de texto se puede almacenar en diferentes codificaciones y con el uso de diferentes tipos de salto de línea. En las dos tablas posteriores, puede ver qué codificaciones y tipos de salto de línea son compatibles con el TextConverter.

Codificaciones

En la siguiente tabla, puede ver una descripción general de todas las codificaciones compatibles con el TextConverter. Estas codificaciones pueden ser leídas, escritas y cambiadas por el TextConverter.

Si usa el TextConverter con su configuración predeterminada - eso significa sin cambiar ninguna configuración - el TextConverter intentará determinar automáticamente la codificación de un archivo. El TextConverter también usará esta codificación para almacenar el archivo correspondiente. Por lo tanto, si solo desea editar el contenido de un archivo de texto (por ejemplo, con reemplazos de texto), no necesita preocuparse por la configuración de codificación.

Si desea cambiar la codificación de archivos o si desea leer archivos utilizando una codificación específica, puede usar la configuración en "Acciones > Archivos > Codificación". Además de las opciones para leer y escribir, también encontrará una opción sobre la pregunta de si una marca de orden de bytes (byte order mark) debe escribirse en los archivos o no. En la columna "BOM" en la tabla, puede ver si una codificación facilita las marcas de orden de bytes o no.

También en el caso, controla el TextConverter a través de la línea de comando o a través de un script, sin especificar una codificación explícita para leer o guardar el archivo, la codificación se determina automáticamente durante la lectura y también se usa nuevamente para escribir. Si desea desviarse de este comportamiento predeterminado, puede usar los valores de la columna "Parámetro" de la tabla. Se puede encontrar una introducción y ejemplos del uso de los parámetros en el artículo sobre el control de script del TextConverter en la sección acerca de los parámetros para la codificación.

CodificaciónDescripciónBOMParámetro
ASCIICodificación de 7 bits con 128 caracteres (00 a 7F)noascii
Latin-1Codificación de 8 bits según ISO 8859-1nolatin1
Latin-2Codificación de 8 bits según ISO 8859-2nolatin2
WIN-ANSIPágina de Códigos ANSI dependiente del idioma de su instalación de Windowsnowin-ansi
WIN-1250Página de Códigos Windows 1250 (Centroeuropea)nowin-1250
WIN-1251Página de Códigos Windows 1251 (Cirílico)nowin-1251
WIN-1252Página de Códigos Windows 1252 (Europa Occidental)nowin-1252
WIN-1253Página de Códigos Windows 1253 (Griego)nowin-1253
UTF-7Para usar Unicode en entornos que no sean de 8 bitsutf7
UTF-8Codificación Unicode con variable de 1 a 4 bytes por carácterutf8
UTF-16 LECodificación Unicode con variable 2 o 4 bytes por carácter, Little Endianutf16le
UTF-16 BECodificación Unicode con variable 2 o 4 bytes por carácter, Big Endianutf16be
UTF-32 LECodificación Unicode con 4 bytes fijos por carácter, Little Endianutf32le
UTF-32 BECodificación Unicode con 4 bytes fijos por carácter, Big Endianutf32be

Puede obtener más información sobre las codificaciones y sus diferencias en la introducción a los formatos de archivo de texto Unicode.

Tipos de Saltos de Línea

En la siguiente tabla, puede ver una descripción general de todos los tipos de salto de línea proporcionados por el TextConverter. Dado que el TextConverter también admite saltos de línea en caracteres o puntos de código definido por el usuario, no está vinculado a esta selección, pero también puede definir y usar sus propios saltos de línea en uno o más caracteres o puntos de código.

Si el TextConverter se usa sin definir explícitamente un tipo de salto de línea para leer o escribir, el TextConverter intentará determinar automáticamente el tipo de salto de línea utilizado en un texto o archivo de texto en su configuración predeterminada. Este tipo de salto de línea también se reutiliza para el almacenamiento del archivo. Si desea cambiar el tipo de salto de línea de un archivo o leer archivos utilizando un salto de línea específico, puede usar la configuración en "Acciones > Archivos > Tipo de Salto de Línea".

Si desea cambiar el tipo de salto de línea de archivos a través de un script o a través de la línea de comando con el TextConverter o si desea usar un tipo de salto de línea específico para leer archivos, puede usar los valores de la columna "Parámetro". Puede averiguar cómo puede controlar el TextConverter en modo por lotes con parámetros para el tipo de salto de línea en el artículo sobre el control de script del TextConverter en la sección sobre los parámetros para el tipo de salto de línea.

Salto de LíneaSistema / DesignaciónCode PointParámetro
CRLFWindows, DOS, OS/2, CP/M, TOSU+000D + U+000Acrlf
LFUnix, Linux, macOS, Mac OS X, AmigaOSU+000Alf
CRClassic Mac OS, Apple II, CommodoreU+000Dcr
NLAIX OS, IBM Mainframe Systems, OS/390U+0015nl
FFUnicode Form FeedU+000Cff
NELUnicode New LineU+0085nel
LSUnicode Line SeparatorU+2028ls
PSUnicode Paragraph SeparatorU+2029ps
VTVertical TabU+000Bvt
TABHorizontal TabU+0009tab
FIXEDLongitud de línea fija con x Caracteres-fixedlength-x
NOCHARNingún Carácter-nochar
-Salto de Línea en el Carácter x-customstr-x
-Salto de Línea en el Punto de Código x-customcp-x
-Salto de Línea en uno de los Caracteres x, y o z-customstrs-x,y,z
-Salto de Línea en uno de los Puntos de Código x, y o z-customcps-x,y,z

Puede obtener más información sobre los diferentes tipos de salto de línea en la introducción a los saltos de línea.

Saltos de Línea definido por el Usuario

Si desea trabajar con acciones de línea o si desea cambiar el tipo de salto de línea de archivos o textos con el TextConverter, no se limita a los tipos de saltos de línea que se muestran en la tabla. Esta selección es solo la lista de tipos de salto de línea predefinidos, que puede seleccionar directamente en la lista desplegable en el TextConverter.

Para definir los saltos de línea definidos por el usuario en uno o más caracteres o puntos de código arbitrarios, puede ir a "Acciones > Archivos > Tipo de Salto de Línea > Leer como" o "Acciones > Archivos > Tipo de Salto de Línea > Guardar como" y seleccionar cualquiera de "Carácter personalizado" o "Punto de Código personalizado" de la lista desplegable, dependiendo de si desea especificar el salto de línea para leer y/o escribir como carácter o como punto de código. Después de esta selección, aparece un campo de entrada en el que puede escribir su salto de línea deseada.

Si selecciona "Carácter personalizado", puede ingresar directamente el carácter o los caracteres en el campo de entrada que deben interpretarse como un salto de línea al leer o escribir. Entonces, por ejemplo "|" o "--".

Si selecciona "Punto de Código personalizado", tiene la opción de ingresar su salto de línea en forma de uno o más puntos de código. Esto tiene la ventaja sobre la especificación como carácter de que también puede especificar fácilmente caracteres invisibles o no desplazables. Los puntos de código se pueden escribir hexadecimales, decimales o en la forma U+X. Para definir el salto de línea de Windows CR LF como punto de código personalizado, podría, por ejemplo, usar los formatos "#0D#0A" (hexadecimal), "13 10" (decimal), "U+0D U+0A" o "U+000D U+000A".

Si controla el TextConverter a través de la línea de comandos o un script, los saltos de línea personalizados se pueden pasar a través de los parámetros customstr-x y customcp-x. Con customstr-x puede pasar caracteres y con customcp-x puede pasar puntos de código, con x para los caracteres o puntos de código respectivos. Por ejemplo, customstr-ab (salto de línea en la cadena "ab") o customcp-#0D#0A (salto de línea en el salto de línea de Windows CR LF definido por los puntos de código #0D#0A en notación hexadecimal). Se pueden encontrar más ejemplos del uso de los parámetros para saltos de línea personalizados en el tutorial para el control de script del TextEncoder en la sección "Caracteres personalizados para las Saltos de Línea". Incluso si este tutorial se trata del TextEncoder, también puede usar los ejemplos que se muestran allí para TextConverter.

Líneas con una Longitud de Línea Fija

Además de los saltos de línea en uno o varios caracteres, el TextConverter también admite leer y guardar textos y archivos de texto con una longitud de línea fija. Esto significa que el final de una línea no está definido por un cierto carácter o un punto de código, sino por un número definido de caracteres. Por ejemplo, según la definición de que una línea siempre consta de 10 caracteres.

En el TextConverter, en "Acciones > Archivos > Tipo de Salto de Línea > Leer como" puede seleccionar la opción "Salto de línea después de este número de caracteres (longitud de línea fija)" e ingrese su número deseado de caracteres. En "Guardar como" puede seleccionar "Ningún carácter" si desea mantener este tipo de salto de línea. Si no, simplemente seleccione un tipo diferente de salto de línea para cambiar el tipo de salto de línea de su texto.

Se puede encontrar una explicación más detallada sobre trabajar con archivos con una longitud de línea fija en el tutorial sobre la reescritura de archivos de texto con una longitud de línea fija. Este tutorial está escrito para el TextEncoder, pero también puede usar todo para el TextConverter.

Saltos de Línea en múltiples Caracteres

Típicamente, los saltos de línea se definen por un solo carácter fijo o por una sola cadena fija. Por ejemplo, con el carácter fijo LF (Unix, Linux, macOS) o la cadena fija CR LF (Windows). Este salto de línea permanece constante en todo el archivo o todo el texto y ningún otro carácter se interpreta como un salto de línea.

Sin embargo, con el TextConverter, puede desviarse de esta regla rígida y también puede definir múltiples caracteres o múltiples cadenas que se interpretan independientemente entre sí como un salto de línea. Por ejemplo, tanto CR LF como LF. Esta función puede ser útil, por ejemplo, si los archivos de texto de diferentes sistemas se han copiado en un archivo y este archivo ahora debe repararse. Esto significa que el TextConverter se podría usar en este punto para leer el archivo teniendo en cuenta ambos tipos de salto de línea para luego guardar el archivo con un tipo de salto de línea uniforme fijo.

Si desea utilizar el TextConverter a través de la interfaz gráfica de usuario y definir los saltos de línea en varios caracteres, puede ir a "Acciones > Archivos > Tipo de Salto de Línea > Leer como" y seleccionar "Salto de Línea en cada uno de estos caracteres (separado por comas)" o "Salto de Línea en cada uno de estos puntos de código (separado por comas)". Estas dos opciones ofrecen la posibilidad de definir varios caracteres como un salto de línea directamente escribiendo como los caracteres o en forma de puntos de código. Los caracteres o cadenas individuales deben separarse con una coma. Por ejemplo, "a,bc" para un salto de línea en cada "a" y en cada "bc" en el texto. Si desea usar la coma como un salto de línea en sí misma, puede ponerla entre comillas, por ejemplo "",",." para un salto de línea en cada coma y en cada punto del archivo. Los puntos de código se pueden especificar en los formatos hexadecimal ("#0D#0A"), decimal ("13 10") o en la forma U+X ("U+0D U+0A" o "U+000D U+000A").

Si controla el TextConverter a través de la línea de comando o a través de un script, puede usar los parámetros customstrs-x y customcps-x para saltos de línea en varios caracteres. La x debe ser reemplazada por los saltos de línea deseados, por ejemplo, customstrs-a,bc y customcps-#0D#0A para los dos ejemplos mencionados anteriormente. En el tutorial sobre el control de script del TextEncoder en la sección "Saltos de Línea en múltiples Caracteres", encontrará más explicaciones y ejemplos para el uso de los parámetros customstrs-x y customcps-x. Todo en este tutorial también se aplica al TextConverter.

También hay más información y ejemplos sobre el tema en el tutorial de AskingBox "Reparar Archivos de Texto con Saltos de Línea Mixtos". Los ejemplos allí se relacionan nuevamente con el TextEncoder, pero también se pueden usar para el TextConverter.