Dividir Archivos de Texto en varios Archivos Nuevos
Si nos gustaría dividir el contenido de un archivo de texto en varios archivos nuevos, la automatización de esta tarea puede ahorrarnos mucho trabajo y, sobre todo, mucho tiempo. Especialmente si queremos dividir una gran cantidad de archivos y la separación siempre debe llevarse a cabo de acuerdo con el mismo patrón, la tarea es fácil de automatizar y los ahorros son particularmente grandes. En este tutorial, nos gustaría mostrarle una manera fácil de cómo puede obtener un resultado rápido sin mucho esfuerzo. Usamos el programa TextConverter para esto.
Procedimiento General
Antes de lanzar una descripción detallada de las opciones individuales para la separación y las opciones asociadas, primero nos gustaría echar un vistazo al procedimiento general sobre cómo usar el TextConverter para dividir archivos individuales en varios archivos nuevos:
- Primero agregue todos los archivos a separar a la lista de archivos en el programa. La forma más fácil de hacer esto es simplemente descartar los archivos de cualquier carpeta en el TextConverter.
- Luego active la acción "Dividir Archivos" en el lado derecho de la ventana principal sobre "Acciones > Archivos". En las opciones de esta acción, debe activar al menos un criterio según el cual se deben dividir los archivos.
- Cuando haya establecido todas las opciones y, posiblemente otras acciones para editar sus archivos, simplemente haga clic en el botón "Convertir y Guardar" (SHIFT + CTRL + S) para realizar la separación. Como base para los nombres de archivo de las piezas individuales, se utilizan la configuración de las opciones de almacenamiento. Además, un número continuo para cada una de las piezas se adjunta a los nombres básicos.
En esta descripción general del procedimiento, aún no hemos hablado sobre qué criterios podemos seleccionar para la separación. Nos gustaría entrar en esto en la siguiente sección.
Posibilidades de Separación
El TextConverter le ofrece 3 opciones o criterios diferentes según los cuales puede dividir sus archivos. Estas opciones también se pueden combinar:
- Dividir Archivos en un Texto o una Expresión Regular
- Dividir Archivos en Saltos de Línea
- Dividir Archivos después del Número de Caracteres
- Combinación de Criterios múltiples
- Opciones Generales para todas las Separaciones
- Almacenamiento y Configuración de los Nombres de Archivos de las Partes
- Unir varios Archivos de Texto
Dividir Archivos en un Texto o una Expresión Regular
Con esta opción, puede dividir su archivo original en un texto específico. Esto significa que después de cada aparición de este texto de búsqueda, comienza un nuevo archivo. En consecuencia, si su texto ocurre dos veces en el archivo original, se almacenan tres archivos nuevos (uno con el texto que aparece en el archivo original antes de la primera ocurrencia del texto de búsqueda, uno con el texto entre el primer ocurrencia y la segunda ocurrencia del texto de búsqueda y un tercer archivo con el texto que se encuentra en el archivo original detrás de la segunda aparición del texto de búsqueda).
Eso no importa si su texto de búsqueda consta de un solo carácter, varias palabras o incluso varias líneas. Además, el texto de búsqueda no tiene que ser un texto estático: si activa la opción "Interpreta como expresión regular" bajo el cuadro de texto, también puede trabajar con expresiones regulares en este punto. Un ejemplo simple sería la expresión regular [0-9] que ejecuta una separación en cualquier dígito.
Si desea mantener el texto de búsqueda en el que se separó en los nuevos archivos, puede activar una o ambas opciones "Conservar el texto de búsqueda al comienzo de cada nuevo archivo" o "Conservar el texto de búsqueda al final de cada nuevo archivo". Si no activa ninguna de estas dos opciones, el texto de búsqueda no aparecerá en los nuevos archivos.
Otra opción hace posible no separarse directamente en el texto de búsqueda sino en la siguiente salto de línea. Si se activa la opción "Dividirse en el siguiente salto de línea", las palabras relacionadas de un párrafo permanecen en el mismo archivo y no se separan entre sí. Esto le permite separarse, por ejemplo, de acuerdo con las secciones que contienen ciertas palabras sin destrozar las secciones respectivas.
Dividir Archivos en Saltos de Línea
Con esta opción, puede separar el archivo original en sus saltos de línea. Esto significa que para cada línea del archivo original se crea un nuevo archivo que contiene el texto de la línea respectiva.
Para esta opción, se aplican la configuración sobre "Acciones > Archivos > Tipo de Salto de Línea". Por defecto, eso significa que si no realiza ningún cambio aquí, el tipo de salto de línea del archivo original se reconoce automáticamente y obtiene el resultado que esperaría en general. El factor decisivo es el salto de línea típico que conoce de un editor de texto promedio. Sin embargo, también puede definir otros criterios para una línea en el TextConverter. Por ejemplo, es posible definir cualquier caracteres arbitrarios, cadenas de caracteres o varios caracteres diferentes como un salto de línea. Esto le brinda más formas de separar sus archivos de manera flexible. Puede averiguar cómo funciona esto en las explicaciones de los saltos de línea personalizados en uno o varios caracteres.
Dividir Archivos después del Número de Caracteres
Con esta opción, puede cortar su archivo original en piezas con un número, respectivamente una longitud, seleccionable libremente, de caracteres. Puede ingresar cualquier valor numérico en el campo. Por ejemplo, si su archivo original tiene 2500 caracteres y especifica un valor de 1000 caracteres, su archivo se divide en 3 partes: el primer archivo nuevo contiene los primeros 1000 caracteres del archivo original, el segundo archivo nuevo contiene el segundo 1000 caracteres del archivo original y el tercer archivo nuevo contiene los 500 caracteres restantes. Si su archivo original contiene menos caracteres que el valor especificado, no hay separación y el archivo original permanece con su contenido tal como está.
También puede usar esta opción para limitar el texto de todos los archivos creados a un número máximo de caracteres. Por ejemplo, si combina esta opción con las otras opciones.
Combinación de Criterios múltiples
Al menos una de estas opciones introducidas debe activarse para poder realizar la función. La activación de más de una de estas opciones también es posible. En este caso, primero se separa de acuerdo con el criterio de la primera opción activada. Luego, las partes resultantes se separan nuevamente de acuerdo con el criterio de la segunda opción activada y así sucesivamente.
Por ejemplo, si activa tanto la opción para una separación en los saltos de línea como la opción para una separación después de un cierto número de caracteres, primero se separa en todas las salidas de línea. Entonces, todas las partes (aquí las partes son iguales a las líneas) se realizan y si una línea consiste en más del número permitido de caracteres, se divide nuevamente dentro de la línea relevante de acuerdo con el segundo criterio.
Opciones Generales para todas las Separaciones
Por debajo de las 3 opciones con las que puede determinar los criterios para la separación de los archivos, encontrará más opciones generales que siempre se usan independientemente de los criterios seleccionados:
- Eliminar whitespace del comienzo o del final de cada nuevo archivo: Si esta opción está activada, los espacios, las pestañas y los saltos de línea se eliminarán desde el principio o desde el final de cada nuevo archivo. Esto significa que si una parte de la división debe comenzar o terminar, por ejemplo, con saltos de línea o algunos espacios, se eliminan antes de almacenar para que el nuevo archivo comience o termine directamente con el texto real.
- Realizar las acciones antes o después de dividir los archivos: Si hay otras acciones como acciones de texto, acciones de líneas o acciones de CSV activadas además de la división del archivo, surge la pregunta si estas acciones deben aplicarse antes o después de la separación. Esto es particularmente importante para acciones de línea o acciones de CSV que se refieren a una determinada línea o columna en el texto o en el archivo. Eso es porque la partición puede cambiar tanto el número de línea como el número de columna. Un ejemplo extremo de esto sería la separación en los saltos de línea. Antes de la separación, un archivo podría tener 100 líneas que se pueden abordar individualmente con las acciones a través de los 100 números de línea diferentes. Sin embargo, después de la separación, cada archivo solo tiene una línea con la línea número 1 - ya no es posible una distinción según las líneas. Sin embargo, si desea separar de acuerdo con un criterio diferente y proporcionar a los archivos nuevos una numeración de líneas dentro del nuevo archivo respectivo, esta acción debe tener lugar después de la separación para que los números de línea comiencen nuevamente para cada nuevo archivo. Entonces, dependiendo del área de aplicación, puede tener más sentido ejecutar las acciones antes o después de la separación. Puede controlar esta distinción con estas dos opciones. También es posible aplicar las acciones por dos veces, antes así como después de la separación en ambas ocasiones.
- Longitud mínima de un nuevo archivo (en caracteres): Con esta opción puede definir una longitud mínima para las piezas resultantes respectivamente para los nuevos archivos. Solo se guarda si un nuevo archivo resultante contiene al menos tantos caracteres como se indica. Con esta opción, puede prevenir, por ejemplo, el almacenamiento de archivos vacíos. Dependiendo de los criterios de separación, los archivos vacíos sin contenido pueden surgir a través de diferentes circunstancias. Por ejemplo, si se divide en los saltos de línea y un archivo contiene varios saltos de línea o líneas vacías una después del otra en una fila. Si indica que los nuevos archivos deben tener al menos una longitud de un carácter, tales partes vacías se ignoran durante la separación y no se guardan. Por supuesto, también puede establecer un número más alto y, por lo tanto, controlar el almacenamiento de acuerdo con otros criterios. Si establece el número en 0, cada parte resultante se guarda, así que también vacía archivos.
Almacenamiento y Configuración de los Nombres de Archivos de las Partes
En qué carpeta y debajo de qué nombre se deben guardar los nuevos archivos, puede definir en la parte inferior derecha de la ventana principal del TextConverter. Aquí puede seleccionar una carpeta arbitraria y determinar un nombre base para todos los archivos. Con la opción "preservar", esta también puede ser la carpeta o el nombre del archivo original. Finalmente, las partes individuales respectivamente archivos se numeran a su vez al conectar un número continuo al nombre especificado.
Incluso si a veces hablamos solo de un archivo como el archivo original en este tutorial, la función, por supuesto, también se puede usar con varios archivos al mismo tiempo. Esto significa que si tiene más de un archivo en su lista de archivos, cada archivo se separa individualmente independientemente de los otros archivos en la lista de archivos.
Unir varios Archivos de Texto
Además de la posibilidad de dividir los archivos individuales en varios archivos nuevos, el TextConverter también ofrece la forma inversa: Cómo puede juntar cualquier cantidad de archivos, puede aprender en el tutorial sobre la combinación de varios archivos de texto.