Hoy en día, el formato Markdown (MD) es ampliamente utilizado para escribir artículos, blogs y documentación en línea. Sin embargo, su sintaxis se vuelve difícil de recordar y escribir en el caso de documentos de gran tamaño. Para facilitar las cosas, puede escribir contenido en MS Word y luego convertir el archivo DOCX o DOC a Markdown. Para realizar esta conversión mediante programación, este artículo explica cómo convertir documentos de Word en archivos Markdown (.md) mediante Java.
- Biblioteca de conversión de Word a Markdown
- Convertir un documento de Word a Markdown
- Personalizar la conversión de Word a Markdown
Biblioteca de conversión de Word a Markdown de Java
Para convertir archivos DOCX/DOC a formato Markdown, usaremos Aspose.Words for Java. Dicha API le permite crear y manipular documentos de Word desde aplicaciones Java. Además, proporciona un convertidor de documentos de alta calidad para convertir documentos de MS Word a otros formatos. Puede descargar el JAR de la API o instalarlo usando las siguientes configuraciones de Maven.
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-words</artifactId>
<version>21.11</version>
<type>pom</type>
</dependency>
Convertir un documento de Word a Markdown en Java
Los siguientes son los pasos para convertir un archivo DOCX de Word al formato Markdown en Java.
- Cargue el archivo de Word usando la clase Document.
- Convierta el archivo de Word al formato Markdown usando el método Document.save(string).
El siguiente ejemplo de código muestra cómo convertir un archivo DOCX al formato Markdown usando Java.
// Cargar documento de Word desde el disco
Document doc = new Document("document.docx");
// Guarde el documento en formato Markdown
doc.save("word-to-markdown.md");
Personalizar la conversión de Word a Markdown
También puede cambiar el comportamiento predeterminado de la API para la conversión de Word a Markdown. Por ejemplo, puede establecer la alineación del contenido en las tablas, especificar una carpeta para guardar las imágenes, etc. Los siguientes son los pasos para establecer diferentes opciones en la conversión de Word a Markdown.
- Cargue el documento de Word usando la clase Document.
- Cree un objeto de la clase MarkdownSaveOptions.
- Configure las opciones deseadas, como MarkdownSaveOptions.setImagesFolder(string).
- Convierta un documento de Word a Markdown usando el método Document.save(string, MarkdownSaveOptions).
El siguiente ejemplo de código muestra cómo personalizar la conversión de DOCX a Markdown usando Java.
// Cargar documento de Word desde el disco
Document doc = new Document("document.docx");
// Establecer opciones de descuento
MarkdownSaveOptions so = new MarkdownSaveOptions();
so.setImagesFolder("D:\\Images");
// Guarde el documento en formato Markdown
doc.save("word-to-markdown.md", so);
Obtenga una licencia de API gratuita
Puede usar Aspose.Words for Java sin limitaciones de evaluación usando una licencia temporal.
Conclusión
En este artículo, ha aprendido cómo convertir archivos DOCX/DOC de Word a Markdown (.md) mediante programación en Java. Además, ha visto cómo modificar la conversión de Word a Markdown usando diferentes opciones. También puede explorar otras características que ofrece Aspose.Words for Java utilizando la documentación. Además, no dude en hacer sus preguntas a través de nuestro foro.