Blog sobre educación

Categoría: Markdown

Cómo convertir un PDF o DOCX al formato Markdown

Los chatbots de inteligencia artificial como ChatGPT o Claude leen mejor el formato Markdown que no los PDF y otros formatos. Si queremos subir archivos al chatbot, aconsejamos pasarlos antes al formato Markdown.

¿Qué es el formato Markdown?

Markdown es un formato de texto sencillo que permite dar estilo a documentos con títulos, listas y enlaces, facilitando su lectura tanto para personas como para aplicaciones de IA. Por ejemplo, el texto **negrita** se convierte en negrita y # Título genera un título principal. Markdown es ideal para subir archivos a chatbots como ChatGPT o Claude, ya que mejora la interpretación del contenido.

Acciones previas

Antes de comenzar, debemos tener activado el formato Markdown en los documentos de Google:

  1. Abrir cualquier documento de Google o uno vacío.
  2. Pulsar en Herramientas > Preferencias.
  3. Marcar la opción: Habilitar Markdown.

Esto solo hay que hacerlo la primera vez que se va a utilizar.

Conversión PDF a Markdown

El proceso que seguiremos es:

  1. Conversión del PDF a formato DOCX a través de la web IlovePdf. Las conversiones realizadas por IlovePdf tienen mucha calidad.
  2. Conversión del documento DOCX a MD:
    • Subimos el archivo DOCX a Google Drive.
    • Abrimos el documento.
    • Pulsamos sobre Archivo > Descargar > Markdown (.md)

Una vez tenemos el archivo MD, podremos subirlo al chat de IA de nuestra elección.

Limitaciones

  • Imágenes: Si el PDF contiene imágenes, estas se perderán en el archivo final MD. Si las imágenes son muy importantes, aconsejamos utilizar el archivo original en PDF con Claude o NotebookLM. Ambos pueden ver las imágenes de los documentos PDF; ChatGPT y el resto de IA no pueden verlas, de momento.
  • Tablas: Si las tablas son complejas, por ejemplo, con algunas celdas unidas, el resultado no será idéntico, ya que el formato Markdown solo permite tablas sencillas.

Para terminar

Convertir los documentos a Markdown permite que chatbots como ChatGPT o Claude los entiendan mejor, especialmente si contienen texto extenso o estructurado. Markdown simplifica la presentación y puede mejorar la calidad de respuesta en aplicaciones de inteligencia artificial.

Pódcast del artículo

Nota: Este artículo tiene nivel 1 en el marco MIAE.

Quizás también te interese:

Cómo hacer diagramas en árbol con IA y Markmap (organizadores gráficos)

Hacer diagramas en árbol, como mapas mentales y conceptuales, con el uso de IA generativa de texto como ChatGPT, Claude o incluso en NotebookLM es una tarea muy sencilla si utilizamos Markmap.

En este artículo te explicamos como hacerlo en 3 sencillos pasos: Generar el diagrama con la IA, crear el gráfico con Markmap y bajarlo al ordenador (o hacer captura de pantalla).

Markmap es un programa basado en software libre y está directamente relacionado con el formato Markdown, que es el formato utilizado por todas las IA cuando copiamos el texto que generan a través del botón copiar. Si te interesa saber más sobre Markdown, consulta el artículo Markdown: el formato oculto tras el texto de la IA. Cómo activarlo en Google Docs y otros editores para trabajar con él.

Este código, que copiamos directamente del chat de la IA, lo podemos utilizar para crear un diagrama en árbol con Markmap. Markmap convierte en un gráfico cualquier texto Markdown que le peguemos en el lado izquierdo del editor.

Veamos cómo. Hemos realizado los ejemplos con Claude, pero se puede utilizar ChatGPT y otras IA de texto.

1. Generar el diagrama en árbol en forma de lista

Lo único que necesitamos es pedirle a la IA un mapa conceptual en forma de lista.

Hemos elaborado este prompt con el GPT Úrsula, que está especializada en crear prompts educativos, pero otro prompt también serviría:

Eres un experto en diseño de mapas conceptuales con formación en educación y conocimientos en organización de contenidos de aprendizaje. Tu tarea es ayudar al usuario a crear un mapa conceptual en formato de lista para organizar de forma jerárquica y clara las ideas principales.

1. Pregunta al usuario sobre el tema, concepto o texto específico que quiere estructurar en el mapa conceptual. NO digas nada más y espera la respuesta.

2. Pregunta cualquier otra información adicional que consideres relevante para organizar el contenido de forma lógica y jerárquica.


Con la información proporcionada, organiza el contenido en un mapa conceptual en forma de lista Markdown, encabezada por el título del mapa.

Cuando escribas la lista Markdown, asegúrate de no decir absolutamente nada más y escribir únicamente la lista.

Asegúrate de que la estructura esté claramente organizada y jerárquica.

Aquí tenemos un ejemplo con Claude:

2. Crear el diagrama

En la parte inferior de la última respuesta encontraremos el botón para copiarla, y pegaremos la respuesta completa en la web de Markmap.

Si hemos utilizado el prompt anterior, nos saldrá la lista que le hemos pedido limpia, sin más texto. Si has usado otro prompt es posible que salga más texto de la IA dando explicaciones de lo que ha hecho; en ese caso, lo mejor es borrar este texto extra que no aporta nada a nuestro diagrama.

Inmediatamente, aparecerá en el lado derecho el diagrama de árbol.

3. Bajar el diagrama

En este punto podemos hacer una captura de pantalla de lo que nos aparece en el lado derecho, aunque recomendamos bajarlo como HTML (busca donde pone: Download as interactive HTML en la parte inferior de la página) lo que nos proporcionará una página web en nuestro disco duro que podremos usar de varias formas. Si solo nos interesa el gráfico, abriremos la página haciendo doble clic sobre ella y haremos una captura de pantalla o lo imprimiremos como PDF.

Si tenemos los conocimientos suficientes, podremos incluir este mapa interactivo en nuestras páginas web, algo de lo que no nos podemos ocupar aquí porque no es el objetivo de este artículo.

MarkDownload – Markdown Web Clipper

Esta extensión para el navegador nos permite bajar o copiar cualquier texto de una página web en formato Markdown, de forma que bastará con copiar el texto con el que queremos hacer nuestro mapa mental y pegarlo directamente en Markmap.

Podemos instalar esta extensión siguiendo los enlaces:

Pódcast del artículo generado con IA

Si alguna cosa no ha quedado clara, en este pódcast te lo explican.

Uso de IA en este trabajo: Este artículo tiene nivel 1 en el marco MIAE.

Markdown: el formato oculto tras el texto de la IA. Cómo activarlo en Google Docs y otros editores para trabajar con él

Cuando se utilizan los botones para copiar que llevan incorporados los chats de IA, el resultado al ser pegado no es el que muchos esperaban. En lugar de títulos, listas, tablas y negritas aparece el texto con símbolos extraños. Es el formato Markdown.

Botón para copiar en Claude
Botón para copiar en ChatGPT

Markdown es un formato simple que facilita la aplicación de efectos al texto mediante el uso de ciertos símbolos, lo que lo hace ideal para su uso en Internet. Por ejemplo, para resaltar una palabra en negrita, basta con rodearla con dos asteriscos: Esta **palabra** aparecerá en negrita en un editor compatible con Markdown. Además, muchos editores de Markdown también soportan LaTeX para la inserción de fórmulas matemáticas. Si deseas profundizar en este formato, puedes consultar un tutorial de Markdown.

Para copiar fórmulas matemáticas del chat de la IA te recomendamos leer el artículo: Conversión de texto y fórmulas generadas por ChatGPT a documentos de texto DOCX y ODT.

Markdown con Google Docs

Desde no hace mucho que Google Docs admite el formato Markdown, aunque si este tiene fórmulas matemáticas habrá que utilizar las alternativas que encontrarás en el artículo recomendado antes.

En primer lugar, debemos activar Markdown, ya que viene desactivado. Pulsamos sobre Herramientas > Preferencias y activamos Markdown

A partir de este momento podremos:

  • Pegar el texto copiado del chat: Botón derecho del ratón > Pegar desde Markdown (esta opción no funciona en Firefox) con lo que el texto aparecerá exactamente con el mismo formato que veíamos en el chat.
Al pulsar el botón derecho del ratón sobre un documento aparecerá la opción Pegar desde Markdown.
  • Descargar archivos en este formato Archivo > Descargar > Markdown.
  • Subir archivos Markdown que tengamos en nuestro ordenador.

Otros programas especializados en Markdown

Joplin

Joplin es un programa muy completo de código abierto que organiza los archivos en libretas. Cada libreta puede tener notas (documentos Markdown) y tareas (listas que podemos marcar y desmarcar). Tiene la enorme ventaja de disponer de una versión para móvil que se sincroniza mediante Dropbox, por lo que siempre tenemos nuestros documentos a mano.

Al ser de código abierto es plenamente funcional, sin límites y sin anuncios. Existe una versión de pago para almacenar los archivos en sus propios servidores.

Ghostwriter

Este programa está disponible para Linux, Windows y macOS, es de código abierto y dispone de numerosos formatos de exportación de los archivos, lo que lo hace muy útil para reutilizar el material.

Apostrophe

Este programa, también de código abierto, solo está disponible para Linux, es igualmente recomendable. Dispone también de numerosos formatos de exportación. Se descarga desde el repositorio de programas.

Markdown en la nube

Existen numerosos servicios que trabajan en línea con Markdown y que pueden ser útiles para usos ocasionales. Ponemos un par de ejemplos:

Este artículo tiene nivel 1 en el Marco para la integración de la IA generativa.

Evaluación de la eficacia del formato de archivo en la generación de respuestas correctas por ChatGPT

Se ha evaluado la eficacia de diferentes formatos de archivo (PDF, DOCX, MD, TXT y un grupo de control) en la capacidad de ChatGPT para generar respuestas correctas y se ha llegado a la conclusión de que el formato Markdown es el que ofrece mejores resultados y por extensión cualquier archivo de texto puro.

Método

Se utilizó el script pdf2md para convertir el archivo PDF de 110 páginas de extensión: Mesures i suports universals en el centre educatiu a los formatos DOCX y Markdown. Al archivo Markdown (con extensión MD) se le cambió la extensión a TXT, por lo que fue utilizado dos veces con el mismo contenido. Esto se hizo porque se sospechaba que el cambio de extensión provocaba un cambio en la forma de ser consultado por ChatGPT. El control ha consistido en la ausencia de cualquier tipo de documento.

Con estos archivos se creó un GPT para cada uno de ellos con el siguiente prompt: «Responde las preguntas consultando el documento que tienes».

Se les hizo las mismas preguntas a todos ellos y se utilizó el botón «Volver a generar» para obtener un total de 3 respuestas a la misma pregunta. Cada pregunta se ha hecho en una conversación nueva y requieren la lectura del documento para poder ser respondidas.

Para verificar si las respuestas correctas difieren entre los distintos formatos, se realizó una prueba de Kruskal-Wallis. Para identificar qué formatos presentaban diferencias significativas, se aplicó la prueba U de Mann-Whitney.

Resultados

A continuación, se presentan los datos de puntuaciones para cada pregunta y formato, que se utilizaron en los análisis estadísticos:

PreguntaPDFDOCXMDTXT
(=MD)
Control
101330
200300
300320
400020
510010
600330
Aciertos5.6%5.6%66.7%61.1%0%
Aciertos a cada pregunta de un total de 3 posibilidades. Puntuación máxima: 3, puntuación mínima: 0.

Análisis estadístico

Las medias de aciertos y desviaciones estándar calculadas para cada formato fueron las siguientes:

FormatoMediaDesviación estándar
PDF0.170.41
DOCX0.170.41
MD2.001.55
TXT1.831.17
Control0.000.00
Medias de aciertos y sus desviaciones estándar. El formato MD es el que obtiene una media de aciertos más alta.

Pruebas para comprobar las diferencias entre los formatos

Para comprobar la igualdad de varianzas (necesaria para el test de Kruskal-Wallis) se ha usado el test de Levene que indica que no hay diferencias entre ellas (W = 1.84, p-valor = 0.152).

Test de Kruskal-Wallis: Este test no paramétrico se utilizó para comparar las medianas entre los diferentes grupos (formatos de archivo).

  • Valor estadístico H = 14.66
  • p-valor: 0.0055

Este resultado indica que hay diferencias significativas entre los formatos de archivo.

Comparaciones post hoc con la prueba U de Mann-Whitney: Para identificar qué grupos diferían entre sí, se realizaron comparaciones por pares.

Comparaciónp-valorResultado
MD vs PDF0.0276Significativo
MD vs DOCX0.0276Significativo
MD vs TXT0.6660No significativo
MD vs Control0.0123Significativo
TXT vs PDF0.0101Significativo
TXT vs DOCX0.0101Significativo
TXT vs Control0.0047Significativo
PDF vs DOCX1.0000No significativo
PDF vs Control0.2023No significativo
DOCX vs Control0.2023No significativo

Interpretación:

  • Los formatos MD y TXT son significativamente superiores a PDF, DOCX, y Control.
  • MD y TXT no muestran diferencias significativas entre ellos.
  • Los formatos PDF y DOCX no son diferentes del grupo control.

Conclusiones

El análisis revela que los formatos MD y TXT son significativamente más efectivos que los formatos PDF, DOCX, y el grupo de Control para la generación de respuestas correctas por ChatGPT.

No se encontraron diferencias significativas entre MD y TXT, lo que sugiere que ambos son igualmente efectivos, por lo que cambiar la extensión MD por TXT no aporta ninguna mejora en las respuestas, más bien las empeora ligeramente.

Así pues, la recomendación es utilizar el formato Markdown (MD), ya que es el que tiene una mayor media de aciertos, al menos en los documentos de cierta extensión.

Aunque no hemos puesto a prueba los documentos de texto sin formato Markdown, teniendo en cuenta que este último formato es texto puro con algunos caracteres para representar el formato, el formato en texto puro sería la segunda opción lógica para utilizar con la IA.

Es posible que para documentos de pocas páginas todos los formatos sean igualmente apropiados, comprobar esto requeriría un estudio adicional.

Advertencia: Este artículo tiene nivel 3 en el marco para la integración de la IA generativa.

Conversión de texto y fórmulas generadas por ChatGPT (y otras IA) a documentos de texto DOCX, ODT y Google Docs

En este artículo veremos cómo pasar una conversación con ChatGPT (y otras IA) que incluya fórmulas matemáticas a formatos estándar de texto como el de LibreOffice (ODT), Word (DOCX) y los documentos de Google.

Conversión en 4 pasos (explicación rápida)

Si tienes prisa por convertir inmediatamente el texto y las fórmulas a un documento de texto, aquí tienes los pasos básicos. Si necesitas más información, abajo tienes un ejemplo completo, con imágenes.

  1. Pegarlo en el programa: Convertidor de fórmulas.
  2. Descargar desde el mismo programa el archivo (que tendrá extensión .md).
  3. Utilizar un servicio de Internet, como Markdown Converter para convertir este archivo en ODT (el formato de LibreOffice) o DOCX (el formato de Word). Para utilizar con Google Docs únicamente habrá que subir el archivo DOCX a Drive.

Introducción

Uno de los problemas a la hora de utilizar las fórmulas de matemáticas en los chats de IA como ChatGPT es que no hay una forma directa de reutilizar las fórmulas para elaborar material didáctico. En este artículo explicaremos algunos métodos de fácil utilización para todos.

A continuación se explican los problemas que hay con las fórmulas, se da un ejemplo con imágenes de la explicación rápida anterior y se proporcionan más alternativas, además de la ya citada.

Markdown

Los chats de IA utilizan un sistema para dar formato al texto llamado Markdown y es lo que aparece al pulsar el botón del chat para copiar la conversación. Si lo habéis usado alguna vez para copiar y pegar, os habrán aparecido almohadillas # asteriscos *, etc. Este es el formato Markdown que se usa para hacer negritas, listas, enlaces, etc. Si deseas más información, puedes leer la entrada de la Wikipedia sobre Markdown o preguntar a ChatGPT.

Delimitadores de fórmulas

Las fórmulas utilizan el formato LaTeX y cada una de ellas se encierra entre determinados caracteres, llamados delimitadores de fórmula, de forma que, explicado de forma sencilla, el navegador sabe que está frente a una fórmula y la representa correctamente.

Los delimitadores utilizados por ChatGPT son diferentes a los usados por los programas que manipulan Markdown, lo que puede suponer un problema. Para solucionarlo hemos hecho un pequeño programa que los adapta copiando y pegando el contenido generado por la IA en un cuadro de texto. Una vez modificado, se puede copiar y pegar o bien guardar en un archivo de tipo Markdown (con extensión .md).

El programa en cuestión lo tenéis en la página: Convertidor de fórmulas: Markdown IA a formato compatible.

Siempre deberemos convertir las fórmulas con esta página, usemos el método que usemos, excepto si las fórmulas provienen de Claude, con el que nos podremos saltar este paso.

A continuación encontrarás un ejemplo completo de cómo usar el convertidor de fórmulas y después 3 opciones para obtener el archivo ODT o DOCX (este último lo podrás subir directamente a Drive para convertirlo en un documento de Google). Estas 3 opciones son:

  1. Opción 1. Utilizar un servicio de Internet para la conversión (el método más sencillo).
  2. Opción 2. Solo para Linux: utilizar el programa pandoc para hacer la conversión.
  3. Opción 3. Descargar un programa que se instala en el ordenador que manipule archivos de tipo Markdown.

Ejemplo de uso del «Convertidor de fórmulas: Markdown IA a formato compatible»

1. Comenzamos con una conversación con la IA:

2. Seguidamente, copiaremos el texto generado utilizando el botón de copiar:

Paso 2. Pulsamos el botón para copiar el texto.

3. Abrimos la página para convertir las fórmulas, pegamos el texto y guardamos el resultado:

Este archivo (que si no le cambiamos el nombre se llamará resultado.md) lo utilizaremos para cualquiera de los apartados siguientes.

A continuación presentamos tres posibilidades que podéis elegir en función de vuestras preferencias.

Opción 1: Servicios web para pasar el código Markdown de la IA a documento de texto

Una vez hemos guardado el archivo con extensión .md utilizando la página web anterior. Podemos ir a algunos de estos servicios para convertirlo al formato que queramos y desde donde podremos bajar el documento en varios formatos:

Ejemplo con Markdown Converter

1. Vamos a la página de Markdown Converter, seleccionamos el formato y subimos el archivo que hemos generado anteriormente, resultado.md:

Paso 1. Subimos el archvo md.

2. Seleccionamos el formato, si no lo hemos hecho antes y pulsamos START:

Paso 2. Seleccionar el formato si no lo hemos hecho antes y pulsar START.

3. Se baja el archivo y ya podemos ver el resultado:

¡Esto es todo! Con estos sencillos pasos tenemos uno de los mensajes en nuestro procesador de texto. Hay que repetir estos pasos para cada respuesta de la IA. Recordemos que si deseamos un documento de Google hay que subir el archivo DOCX a Drive.

Opción 2: Conversión en Linux con Pandoc

Los usuarios de Linux lo tenemos mucho más fácil, ya que Pandoc es un programa capaz de convertir entre muchos formatos de texto y entre ellos están todos estos y más.

Para instalar Pandoc, si no lo tenemos, utilizaremos los siguientes comandos a través de la consola:

Para convertir a ODT (el formato de LibreOffice) abrimos una consola desde la carpeta donde tengamos el archivo resultado.md y escribiremos:

Para convertir a DOCX (el formato de Word) usaremos:

Donde resultado.md es el archivo que deseamos convertir y resultado.odt y resultado.docx son los archivos a los que se convertirá. Al ejecutar cualquiera de estas dos últimas instrucciones tendremos el archivo convertido en la misma carpeta.

Recordemos que para realizar la conversión necesitamos el archivo resultado.md generado por la página Convertidor de fórmulas: Markdown IA a formato compatible.

Cualquier duda que tengas sobre el uso de Pandoc puedes preguntarla a ChatGPT.

Opción 3: Programas de escritorio para edición de Markdown

Hay muchos programas de escritorio que manejan Markdown, pero su número se reduce drásticamente si lo que deseamos es exportarlos en un formato de texto clásico que podamos manipular como ODT y DOCX.

Estos programas también necesitan pasar el texto por el Convertidor de fórmulas: Markdown IA a formato compatible para mostrar las fórmulas correctamente.

Apostrophe

Este programa para Linux es excelente y permite exportar, entre otros formatos, en ODT, entre ellos no está el formato DOCX, pero sí EPUB, PDF, HTML, etc. Dispone de características avanzadas de exportación que permiten configurar la exportación.

GhostWriter

Este programa está disponible para Linux, Windows y Mac y dispone también de diversos formatos de exportación, aunque solo hemos probado la versión para Linux.

Si conocéis más programas que permitan la exportación a formatos estándar de texto, los podéis indicar en los comentarios y se añadirán a la lista.

Advertencia

Para los que usamos editores de LaTeX, como Overleaf, todo esto es innecesario, ya que las fórmulas se pueden copiar y pegar tal como nos las da la IA. Sin embargo, el uso de LaTeX requiere ciertos conocimientos de los que ahora no nos ocuparemos. Para los interesados, en este blog hay una sección dedicada al LaTeX.

Pódcast del artículo

Este pódcast, generado por IA, explica en detalle y con lenguaje sencillo el contenido del artículo.


Marco para la integración de la IA generativa

  • Para el texto del artículo: Nivel 1.
  • Para la página web Convertidor de fórmulas: Nivel 4.

© 2024 Bilateria

Tema por Anders NorenArriba ↑