Blog sobre educación

Categoría: Markdown

Markdown: el formato oculto tras el texto de la IA. Cómo activarlo en Google Docs y otros editores para trabajar con él

Cuando se utilizan los botones para copiar que llevan incorporados los chats de IA, el resultado al ser pegado no es el que muchos esperaban. En lugar de títulos, listas, tablas y negritas aparece el texto con símbolos extraños. Es el formato Markdown.

Botón para copiar en Claude
Botón para copiar en ChatGPT

Markdown es un formato simple que facilita la aplicación de efectos al texto mediante el uso de ciertos símbolos, lo que lo hace ideal para su uso en Internet. Por ejemplo, para resaltar una palabra en negrita, basta con rodearla con dos asteriscos: Esta **palabra** aparecerá en negrita en un editor compatible con Markdown. Además, muchos editores de Markdown también soportan LaTeX para la inserción de fórmulas matemáticas. Si deseas profundizar en este formato, puedes consultar un tutorial de Markdown.

Para copiar fórmulas matemáticas del chat de la IA te recomendamos leer el artículo: Conversión de texto y fórmulas generadas por ChatGPT a documentos de texto DOCX y ODT.

Markdown con Google Docs

Desde no hace mucho que Google Docs admite el formato Markdown, aunque si este tiene fórmulas matemáticas habrá que utilizar las alternativas que encontrarás en el artículo recomendado antes.

En primer lugar, debemos activar Markdown, ya que viene desactivado. Pulsamos sobre Herramientas > Preferencias y activamos Markdown

A partir de este momento podremos:

  • Pegar el texto copiado del chat: Botón derecho del ratón > Pegar desde Markdown (esta opción no funciona en Firefox) con lo que el texto aparecerá exactamente con el mismo formato que veíamos en el chat.
Al pulsar el botón derecho del ratón sobre un documento aparecerá la opción Pegar desde Markdown.
  • Descargar archivos en este formato Archivo > Descargar > Markdown.
  • Subir archivos Markdown que tengamos en nuestro ordenador.

Otros programas especializados en Markdown

Joplin

Joplin es un programa muy completo de código abierto que organiza los archivos en libretas. Cada libreta puede tener notas (documentos Markdown) y tareas (listas que podemos marcar y desmarcar). Tiene la enorme ventaja de disponer de una versión para móvil que se sincroniza mediante Dropbox, por lo que siempre tenemos nuestros documentos a mano.

Al ser de código abierto es plenamente funcional, sin límites y sin anuncios. Existe una versión de pago para almacenar los archivos en sus propios servidores.

Ghostwriter

Este programa está disponible para Linux, Windows y macOS, es de código abierto y dispone de numerosos formatos de exportación de los archivos, lo que lo hace muy útil para reutilizar el material.

Apostrophe

Este programa, también de código abierto, solo está disponible para Linux, es igualmente recomendable. Dispone también de numerosos formatos de exportación. Se descarga desde el repositorio de programas.

Markdown en la nube

Existen numerosos servicios que trabajan en línea con Markdown y que pueden ser útiles para usos ocasionales. Ponemos un par de ejemplos:

Este artículo tiene nivel 1 en el Marco para la integración de la IA generativa.

Evaluación de la eficacia del formato de archivo en la generación de respuestas correctas por ChatGPT

Se ha evaluado la eficacia de diferentes formatos de archivo (PDF, DOCX, MD, TXT y un grupo de control) en la capacidad de ChatGPT para generar respuestas correctas y se ha llegado a la conclusión de que el formato Markdown es el que ofrece mejores resultados y por extensión cualquier archivo de texto puro.

Método

Se utilizó el script pdf2md para convertir el archivo PDF de 110 páginas de extensión: Mesures i suports universals en el centre educatiu a los formatos DOCX y Markdown. Al archivo Markdown (con extensión MD) se le cambió la extensión a TXT, por lo que fue utilizado dos veces con el mismo contenido. Esto se hizo porque se sospechaba que el cambio de extensión provocaba un cambio en la forma de ser consultado por ChatGPT. El control ha consistido en la ausencia de cualquier tipo de documento.

Con estos archivos se creó un GPT para cada uno de ellos con el siguiente prompt: «Responde las preguntas consultando el documento que tienes».

Se les hizo las mismas preguntas a todos ellos y se utilizó el botón «Volver a generar» para obtener un total de 3 respuestas a la misma pregunta. Cada pregunta se ha hecho en una conversación nueva y requieren la lectura del documento para poder ser respondidas.

Para verificar si las respuestas correctas difieren entre los distintos formatos, se realizó una prueba de Kruskal-Wallis. Para identificar qué formatos presentaban diferencias significativas, se aplicó la prueba U de Mann-Whitney.

Resultados

A continuación, se presentan los datos de puntuaciones para cada pregunta y formato, que se utilizaron en los análisis estadísticos:

PreguntaPDFDOCXMDTXT
(=MD)
Control
101330
200300
300320
400020
510010
600330
Aciertos5.6%5.6%66.7%61.1%0%
Aciertos a cada pregunta de un total de 3 posibilidades. Puntuación máxima: 3, puntuación mínima: 0.

Análisis estadístico

Las medias de aciertos y desviaciones estándar calculadas para cada formato fueron las siguientes:

FormatoMediaDesviación estándar
PDF0.170.41
DOCX0.170.41
MD2.001.55
TXT1.831.17
Control0.000.00
Medias de aciertos y sus desviaciones estándar. El formato MD es el que obtiene una media de aciertos más alta.

Pruebas para comprobar las diferencias entre los formatos

Para comprobar la igualdad de varianzas (necesaria para el test de Kruskal-Wallis) se ha usado el test de Levene que indica que no hay diferencias entre ellas (W = 1.84, p-valor = 0.152).

Test de Kruskal-Wallis: Este test no paramétrico se utilizó para comparar las medianas entre los diferentes grupos (formatos de archivo).

  • Valor estadístico H = 14.66
  • p-valor: 0.0055

Este resultado indica que hay diferencias significativas entre los formatos de archivo.

Comparaciones post hoc con la prueba U de Mann-Whitney: Para identificar qué grupos diferían entre sí, se realizaron comparaciones por pares.

Comparaciónp-valorResultado
MD vs PDF0.0276Significativo
MD vs DOCX0.0276Significativo
MD vs TXT0.6660No significativo
MD vs Control0.0123Significativo
TXT vs PDF0.0101Significativo
TXT vs DOCX0.0101Significativo
TXT vs Control0.0047Significativo
PDF vs DOCX1.0000No significativo
PDF vs Control0.2023No significativo
DOCX vs Control0.2023No significativo

Interpretación:

  • Los formatos MD y TXT son significativamente superiores a PDF, DOCX, y Control.
  • MD y TXT no muestran diferencias significativas entre ellos.
  • Los formatos PDF y DOCX no son diferentes del grupo control.

Conclusiones

El análisis revela que los formatos MD y TXT son significativamente más efectivos que los formatos PDF, DOCX, y el grupo de Control para la generación de respuestas correctas por ChatGPT.

No se encontraron diferencias significativas entre MD y TXT, lo que sugiere que ambos son igualmente efectivos, por lo que cambiar la extensión MD por TXT no aporta ninguna mejora en las respuestas, más bien las empeora ligeramente.

Así pues, la recomendación es utilizar el formato Markdown (MD), ya que es el que tiene una mayor media de aciertos, al menos en los documentos de cierta extensión.

Aunque no hemos puesto a prueba los documentos de texto sin formato Markdown, teniendo en cuenta que este último formato es texto puro con algunos caracteres para representar el formato, el formato en texto puro sería la segunda opción lógica para utilizar con la IA.

Es posible que para documentos de pocas páginas todos los formatos sean igualmente apropiados, comprobar esto requeriría un estudio adicional.

Advertencia: Este artículo tiene nivel 3 en el marco para la integración de la IA generativa.

Conversión de texto y fórmulas generadas por ChatGPT a documentos de texto DOCX y ODT

En este artículo veremos cómo pasar una conversación con ChatGPT (y otras IA) que incluya fórmulas matemáticas a formatos estándar de texto como el de LibreOffice (ODT) o Word (DOCX).

Uno de los problemas a la hora de utilizar las fórmulas de matemáticas en los chats de IA como ChatGPT es que no hay una forma directa de reutilizar las fórmulas para elaborar material didáctico. En este artículo explicaremos algunos métodos de fácil utilización para todos.

El formato utilizado por Claude es, en principio compatible con los programas que manipulan Markdown, por lo tanto, se puede copiar y pegar directamente.

Markdown

Los chats de IA utilizan un sistema para dar formato al texto llamado Markdown y es lo que aparece al pulsar el botón del chat para copiar la conversación. Si lo habéis usado alguna vez para copiar y pegar os habrán aparecido almohadillas # asteriscos *, etc. Este es el formato Markdown que se usa para hacer negritas, listas, enlaces, etc. Si deseas más información, puedes leer la entrada de la Wikipedia sobre Markdown.

Delimitadores de fórmulas

Las fórmulas utilizan el formato LaTeX y no nos debemos preocupar por él, se nombra únicamente a título informativo.

Cada fórmula se encierra entre determinados caracteres, llamados delimitadores de fórmula, de forma que, explicado de forma sencilla, el navegador sabe que está frente a una fórmula y la representa correctamente.

Los delimitadores utilizados por ChatGPT son diferentes a los usados por los programas que manipulan Markdown, lo que puede suponer un problema. Para solucionarlo hemos hecho un pequeño programa que los adapta copiando y pegando el contenido generado por la IA en un cuadro de texto. Una vez modificado se puede copiar y pegar o bien guardar en un archivo de tipo Markdown (con extensión .md).

El programa en cuestión lo tenéis en la página: Convertidor de fórmulas: Markdown IA a formato compatible.

Siempre deberemos convertir las fórmulas con esta página, usemos el método que usemos.

Por norma general deberemos seguir el siguiente proceso:

  1. Copiar el contenido del chat que contiene las fórmulas utilizando el botón que la IA tiene para copiar el contenido.
  2. Pegarlo en el programa citado antes: Convertidor de fórmulas.
  3. Descargar desde el mismo programa el archivo (que tendrá extensión .md).
  4. Utilizar un servicio de Internet, como los que hay más abajo (Opción 1), para convertir este archivo en ODT (el formato de LibreOffice) o DOCX (el formato de Word).

A continuación encontrarás un ejemplo de cómo usar el convertidor de fórmulas y después 3 opciones para obtener el archivo ODT o DOCX. Estas 3 opciones son:

  1. Opción 1. Utilizar un servicio de Internet para la conversión.
  2. Opción 2. Solo para Linux: utilizar el programa pandoc para hacer la conversión.
  3. Opción 3. Descargar un programa que manipule archivos de tipo Markdown.

Ejemplo de uso del Convertidor de fórmulas: Markdown IA a formato compatible

1. Comenzamos con una conversación con la IA:

2. Seguidamente, copiaremos el texto generado utilizando el botón de copiar:

Paso 2. Pulsamos el botón para copiar el texto.

3. Abrimos la página para convertir las fórmulas, pegamos el texto y guardamos el resultado:

Este archivo (que si no le cambiamos el nombre se llamará resultado.md) lo utilizaremos para cualquiera de los apartados siguientes.

A continuación presentamos tres posibilidades que podéis elegir en función de vuestras preferencias.

Opción 1: Servicios web para pasar el código Markdown de la IA a documento de texto

Una vez hemos guardado el archivo con extensión .md utilizando la página web anterior. Podemos ir a algunos de estos servicios para convertirlo al formato que queramos y desde donde podremos bajar el documento en varios formatos:

Ejemplo con Markdown Converter

1. Vamos a la página de Markdown Converter, seleccionamos el formato y subimos el archivo que hemos generado anteriormente, resultado.md:

Paso 1. Subimos el archvo md.

2. Seleccionamos el formato, si no lo hemos hecho antes y pulsamos START:

Paso 2. Seleccionar el formato si no lo hemos hecho antes y pulsar START.

3. Se baja el archivo y ya podemos ver el resultado:

¡Esto es todo! Con estos sencillos pasos tenemos uno de los mensajes en nuestro procesador de texto. Hay que repetir estos pasos para cada respuesta de la IA.

Opción 2: Conversión en Linux con Pandoc

Los usuarios de Linux lo tenemos mucho más fácil, ya que Pandoc es un programa capaz de convertir entre muchos formatos de texto y entre ellos están todos estos y más.

Para instalar Pandoc, si no lo tenemos, utilizaremos los siguientes comandos a través de la consola:

Para convertir a ODT (el formato de LibreOffice) abrimos una consola desde la carpeta donde tengamos el archivo resultado.md y escribiremos:

Para convertir a DOCX (el formato de Word) usaremos:

Donde resultado.md es el archivo que deseamos convertir y resultado.odt y resultado.docx son los archivos a los que se convertirá. Al ejecutar cualquiera de estas dos últimas instrucciones tendremos el archivo convertido en la misma carpeta.

Recordemos que para realizar la conversión necesitamos el archivo resultado.md generado por la página Convertidor de fórmulas: Markdown IA a formato compatible.

Cualquier duda que tengas sobre el uso de Pandoc puedes preguntarla a ChatGPT.

Opción 3: Programas de escritorio para edición de Markdown

Hay muchos programas de escritorio que manejan Markdown, pero su número se reduce drásticamente si lo que deseamos es exportarlos en un formato de texto clásico que podamos manipular como ODT y DOCX.

Estos programas también necesitan pasar el texto por el Convertidor de fórmulas: Markdown IA a formato compatible para mostrar las fórmulas correctamente.

Apostrophe

Este programa para Linux es excelente y permite exportar, entre otros formatos, en ODT, entre ellos no está el formato DOCX, pero sí EPUB, PDF, HTML, etc. Dispone de características avanzadas de exportación que permiten configurar la exportación.

GhostWriter

Este programa está disponible para Linux, Windows y Mac y dispone también de diversos formatos de exportación, aunque solo hemos probado la versión para Linux.

Si conocéis más programas que permitan la exportación a formatos estándar de texto, los podéis indicar en los comentarios y se añadirán a la lista.

Advertencia

Para los que usamos editores de LaTeX, como Overleaf, todo esto es innecesario, ya que las fórmulas se pueden copiar y pegar tal como nos las da la IA. Sin embargo, el uso de LaTeX requiere ciertos conocimientos de los que ahora no nos ocuparemos. Para los interesados, en este blog hay una sección dedicada al LaTeX.


Marco para la integración de la IA generativa

  • Para el texto del artículo: Nivel 1.
  • Para la página web Convertidor de fórmulas: Nivel 4.

© 2024 Bilateria

Tema por Anders NorenArriba ↑