Blog sobre educación

Categoría: Inteligencia Artificial (Página 1 de 13)

Creación de herramientas educativas con inteligencia artificial: guía para docentes

La incorporación de la inteligencia artificial (IA) en el ámbito educativo representa una oportunidad para ampliar las posibilidades didácticas. Más allá de su papel como asistente de redacción o generador de contenido, los sistemas basados en IA permiten la creación de recursos digitales adaptados a contextos específicos de enseñanza y aprendizaje utilizando únicamente el lenguaje natural.

La elaboración de juegos de preguntas, fichas de lectura interactivas o formularios de repaso puede realizarse actualmente sin conocimientos de programación, únicamente mediante la redacción de instrucciones claras en lenguaje natural, es lo que se llama Vibe Coding (o programación por vibraciones). De este modo, la IA se consolida como un instrumento creativo al servicio del profesorado.

En este artículo hablaremos exclusivamente de la generación de programas a través de los chatbots disponibles de forma gratuita en la web y dejaremos de lado métodos más avanzados que se ejecutan desde el propio ordenador, como la programación mediante consola o versiones CLI de los chatbots.

Si te interesa estar al día, resolver dudas y compartir aplicaciones y conocimientos, apúntate a la comunidad Vibe Coding Educativo.


Paso 1: selección del chatbot o servicio de IA adecuado

Un chatbot de inteligencia artificial puede definirse como un sistema capaz de mantener una interacción conversacional y ejecutar tareas complejas en función de las instrucciones recibidas. Entre las opciones disponibles destacan los siguientes. Todos disponen de canvas, lienzo o visualizador del recurso educativo que estamos creando:

  • Gemini (Google): con funciones como Canvas que permiten estructurar proyectos completos. https://gemini.google.com
  • ChatGPT (OpenAI): ampliamente extendido por su versatilidad y facilidad de uso. También dispone de canvas o lienzo. https://chat.openai.com
  • Qwen (Alibaba): orientado a la generación de código y con herramientas específicas de desarrollo web. Utiliza un canvas. https://qwen.ai
  • Claude (Anthropic): reconocido por su claridad en la explicación de procesos y capacidad de depuración. Para la programación utiliza artefactos que no son editables por el usuario, es decir, donde no podemos editar directamente el código generado. https://claude.ai
  • Deepseek: con un enfoque técnico que también resulta útil en entornos educativos. Como Claude, no puede modificarse el resultado mediante edición directa. https://deepseek.com

Además de los chatbots, se pueden utilizar plataformas que ofrecen la posibilidad de programar, aunque su enfoque es diferente.

  • Canva Pro: herramienta de diseño gráfico, gratuita para docentes, que permite crear presentaciones, infografías y materiales visuales de apoyo. https://www.canva.com/education
  • Lovable: servicio especializado en creación de aplicaciones y prototipos mediante IA. https://lovable.dev
  • Websim: plataforma para generar y simular páginas web a partir de instrucciones en lenguaje natural. https://websim.ai

La elección de las versiones más avanzadas, como por ejemplo Gemini 2.5 Pro o ChatGPT con el modo pensamiento activado, facilita la creación de aplicaciones educativas gracias a su mayor capacidad de generación y corrección de código. Si hay una opción de «pensar» o «razonar» deberemos marcarla.

Paso 2: inicio del proceso de creación

Para garantizar la correcta producción de recursos, es necesario activar las funciones de programación que cada chatbot ofrece.

En el caso de Gemini y ChatGPT, la función Canvas (lienzo) organiza el trabajo en un entorno que permite generar, revisar y editar código. Qwen, por su parte, dispone de la opción desarrollo web, con la que se preparan estructuras en HTML, CSS o JavaScript (HTML se utiliza para estructurar el contenido de una página web, CSS para definir su aspecto visual y JavaScript para añadir interactividad). Cuando creamos un programa simple con un chatbot, estos tres elementos ya van incorporados dentro del código generado.

Este tipo de funciones operan como un “taller digital” en el que la IA recibe las herramientas necesarias para elaborar materiales educativos adaptados a las necesidades planteadas.

Paso 3: comunicación con la IA: transformar ideas en realidad mediante prompts sencillos

La forma de crear un recurso educativo es mediante lenguaje natural, explicando con el máximo detalle posible lo que deseamos. Conviene indicar siempre que sea una aplicación en HTML, de este modo no nos creará programas en Python y otros lenguajes de programación que no nos servirían para compartir en la web.

De forma opcional, pero recomendable en muchos casos, podemos también indicar:

De cara a la creación de los prompts podemos utilizar dos enfoques. La primera es cuando sabemos lo que queremos, pero no cómo lo queremos. Por ejemplo:

  • Crear una página HTML con un formulario básico para que los alumnos ingresen su nombre y respondan tres preguntas sobre el sistema solar.
  • Generar un programa en HTML para un mini-juego de adivinar animales con pistas.
  • Diseñar una plantilla HTML para una ficha de lectura con campos para título, autor y resumen.
Prompt: Diseñar una plantilla HTML para una ficha de lectura con campos para título, autor y resumen. Hecho con Gemini 2.5 Pro. Su funcionalidad es limitada ya que no se puede guardar el resultado.

El segundo enfoque es especificar detalles que ya tengamos pensados o que queremos incorporar después de una conversación previa con la IA. Por ejemplo:

Crea una aplicación de una sola página para gestionar fichas de lectura. Necesito que tenga las siguientes características:

  • Un formulario para introducir título, autor y resumen.
  • Que los datos se guarden localmente en el navegador.
  • Una tabla que muestre todas las fichas guardadas.
  • Botones para poder editar y borrar cada ficha de forma individual.
  • Exportar todas las fichas a un archivo CSV.
  • Un botón para borrar todas las fichas guardadas, con un aviso de confirmación.»

Pocas veces llegaremos al resultado deseado a la primera, por lo que deberemos decirle en cada interacción aquello que deseamos modificar hasta obtener el resultado deseado. Conviene ir guardando copias intermedias por si acabamos estropeando el programa. Una forma de hacerlo es compartirlo y guardar la URL que nos llevará siempre a esa versión concreta.

Características adicionales de canvas y visores integrados

Es importante remarcar que los programas que hagamos a través de los chatbots, en principio, tienen una serie de limitaciones:

  • Excepto en Deepseek, en el resto tenemos un botón para compartir el resultado (que Qwen llama desplegar) para poder compartir lo que hemos hecho y que sea visible para los demás.
  • En todos ellos, si queremos visualizar el resultado en el mismo chatbot, nos tenemos que limitar a un único archivo HTML. Esto ya lo tienen en cuenta los propios chatbots, que siempre nos ofrecerán un documento con todo lo necesario en su interior. No obstante, esto limita su aplicación en proyectos más complicados. Para proyectos complejos, una vez se dominen los chatbots, recomendamos el uso de las versiones de terminal de las IA (ver Guía básica para usar la inteligencia artificial desde la terminal).
  • Todos tienen medidas de seguridad que impiden la ejecución de determinado tipo de código. Por ejemplo, la opción de guardar datos en el propio navegador no funciona nunca dentro de los visores integrados, por lo que no pueden recordar datos. En estos casos no quedará más remedio que pasarlo a una plataforma externa como GitHub. Ver GitHub para alojar recursos educativos abiertos (REA) y presentarlos en formato web.
  • Canvas de Gemini:
    • Los programas de Gemini que incluyan inteligencia artificial solo podrán funcionar desde el propio entorno de Gemini. Deberemos tener en cuenta si los alumnos de nuestro centro los podrán usar (normalmente las cuentas educativas no lo permiten).
    • Las cuentas educativas no tienen la opción de compartir. Por lo tanto, la recomendación es utilizar siempre cuentas personales para crear los programas o nos encontraremos con un programa que solo podremos utilizar nosotros (a no ser que lo subamos a un servicio como GitHub).
  • Las aplicaciones que hayamos compartido a partir del canvas en Gemini, ChatGPT y Claude podrán ser modificadas pulsando el botón para hacer copia que llevan integrado. De este modo podemos adaptar cualquier aplicación compartida según nuestras necesidades. Qwen permite compartir el recurso con otros usuarios, pero no les deja modificarlo.

Particularidades del canvas de Gemini

El canvas de Gemini tiene dos características únicas de las que merece la pena citar, aunque sea brevemente. Son la posibilidad de incorporar inteligencia artificial a nuestros productos y la herramienta gráfica para seleccionar sobre el propio recurso y pedir modificaciones.

Añadir características de IA a nuestro recurso

En Gemini podemos añadir IA a nuestra propia aplicación para hacerla inteligente. Deberemos tener en cuenta varios aspectos importantes:

  • La aplicación solo funcionará dentro de Gemini, es decir, utilizando el botón compartir y proporcionando a los alumnos el enlace. No podríamos ponerla en Moodle, GitHub o nuestra página personal.
  • Las versiones corporativas (educativas) no permiten compartir los recursos creados, por lo que es obligatorio hacerlo desde una cuenta personal.
  • Las funciones de Gemini suelen estar desactivadas para el alumnado, por lo que debemos asegurarnos que pueden usar Gemini con las cuentas de centro o, en su defecto, deberán utilizar cuentas personales.

Una vez tenemos claro lo anterior, al crear un recurso educativo, en la parte inferior derecha veremos una pequeña barra de herramientas:

Presentación creada por Gemini con el prompt: «Crea una presentación HTML que explique mediante fichas el concepto evolutivo actual a alumnos de 4º de ESO». El botón señalado añadirá opciones de intelegencia artificial. Pulsa sobre la imagen para acceder.

Al pulsar el botón para añadir IA, nos aparecerán funciones inteligentes decididas por el mismo Gemini.

Presentación con funciones inteligentes determinadas por Gemini. Pulsa sobre la imagen para acceder.

Si no nos convence lo que acaba de hacer, podemos pulsar el botón «Versión anterior» para deshacer los cambios.

No es necesario pulsar el botón de IA para añadirla a nuestra aplicación, también le podemos indicar lo que queremos exactamente en el prompt inicial o más tarde, una vez tengamos la aplicación hecha. Por ejemplo, si a la versión que todavía no tiene IA le indicamos: Añade en cada ficha un cuadro de texto para que los alumnos puedan hacer preguntas a la IA y ampliar la información. El resultado será:

Cada ficha dispone de un espacio para escribir con el que el alumnado podrá hacer preguntas. Pulsa sobre la imagen para acceder

Herramienta para editar gráficamente el recurso

Recientemente, se ha añadido un botón que permite seleccionar una parte de la aplicación generada para pedirle a Gemini que cambie cualquier aspecto del contenido que tenemos en pantalla.

Al pulsarla, podemos seleccionar cualquier parte de la pantalla y decirle qué cambios queremos, por ejemplo, que modifique el título:

Paso 4: manejo de errores: identificación y solución

La aparición de errores forma parte habitual del proceso de generación de código. Este procedimiento de corrección recibe el nombre de depuración.

Los chatbots como Gemini, ChatGPT o Claude suelen ofrecer mecanismos de autocorrección y sugerencias para resolver fallos detectados. Ante un error, resulta recomendable interpretar el mensaje generado, solicitar a la IA una revisión del código.

Aparte de los mecanismos de autocorrección, una forma que muchas veces resulta útil es copiar el contenido a un archivo HTML, utilizando el bloc de notas o programa similar de texto (nunca Word o LibreOffice)

Paso 5: consulta con otro chatbot para errores persistentes

Cuando un error no se resuelve de forma satisfactoria, es posible recurrir a otro sistema de IA como apoyo complementario. El procedimiento consiste en trasladar el código con el fallo al nuevo chatbot, recibir una propuesta de solución y, posteriormente, proporcionar las correcciones indicadas a nuestra IA para que las ponga en práctica.

Esta estrategia se asemeja a la colaboración entre colegas: diferentes perspectivas contribuyen a encontrar soluciones más eficaces.

Paso 6: publicación de la creación: compartir la aplicación educativa con alumnos

Una vez finalizado el recurso, existen varias opciones para su difusión:

  • Opción A (inmediata): compartir el proyecto y ejecutarlo directamente desde la plataforma de IA utilizada. Esta opción es obligatoria si nuestra app de Gemini utiliza en su interior la IA.
  • Opción B (directa): guardar el archivo en formato HTML y abrirlo en un navegador web. Este archivo puede compartirse a través de plataformas educativas o entornos digitales de aprendizaje.
  • Opción C (avanzada): utilizar espacios de almacenamiento y difusión como GitHub, que permiten compartir proyectos con mayor alcance. GitHub para alojar recursos educativos abiertos (REA) y presentarlos en formato web.

Dispones de más información y la forma de publicarlo en otros lugares como Google Sites o Moodle en la página: Dónde publicar las aplicaciones.

Resumen de características

Chatbot Lo mejor Limitaciones clave Cuándo elegirlo
Gemini (Google) Canvas con edición directa y posibilidad de añadir funciones de IA dentro de la app. Las apps con IA solo funcionan dentro de Gemini; con cuenta educativa de Google no se puede compartir. Si quieres incorporar IA en el recurso y trabajas con cuenta personal de Google; adecuado para prototipos rápidos con edición en el lienzo.
ChatGPT (OpenAI) Muy versátil y sencillo para generar, editar y compartir desde un lienzo. Los diseños que genera son pobres y simples. Útil para continuar programas ya empezados por otros o para corregir errores, pero poco recomendable para iniciar proyectos desde cero debido a sus diseños básicos.
Qwen (Alibaba) Opción “desarrollo web” orientada a HTML, CSS y JS con visor integrado. Comparte el recurso pero no permite que otros lo modifiquen. Cuando necesitas estructuras web algo más elaboradas y no requieres edición colaborativa del recurso compartido.
Claude (Anthropic) Excelente explicando procesos y ayudando a depurar código. El diseño de los artefactos es más elegante y cuidado. No permite edición directa del recurso: solo se pueden leer los artefactos o hacer una copia para trabajar aparte. Cuando priorizas comprender y refinar el código, o si valoras un entorno más claro y estético aunque sin edición directa.
Deepseek Visor integrado útil para revisar y validar código con enfoque técnico. No ofrece botón de compartir ni edición en el visor. Como apoyo técnico para revisar soluciones, más que para crear y distribuir recursos finales desde el visor.

Conclusión: integración de la IA en el aula para el futuro de la educación

La inteligencia artificial se presenta como una herramienta transformadora en la práctica docente, al posibilitar la creación de recursos personalizados sin necesidad de programación. Su valor radica en la capacidad de adaptar materiales al contexto de aprendizaje y potenciar la creatividad en el diseño de actividades educativas.

El desarrollo responsable y ético de estas tecnologías constituye un aspecto esencial. Al integrarse en el aula, la IA no solo amplía las metodologías disponibles, sino que también proyecta una visión de futuro en la que la innovación y la enseñanza avanzan de manera conjunta.

Nota: este artículo tiene nivel 3 en el Marco para la integración de la IA generativa.


Pódcast del artículo

Resumen creado por NotebookLM

FAQ creada por NotebookLM

1. ¿Qué es el «Vibe Coding» y cómo facilita la creación de herramientas educativas con IA?

El «Vibe Coding» o programación por vibraciones es la capacidad de crear recursos digitales mediante la redacción de instrucciones claras en lenguaje natural, sin necesidad de conocimientos de programación. En el ámbito educativo, esto permite a los docentes diseñar juegos de preguntas, fichas de lectura interactivas o formularios de repaso de forma sencilla, utilizando chatbots de IA. La IA se convierte así en un instrumento creativo al servicio del profesorado, transformando ideas didácticas en aplicaciones funcionales.

2. ¿Cuáles son los chatbots de IA recomendados para docentes que buscan crear herramientas educativas y qué ofrecen?

Existen varios chatbots de IA útiles para docentes, cada uno con características particulares:

  • Gemini (Google): Ofrece funciones como Canvas para estructurar proyectos completos y la posibilidad de añadir inteligencia artificial a las aplicaciones creadas, aunque las apps con IA solo funcionan dentro de Gemini y las cuentas educativas no permiten compartir.
  • ChatGPT (OpenAI): Ampliamente extendido por su versatilidad y facilidad de uso con un lienzo integrado para generar, editar y compartir, aunque sus diseños suelen ser básicos.
  • Qwen (Alibaba): Orientado a la generación de código con una opción de «desarrollo web» y un visor integrado, pero no permite que otros modifiquen los recursos compartidos.
  • Claude (Anthropic): Destaca por su claridad en la explicación de procesos y capacidad de depuración, con diseños más elegantes, pero no permite la edición directa del código generado.
  • Deepseek: Con un enfoque técnico, útil para revisar y validar código con un visor integrado, aunque no ofrece botón de compartir ni edición en el visor.

Además de los chatbots, plataformas como Canva Pro (diseño gráfico), Lovable (creación de apps y prototipos) y Websim (simulación de páginas web) también pueden ser de utilidad.

3. ¿Qué pasos básicos debe seguir un docente para crear un recurso educativo con IA utilizando un chatbot?

El proceso de creación de recursos educativos con IA se resume en los siguientes pasos:

  1. Selección del chatbot o servicio de IA: Elegir la herramienta más adecuada según las necesidades, como Gemini, ChatGPT, Qwen, Claude o Deepseek, considerando sus funcionalidades de Canvas o visualizador.
  2. Inicio del proceso de creación: Activar las funciones de programación del chatbot (como Canvas en Gemini y ChatGPT, o la opción de desarrollo web en Qwen).
  3. Comunicación con la IA mediante prompts: Redactar instrucciones claras y detalladas en lenguaje natural, especificando siempre que se desea una aplicación en HTML y, opcionalmente, que sea responsiva y con una licencia de uso. Se puede partir de una idea general o especificar detalles concretos.
  4. Manejo de errores (depuración): Interpretar los mensajes de error, solicitar a la IA una revisión del código o copiar el contenido a un archivo HTML para revisar.
  5. Consulta con otro chatbot (si los errores persisten): Trasladar el código con el fallo a un segundo chatbot para obtener una propuesta de solución y aplicarla en la IA original.
  6. Publicación de la creación: Compartir el proyecto directamente desde la plataforma de IA, guardar el archivo HTML para abrirlo en un navegador, o usar plataformas de almacenamiento y difusión como GitHub.

4. ¿Qué son los «prompts» y cómo se utilizan eficazmente para generar herramientas educativas con IA?

Los «prompts» son las instrucciones que el usuario da a la IA en lenguaje natural para que genere un determinado recurso. Para utilizarlos eficazmente en la creación de herramientas educativas, es crucial:

  • Ser lo más detallado posible: Explicar con precisión lo que se desea que la IA cree.
  • Especificar el formato HTML: Es importante indicar que se quiere una aplicación en HTML para asegurar que el programa sea compartible en la web y no se generen códigos en otros lenguajes.
  • Indicar características opcionales: Recomendar que la aplicación sea «responsiva» (adaptable a diferentes dispositivos) y, si se desea, la licencia de uso.

Existen dos enfoques principales para los prompts:

  • Ideas generales: «Crear una página HTML con un formulario básico para alumnos…»
  • Especificar detalles concretos: «Crea una aplicación de una sola página para gestionar fichas de lectura con un formulario, guardado local, tabla de fichas, botones de edición/borrado y exportación a CSV.»

5. ¿Qué limitaciones tienen los programas creados con chatbots de IA para docentes y cómo se pueden abordar?

Los programas creados directamente con chatbots de IA, especialmente en sus visores integrados, presentan algunas limitaciones:

  • Un solo archivo HTML: Generalmente, se limitan a un único archivo HTML, lo que restringe su aplicación en proyectos más complejos. Para estos, se recomienda el uso de versiones de terminal de la IA.
  • Medidas de seguridad: Impiden la ejecución de cierto tipo de código, como guardar datos en el propio navegador, lo que significa que no pueden recordar información. Para guardar datos de forma persistente, es necesario trasladar el proyecto a plataformas externas como GitHub.
  • Funcionalidades de IA en Gemini: Si una aplicación de Gemini incluye IA, solo funcionará dentro del entorno de Gemini y no podrá ser compartida desde cuentas educativas, requiriendo el uso de cuentas personales.
  • Edición de recursos compartidos: Mientras que Gemini, ChatGPT y Claude permiten hacer una copia y modificar aplicaciones compartidas, Qwen permite compartir pero no editar el recurso por otros usuarios.

Para abordar estas limitaciones, se sugiere utilizar plataformas externas para proyectos complejos o para guardar datos, y considerar las particularidades de cada chatbot al momento de la creación y difusión.

6. ¿Cómo se puede integrar la inteligencia artificial directamente en una aplicación educativa creada con Gemini?

Gemini ofrece la posibilidad de añadir características de IA a una aplicación educativa, lo que la hace «inteligente». Para lograrlo, se deben considerar algunos aspectos importantes:

  • Funciona solo dentro de Gemini: La aplicación solo funcionará y podrá ser utilizada dentro del entorno de Gemini, mediante el enlace compartido. No se podrá integrar en otras plataformas como Moodle o GitHub.
  • Cuentas personales: Es obligatorio crear y compartir estos recursos desde una cuenta personal, ya que las versiones corporativas o educativas no permiten compartir aplicaciones con funciones de IA.
  • Disponibilidad para el alumnado: Hay que asegurarse de que los alumnos puedan usar Gemini con sus cuentas de centro o, si no es posible, deberán usar cuentas personales para interactuar con la aplicación.

Una vez que se tiene claro lo anterior, al crear el recurso, se puede pulsar un botón específico en la barra de herramientas inferior derecha para añadir opciones de IA que Gemini determine. Alternativamente, se puede indicar directamente en el prompt inicial o en interacciones posteriores qué funciones inteligentes se desean, por ejemplo: «Añade en cada ficha un cuadro de texto para que los alumnos puedan hacer preguntas a la IA y ampliar la información.»

7. ¿Qué opciones de publicación y difusión existen para las aplicaciones educativas creadas con IA?

Una vez finalizado el recurso educativo, hay varias opciones para su difusión, dependiendo de las necesidades y características de la aplicación:

  • Opción A (inmediata): Compartir el proyecto directamente desde la plataforma de IA utilizada. Esta es la opción obligatoria si la aplicación de Gemini utiliza funciones de IA internas.
  • Opción B (directa): Guardar el archivo generado en formato HTML y abrirlo en un navegador web. Este archivo puede compartirse fácilmente a través de plataformas educativas o entornos digitales de aprendizaje.
  • Opción C (avanzada): Utilizar espacios de almacenamiento y difusión como GitHub, que permiten compartir proyectos con un alcance mayor, especialmente útil para recursos educativos abiertos (REA) y para alojar aplicaciones más complejas que requieren guardar datos o múltiples archivos.

Además, se menciona la posibilidad de publicarlo en otros lugares como Google Sites o Moodle, para lo cual se recomienda consultar la página «Dónde publicar las aplicaciones».

8. ¿Qué estrategias de depuración o resolución de errores se recomiendan al crear código con chatbots de IA?

La aparición de errores es una parte normal del proceso de generación de código con IA. Para manejarlos eficazmente, se recomiendan las siguientes estrategias:

  • Interpretación del mensaje de error: Los chatbots como Gemini, ChatGPT o Claude suelen ofrecer mensajes claros que explican el error. Es fundamental leerlos y comprenderlos.
  • Solicitar revisión a la IA: Pedir a la propia IA que revise el código y sugiera soluciones para el fallo detectado.
  • Copiar el contenido a un archivo HTML externo: Una técnica útil es copiar el código generado a un archivo HTML simple usando un bloc de notas (nunca programas de procesamiento de texto como Word o LibreOffice). Esto permite una revisión manual más sencilla.
  • Consulta con otro chatbot: Si un error persiste y no se resuelve satisfactoriamente, se puede recurrir a un segundo sistema de IA. El procedimiento consiste en trasladar el código con el fallo a este nuevo chatbot para que proponga una solución, la cual luego se aplica en la IA original. Esta estrategia aprovecha diferentes perspectivas para una depuración más eficaz.

Guía básica para usar la inteligencia artificial desde la terminal (parte I)

Desde hace poco tiempo, Gemini, ChatGPT , Qwen y Claude han lanzado versiones CLI (Command Line Interface) de sus modelos de IA. A diferencia de las versiones web, estos modelos se instalan en el ordenador y se utilizan desde ventanas de texto (llamadas terminales o consolas). No es necesario disponer de un ordenador potente ni con mucha memoria, ya que el programa se limita a poner en contacto a nuestro ordenador con los servicios correspondientes en Internet. Por lo tanto, un modesto portátil es más que suficiente.

En el entorno CLI se utiliza la IA como en un chat tradicional, escribiendo nuestras peticiones y recibiendo allí mismo las respuestas de la IA.

Pros y contras de la consola frente al chat web

Contras

La principal desventaja de la consola frente a la web es el no poder pegar directamente en el chat imágenes y no disponer de lienzo para editar o previsualizar el resultado allí mismo. Sin embargo, sí las podemos arrastrar para que las visualice.

Pros

  • La IA en terminal se puede utilizar exactamente igual que en la web, aunque no podremos pegar imágenes, se las podemos proporcionar junto con otro tipo de archivos.
  • Pueden ejecutar comandos en nuestro ordenador, lo que les permite leer y escribir directamente en él. Por lo tanto, es posible llevar a cabo acciones imposibles desde el chat web, como:
    • Manipular archivos y carpetas, para leeros, reorganizarlos, borrarlos, crearlos, etc.
    • Ordenar archivos automáticamente en subcarpetas por fecha o por nombre.
    • Renombrar varios archivos siguiendo un mismo criterio (ejemplo: “tema1_01”, “tema1_02”…).
    • Realizar operaciones directas sobre el sistema operativo, como lanzar programas, consultar el estado de la memoria, el espacio libre que tenemos, etc.
    • Convertir todos los .wav a .mp3, generar subtítulos y crear un índice.
    • Convertir documentos en Word a PDF.
    • Convertir audios a texto para obtener transcripciones y traducciones.
  • El entorno CLI destaca en tareas de vibe coding, es decir, hacer programas y aplicaciones dándole instrucciones a la IA. Especialmente si nuestra aplicación tiene más de un archivo. Basta con abrir la consola desde la carpeta en la que trabajaremos (ver más adelante) y pedirle una explicación sobre el contenido, que solucione un error o que cree un programa a partir de cero. La capacidad de ver, abrir y manipular cualquier archivo que contenga permite a la IA ser mucho más eficiente que en la web, donde también puede trabajar con varios archivos, pero los debemos subir y después bajar uno a uno.

Qué son las consolas de IA

Estamos acostumbrados a utilizar los chatbots desde su página web, escribiendo sobre un campo de texto, obtenemos la respuesta de la IA a nuestra petición.

Pero existe otra forma de utilizarlos y es a través de consolas (o terminales) que no son más que ventanas de texto donde podemos escribir instrucciones directamente al ordenador. En Windows se llaman Símbolo del sistema o PowerShell.

Cómo abrir la consola del sistema operativo

  • Windows: pulsar la tecla de Windows, escribir cmd o PowerShell y abrir el programa.
  • Mac: abrir Launchpad (el icono de cohete), escribir Terminal y hacer clic en la aplicación.
  • Linux: buscar Terminal en el menú principal de aplicaciones o presionar CTRL + ALT + T.

Cómo abrir la consola del sistema operativo en una carpeta determinada

Hay que evitar abrir la consola IA en la carpeta raíz del sistema o donde pueda tener acceso a información personal o confidencial. Es importante abrir la IA en la carpeta donde vayamos a trabajar.

  • Para abrir una terminal desde una carpeta en Linux, navega hasta la carpeta en tu gestor de archivos y haz clic derecho en un espacio vacío para seleccionar la opción «abrir en un terminal».
  • En Mac, puedes hacerlo desde Finder navegando a la carpeta y seleccionando «nuevas ventanas de la terminal en la carpeta», o arrastrando la carpeta a una ventana de terminal ya abierta tras escribir «cd «.
  • En Windows, la forma más rápida es abrir la carpeta en el explorador de archivos, hacer clic en la barra de direcciones superior y escribir «cmd» o «powershell» para abrir la terminal en esa ubicación. Si no podemos escribir en la barra de direcciones, pulsar CRL+L antes.

Particularidades de la consola

Cuando trabajemos en la consola, deberemos dejar el ratón y utilizar casi exclusivamente el teclado. Debemos tener en cuenta que una consola es un medio estrictamente de texto, por lo que el ratón no servirá para ir a un punto anterior del texto que estamos escribiendo, por ejemplo. Si queremos rectificar una parte que hemos escrito antes, no quedará más remedio que desplazarse con las flechas del teclado.

Podemos arrastrar imágenes y otro tipo de archivos a la consola para que sean visualizados o leídos por la IA.

Copiar y pegar en la consola

En las consolas y terminales, las combinaciones de teclas habituales Ctrl+C y Ctrl+V no siempre sirven para copiar y pegar, ya que Ctrl+C suele interrumpir procesos. Dependiendo del sistema operativo, los atajos son diferentes:

  • Linux (terminal GNOME, KDE, etc.):
    • Copiar: Ctrl+Shift+C
    • Pegar: Ctrl+Shift+V
  • macOS (Terminal o iTerm2):
    • Copiar: Cmd+C
    • Pegar: Cmd+V
  • Windows (símbolo del sistema o PowerShell moderno):
    • Copiar: Ctrl+C
    • Pegar: Ctrl+V

Además, en los tres sistemas también se puede usar el ratón: seleccionar el texto, pulsar con el botón derecho y elegir copiar o pegar. En Linux, en muchos entornos, el botón central pega directamente lo que se haya seleccionado.

Cómo abrir el entorno CLI de las IA

Una vez hemos abierto una consola, será suficiente con teclear gemini (para abrir la IA de Google), codex (para abrir la IA de OpenAI, ChatGPT) o claude (para abrir la IA de Anthropic).

Las siguientes imágenes muestran las consolas de IA en un entorno Linux:

Consola de Gemini (Gemini CLI)
Consola de ChatGPT (Codex)
Consola de Claude (Claude Code)

Instalación de las consolas de IA en el ordenador

En esta parte se explica cómo instalar tres herramientas de inteligencia artificial que se utilizan desde la consola del sistema operativo (Windows, Mac o Linux). Las herramientas son Gemini, Codex y Claude. Una vez instaladas, también se ejecutan desde la consola, pero en este caso hablamos de la consola de la aplicación (cuando escribes el nombre del programa, como gemini, codex o claude, para usarlas).

Antes de empezar

Necesitas tener instalado Node.js, que es el programa base que permite usar estas herramientas.

  • Si no está instalado, al intentar ejecutar algunos de los comandos en la consola del sistema operativo verás un mensaje de error indicando que node o npm no se reconocen como comandos.
  • En ese caso, descárgalo en nodejs.org. Descarga la versión recomendada para tu sistema operativo y sigue las instrucciones de instalación o sigue las instrucciones que te dará la consola.

Recomendamos utilizar nuestra IA favorita para consultarle cualquier problema o duda que surja en esta parte (y también en las posteriores).

Instalación de Gemini (Google)

(Repositorio oficial en GitHub)

Métodos de instalación (elige solo uno y hazlo en la consola del sistema operativo):

  • Método 1 (recomendado, cualquier sistema con Node.js): npm install -g @google/gemini-cli.
  • Método 2 (solo Mac/Linux con Homebrew): brew install gemini-cli.
  • Método 3 (probar sin instalar): npx https://github.com/google-gemini/gemini-cli. Este método descarga la aplicación cada vez que la uses.

Después de instalar:

  • Abre la consola del sistema operativo.
  • Escribe gemini y pulsa Enter.
  • Te pedirá iniciar sesión con tu cuenta de Google o usar una clave de aistudio.google.com/apikey.

Instalación de Codex (OpenAI)

(Repositorio en GitHub)

Métodos de instalación (elige solo uno y hazlo en la consola del sistema operativo):

  • Método 1 (recomendado, cualquier sistema con Node.js): npm install -g @openai/codex@latest.
  • Método 2 (solo Mac con Homebrew): brew install codex.
  • Método 3 (descarga manual): en la sección «Releases» de GitHub descarga el archivo correspondiente, descomprímelo y renómbralo como «codex».

Después de instalar:

  • Abre la consola del sistema operativo.
  • Escribe codex y pulsa Enter.
  • Podrás iniciar sesión con tu cuenta de ChatGPT o configurar tu clave de OpenAI.

Instalación de Claude (Anthropic)

(Repositorio en GitHub)

Métodos de instalación (elige el que corresponda a tu sistema operativo y hazlo en la consola del sistema operativo):

  • Mac/Linux (con Node.js): npm install -g @anthropic-ai/claude-code.
  • Mac/Linux (instalador rápido): curl -fsSL https://claude.ai/install.sh | bash.
  • Windows: abre PowerShell y escribe irm https://claude.ai/install.ps1 | iex.

Después de instalar:

  • Abre la consola del sistema operativo.
  • Escribe claude doctor para comprobar que funciona.
  • Escribe claude para usar la aplicación.
  • Inicia sesión con tu cuenta de Claude.

Instalación de Qwen

  • Escribe desde una consola: npm install -g @qwen-code/qwen-code
  • Abre la consola, escribe qwen y elige el método de inicio de sesión.

Importante: Solo hemos probado las versiones para Linux. Las instrucciones proporcionadas para Windows y Mac han sido redactadas por Grok basándose en las referencias que hay más adelante. Por lo tanto, no podemos asegurar que sean correctas.

Modo de uso

Una vez hemos entrado, abriendo una consola y tecleando el nombre de la IA deseada, todas nos darán la oportunidad de entrar en nuestra cuenta a través de la web. Una vez introducidas nuestras credenciales, el programa se acabará de iniciar normalmente. Si deseamos cambiar las opciones de inicio de sesión, podemos eliminar la carpeta de configuración que se detalla a continuación.

Cuando hayamos iniciado sesión, hablaremos con la IA de la forma habitual, escribiendo en la caja de texto que tenemos para ello.

Todas las IA tienen comandos que realizan acciones específicas. Destacamos un par de ellos comunes a todas.

  • /quit. Escribiendo este comando, cerraremos la consola de la IA. Se puede conseguir el mismo efecto pulsando dos veces seguidas CTRL +C.
  • /init. Esa instrucción hace que la IA analice la carpeta actual y escriba un archivo en formado Markdown, donde coloca una descripción del contenido en la misma carpeta. Hay que tener en cuenta que si tenemos archivos de texto con información sensible, estos serán leídos por la IA, por lo que hay que tener precaución en este sentido. Si utilizamos la consola por primera vez en una carpeta que ya tiene archivos, conviene ejecutar este comando antes de empezar. Gemini creará el archivo GEMINI.md, Codex creará el archivo AGENTS.md y Claude hará el archivo CLAUDE.md. Podemos abrirlos y añadir allí información extra que deseamos que tengan en cuenta.

Cuando deba realizar acciones que afecten a nuestro ordenador (leer archivos, escribir, eliminar, acceder a un programa, etc.) nos pedirán permiso. Podemos dárselo cada vez, es la opción 1 o, si estamos seguros, darles permiso para el resto de la sesión con la opción 2, aunque alguna vez esta opción sirve para cancelar.

Carpetas y archivos importantes

La configuración de cada programa (datos de inicio de sesión, instrucciones iniciales, etc.) se encuentra en las carpetas indicadas a continuación. Allí crearán archivos Markdown (.md) con la información que crean relevante.

ServicioCarpeta de configuración en WindowsCarpeta de configuración en Linux / MacOSArchivo de instrucciones
Gemini CLI%USERPROFILE%\.gemini~/.geminiGEMINI.md
OpenAI Codex%USERPROFILE%\.codex~/.codexAGENTS.md
Claude Code%USERPROFILE%\.claude~/.claudeCLAUDE.md

En cualquier momento podemos borrar estas carpetas y la próxima vez que entremos en el programa se crearán de nuevo y nos volverán a pedir el inicio de sesión.

También podemos crear los archivos de instrucciones en estas carpetas con instrucciones específicas sobre su comportamiento, quienes somos, etc. Estos archivos pueden estar en la carpeta de configuración, con lo que serán leídos cada vez que iniciemos la IA, y se pueden colocar también en la carpeta actual, la IA los puede generar también de forma automática con el comando /init.

En el caso de Gemini, podemos iniciar sesión con otra cuenta eliminando el archivo config.json de la carpeta .gemini. Esto hará que nos pregunte el método para iniciar sesión la próxima vez que entremos, lo que podremos utilizar para indicar una cuenta de Google diferente a la anterior, en el caso de que hayamos llegado al límite.

Límites de uso, modelos y ventanas de contexto

  • Gemini CLI
    Es gratuito. Permite 60 mensajes por minuto y un máximo diario de 1 000. Utiliza por defecto Gemini 2.5 Pro, con una ventana de contexto de 1 000 000 tokens. Google ha anunciado que se ampliará a 2 000 000, aunque aún no está disponible para todos. Cuando alcanza el límite de uso, cambia a Gemini 2.5 Flash.
  • Qwen Code CLI
    Es gratuito. Admite 60 solicitudes por minuto y 2000 por día.
  • Codex (ChatGPT CLI)
    Funciona con una cuenta Plus de ChatGPT y aplica un límite de uso cada 5 horas y otro semanal, aunque no se han dado cifras concretas. Utiliza por defecto GPT-5, con una ventana de contexto de 200 000 tokens.
  • Claude Code
    Con una suscripción Pro, permite entre 10 y 40 mensajes cada 5 horas. A partir del 28 de agosto de 2025, también habrá un límite semanal. Utiliza Claude 4 Sonnet, con una ventana de contexto de 200 000 tokens.

Resumen de políticas de privacidad para versiones CLI de herramientas de IA

Este resumen se basa en las políticas oficiales actualizadas al 17 de agosto de 2025, extraídas de las fuentes de cada proveedor. Las políticas pueden cambiar con el tiempo.

Recomendamos especial precaución con Gemini CLI donde, por defecto, en las cuentas personales, los datos se usan para entrenar sus modelos y pueden ser leídos por humanos. Véase en el texto cómo desactivarlo.

Gemini CLI (versión gratuita para individuos)

Los datos (prompts, outputs, código) se usan por defecto para mejorar productos y entrenar modelos de machine learning, con opción de opt-out mediante la desactivación de Gemini Apps Activity. El término opt-out se refiere a la posibilidad de excluirse voluntariamente de un uso que está activo por defecto. En el caso de Gemini CLI para cuentas personales, los datos (prompts, salidas de código, etc.) pueden usarse para entrenar modelos si no se desactiva esta opción en la configuración de la cuenta de Google, en el apartado Controles de actividadGemini Apps Activity. Los contenidos pueden ser revisados por humanos para control de calidad, se guardan de forma desconectada de la cuenta y se retienen hasta 18 meses. Se recomienda no enviar información confidencial.
Política de privacidad para Gemini Code Assist (individuales)

Gemini CLI (versiones de pago, como Gemini Advanced/Pro)

El tratamiento de datos es equivalente al de la versión gratuita: pueden usarse para mejorar servicios y entrenar modelos, con posibilidad de opt-out desactivando Gemini Apps Activity. Si está activada, Google puede realizar revisión humana de chats con datos desvinculados de la cuenta, y en caso de ser revisados, pueden conservarse hasta 3 años.
Hub de privacidad de Gemini Apps

Gemini (versiones corporativas: Vertex AI y Workspace empresarial)

En entornos corporativos, los datos de clientes no se usan para entrenar modelos ni para mejorar servicios sin permiso. No existe revisión humana rutinaria; solo puede haber acceso limitado en casos de soporte, cumplimiento legal o investigación de abuso. En Vertex AI se ofrecen opciones avanzadas de gobernanza de datos, incluida la configuración de zero data retention (ZDR), que evita el almacenamiento incluso temporal. De forma predeterminada puede existir caché técnica de hasta 24 horas o registros mínimos de auditoría.
Gobernanza de datos en Vertex AI Generative AI

Gemini (versiones educativas: Workspace for Education)

En dominios educativos, los datos no se usan para entrenar modelos, ni para mostrar anuncios, ni son revisados por humanos. Desde junio de 2025, estas protecciones se aplican a todas las edades en cuentas de educación. Se ofrecen protecciones de nivel empresarial, sin coste adicional y con controles de administrador. El contenido no se comparte fuera del dominio escolar.
Política de privacidad de Google Workspace for Education

OpenAI API (versiones CLI o API)

En la API de OpenAI, los datos no se usan para entrenar modelos por defecto, salvo en caso de consentimiento expreso. Se conservan hasta 30 días para monitorizar abusos y resolver incidencias técnicas, con posibilidad de solicitar Zero Data Retention en contextos empresariales. La revisión humana está limitada a casos de seguridad o abuso.
Uso de datos en la API de OpenAI

Claude Code (API/CLI, versión gratuita)

Los datos no se usan para entrenar modelos por defecto, salvo en caso de consentimiento voluntario o cuando un contenido se marca como feedback para trust & safety. Puede haber revisión humana o automática en situaciones de abuso, y en esos casos las retenciones pueden extenderse hasta 2 años para prompts/respuestas y hasta 7 años para métricas de seguridad. En la aplicación Claude Code local, las sesiones pueden conservarse hasta 30 días, configurable, y en organizaciones con Zero Data Retention no se guardan en servidores.
Uso de datos personales en entrenamiento de modelos (Anthropic)
Privacidad en Claude Code

Diferencias entre Gemini CLI, Codex y Claude Code

CaracterísticaGemini CLICodex (ChatGPT)Claude CodeQwen
Instalaciónnpm install -g @google/gemini-clinpm install -g @openai/codex@latestnpm install -g @anthropic-ai/claude-codenpm install -g @qwen-code/qwen-code
Carpeta y archivo de configuración~/.gemini / GEMINI.md~/.codex / AGENTS.md~/.claude / CLAUDE.md~/.qwen / QWEN.md
Modelo utilizadoGemini 2.5 Pro (cambia a Flash al límite)GPT-5-codexClaude 4 Sonnetqwen3-coder-plus
Límites de uso60 mensajes/min, 1000 diariosLímites cada 5h y semanales (detalles no públicos)10-40 prompts/5h, límite semanal desde ago 202560 solicitudes por minuto, 2000 por día.
Ventana de contexto en tokens1 000 000200 000200 000256 000
Versión gratuitaNoNo
Política de privacidadDatos usados para entrenamiento por defecto; revisión humana posible; retención hasta 18 mesesNo entrenan por defecto; retención 30 días; revisión solo en casos de abusoNo entrenan por defecto; retención 30 días (configurable)Los datos de las conversaciones serán usados para entrenamiento

Uso de IA en consola frente a la versión web

AspectoVersiones CLIVersiones web
AccesoDesde consola/terminal del sistema (cmd, PowerShell, Terminal).Desde un navegador web.
RequisitosNecesita Node.js.Solo conexión a Internet y un navegador.
MultimediaNo admite pegar imágenes en el chat; solo como archivos. Sin lienzo de previsualización.Admite copiar/pegar imágenes y elementos multimedia. En algunos casos, lienzo integrado.
Acceso a archivos localesSí. Puede leer, escribir, organizar, renombrar, convertir formatos, etc. Requiere permisos explícitos.No. Los archivos deben subirse y descargarse manualmente.
Operaciones sobre el sistemaPuede lanzar programas, consultar memoria, espacio libre, ejecutar conversiones o transcripciones.No tiene acceso directo al sistema operativo.
Versatilidad en tareasIdeal para automatizar procesos, manipular lotes de archivos, programar proyectos completos y convertir formatos directamente desde el ordenador.Más adecuada para consultas rápidas, interacción visual, compartir elementos multimedia y uso general sin instalación.
Uso en programación (vibe coding)Muy eficiente para proyectos con múltiples archivos; puede ver y manipularlos directamente.Menos eficiente: se deben subir/bajar o copiar archivos individualmente.
InterfazExclusivamente texto, sin ratón; navegación con teclado.Interfaz gráfica con botones, menús y edición más visual.

Mi experiencia personal, a modo de conclusión

Después de haber usado de forma intensiva los tres modelos durante un tiempo, he podido comprobar que tango ChatGPT como Claude son superiores en programación a Gemini por lo que si deseamos crear recursos educativos (páginas web, programas, etc.) los dos primeros son recomendables.

Sin embargo, la enorme ventana de contexto de Gemini (5 veces más que la de los otros dos), unido a su gratuidad, lo hacen ideal para tareas masivas (donde hay que realizar una gran cantidad de trabajo como convertir documentos, traducirlos, etc.) y, por lo tanto, es el CLI recomendable a nivel general.

Una buena técnica es utilizar Gemini por defecto y, si tenemos una cuenta Plus de ChatGPT o Pro de Claude, acudir a ellos cuando Gemini se queda atascado en una tarea que no puede resolver.

Advertencia: Este artículo tiene nivel 3 en el Marco para la integración de la IA generativa.

Lee también la segunda parte de la Guía básica para usar la inteligencia artificial desde la terminal.

Pódcast (creado con NotebookLM)

FAQ creado con NotebookLM

¿Qué son las consolas de IA y en qué se diferencian de las versiones web?

Las consolas de IA, como las versiones CLI (Command Line Interface) de Gemini, ChatGPT (Codex), Qwen y Claude, son programas que se instalan directamente en tu ordenador y se utilizan a través de ventanas de texto, conocidas como terminales o consolas. A diferencia de las versiones web, que se acceden mediante un navegador, las consolas de IA ofrecen una interacción más directa y profunda con el sistema operativo. No requieren un ordenador potente, ya que la comunicación se realiza a través de internet con los servicios de IA. La principal diferencia radica en que las consolas pueden ejecutar comandos directamente en tu ordenador, permitiéndoles leer, escribir, manipular archivos y carpetas, y realizar operaciones directas sobre el sistema operativo, acciones que no son posibles con los chats web.

¿Cuáles son las principales ventajas de usar una consola de IA en comparación con la versión web?

Las consolas de IA ofrecen varias ventajas significativas sobre las versiones web. Permiten manipular archivos y carpetas directamente en el ordenador, como reorganizar, borrar, crear o renombrar archivos masivamente (ej. renombrar varios archivos con un mismo criterio o convertir documentos de Word a PDF). También pueden realizar operaciones sobre el sistema operativo, como lanzar programas, consultar el estado de la memoria o el espacio libre, y convertir audios a texto para obtener transcripciones y traducciones. Son especialmente útiles para tareas de «vibe coding» (programación asistida por IA) en proyectos con múltiples archivos, ya que la IA puede ver, abrir y manipular todos ellos de manera eficiente. Aunque no admiten pegar imágenes directamente en el chat, se les pueden proporcionar como archivos.

¿Qué se necesita para instalar y usar una consola de IA como Gemini, Codex, Claude o Qwen?

Para instalar y usar estas consolas de IA, primero necesitas tener Node.js instalado en tu sistema operativo (Windows, Mac o Linux), ya que es el programa base que permite que estas herramientas funcionen. Si Node.js no está instalado, al intentar ejecutar los comandos verás un mensaje de error. Una vez que Node.js está instalado, puedes proceder a instalar la IA deseada utilizando comandos específicos en la consola del sistema (por ejemplo, npm install -g @google/gemini-cli para Gemini). Después de la instalación, simplemente escribes el nombre de la IA (ej. gemini, codex, claude, qwen) en la consola para iniciarla. Al principio, te pedirá iniciar sesión con tu cuenta correspondiente o introducir una clave API.

¿Cómo se gestionan la privacidad y el uso de datos en las versiones CLI de estas IA?

La gestión de la privacidad varía significativamente entre los diferentes proveedores y tipos de cuenta. En Gemini CLI para cuentas personales, los datos (prompts, outputs, código) se usan por defecto para entrenar modelos y pueden ser revisados por humanos, aunque esta opción puede desactivarse (opt-out) en la configuración de la cuenta de Google. Para las versiones empresariales y educativas de Gemini, así como para OpenAI API (Codex) y Claude Code, los datos no se usan para entrenar modelos por defecto, salvo consentimiento explícito o en casos específicos de seguridad y abuso. La retención de datos también varía: 30 días para monitorear abusos (OpenAI, Claude), hasta 18 meses para Gemini personal con revisión humana, y opciones de Zero Data Retention (ZDR) para entornos empresariales. Se recomienda precaución al enviar información confidencial, especialmente con Gemini CLI si no se ha configurado la opción de exclusión.

¿Cuáles son las principales diferencias entre Gemini CLI, Codex (ChatGPT CLI), Claude Code y Qwen en términos de características y límites de uso?

Existen diferencias notables entre las cuatro consolas de IA:

  • Gemini CLI: Ofrece una versión gratuita para uso individual, con un límite de 60 mensajes por minuto y 1000 diarios. Utiliza Gemini 2.5 Pro (cambiando a Flash al límite) con la ventana de contexto más grande: 1.000.000 de tokens. Por defecto, usa datos para entrenamiento.
  • Codex (ChatGPT CLI): Requiere una cuenta ChatGPT Plus, utiliza GPT-5 con una ventana de contexto de 200.000 tokens y tiene límites de uso por hora y semanales no especificados públicamente. No usa datos para entrenamiento por defecto.
  • Claude Code: Con una suscripción Pro, permite entre 10 y 40 mensajes cada 5 horas (con un límite semanal desde agosto de 2025). Usa Claude 4 Sonnet y tiene una ventana de contexto de 200.000 tokens. No usa datos para entrenamiento por defecto.
  • Qwen: Ofrece una versión gratuita con 60 solicitudes por minuto y 2000 diarias. Utiliza qwen3-coder-plus con una ventana de contexto de 256.000 tokens. Sus políticas de privacidad indican que los datos de las conversaciones serán usados para entrenamiento.

¿Cómo puedo abrir la consola del sistema operativo en una carpeta específica y por qué es importante?

Es fundamental abrir la consola de IA en la carpeta donde planeas trabajar para evitar que la IA tenga acceso a información personal o confidencial en otras partes de tu sistema. Los métodos para abrirla en una carpeta específica son:

  • Windows: Abre la carpeta en el Explorador de Archivos, haz clic en la barra de direcciones superior y escribe cmd o powershell, luego presiona Enter.
  • Mac: En Finder, navega a la carpeta y selecciona «Nuevas ventanas de la terminal en la carpeta» o arrastra la carpeta a una ventana de Terminal ya abierta después de escribir cd.
  • Linux: Navega hasta la carpeta en tu gestor de archivos y haz clic derecho en un espacio vacío para seleccionar la opción «abrir en un terminal».

¿Qué son los comandos /quit y /init y qué hacen en la consola de IA?

Los comandos /quit y /init son acciones específicas comunes a todas las consolas de IA:

  • /quit: Este comando cierra la sesión de la IA. También se puede lograr el mismo efecto pulsando CTRL + C dos veces seguidas.
  • /init: Esta instrucción le pide a la IA que analice el contenido de la carpeta actual y genere un archivo en formato Markdown (GEMINI.md, AGENTS.md, CLAUDE.md o QWEN.md según la IA) que contiene una descripción de su contenido. Es importante tener precaución, ya que si hay archivos de texto con información sensible en esa carpeta, serán leídos por la IA. Es conveniente ejecutar este comando antes de empezar si la consola se abre en una carpeta con archivos.

¿Dónde se guarda la configuración de las consolas de IA y cómo se puede gestionar?

La configuración de cada programa de IA (como los datos de inicio de sesión o las instrucciones iniciales) se guarda en carpetas específicas en tu sistema:

  • Gemini CLI: ~/.gemini (Linux/macOS) o %USERPROFILE%\.gemini (Windows). Archivo de instrucciones: GEMINI.md. Para cambiar de cuenta, puedes eliminar el archivo config.json de esta carpeta.
  • OpenAI Codex: ~/.codex (Linux/macOS) o %USERPROFILE%\.codex (Windows). Archivo de instrucciones: AGENTS.md.
  • Claude Code: ~/.claude (Linux/macOS) o %USERPROFILE%\.claude (Windows). Archivo de instrucciones: CLAUDE.md.
  • Qwen: ~/.qwen (Linux/macOS) o %USERPROFILE%\.qwen (Windows). Archivo de instrucciones: QWEN.md.

Puedes borrar estas carpetas en cualquier momento para que el programa las cree de nuevo la próxima vez que inicies la IA, lo cual puede ser útil para cambiar las opciones de inicio de sesión. También puedes crear archivos de instrucciones personalizados en estas carpetas de configuración (o en la carpeta actual de trabajo) para especificar el comportamiento o las instrucciones iniciales de la IA.

Glosario de términos

  • CLI (Command Line Interface): Son versiones de programas de inteligencia artificial que se instalan en tu ordenador y se usan escribiendo texto en ventanas especiales (llamadas terminales o consolas), en lugar de usar un navegador web y hacer clic. Es como usar el ordenador solo con el teclado, escribiendo tus instrucciones y recibiendo las respuestas ahí mismo.
  • Terminal o Consola: Es una ventana de texto en la que puedes escribir instrucciones directamente a tu ordenador. En Windows, se conocen como «Símbolo del sistema» o «PowerShell».
  • Chat web: Es la forma habitual de usar los chatbots de IA a través de su página web, donde escribes en un recuadro y recibes la respuesta.
  • Multimedia: En el contexto de las consolas de IA, se refiere a que no puedes pegar directamente imágenes u otros elementos visuales en el chat, aunque sí puedes proporcionarlos como archivos.
  • Lienzo: Se refiere a un espacio donde podrías editar o previsualizar resultados directamente en el chat, algo que no está disponible en las versiones de consola.
  • Comandos (en el ordenador): Son instrucciones que la inteligencia artificial puede ejecutar directamente en tu ordenador, permitiéndole leer y escribir archivos. Esto le da la capacidad de hacer cosas que no se pueden hacer desde una versión web, como manipular archivos, lanzar programas o consultar el estado de tu sistema.
  • Manipular archivos y carpetas: Se refiere a realizar acciones como leer, reorganizar, borrar o crear archivos y carpetas en tu ordenador.
  • Sistema operativo: Es el programa principal que controla todas las funciones de tu ordenador, como Windows, macOS o Linux. Las consolas de IA pueden interactuar con él para, por ejemplo, iniciar programas o ver cuánta memoria tienes disponible.
  • Vibe coding: Es la tarea de crear programas y aplicaciones dándole instrucciones a la inteligencia artificial. Es muy eficiente en el entorno de consola, especialmente para proyectos con varios archivos, ya que la IA puede ver, abrir y manejar esos archivos directamente.
  • Carpeta raíz del sistema: Es la carpeta principal y más básica de tu ordenador, de la que derivan todas las demás carpetas. Se recomienda evitar abrir la consola de IA en esta carpeta para proteger tu información personal y confidencial.
  • Node.js: Es un programa esencial que necesitas tener instalado en tu ordenador para poder usar las consolas de IA como Gemini, Codex o Claude. Si no lo tienes, verás un mensaje de error.
  • npm: Es una herramienta que se usa junto con Node.js para instalar y gestionar paquetes (programas) de JavaScript. Se menciona en las instrucciones de instalación de las IA.
  • Homebrew: Es un gestor de paquetes para sistemas operativos Mac y Linux, una forma alternativa de instalar programas de manera sencilla.
  • npx: Es un comando que te permite ejecutar un paquete (programa) sin necesidad de instalarlo de forma permanente. La aplicación se descarga cada vez que la usas.
  • GitHub (Repositorio oficial): Es una plataforma muy popular donde los desarrolladores de software almacenan y gestionan el código de sus proyectos. Los «repositorios oficiales» son donde se encuentra el código original y más actualizado de las IA.
  • WSL (Windows Subsystem for Linux): Es una característica de Windows que permite ejecutar un entorno Linux (otro sistema operativo) dentro de Windows, lo que puede ser útil para ciertos programas o si tienes dificultades en Windows.
  • Markdown: Es un formato de texto simple que se usa para escribir documentos. La IA puede generar un archivo en este formato con una descripción del contenido de la carpeta actual.
  • Tokens: Son las unidades en las que la inteligencia artificial procesa el texto (pueden ser palabras, partes de palabras o incluso caracteres).
  • Ventana de contexto: Se refiere a la cantidad máxima de «tokens» que una IA puede procesar o «recordar» en una conversación o tarea. Una ventana más grande significa que la IA puede manejar textos más largos o recordar más información de la conversación.
  • Opt-out: Significa la opción de poder desactivar voluntariamente una función que viene activada por defecto. Por ejemplo, en Gemini CLI, la opción de que tus datos se usen para entrenar el modelo está activada por defecto, pero puedes desactivarla.
  • Prompts: Son las instrucciones, preguntas o peticiones que tú le escribes a la inteligencia artificial.
  • Outputs: Son las respuestas o los resultados que genera la inteligencia artificial en base a tus «prompts».
  • Machine learning (aprendizaje automático): Es una rama de la inteligencia artificial que permite a los sistemas aprender de los datos para mejorar su rendimiento en tareas específicas, como entender lo que pides o generar respuestas.
  • Zero Data Retention (ZDR): Es una configuración avanzada que impide que tus datos sean almacenados, incluso temporalmente, en los servidores del proveedor de la IA. Se ofrece en versiones corporativas o para APIs específicas.
  • API (Application Programming Interface): Es un conjunto de reglas y herramientas que permiten a diferentes programas de software comunicarse entre sí. Cuando se menciona «OpenAI API», se refiere a usar los servicios de OpenAI (como ChatGPT) a través de una conexión directa de programa a programa, en lugar de la interfaz web.
  • Feedback para trust & safety: Se refiere a cuando un usuario marca un contenido como problemático o inadecuado para que sea revisado por motivos de seguridad o confianza.
  • Caché técnica: Es un almacenamiento temporal de datos que se guarda para que los programas funcionen más rápido.
  • Registros mínimos de auditoría: Son pequeños registros que se guardan para hacer un seguimiento básico de las operaciones, por ejemplo, quién accedió a qué sistema y cuándo, con fines de seguridad o cumplimiento normativo.

Referencias:

Inteligencia artificial y matemáticas: cálculo y formato

Recientemente y hablando de matemáticas, he visto comentarios acerca de que los chatbots son incapaces de resolver problemas matemáticos donde hay algún tipo de cálculo o que no pueden comprender lo que se les sube, por ejemplo, en PDF.

Estas críticas entroncan directamente con dos capacidades matemáticas importantes: la capacidad de realizar operaciones matemáticas y, una más genérica, que es el formato con el que leen mejor los datos.

Chatbots con capacidad de cálculo

El primer error que suele cometer el docente inexperto consiste en pensar que da igual usar un chatbot u otro, pongamos, por ejemplo, Copilot o ChatGPT, para resolver un problema. Nada más lejos de la realidad, porque las diferencias en las capacidades matemáticas entre chatbots son abismales. Como veremos a continuación, los chatbots dan resultados incorrectos porque intentan hacer los cálculos «de cabeza» y se equivocan. Son muy pocos los que pueden utilizar herramientas informáticas de cálculo (programación).

Veamos un ejemplo donde les pedimos la media de 39 números. Hemos utilizado tres prompts en el mismo chat. El primero ha sido:

El segundo ha sido:

Y, por último:

En la siguiente tabla podemos ver los resultados obtenidos con cada uno de los chatbots.

ChatbotResultados de los prompts:
1 / 2 / 3
¿Resultado correcto?
Claude53.5 / 53.5 / 53.5✅ / ✅ / ✅
ChatGPT53.8 / 53.5 / 53.5❌ / ✅ / ✅
Gemini53.4 / 53.4 / 53.5❌ / ❌ / ✅
DeepSeek51.3 / 51.3 / 53.5❌ / ❌ / ✅
Grok53.6 / 53.6 / 53.5❌ / ❌ / ✅
Copilot57.4 / 57.4 / –❌ / ❌ / ❌
Perplexity52.0* / 52.0 / –❌ / ❌ / ❌

* Perplexity da un primer resultado válido, pero no los siguientes. El motivo es que, en la versión gratuita, la opción Pro Search se desactiva automáticamente, por lo tanto se considera un resultado negativo.

  • Claude ha utilizado programación desde el primer momento (hizo un programa en JavaScript), por lo que su resultado ha sido exacto desde el principio. De hecho, cuando se le puso el segundo prompt se «quejó» diciendo que ya lo había hecho antes.
  • ChatGPT confió en sus capacidades de cálculo y lo resolvió en un primer momento sin usar programación; el resultado fue, lógicamente, erróneo. ChatGPT no siempre hace esto, cuando ve operaciones complejas, suele utilizar programación desde un primer momento (hace programas en Python). Para asegurarnos de que siempre lo hará así, lo mejor es decirle desde el principio que use programación para los cálculos, de este modo su resultado será siempre acertado.
  • Gemini, DeepSeek y Grok dan un resultado erróneo en un primer momento. Cuando se les pide que usen programación en el chat con el segundo prompt, los tres hacen un programa que no ejecutan, por lo que tampoco dan el resultado correcto. Se limitan a decir que con ese programa el usuario podrá comprobar que el primer resultado era válido. Cuando se les pide un programa en HTML, los tres lo hacen, lo permiten ejecutar desde el mismo chat y se obtiene el resultado correcto.
  • Copilot y Perplexity no dan el resultado correcto en ningún caso, ya que no pueden ejecutar programas en el chat y tampoco son capaces de ejecutar los programas que crean en HTML, por lo que no es posible comprobar sin salir del chat, si los programas realmente funcionan.

Como conclusión, podemos decir que, cuando hay implicados cálculos matemáticos, debemos limitarnos a utilizar Claude y ChatGPT. Por seguridad, siempre es preferible decirles desde el principio que usen programación para calcular los resultados.

Podemos utilizar Gemini, DeepSeek o Grok (aquí también entraría el chatbot Qwen) siempre que les hagamos hacer programas en HTML para poder ejecutarlos una vez que los hayan creado.

Bajo ningún concepto deberíamos usar Copilot o Perplexity, ya que los resultados tienen una alta probabilidad de ser erróneos.

Debemos tener en cuenta que tanto ChatGPT como Claude pueden utilizar librerías como SymPy o mathjs con las que se puede hacer cálculo simbólico como, por ejemplo, derivadas de funciones y también librerías gráficas con las que podremos tener gráficos en el transcurso de nuestra conversación en el chat. Estos dos chatbots están muy por delante de cualquiera de sus competidores.

ChatGPT hace los programas en Python y Claude en JavaScript, dado que Python es más potente para la manipulación y cálculo matemático, ChatGPT se presenta como el chatbot más potente en matemáticas, no obstante, para las tareas habituales ambos nos irán igualmente bien.

En el artículo ¿Qué IA me conviene? hay una tabla, que se actualiza periódicamente, donde se indica la capacidad de las diferentes IA para hacer cálculos (fila 7). En el caso de que otros chatbots adquieran posteriormente la capacidad de hacer cálculos matemáticos, se indicará puntualmente allí.

El formato matemático desde la perspectiva de los chatbots

El formato que mejor manejan los chatbots es el de texto puro. Todos ellos utilizan para sus respuestas el formato Markdown, que es texto puro, pero con ciertas marcas que definen formatos, listas de viñetas o fórmulas. Cuando usamos el botón copiar del chat, lo que estamos copiando es el texto en formato Markdown.

Aunque podemos escribir una fracción como: (x+1)/(3x+2), hay expresiones que pueden ser más complicadas de representar y la recomendación es usar LaTeX. La fórmula anterior se escribiría como \frac{x+1}{3x+2} que se vería como \(\frac{x+1}{3x+2}\). No se trata ahora de aprender LaTeX, aunque recomiendo muy encarecidamente conocer lo más básico que son unas pocas expresiones como la de la fracción anterior (en esta página tienes lo más usado).

Documentos

Para convertir un texto en formato DOCX o PDF a Markdown podemos utilizar Gemini, ya que hace una conversión más que aceptable. Podemos usar un prompt como este:

La coletilla «no añadas citas» es para evitar que nos añada enlaces al documento con la localización del texto, aunque si las pone tampoco supondrá un problema.

El texto producido hay que copiarlo con el botón que hay en la base del chat (nunca seleccionando con el ratón) y lo podremos pegar directamente en ChatGPT o Claude. También lo podemos guardar en un archivo de texto, utilizando un programa como el bloc de notas de Windows, con la extensión: md. Por ejemplo: mi_examen.md o guardándolo como texto sin formato en Word o Google Docs. No debemos guardarlo con el formato por defecto de estos procesadores de texto.

Si actuamos de este modo, los chatbots entenderán perfectamente el texto que les estamos proporcionando y ya no tendremos la impresión de que la IA no nos entiende cuando le pedimos algo (cuando, en realidad, lo que no entiende son los datos que le subimos).

Utilidades para las fórmulas

Estos programas son de utilidad para el que trabaja habitualmente con fórmulas. El primero es para reutilizar las conversaciones con los chatbots y el segundo para hacer fórmulas.

MDAITex. Con este programa podremos hacer el paso inverso al explicado antes: el resultado proporcionado por el chatbot (la solución de un examen, ejercicios, etc.) lo podremos pasar a nuestro procesador de textos favorito.

EdiCuaTeX. Es un editor de fórmulas gráfico con el que podemos hacer fórmulas que obtendremos en LaTeX y que también podremos descargar como imagen.

Imágenes

Aunque no es tan preciso como lo anterior, todos los chatbots pueden descifrar las imágenes, por lo que si subimos fotos no debería haber ningún problema, incluso si el texto y las fórmulas están escritas a mano.

Conclusiones

Los mejores chatbots para usar en matemáticas y otras asignaturas científicas, son ChatGPT y Claude. En las conversaciones conviene indicarles que hagan los cálculos mediante programación. Para pasarles documentos hay que pedirle a Gemini que los transcriba a formato Markdown y se los proporcionaremos en este formato.

Pódcast creado con NotebookLM

FAQ del artículo

1. ¿Son todos los chatbots igualmente capaces de resolver problemas matemáticos?

No, las diferencias en las capacidades matemáticas entre los chatbots son abismales. Muchos chatbots cometen errores al intentar realizar cálculos «de cabeza» y no pueden utilizar herramientas de programación. Solo unos pocos chatbots, como Claude y ChatGPT, son fiables para cálculos matemáticos complejos, ya que pueden usar programación.

2. ¿Por qué algunos chatbots dan resultados incorrectos en matemáticas y cómo se puede mejorar su precisión?

Los chatbots dan resultados incorrectos cuando intentan hacer los cálculos sin usar programación. Para asegurar resultados precisos, es fundamental pedirles que usen programación desde el principio. Por ejemplo, al solicitar a ChatGPT que use programación (Python), sus resultados son consistentemente correctos. Otros chatbots como Gemini, DeepSeek, y Grok, aunque pueden generar código, no lo ejecutan internamente, requiriendo que el usuario ejecute el programa (por ejemplo, en HTML) para obtener la respuesta correcta.

3. ¿Cuáles son los chatbots más recomendados para tareas matemáticas y científicas?

Los mejores chatbots para usar en matemáticas y otras asignaturas científicas son ChatGPT y Claude. Claude utiliza JavaScript para su programación interna, mientras que ChatGPT usa Python. Aunque ambos son muy competentes, Python ofrece una mayor potencia para la manipulación y el cálculo matemático, lo que posiciona a ChatGPT como el más potente en matemáticas. Ambos pueden integrar librerías de cálculo simbólico (como SymPy o mathjs) y gráficas.

4. ¿Qué formato de datos es el más efectivo para que los chatbots entiendan la información, especialmente en matemáticas?

El formato que mejor manejan los chatbots es el de texto puro, específicamente Markdown. Markdown permite incluir ciertas marcas para definir formatos, listas o fórmulas. Para expresiones matemáticas complejas, se recomienda usar LaTeX, ya que los chatbots lo interpretan sin problemas. Es crucial copiar el texto directamente con el botón de copiar del chat para asegurar que el formato Markdown se preserve.

5. ¿Cómo se pueden transcribir documentos como DOCX o PDF para que los chatbots los procesen eficazmente?

Para transcribir documentos en formatos como DOCX o PDF a un formato legible para los chatbots, se puede utilizar Gemini. Se le puede pedir a Gemini que transcriba el documento a formato Markdown con un prompt como: «Transcribe el siguiente documento al formato Markdown, no añadas citas». Una vez transcrito, el texto resultante debe copiarse utilizando el botón de copiar del chat y pegarse directamente en chatbots como ChatGPT o Claude, o guardarse como un archivo .md.

6. ¿Es posible que los chatbots entiendan texto y fórmulas escritas a mano en imágenes?

Sí, aunque no con la misma precisión que con texto puro o LaTeX, todos los chatbots pueden descifrar imágenes. Esto significa que si se suben fotos con texto y fórmulas, incluso si están escritas a mano, los chatbots deberían poder procesarlas sin mayores problemas.

7. ¿Qué herramientas externas pueden complementar el uso de chatbots para trabajar con fórmulas matemáticas?

Existen utilidades que facilitan el trabajo con fórmulas. MDAITex es un programa que permite convertir los resultados proporcionados por los chatbots (en Markdown) a un formato compatible con procesadores de texto, invirtiendo el proceso de transcripción. EdiCuaTeX es un editor gráfico de fórmulas que permite crear expresiones en LaTeX y descargarlas como imagen, facilitando la creación de contenido matemático.

8. ¿Qué precauciones deben tomarse al usar chatbots para cálculos matemáticos?

Es crucial indicar a los chatbots (especialmente a Claude y ChatGPT) que realicen los cálculos mediante programación para asegurar la exactitud de los resultados. Además, para proporcionar documentos a los chatbots, se recomienda transcribirlos previamente a formato Markdown usando Gemini. Se desaconseja el uso de chatbots como Copilot o Perplexity para cálculos matemáticos, ya que sus resultados son propensos a errores y no pueden ejecutar programas internamente. Las capacidades mencionadas corresponden a las versiones gratuitas de los chatbots.

Notas

Las versiones de las que hablamos en este artículo son las gratuitas para cada uno de los chatbots, las que aparecen por defecto al abrir su enlace.

Este artículo tiene nivel 0 en el marco para la integración de la IA generativa en las tareas educativas. Excepto las FAQ y el pódcast que ha sido creado por NotebookLM.

Cómo crear un chatbot en Gemini con canvas

Gemini permite realizar programas y páginas web utilizando canvas (o lienzo) que es un espacio separado del chat, pero integrado en él, donde tanto Gemini como el usuario pueden escribir.

Para ilustrar el proceso, haremos una aplicación que será un chatbot que admita texto y el programa nos haga preguntas sobre él para ver si lo hemos comprendido.

Pasos previos

Es muy importante seleccionar el modelo más potente, que en este momento es 2.5 Pro (preview).

y marcar la opción Canvas:

Las cuentas corporativas normalmente no tienen la opción para compartir el programa, lo cual será necesario más adelante para que otros lo puedan usar. Por lo tanto, asegúrate de que tu cuenta permita compartir el programa que hagas o tendrás que empezar de cero. Para ello, pídele cualquier programa que haga rápidamente (por ejemplo, un programa que muestre la hora actual) y asegúrate de que el botón compartir está activado:

Objetivo del chatbot y su creación

En primer lugar, debemos tener muy claro lo que queremos y, si no lo tenemos, trabajar hasta obtener una descripción que lo sea.

Para hacer el prompt ejemplo de este artículo he utilizado Claude, pero podemos usar el mismo Gemini o cualquier otra que queramos. Con la idea en mente de hacer un programa que sirviese para saber si hemos comprendido determinado texto de una materia, le he pedido a Claude tipos de preguntas que podríamos hacer y después he añadido que fuese un método socrático. La conversación completa hasta obtener el prompt final está aquí y este ha sido:

Aquí tenemos una captura de pantalla después de pegar el prompt y de que Gemini haya trabajado un rato:

Depuración del chatbot

Lo siguiente que hay que hacer es probarlo en profundidad para encontrar errores o aspectos que no nos gusten. Cuando queramos cambiar algo, simplemente le explicamos a Gemini lo que queremos hacer y por qué, esto último ayuda a que la IA se haga una idea de lo que perseguimos realmente.

Un problema es que cuando se trabaja mucho tiempo en el mismo chat, Gemini empieza a arrastrar errores anteriores y se entra en un bucle difícil de salir. En este caso lo aconsejable es compartirlo, abrir la dirección compartida y pulsar el botón «Copiar Canvas» con lo que podremos empezar con el programa completo y el chat limpio.

Si trabajamos mucho tiempo en un programa, probablemente se nos acaben las interacciones gratuitas, en ese caso podemos esperar a que se restablezcan o utilizar la misma técnica explicada antes de compartir y empezar en un chat nuevo, pero esta vez cambiando de usuario. Los pasos serían: compartir el programa, cambiar de usuario, abrir el enlace compartido, pulsar «Copiar Canvas» desde el nuevo usuario y continuar con la mejora del programa.

Compartir el chatbot

Una vez tengamos la versión definitiva, hay que pulsar el botón para compartir y copiar la URL que nos dará.

Si hacemos algún cambio en el programa, tenemos que volver a compartirlo y esta dirección también cambiará. Esto puede ser un problema si ya se la hemos dado al alumnado. Por eso, es mejor usar un documento online u otro sistema que nos permita actualizar la URL sin tener que volver a difundirla. Así, los alumnos accederán siempre al mismo documento, donde encontrarán la dirección actual del programa.

Tutor socrático con IA

Puedes probar el programa en este enlace. Si lo deseas, cópialo y mejóralo. Por ejemplo, se me ocurre, no limitar a 8 las preguntas y que sea el usuario el que elija cuántas quiere, que el informe final se pueda copiar, que por defecto la edad sea de 14 años (que es la edad mínima legal para usar Gemini) o que podamos abrir archivos PDF, no solo pegar texto.

Pulsa sobre la imagen para abrir el tutor socrático

Recomendaciones

Actúa prudentemente, si le pides cosas demasiado complicadas, puede ser que el programa empiece a fallar y no consigas que vuelva a funcionar. Una forma de mitigar esto es compartirlo de vez en cuando e ir guardando estas direcciones, así podremos volver atrás en cualquier momento. También puedes volver a la versión anterior pulsando el botón indicado a continuación:

Si el programa da errores, aparecerá un mensaje indicándolo. Si el error es 401, actualiza la página. Este error normalmente indica que se ha perdido la conexión y es inútil decirle a Gemini que lo arregle. Si es otro tipo de error, un enlace te permitirá que Gemini lo arregle automáticamente. Si no lo consigues después de varios intentos, vuelve a una versión anterior.

Si, cuando acaba de hacer el programa, en lugar de aparecer la vista previa con el programa, esta está en blanco, actualiza el navegador y volverá a funcionar, después de hacerte confirmar que no eres un robot.

Puedes añadir más características basadas en IA, pulsando el botón con el símbolo de la IA que está en una pequeña barra de herramientas abajo a la derecha:

No pedirá confirmación, añadirá las características que a Gemini le parecen adecuadas. Si no nos gustan, podemos usar el botón para volver a la versión anterior.

Para terminar

Para poder usar estos programas hechos por Gemini se necesitan cuentas de Google que puedan acceder a Gemini, por lo tanto, es posible que algunas cuentas sin acceso no lo puedan usar. Esto pasa, por ejemplo, con algunas de las educativas.

La técnica que hemos usado para construir este chatbot se llama vibe coding, que consiste en explicar a la IA lo que queremos conseguir y ella nos haga el programa. Si te interesa el tema, participa en el grupo de Telegram: Vibe Coding Educativo.

Pódcast creado con NotebookLM

FAQ generada con NotebookLM

¿Qué es «canvas» en el contexto de Gemini y cómo se utiliza para crear un chatbot?

Canvas, o lienzo, es un espacio interactivo dentro de la interfaz de Gemini que funciona de forma separada del chat principal pero está integrado en él. Permite que tanto Gemini como el usuario interactúen directamente con elementos visuales o código. Para crear un chatbot, se selecciona la opción «Canvas» al iniciar un nuevo chat o proyecto en Gemini. Este lienzo actúa como el entorno donde se desarrollará y probará el programa del chatbot, permitiendo la visualización y depuración de su funcionamiento.

¿Cuál es el primer paso crucial al diseñar un chatbot en Gemini y por qué es importante seleccionar el modelo adecuado?

El primer paso esencial es tener una idea muy clara del objetivo y funcionalidad del chatbot. Si la idea inicial no es lo suficientemente precisa, se debe refinar hasta obtener una descripción detallada de lo que se quiere que el chatbot haga. Es fundamental seleccionar el modelo más potente disponible en ese momento, como 2.5 Pro (preview), ya que un modelo más avanzado ofrece mayores capacidades y un mejor rendimiento para el desarrollo del programa.

¿Qué consideraciones se deben tener en cuenta sobre las cuentas corporativas al crear y compartir un chatbot en Gemini?

Las cuentas corporativas a menudo no disponen de la opción para compartir programas o aplicaciones creadas en Gemini. Dado que la posibilidad de compartir es necesaria para que otros usuarios puedan acceder y utilizar el chatbot, es vital asegurarse de que la cuenta utilizada permita esta función. Se recomienda verificar esta capacidad creando un programa sencillo y comprobando si el botón de compartir está activado antes de invertir tiempo en el desarrollo de un chatbot complejo.

¿Cómo se utiliza un prompt efectivo para guiar a la IA en la creación de un chatbot de tutoría Socrática como el descrito?

Un prompt efectivo debe ser específico y detallado sobre la funcionalidad deseada. Para el chatbot de tutoría Socrática, el prompt incluyó instrucciones claras sobre la interacción con el usuario (pegar texto, especificar edad), el método de enseñanza (preguntas abiertas, ajuste a respuestas, método socrático), los límites (máximo 8 preguntas), las condiciones de finalización (reconocimiento de falta de comprensión o límite alcanzado), y la generación de un informe final con análisis detallado (nivel de comprensión, puntos fuertes, áreas a reforzar, sugerencias de estudio). También se especificó la adaptación del lenguaje a la edad del usuario.

¿Qué estrategias se recomiendan para depurar un chatbot en Gemini y solucionar problemas comunes?

Para depurar, se prueba el chatbot exhaustivamente y se explican a Gemini los cambios deseados y las razones detrás de ellos. Si Gemini empieza a arrastrar errores de interacciones anteriores, se aconseja compartir el programa, abrir la URL compartida y copiarlo para empezar con un chat limpio pero conservando el programa. Si se agotan las interacciones gratuitas, se puede compartir el programa, cambiar de usuario y continuar desde el nuevo usuario, abriendo el archivo compartido. Para errores de tipo 401, se debe actualizar la página. Para otros errores, Gemini puede intentar solucionarlos automáticamente a través de un enlace proporcionado; si no funciona, se recomienda volver a una versión anterior.

¿Cómo se gestiona la compartición de un chatbot en Gemini, especialmente si se realizan actualizaciones?

Una vez finalizada la versión del chatbot, se utiliza el botón de compartir para obtener una URL. Si se realizan cambios posteriores, es necesario volver a compartir para obtener una nueva URL, ya que la anterior dejará de funcionar para la versión actualizada. Para evitar tener que redifundir constantemente la nueva URL a los usuarios (como estudiantes), se sugiere utilizar un documento en línea o sistema similar donde se pueda actualizar la URL de forma centralizada. Así, los usuarios acceden siempre al mismo documento para obtener la dirección actualizada del programa.

¿Qué técnica de desarrollo se menciona y en qué consiste?

La técnica de desarrollo mencionada es «vibe coding». Consiste en describir a la inteligencia artificial lo que se desea conseguir o el resultado final esperado, y dejar que la IA se encargue de generar el código o el programa necesario para lograrlo. En lugar de dar instrucciones de programación paso a paso, se le comunica a la IA el «vibe» o la intención del proyecto.

¿Qué precauciones se sugieren al desarrollar un chatbot en Gemini y cómo se pueden mitigar posibles fallos?

Se recomienda actuar prudentemente y evitar pedirle a la IA cosas demasiado complicadas, ya que esto puede causar que el programa falle y sea difícil de recuperar. Una forma de mitigar esto es compartir el programa periódicamente y guardar las URLs de estas versiones intermedias. Esto permite volver a una versión anterior funcional si el desarrollo actual presenta problemas irresolubles. Además, Gemini ofrece un botón para volver a la versión anterior en caso de errores o cambios no deseados. Si aparece un mensaje de error, se debe prestar atención al tipo de error (ej. 401 indica pérdida de conexión).

Asistente de Estudio Inteligente Multilingüe

El Asistente de Estudio Inteligente Multilingüe es una aplicación hecha con Gemini 2.5 Pro cuya finalidad es ayudar a estudiar y a comprender los conceptos tratados.

Es multilingüe porque antes de iniciarse detecta el idioma preferido en el navegador y la aplicación se traduce a sí misma antes de mostrarse. La traducción, como es lógico, la realiza la IA, por lo que el número de idiomas que maneja es realmente importante.

Contenido y herramientas

Antes de aparecer el programa, la aplicación detecta el idioma preferido en el navegador, traducirá toda la interfaz a este idioma y lo definirá como el idioma de interacción con la IA. Esto se puede cambiar en la primera pantalla.

Esta es la primera pestaña del programa, aquí definimos:

  • Edad: es opcional, pero recomendable, la IA adaptará sus preguntas y comentarios a la edad introducida. Si no la indicamos, el nivel se adaptará al del texto introducido.
  • Idioma de la interacción con la IA. Es el idioma en el que nos hablará la IA, podemos poner cualquier idioma. El idioma que usemos nosotros al escribir no es importante, siempre responderá en el idioma indicado aquí.
  • Traducir también la interfaz. Este botón traducirá la aplicación al idioma indicado en: Idioma de la interacción con la IA. Si, por ejemplo, estamos estudiando inglés, podemos hacer que también la interfaz aparezca en este idioma.
  • A continuación hay que cargar la información que usará el asistente para trabajar.
    • Con el primer selector se puede cargar un archivo PDF, de texto o Markdown. Una vez cargado el texto, aparecerá en el siguiente recuadro. Si el PDF tiene imágenes, estas serán ignoradas.
    • En el segundo selector aparece el texto cargado en el primero, pero también podemos pegar cualquier texto que hayamos copiado.
    • Con el tercer selector podemos añadir una imagen que puede ser una foto de apuntes tomados a mano, de una página escrita, un mapa conceptual, etc. Si utilizamos un móvil, la mayoría de ellos nos permitirán hacer una foto en el momento, en algunos modelos solo permiten seleccionar las que ya tengamos hechas.

      Es importante remarcar que podemos añadir texto e imagen a la vez, solo texto o solo imagen.
  • Una vez cargada la información, disponemos de cuatro herramientas que ayudan en el estudio:
    • Resumir. Hace un resumen del texto o imagen.
    • FAQ. Elabora preguntas y respuestas.
    • Flashcard. Crea tarjetas de memoria para estudiar. Aparece una pregunta y pulsando encima saldrá la solución.
    • Mapa conceptual. Crea un mapa conceptual interactivo con la información. Podemos usar la rueda del ratón para hacer zoom, mover el lienzo y dejando el ratón encima de un concepto, lo describe brevemente. Este mapa puede descargarse como HTML, es decir, una página web con las mismas características ya descritas, pero que nos permitirán disponer de la imagen en un espacio mayor para imprimir o facilitar el estudio.

      Todas estas representaciones de la información se generan en el momento mediante IA, por lo tanto, cada vez que pulsemos un botón, obtendremos una respuesta diferente. Esto es útil si no estamos satisfechos la primera vez.

Práctica guiada

Forma el corazón de la aplicación y aquí es donde la IA nos hará preguntas y nos dirá si las respuestas son correctas o no.

Disponemos de varias opciones:

  • Modo de estudio:
    • Aleatorio. Es el modo por defecto, hace preguntas al azar, sin seguir un orden.
    • Guiado (progresivo). La IA va haciendo preguntas, de forma que se intenta asegurar que vamos avanzando siguiendo una progresión creciente que facilita la comprensión.
  • Tipo de pregunta:
    • Aleatorio. Es la pregunta por defecto. Va cambiando el tipo de forma aleatoria. El tipo de la pregunta aparecerá durante breves segundos sobre la pantalla.
    • General. Preguntas clásicas sobre el texto o imagen.
    • Definición. Plantea definiciones a partir de los contenidos.
    • Relación entre conceptos. Hace preguntas donde haya que relacionar diferentes conceptos.
    • Aplicación/Ejemplo. Plantea situaciones de aplicación concretas a partir del contenido.
    • Verdadero/Falso. Escribirá alguna afirmación de la que tenemos que decidir si es cierta o no.
    • Opción múltiple. Hace preguntas con varias opciones, solo una es correcta.

      Nota: Dado que la IA revisa las respuestas, no se requiere responder de forma estricta. Por ejemplo, si es una pregunta de verdadero o falso, podemos responder: «Creo que es cierto» o «Me parece que es mentira» y lógicamente también podemos responder con el clásico «V/F». Esto se aplica a todas las respuestas, la IA valora nuestra aproximación a la realidad y finalmente determina si la respuesta se puede considerar correcta o no.
      El programa lleva la cuenta de las preguntas que ha hecho hasta el momento, por lo que no debería repetir ninguna de ellas. También lleva el control de los conceptos que ha tratado, aparecen al final de cada una de sus preguntas entre paréntesis.
  • Información extra. Una vez que el Asistente ha realizado una pregunta y hemos respondido, podemos pedirle que nos amplíe la información (Explicar más) o que nos establezca analogías (Crear analogías) para entender mejor la respuesta correcta.

Chat con IA

Podemos hablar con la IA sobre los contenidos que le hemos subido. La IA se limitará a responder solo las preguntas relacionadas con el tema de estudio.

Informe y reinicio

Crea un informe del progreso del estudiante y reinicia toda la aplicación.

El informe se basa en las respuestas de la pestaña Práctica Guiada, el contenido del chat no se tiene en cuenta. Se pueden hacer tantos informes como se quieran a medida que se avanza en el estudio.

Si pulsamos el botón Reiniciar Sesión, se borra toda la información relativa a los temas tratados, así como las respuestas de la sesión actual.

Pódcast

FAQ

¿Qué es el Asistente de Estudio Inteligente Multilingüe?

Es una aplicación diseñada con Gemini 2.5 Pro cuya principal finalidad es ayudar a los usuarios a estudiar y comprender conceptos a partir de la información que proporcionan.

¿Cómo funciona la función multilingüe de la aplicación?

Antes de iniciar, la aplicación detecta el idioma preferido en el navegador del usuario y automáticamente traduce toda la interfaz a ese idioma. Además, este idioma se establece como el idioma de interacción con la IA, aunque el usuario puede cambiarlo en la primera pantalla. La traducción es realizada por la IA, lo que permite un amplio soporte de idiomas.

¿Qué tipo de contenido puedo cargar en el Asistente?

Se puede cargar información en formato de archivo PDF, de texto o Markdown. También se puede pegar texto directamente o añadir imágenes, como fotos de apuntes, páginas escritas o mapas conceptuales. Es posible cargar tanto texto como imagen, solo texto o solo imagen.

¿Qué herramientas de estudio ofrece la aplicación?

La aplicación proporciona cuatro herramientas basadas en IA para ayudar en el estudio: Resumir (crea un resumen del contenido), FAQ (elabora preguntas y respuestas), Flashcard (crea tarjetas de memoria interactivas) y Mapa conceptual (genera un mapa conceptual interactivo que se puede descargar como HTML). Cada vez que se utilizan estas herramientas, la IA genera una respuesta diferente, lo que permite obtener diversas representaciones de la información.

¿Cómo funciona la función de «Práctica guiada»?

La «Práctica guiada» es la parte central de la aplicación donde la IA plantea preguntas basadas en el contenido cargado y evalúa las respuestas del usuario. Se pueden seleccionar diferentes modos de estudio (Aleatorio o Guiado/progresivo) y tipos de pregunta (Aleatorio, General, Definición, Relación entre conceptos, Aplicación/Ejemplo, Verdadero/Falso, Opción múltiple). La IA no requiere respuestas estrictas y evalúa la aproximación del usuario a la respuesta correcta. La aplicación lleva un registro de las preguntas realizadas y los conceptos tratados para evitar repeticiones.

¿Qué opciones tengo después de responder una pregunta en la «Práctica guiada»?

Después de responder una pregunta, el usuario puede solicitar a la IA que amplíe la información (Explicar más) o que establezca analogías (Crear analogías) para comprender mejor la respuesta correcta.

¿Para qué sirve la función «Chat con IA»?

La función «Chat con IA» permite al usuario interactuar con la IA sobre los contenidos cargados. La IA se limita a responder preguntas que estén relacionadas con el tema de estudio.

¿Qué información incluye el informe de progreso y cómo se genera?

El informe de progreso se basa en las respuestas proporcionadas en la pestaña «Práctica guiada». El contenido del chat con la IA no se tiene en cuenta para el informe. Se pueden generar múltiples informes a medida que se avanza en el estudio. La función «Reiniciar Sesión» borra toda la información relativa a los temas tratados y las respuestas de la sesión actual.

Nota: Este artículo tiene nivel 0 en el Marco para la integración de la IA generativa en las tareas educativas, excepto el pódcast y las FAQ que han sido creadas con NotebookLM.

« Entradas anteriores

© 2025 Bilateria

Tema por Anders NorenArriba ↑