Blog · tutorial · IA en obra · móvil

Generar actas de visita por voz desde el móvil.

El arquitecto graba lo que ve. La IA transcribe, estructura y asigna tareas. El PDF llega al móvil antes de salir de obra. Sin formularios, sin apps nuevas, sin redacción posterior. Tutorial del flujo completo con Pracmatik.

Publicado el 29 de mayo de 2026 · 8 min de lectura

El problema: la visita dura una hora, el acta dura otra.

En un estudio pyme con tres o cuatro obras activas, el patrón es siempre el mismo. La visita de obra dura entre 45 minutos y una hora y media. Después viene el trabajo que no se ve desde fuera: revisar las notas del móvil, transcribir los audios grabados, estructurar la información en el formato del despacho, redactar las instrucciones con el lenguaje técnico correcto, adjuntar fotos en el orden adecuado, enviar el documento al promotor y archivar en el expediente. Entre 45 minutos y dos horas adicionales por visita.

En un estudio con cuatro obras y visita semanal, eso son hasta ocho horas semanales de trabajo administrativo directo de arquitecto. Tiempo que no se factura, que resta al proyecto y que condiciona cuántas obras puede gestionar un estudio sin crecer en equipo. La automatización de la redacción del acta no cambia el contenido de la visita ni la responsabilidad técnica — solo elimina el trabajo mecánico.

Flujo tradicional vs flujo por voz.

Flujo tradicional

  • Notas a mano o grabación de voz en la visita
  • Fotos en el carrete del móvil, sin contexto
  • Transcripción manual en el despacho (45-90 min)
  • Redacción en Word o plantilla propia
  • Adjuntar fotos manualmente, una a una
  • Exportar PDF, enviar, archivar
  • Total:75-120 minutos por visita

Flujo por voz con Pracmatik

  • Audios de voz directos al chat de obra en Telegram
  • Fotos con caption breve en el mismo chat
  • /fin para cerrar la visita
  • IA transcribe, estructura y asigna tareas
  • PDF llega al chat en menos de 3 minutos
  • Revisión rápida y firma desde el móvil
  • Total:3-8 minutos por visita
Tutorial paso a paso · flujo Pracmatik

Cómo funciona el flujo en cinco pasos.

01

Abrir el chat de la obra en Telegram

Cada obra tiene un grupo de Telegram vinculado al sistema. No hace falta instalar ninguna app adicional: el bot está ya en el chat. El arquitecto escribe /visita para abrir la sesión de documentación de esa visita concreta. El sistema responde confirmando la obra y el número de visita.

02

Grabar audios mientras se recorre la obra

Con el móvil en la mano, el arquitecto graba un audio de voz en el chat cada vez que tiene algo que documentar: una instrucción técnica, una incidencia detectada, el estado de un trabajo. No hace falta seguir ningún orden ni formato. El contenido puede ser tan informal como "el tabique norte está mal aplomado, que Sebas lo corrija antes del jueves". El sistema transcribe y estructura.

03

Fotografiar los puntos con el móvil

Las fotos se envían directamente al chat. Si se añade un caption a la foto antes de enviar — por ejemplo "falta de impermeabilización en junta" — la IA utiliza ese texto para colocar la imagen en la sección del acta que habla de ese elemento. Las fotos sin caption también se distribuyen automáticamente por contexto, pero el caption garantiza la posición exacta.

04

Escribir /fin para cerrar la visita

Cuando el arquitecto ha documentado todo lo que necesita, escribe /fin en el chat. Este comando dispara el proceso de generación del acta. La IA procesa todas las transcripciones, analiza las fotos, consulta el glosario de industriales de la obra (quién hace qué en ese proyecto concreto) y redacta el borrador del acta en formato estructurado.

05

Recibir el PDF y revisar

En menos de tres minutos desde el /fin, el arquitecto recibe en el mismo chat el enlace al PDF del acta. El documento está disponible en Google Drive y puede abrirse directamente desde el móvil para revisión. Si hay algo que ajustar, se edita desde el portal web o en el PDF directamente. La revisión tarda habitualmente menos de 5 minutos.

Output · qué contiene el PDF generado

Los campos del acta PDF generada por la IA.

01

Cabecera de obra

Nombre del proyecto, dirección, promotor, número de visita correlativo, fecha y hora de inicio y fin, asistentes.

02

Estado de los trabajos

Resumen del avance de obra desde la visita anterior, generado a partir de las transcripciones de audio.

03

Instrucciones técnicas de dirección

Las decisiones y órdenes emitidas durante la visita, organizadas por ámbito (estructura, instalaciones, acabados, etc.).

04

Incidencias y no conformidades

Defectos o desviaciones detectadas, con referencia al elemento afectado y fotografía adjunta cuando existe.

05

Tareas asignadas a industriales

Lista de tareas con industrial responsable (Sebas / carpintero, Jesús / herrero, etc.), plazo y nivel de prioridad. Generadas automáticamente por la IA a partir del contexto del audio.

06

Galería fotográfica

Las fotos de la visita, posicionadas inline junto a la sección del acta a la que pertenecen según el caption o el contexto semántico.

El PDF está estructurado conforme a los requisitos del artículo 12 de la LOE para el libro de órdenes. El arquitecto lo revisa, edita si considera necesario algún ajuste y lo firma. La IA ha hecho el trabajo de transcripción y estructura; la dirección técnica sigue siendo del arquitecto.

Caso real · Pracmatik

87% menos tiempo en documentación.

En la rehabilitación patrimonial de Escuelas Pías (Barcelona), cada visita de obra generaba entre 75 y 90 minutos de trabajo administrativo posterior: transcripción de notas, redacción, adjuntar fotos, envío y archivo. Con el flujo de audios y fotos por Telegram, ese tiempo pasó a menos de 3 minutos por visita. Un 87% menos de tiempo en documentación.

Una constructora pyme con 30 obreros y cuatro obras activas experimentó una reducción del 92% en tiempo de papeleo administrativo de obra al combinar el acta automática con la asignación automática de tareas a industriales desde el PDF. Los industriales reciben sus tareas directamente desde el acta sin que el jefe de obra tenga que reenviar instrucciones por separado.

Preguntas frecuentes

Dudas habituales sobre el flujo por voz.

¿Se puede usar WhatsApp en lugar de Telegram?

+

El flujo actual de Pracmatik opera sobre Telegram por razones técnicas: la API de Telegram permite recibir audio, imágenes y texto en tiempo real sin restricciones y sin coste por mensaje. WhatsApp Business API tiene limitaciones de tipos de mensaje y coste por conversación que hacen el flujo más complejo. En el roadmap se contempla integración con WhatsApp para estudios que prefieran ese canal.

¿El documento generado tiene validez según la LOE?

+

El PDF generado incluye todos los campos que el artículo 12 LOE requiere para el libro de órdenes: identificación de obra, fecha, asistentes, instrucciones técnicas y estado de los trabajos. La validez legal del documento depende de que el arquitecto director de obra lo revise y lo firme con su identidad verificable (firma electrónica reconocida según el Reglamento eIDAS o equivalente). La IA genera el contenido estructurado; la responsabilidad de la dirección facultativa recae en el técnico que firma.

¿Qué pasa si el audio tiene ruido de obra o voces de fondo?

+

El motor de transcripción utilizado (Whisper de OpenAI) está entrenado específicamente para condiciones de audio no ideales y tiene buen rendimiento con ruido ambiental de obra. Para contenido técnico con terminología específica del proyecto (nombres de industriales, referencias a planos), el contexto previo de la obra mejora la precisión. La recomendación práctica es grabar audios de 30-60 segundos en lugar de audios muy largos: es más fácil para la IA procesar y para el arquitecto revisar.

¿Las fotos quedan almacenadas de forma segura?

+

Las fotos y los documentos generados se almacenan en Google Drive en una carpeta específica de la obra, accesible solo para los usuarios con acceso al expediente. No se almacenan en servidores ajenos a Google Drive ni se utilizan para entrenar modelos de IA. La infraestructura opera en servidores europeos.

¿Cuántas obras puede gestionar un arquitecto con este sistema?

+

No hay límite técnico por obra. El sistema gestiona obras en paralelo y mantiene el contexto de cada una por separado: los industriales, el historial de visitas anteriores y el glosario de elementos específicos de cada proyecto. Estudios con 4-8 obras activas simultáneas tienen el mayor retorno de tiempo porque la reducción de 90 minutos a 3 por acta se multiplica por el número de visitas totales.

Si quieres ver cómo suena y qué acta genera sobre una visita real de tu estudio, son 30 minutos.

Conversación de alcance · sin compromiso