Skip al contenido
Blog

Guía técnica

Agentes IA en Producción

Arquitectura, testing, tool use, MCP y mitigación de alucinaciones para agentes que hacen trabajo real.

agentes IA produccióntesting agentes IAMCP tool usemulti-agent orchestration

Por qué el índice de tu vault importa más que la cantidad de notas

Acumular notas no escala con IA. Cómo un _INDEX.md se volvió el contrato vital para que mis agentes no destruyan el blog.

IAAgentes PKMObsidianCotocha

Por qué los subagentes sirven más como revisores que como escritores

Lanzar 5 agentes a escribir código en paralelo es un desastre. Por qué invertimos el patrón: 1 escritor y 5 revisores adversarios ciegos.

IAAgentesArquitecturaOpenCode

Mi stack B2B: Cómo uso NotebookLM y Obsidian para cerrar negocios en salud

Vender software clínico requiere procesar horas de reuniones y PDFs densos. Así armé un workflow con IA para convertir documentos en propuestas letales.

IAAutomatización ObsidianB2BSalud Digital

La IA clínica falla por el dato, no por el modelo

Un modelo clínico puede sonar correcto y fallar igual si recibe PDFs, texto libre y resultados sin trazabilidad. El problema empieza antes del prompt.

IA Salud DigitalFHIRInteroperabilidad

La interoperabilidad no empieza conectando todo

Por qué los pilotos FHIR/Core-CL deben partir con un flujo acotado, datos sintéticos y evidencia antes de tocar producción.

Arquitectura ExamyaInteroperabilidadFHIR

Ley 21.719 en software clínico: consentimiento y ARCO-P real

Cómo convertí privacidad en arquitectura para Examya: consent ledger, ARCO-P, reportes y autoservicio antes de diciembre de 2026.

Arquitectura ExamyaSalud DigitalCumplimiento

Human-in-the-loop no basta: cómo diseño supervisión real para IA médica

Supervisar IA médica no es poner un médico mirando. Requiere autoridad, trazabilidad, escalamiento, monitoreo de drift y evidencia auditable.

IAArquitectura Salud DigitalCumplimientoSalud

La IA no arregla procesos rotos: los acelera

Antes de automatizar con IA, hay que mapear decisiones, datos, trazabilidad y reglas. Si automatizamos caos, solo obtenemos caos más rápido.

IAAutomatizaciónArquitectura Salud

NEW, REVIEW, DUPLICATE: el guard que evita que un agente de contenido escriba el mismo post diez veces

Cómo diseñé un guard determinístico con tres estados para evitar que mi agente de contenido repita temas en el blog

AgentesAutomatizaciónTestingArquitectura

El bug invisible de mi segundo cerebro: cuando el VPS escribía en un vault que nadie leía

Cotocha editaba el vault en el VPS, pero nada llegaba a mi Mac. La lección: sincronizar agentes requiere contratos verificables, no suposiciones.

AutomatizaciónAgentes ObsidianSincronizaciónVPS

Fhirex by Examya: pilotos FHIR sin tocar producción

Por qué lanzamos fhirex.examya.cl: pilotos FHIR/Core-CL con datos sintéticos, evidencia técnica y revisión TI antes de producción.

Arquitectura ExamyaInteroperabilidadFHIR

Forensic Code Cleanup: borrar código con método

Cómo borré 12 archivos zombie en Shuri con forensic cleanup, ripgrep, tests y revisión adversarial como guardrail final.

AgentesTestingArquitecturaProducción DesarrolloTypeScript

El laboratorio clínico como API de salud digital

El laboratorio clínico ya recibe órdenes, procesa muestras y devuelve resultados. La capa faltante es tratarlo como una API clínica.

Arquitectura Salud DigitalInteroperabilidadFHIR

Compliance no es feature: es evidencia

En salud digital, que una feature funcione no basta. Sin trazabilidad auditable, para el regulador simplemente no existe.

ArquitecturaProducción Salud DigitalExamyaCumplimiento

100% Compliant: Cómo cerramos los 36 verificadores MINSAL en tiempo récord

Cerrar la acreditación MINSAL (Ley 21.541) no es solo picar código. Te cuento cómo pasamos del 33% al 100% de cumplimiento en un solo fin de semana.

Arquitectura Salud DigitalExamyaCumplimiento

Mitigación de Alucinaciones en Sub-agentes: Protocolo de 4 Comandos para Producción

Cómo detectar y mitigar alucinaciones en sub-agentes con un protocolo práctico basado en verificación adversarial y redundancia.

IAAgentesTestingProducciónOpenCode Examya

Democratizando el acceso a FONASA MLE: Datos abiertos y un servidor MCP

Cómo convertimos el catálogo de exámenes FONASA en una herramienta para agentes de IA con un servidor MCP y datos normalizados a 7 dígitos.

IAMCP Salud DigitalFONASA

Migración de esquemas Prisma: cómo sobrevivir al infierno local en un monorepo de salud

Lecciones de campo sobre las trampas de migración de esquemas en un monorepo médico con múltiples bases de datos y ambientes de desarrollo.

IA PostgreSQLPrismaDesarrollo

Por qué Claude sobre GPT-4 para español: 6 razones desde el campo

Después de construir un agente médico con OpenAI y Claude, 6 razones prácticas por las que Claude supera a GPT-4 para producción en español.

IAAgentes LLMClaude APIExamya

Pruebas unitarias y TDD en agentes de IA: Lecciones desde el campo de batalla de Examya

Cómo implementé pruebas unitarias y TDD en mi agente médico de IA, los desafíos encontrados y las soluciones que realmente funcionan en producción.

TestingAgentesIAProducción ExamyaDesarrollo

Ingeniería de Campo: cómo construimos un laboratorio molecular portátil en la Patagonia

Los detalles técnicos detrás de BioHealth: cómo empaquetamos extracción de RNA, microfluidos y conectividad 4G en una caja de herramientas para operar en Torres del Paine.

Arquitectura IngenieríaDiagnósticoBiohealth

El email equivocado de OpenAI que nos obligó a migrar 45.000 embeddings

Migramos 45,678 vectores médicos por un aviso de deprecación falso. Cómo el error de OpenAI mejoró nuestra precisión en 37%.

IAArquitectura ExamyaPostgreSQL

Arquitectura de Routing OCR en Examya: cómo un foto decide el flujo completo

Análisis profundo de la arquitectura de routing OCR en Examya: cómo un foto médica decide entre cotización e interpretación de resultados.

IAArquitectura ExamyaWhatsAppOCR

Sub-agentes que alucinan: protocolo de detección y mitigación en producción

Cómo detectar y mitigar cuando sub-agentes de IA reportan información incorrecta: un caso real con gemini-flash y el protocolo de 4 comandos.

IAAgentesTestingProducciónOpenCode Examya

Testing estratégico en agentes de IA: de unitarios a adversariales

Cómo construí un sistema de testing multi-capa para agentes médicos, desde unitarios con TDD hasta protocolos adversariales en producción.

IAAgentesTesting ExamyaDesarrollo

Cómo instalé el primer lab PCR privado de Magallanes (y por qué terminé construyendo IA)

En marzo 2021, subí un gabinete de 300 kg con grúa al segundo piso en cuarentena patagónica. En mayo procesábamos los primeros PCR COVID privados de Magallanes. Lo que aprendí en esas noches me llevó a construir Examya.

IA ExamyaSalud DigitalPatagonia

Orquestación Multi-Agente vs Agente Único: Lecciones desde el Campo

Mi viaje construyendo Cotocha: por qué la orquestación multi-agente supera al agente único en proyectos reales.

IAAgentesArquitectura CotochaOpenClaw

Sub-agentes que alucinan: 3 tests fallando que gemini-flash juró que pasaban

gemini-flash reportó 'all tests passing': 3 tests fallaban, 353 líneas de package-lock.json de regalo. El protocolo de 4 comandos que armé para auditar sub-agentes en Examya.

IATestingAgentesOpenCode Examya

De 0 a pagos por WhatsApp: Mercado Pago + Stripe desde una conversación

Cómo construí un sistema de pagos integrado en WhatsApp que procesa órdenes médicas y cobra automáticamente con Mercado Pago y Stripe.

Arquitectura WhatsAppPagosMercado Pago

Laboratorios clínicos: la pieza que falta para interoperar la salud en Chile

Mapeamos 245 laboratorios clínicos de Arica a Punta Arenas. Cuatro de cada diez no tiene presencia digital funcional. La Ley 21.668 los va a obligar a interoperar en 2026. Estos son los datos del terreno.

Automatización Salud DigitalLaboratorios ClínicosInteroperabilidad

PostgreSQL + Drizzle ORM: mi stack favorito para proyectos con IA

Cómo Drizzle ORM transformó mi desarrollo backend en proyectos de IA con TypeScript, tipos seguros y rendimiento de producción.

IA PostgreSQLDrizzle ORMTypeScript

Chile obliga a interoperar fichas clínicas: por qué esto cambia todo para la salud digital

La Ley 21.668 obliga a todos los prestadores de salud en Chile a interoperar sus fichas clínicas. Analizo qué significa esto técnicamente, qué estándares vienen (FHIR, SNOMED CT, AIToF), y cómo Examya se está preparando para este nuevo mercado obligatorio.

IA Salud DigitalInteroperabilidadFHIR

Crowdsourcing de precios médicos: cómo Examya construye transparencia de costos capa por capa

Arquitectura real de las 3 capas de inteligencia de precios en Examya: datos FONASA, crowdsourcing de usuarios y generación de órdenes desde WhatsApp. Con código, decisiones de diseño y bugs reales.

IAAgentes ExamyaCrowdsourcingFONASA

OCR médico en WhatsApp: cómo mi agente lee órdenes de exámenes y resultados de laboratorio

Arquitectura real del pipeline OCR de Examya: cómo un agente de IA clasifica fotos en WhatsApp, decide si son órdenes médicas o resultados de laboratorio, y genera cotizaciones FONASA automáticamente. Con bugs reales y decisiones de diseño explicadas.

IAAgentesArquitectura OCRWhatsAppExamya

DeepEval: cómo mido la calidad de mi agente médico con métricas objetivas

Cómo construí un evaluation layer con DeepEval para medir la calidad de Shuri, el agente médico de Examya. Con datos reales: de 20% a 70% en E2E, métricas custom para FONASA, y por qué gpt-5-nano no sirve para structured output.

IAEvaluaciónTestingAgentesProducción DeepEvalExamyaLLM

Sincronización bidireccional Mac-VPS con Engram: el cerebro que nunca se apaga

Tutorial técnico de cómo construí un pipeline de sincronización bidireccional entre mi Mac, un VPS en Alemania, Engram, Obsidian y el método Karpathy de knowledge management. Todo con scripts Python, git y cron jobs.

IAAutomatización ObsidianEngramVPS

pgvector + embeddings en producción: La base de razonamiento médico en Examya

Arquitectura de búsqueda semántica y similitud textual en producción con pgvector, pg_trgm y datos MINSAL reales.

IAProducción PostgreSQLpgvectorExamya

Mi cerebro digital: cómo conecté memoria, conocimiento y publicación automática

Cómo construí un sistema que extrae memorias de IA desde un VPS, las organiza en Obsidian al estilo Karpathy, y publica artículos automáticamente en el blog, X.com y LinkedIn.

IAAutomatizaciónAgentes ObsidianEngramPKM

MCP / Tool Use: el futuro de la integración de herramientas reales

Cómo los Modelos de Control de Proceso están revolucionando la manera en que los agentes IA interactúan con herramientas externas para ejecutar tareas complejas.

IAAgentesMCPAutomatización Integración

Una semana de construcción: 82 decisiones que moldean un producto de IA

Lo que revelan las memorias de Engram sobre una semana real de desarrollo: bugs cazados, arquitectura endurecida, y las decisiones invisibles que hacen que un agente médico funcione.

IAAgentes DesarrolloExamyaOpenClaw

Examya: cómo construí un agente médico para WhatsApp que procesa órdenes de exámenes

Detalles técnicos de la implementación del agente Shuri en Examya, un sistema para procesar órdenes médicas vía WhatsApp con integración FONASA.

IAAgentes WhatsAppExamyaFONASA

De equipos en la calle en plena cuarentena a construir agentes de IA en Patagonia

No soy el developer que aprendió a programar en YouTube. Doce años resolviendo problemas reales en salud, gestión y negocios antes de escribir código. Esta es la historia.

IA HistoriaPatagoniaBiohealth

Cotocha: el orquestador de agentes que corre mi vida desde un VPS

Cómo construí un sistema de agentes IA que maneja infraestructura, alertas, base de datos y blogging desde un servidor en Alemania. Sin intermediarios, sin dashboards bonitos.

IAAgentesAutomatización OpenClawPatagonia

Huillín: el agente de WhatsApp que gestiona reservas de cabañas en la Patagonia

Cómo construí un bot agéntico con Claude API que maneja el ciclo completo de reservas — disponibilidad, sincronización de calendarios y pagos — sin intervención humana.

IAAgentes WhatsAppClaude APIPatagonia