Etiqueta

Producción

2 posts

13 de abril de 2026

DeepEval: cómo mido la calidad de mi agente médico con métricas objetivas

Cómo construí un evaluation layer con DeepEval para medir la calidad de Shuri, el agente médico de Examya. Con datos reales: de 20% a 70% en E2E, métricas custom para FONASA, y por qué gpt-5-nano no sirve para structured output.

7 de abril de 2026

pgvector + embeddings en producción: La base de razonamiento médico en Examya

Arquitectura de búsqueda semántica y similitud textual en producción con pgvector, pg_trgm y datos MINSAL reales.