Saltar al contenido
Estrategia IA

Niveles de adopción de IA en PYMES: la lección Doctolib

Niveles de adopción de IA en PYMES: por qué estás en Nivel 2, qué hizo Doctolib y 3 acciones para escalar uso de IA en equipo. Adopción IA PYMES LATAM 2026.

Dario Ramirez · ·
adopción IAPYME LATAMmadurez IAproductividadClaude Codegovernance IA

Niveles de adopción de IA en PYMES: la lección Doctolib

Por Dario · Publicado el 19 de mayo de 2026

Pagaste cinco licencias de ChatGPT Plus hace seis meses. Tu equipo dice que la usa “todo el tiempo”. Y sin embargo, cuando miras el P&L del trimestre, las horas facturables no subieron, el margen tampoco y la propuesta sigue tardando lo mismo que antes. Si te preguntas por qué tu equipo no aprovecha ChatGPT a pesar de tener licencias activas, no es porque sea torpe. Es porque está atrapado en el Nivel 2 de adopción.

Esto es un diagnóstico para directores de PYMES de servicios profesionales en LATAM. Despachos de 10 a 50 personas: agencias, contables, abogados, consultoras, estudios creativos. Usamos un modelo de cinco niveles, lo cruzamos con un caso europeo concreto (Doctolib, la plataforma de salud digital basada en París) y proponemos tres acciones que puedes empezar el lunes. Sin “futuro de la IA”, sin “revolución”. Con cifras y referencias.

TL;DR

  • El 95% de los pilotos de GenAI no mueven el P&L según el reporte MIT NANDA “The GenAI Divide: State of AI in Business 2025” reseñado por Fortune [source: https://fortune.com/2025/08/18/mit-report-95-percent-generative-ai-pilots-at-companies-failing-cfo/]. Es la paradoja clásica de productividad: el problema no es el modelo, es la organización.
  • The Spark Report 2026 publicado por Spark AI mide que el 83% del personal de agencias se siente confiado con IA, pero solo el 15% de las agencias integra IA en cómo opera [source: https://www.wearespark.ai/the-spark-report-ai-in-agencies-benchmark]. Esa brecha define el Nivel 2.
  • Doctolib desplegó Claude Code a todo su equipo de desarrollo tras un piloto con 30 ingenieros, según el customer story publicado por Anthropic [source: https://claude.com/customers/doctolib]. Migraciones que tomaban semanas se completaron en horas y el onboarding bajó de semanas a días. Es el espejo del Nivel 4.
  • Las tres trampas del Nivel 2 son: redeployment ausente (las horas ahorradas vuelven a más emails), governance ausente (el 52% del uso ocurre sin política según Spark AI) y confidence cliff (los más confiados son los menos estructurados según la investigación de Spark AI con BIMA).
  • LATAM puede saltar los errores caros: comprar a vendors especializados tiene cerca de 67% de éxito, construir internamente apenas un tercio, según MIT NANDA.

Key Takeaways

PreguntaRespuesta declarativaFuente
¿Qué % de pilotos GenAI fracasa?95%MIT NANDA 2025 vía Fortune
¿Qué % de agencias integra IA operacionalmente?15%The Spark Report 2026
¿Qué % de uso ocurre sin governance?52%The Spark Report 2026
¿Cuánto valor anual puede capturar LATAM?USD 1.1 a 1.7 billonesWEF + McKinsey, enero 2026
¿Buy vs Build success rate?67% vs 22%MIT NANDA 2025 vía Fortune
¿Cuántos empleos tienen ya 25%+ de tareas IA-realizables?49%Anthropic Economic Index marzo 2026

El síntoma: tu equipo usa ChatGPT pero el P&L no se mueve

La PYME de servicios profesionales promedio paga licencias de ChatGPT o Microsoft Copilot, tiene a un par de “evangelistas IA” en el equipo y publica de vez en cuando algo sobre IA en LinkedIn. La fila de adopción está marcada. La de ROI, no.

El número que importa lo puso el reporte de MIT NANDA “The GenAI Divide: State of AI in Business 2025”, reseñado por Fortune [source: https://fortune.com/2025/08/18/mit-report-95-percent-generative-ai-pilots-at-companies-failing-cfo/]: el 95% de los pilotos de GenAI no genera impacto medible en el P&L. Solo el 5% logra aceleración real de revenue. La causa raíz, según los investigadores del MIT, no es la calidad del modelo. Es el “learning gap”: las herramientas genéricas como ChatGPT no aprenden el workflow específico de la empresa.

Boston Consulting Group llegó al mismo número por otra vía en su reporte “Build for the Future 2025” [source: https://www.bcg.com/publications/2025/are-you-generating-value-from-ai-the-widening-gap]: solo cerca del 5% de las organizaciones ha capturado ganancias financieras sustanciales de IA. No es una crisis técnica. Es una crisis de ejecución organizacional.

En LATAM la cifra es peor en términos absolutos. El reporte conjunto del Foro Económico Mundial y McKinsey “Latin America in the Intelligent Age” (enero 2026) reporta que solo el 23% de las organizaciones latinoamericanas reporta algún valor económico de IA y apenas el 6% reporta impacto significativo [source: https://www.weforum.org/publications/latin-america-in-the-intelligent-age-a-new-path-for-growth/]. Y eso que el potencial es enorme: la adopción podría elevar la productividad regional entre 1.9% y 2.3% anual, generando entre 1.1 y 1.7 billones de dólares de valor económico adicional cada año.

Traducido a tu PYME: el dinero está sobre la mesa. La pregunta es por qué no llega a tu cuenta bancaria.

El modelo de 5 niveles de adopción de IA (y dónde está atrapada la PYME LATAM promedio)

Antes de seguir, una nota de honestidad: el “Nivel 2” del título es un framing editorial nuestro, no un estándar de industria. Está inspirado en el Spark AI Maturity Model publicado en The Spark Report 2026, que define cuatro etapas (Experimentation, Adoption, Optimisation, Innovation) [source: https://www.wearespark.ai/the-spark-report-ai-in-agencies-benchmark]. Le añadimos un nivel inicial (“curiosidad individual”) porque refleja la realidad de la PYME LATAM que apenas está empezando. Si quieres el contexto completo, escribimos un resumen del Spark Report 2026 para PYMES LATAM que sintetiza el benchmark. Útil para diagnóstico, no para citar como ley.

Estos son los cinco niveles aplicados a una PYME de servicios profesionales, el modelo de madurez que usamos en los diagnósticos de Kreante:

NivelCómo se veQuién decide qué usarSeñal en el P&L
1. Curiosidad individualDos o tres personas prueban ChatGPT por curiosidadNadieNinguna
2. Uso individual sistemáticoLa mayoría usa IA personal, cuentas propias, prompts propiosCada empleadoAhorro percibido, no medible
3. Uso en equipoPrompts compartidos, casos definidos, governance básicoLíder de equipo o áreaTareas concretas más rápidas
4. Procesos rediseñadosIA integrada al workflow, no añadida encimaOperaciones y direcciónCapacidad o margen sube de forma visible
5. Ventaja competitivaLa IA cambia el modelo de servicio o el productoDirección generalDiferencial frente a competencia

The Spark Report 2026 midió en su muestra que cerca del 70% de las agencias británicas permanece en la etapa de Experimentación, descrita como “individual prompting, no shared workflows, no strategy” [source: https://www.wearespark.ai/the-spark-report-ai-in-agencies-benchmark]. Esa estadística es de Reino Unido, no de LATAM, pero conversa con la realidad regional: en los diagnósticos que hacemos en Kreante, la mayoría de PYMES latinoamericanas encaja en Nivel 2. Cada uno con su cuenta, sus prompts y su intuición. Sin nada compartido, sin nada medido.

El Nivel 2 es traicionero porque se siente como progreso. El equipo está usando IA. Los líderes están “modernizando” la firma. Pero como muestra Spark AI, el 89% del personal recupera tiempo, hasta 10 horas por semana, y ese tiempo se reabsorbe en más emails y administración [source: https://www.wearespark.ai/the-spark-report-ai-in-agencies-benchmark]. La eficiencia individual no se convierte en capacidad organizacional.

El espejo europeo: cómo Doctolib usa Claude Code a escala de cientos de ingenieros

Doctolib es una plataforma europea de salud digital fundada en París que sirve a 420.000 profesionales de salud y 90 millones de pacientes, según el customer story publicado por Anthropic [source: https://claude.com/customers/doctolib]. Tras un piloto inicial con 30 ingenieros, Doctolib desplegó Claude Code (el agente de programación de Anthropic; si quieres una intro corta, escribimos qué es Claude Code en una empresa) a todo su equipo de desarrollo. Es el caso público más cercano al Nivel 4 que tenemos en servicios digitales europeos y un buen referente de despliegue a escala.

Los resultados publicados por Anthropic son útiles no por la herramienta, sino por lo que Doctolib hizo alrededor de ella:

  • Migración legacy en horas, no semanas. La migración de un sistema legacy de visual regression testing se completó en horas. Julien Tanay, Staff Engineer de Doctolib, lo formula así: “We completed the migration in hours, not weeks” [source: https://claude.com/customers/doctolib].
  • Onboarding de semanas a días. El onboarding de ingenieros a codebases desconocidos pasó de semanas a días.
  • Self-onboarding en menos de cinco minutos. El setup inicial de Claude Code toma menos de cinco minutos en VSCode, JetBrains o CLI.
  • Velocity transformada. Tanay añade: “Engineers can now contribute to areas outside their expertise much faster. This fundamentally changes our development velocity”.

Lo interesante para una PYME no es la herramienta. Es el activo organizacional que Doctolib construyó alrededor. El equipo de plataforma de Doctolib creó un repositorio centralizado de prompts, comandos personalizados y subagents que todos los desarrolladores descargan en el setup inicial [source: https://claude.com/customers/doctolib]. No es Claude Code lo que cambió el P&L. Es que dejaron de tener 30 ingenieros con 30 estilos de prompt y empezaron a tener un activo organizacional compartido. Esa es la lección sobre cómo escalar uso de IA en equipo.

Esa distinción, herramienta versus activo compartido, es la frontera entre Nivel 2 y Nivel 3. Doctolib no es un benchmark para igualar (escala, capital, talento técnico son otra liga). Es la imagen mental de a dónde se puede llegar cuando el sistema, no el individuo, adopta.

Trampa 1: redeployment ausente, ahorras horas pero nadie las reinvierte

La primera trampa del Nivel 2 es no decidir, antes del despliegue, en qué se van a reinvertir las horas que la IA libera. Es la más cara y la menos visible. The Spark Report 2026 de Spark AI lo formula así, sintetizando los datos del estudio: las ganancias de eficiencia se reabsorben en emails, administración y en hacer más de lo mismo, más rápido [source: https://www.wearespark.ai/the-spark-report-ai-in-agencies-benchmark].

Hagamos el cálculo. Si tu equipo de 20 personas recupera 5 horas semanales gracias a la IA, son 100 horas semanales de capacidad libre. A un costo cargado de USD 30 por hora, eso es USD 3.000 semanales o USD 156.000 al año. Si esas horas no se redirigen a una de tres cosas (más facturación, mejor margen, o nuevos servicios) el ahorro no existe. Volvió al correo y a “ya que tengo tiempo, organizo otra reunión”.

El DORA Report 2025 de Google Cloud da el marco general: la IA actúa como espejo y multiplicador [source: https://blog.google/innovation-and-ai/technology/developers-tools/dora-report-2025/]. En organizaciones cohesivas, eleva la eficiencia. En las fragmentadas, expone las debilidades. Si tu PYME no tiene un mecanismo para reinvertir capacidad, la IA simplemente acelera el caos que ya existía.

La acción concreta no es comprar más IA. Es decidir, antes de cada despliegue, en qué se va a reinvertir el tiempo. Tres opciones honestas: subir capacidad facturable (más clientes con el mismo equipo), subir margen (menos subcontratación, menos overtime) o crear capacidad para una línea nueva. Si la respuesta es “ya veremos”, el ahorro se evapora.

Trampa 2: governance ausente, cada quien usa su propia cuenta y su propio prompt

La segunda trampa del Nivel 2 es operar IA sin política formal: cuentas personales, prompts privados y cero trazabilidad. The Spark Report 2026 reporta que más de la mitad del uso de IA en agencias (52% según su benchmark) ocurre sin política o framework formal [source: https://www.wearespark.ai/the-spark-report-ai-in-agencies-benchmark]. Es el síntoma clínico del Nivel 2.

Esto se traduce en cuatro problemas concretos para una PYME:

  1. Datos sensibles en cuentas personales. Información de clientes entra y sale por cuentas individuales de ChatGPT, sin trazabilidad. Si pasa algo, no sabes qué se envió, cuándo, ni a qué modelo.
  2. No hay aprendizaje compartido. Cada empleado descubre los mismos prompts por separado. Si alguien encuentra uno bueno para revisar contratos o redactar propuestas, se queda en su navegador.
  3. Calidad inconsistente al cliente. Dos consultores de la misma firma producen entregables con dos voces, dos formatos y dos estándares, porque cada uno conversa con la IA a su manera.
  4. Riesgo de propiedad intelectual. No queda claro qué partes del trabajo entregado fueron generadas, con qué prompts, ni cómo se revisaron.

Emma Wharton-Love, CEO y cofundadora de Spark AI y miembro BIMA 100, lo viene documentando desde la edición previa del estudio. En su análisis publicado en BIMA en noviembre 2025 sobre confidence vs capability, el dato más útil para directores no es la confianza autoreportada (63% de líderes “se sienten listos”) sino el contraste: solo el 19% de las agencias construye programas estructurados con resultados medibles [source: https://bima.co.uk/ai-confidence-vs-capability-what-our-latest-research-reveals]. El resto vive en governance improvisada.

En su segundo artículo de BIMA, Wharton-Love documenta cuánto valor están dejando los líderes sobre la mesa por falta de estructura organizacional [source: https://bima.co.uk/how-agency-leaders-are-leaving-value-on-the-table-with-ai]. El patrón se repite en cada cohorte.

La acción concreta en governance no es escribir un manual de 40 páginas. Es escribir tres páginas: qué datos NO se pueden pegar en IA, qué casos de uso están aprobados y dónde se guardan los prompts compartidos. Eso solo, hecho en una tarde, ya saca a la firma del 52%. Si quieres una plantilla, tenemos una guía de política de uso de IA en la empresa para equipos PYME con los apartados mínimos.

Trampa 3: confidence cliff, el equipo prueba, falla y abandona

La tercera trampa del Nivel 2 es el confidence cliff: el desfase entre lo que la gente cree que puede hacer con IA y lo que realmente sabe hacer. Es psicológica y es la que más sorprende cuando se ven los datos.

Spark AI lo midió en The Spark Report 2026: el 83% del personal de agencias se siente confiado usando IA, pero solo el 15% de las agencias integra IA en cómo opera [source: https://www.wearespark.ai/the-spark-report-ai-in-agencies-benchmark]. Son dos niveles distintos: confianza individual contra integración organizacional. Esa brecha entre sensación y operación es el confidence cliff.

Wharton-Love llevó el análisis un paso más. En la investigación de Spark AI con BIMA, encontró que entre los líderes “muy confiados”, el 36% admite que su uso de IA es no estructurado [source: https://bima.co.uk/ai-confidence-vs-capability-what-our-latest-research-reveals]. Esa cifra es más alta que el 26% entre los líderes “algo confiados”. Es la firma del efecto Dunning-Kruger aplicada a IA: cuanto más confiado se siente alguien, más probable es que su práctica esté sin método.

El DORA Report 2025 de Google Cloud confirma el patrón del otro lado del espejo, en software: el 90% de los profesionales de desarrollo ya usa IA, con una mediana de dos horas diarias, pero solo el 24% confía mucho en ella [source: https://blog.google/innovation-and-ai/technology/developers-tools/dora-report-2025/]. La gente que más la usa es la que más sabe lo que la IA no puede hacer.

¿Por qué importa para tu PYME? Porque si tu equipo está en el grupo de los “muy confiados sin método”, harán dos cosas mal. Primero, no pedirán entrenamiento estructurado (“ya sé cómo se usa”). Segundo, abandonarán al primer error grave: una respuesta inventada, una propuesta mal redactada, un cliente molesto. La curva no es lineal. Es alta, cae fuerte, y la gente concluye “esto no sirve”.

La acción concreta es bajar el ego: medir capacidad antes que confianza. Una evaluación corta cada trimestre, con tareas reales del negocio, donde cada persona prueba que puede entregar un resultado específico (revisar un contrato, generar una propuesta, segmentar una base) usando IA, sin ayuda. Si no puede, hay formación. Sin shaming, sin gloria.

Buy vs Build: la decisión que define el éxito del piloto

Comprar IA especializada o construirla internamente: esa decisión es el predictor más fuerte de éxito en pilotos GenAI dentro de PYMES, según el reporte MIT NANDA reseñado por Fortune [source: https://fortune.com/2025/08/18/mit-report-95-percent-generative-ai-pilots-at-companies-failing-cfo/].

EstrategiaTasa de éxitoRecomendado para
Comprar a vendor especializado o partnership~67%PYMES 10-50 empleados, servicios profesionales
Construir IA internamente~22%Empresas con equipo técnico dedicado y caso de negocio único

Traducción operativa para una PYME LATAM: contrata Claude (Anthropic), ChatGPT Enterprise (OpenAI), Microsoft Copilot, Glean u otro vendor especializado para un caso de uso concreto, y dedica al equipo interno a rediseñar el workflow alrededor. No al revés. Si tu rediseño cruza varias herramientas o sistemas internos, te dejamos nuestra nota sobre LowCode/AI para automatizar procesos en PYME.

3 acciones concretas para saltar de Nivel 2 a Nivel 3 este trimestre

Saltar de Nivel 2 a Nivel 3 toma 90 días, no 18 meses. Son tres movimientos secuenciales. Esto es lo que hacemos con un cliente de servicios profesionales en LATAM atrapado en Nivel 2.

Acción 1: elige UN proceso, no diez. En el reporte MIT NANDA, los pilotos exitosos comparten un patrón: comprar herramientas especializadas para un proceso concreto en lugar de construir capacidades horizontales. Comprar a vendors especializados tiene cerca de 67% de éxito, construir internamente apenas un tercio [source: https://fortune.com/2025/08/18/mit-report-95-percent-generative-ai-pilots-at-companies-failing-cfo/]. Para una PYME LATAM de 10 a 50 personas esto significa: deja de querer “implementar IA en toda la firma”. Elige un proceso (redacción de propuestas, revisión de contratos, segmentación de leads, onboarding de clientes), rediséñalo con IA al centro, y mide la diferencia. Después escala. Tenemos un catálogo de casos de uso IA en servicios profesionales LATAM para inspirarte por función.

Acción 2: crea el activo compartido, no la lista de licencias. Doctolib no escaló porque cada ingeniero tuviera Claude Code. Escaló porque el equipo de plataforma creó un repositorio centralizado de prompts, comandos personalizados y subagents que todos descargan [source: https://claude.com/customers/doctolib]. Para tu PYME el equivalente es modesto pero igual de potente: un documento (Notion, Google Drive, Confluence) con los prompts validados de cada función, los casos donde la IA se usa y los casos donde no. Asigna un responsable por área. Es lo mínimo viable para entrar al Nivel 3.

Acción 3: cierra el confidence cliff con una métrica trimestral. En lugar de preguntar “¿cómo te sientes usando IA?”, define una tarea real por rol y mide quién la entrega correctamente en una ventana de tiempo razonable. Quien la entrega bien, ayuda a entrenar a los demás. Quien no, tiene un plan corto de formación. No es performance management agresivo. Es la única forma de que la confianza autoreportada y la capacidad real converjan.

La ventaja regional de LATAM: llegar tarde tiene un precio y un premio

La ventaja regional de LATAM es saltarse los errores caros que Estados Unidos y Europa Occidental ya pagaron. El reporte WEF + McKinsey “Latin America in the Intelligent Age” documenta la brecha en valor capturado [source: https://www.weforum.org/publications/latin-america-in-the-intelligent-age-a-new-path-for-growth/]. Esa demora no es fatal: es ventaja. La PYME LATAM puede saltar directamente al Nivel 3 si compra especializado, rediseña antes de escalar y mide capacidad en lugar de confianza.

Brasil es ya el tercer mercado mundial en uso de Claude, con 3.7% del uso global, después de Estados Unidos (21.6%) e India (7.2%), según el Anthropic Economic Index de septiembre 2025 [source: https://www.anthropic.com/research/anthropic-economic-index-september-2025-report]. Y según el Anthropic Economic Index de marzo 2026 “Learning Curves”, el 49% de los empleos ya tiene al menos un cuarto de sus tareas realizables con Claude [source: https://www.anthropic.com/research/economic-index-march-2026-report]. El piso técnico está. El problema, otra vez, no es la herramienta.

Si en este momento, leyendo, identificaste en cuál de las tres trampas (redeployment, governance, confidence cliff) está tu equipo, ese ya es el diagnóstico. La pregunta para los comentarios: ¿cuál de tus procesos crees que es el primero que tu firma debería rediseñar con IA al centro, y por qué ese y no otro?

Si quieres ayuda para hacer ese diagnóstico de forma sistemática, en Kreante hacemos un diagnóstico de madurez IA para PYME de 60 minutos sin costo donde mapeamos tu nivel actual y la primera acción accionable para tu firma. Reservar un audit con el equipo Kreante.

Preguntas frecuentes

¿Cuáles son los niveles de adopción de IA en una empresa?
Los cinco niveles de adopción de IA en una PYME son: Nivel 1 curiosidad individual (uso esporádico, sin método), Nivel 2 uso individual sistemático (cada empleado con su cuenta y prompts propios), Nivel 3 uso en equipo (prompts y casos compartidos, governance básico), Nivel 4 procesos rediseñados (IA integrada al workflow) y Nivel 5 ventaja competitiva (la IA cambia el modelo de servicio). El modelo está inspirado en el Spark AI Maturity Model de cuatro etapas (Experimentation, Adoption, Optimisation, Innovation) publicado en The Spark Report 2026, con un nivel inicial añadido para reflejar la realidad de la PYME latinoamericana.
¿Por qué las empresas no capturan valor de la inteligencia artificial?
El 95% de los pilotos de GenAI no genera impacto medible en el P&L según el reporte MIT NANDA "The GenAI Divide: State of AI in Business 2025". La causa raíz es el "learning gap": herramientas genéricas como ChatGPT no aprenden el workflow específico de la empresa, las horas ahorradas se reabsorben en más reuniones, y casi nadie rediseña los procesos para que el ahorro se traduzca en revenue o margen.
¿Qué es el confidence cliff en adopción de IA?
El confidence cliff es la brecha entre lo que la gente cree saber sobre IA y lo que realmente puede hacer con ella. The Spark Report 2026 mide que el 83% del personal de agencias se siente confiado usando IA pero solo el 15% de las agencias integra IA en cómo operan. La investigación de Spark AI con BIMA muestra que entre los líderes "muy confiados" el 36% admite un uso no estructurado, cifra mayor al 26% entre los "algo confiados".
¿Cuánto valor potencial tiene la IA en América Latina?
El reporte conjunto del Foro Económico Mundial y McKinsey "Latin America in the Intelligent Age" (enero 2026) estima que la adopción de IA puede elevar la productividad regional entre 1.9% y 2.3% anual y generar entre 1.1 y 1.7 billones de dólares en valor económico adicional cada año. Hoy solo el 23% de las organizaciones latinoamericanas reporta algún valor económico de IA y apenas el 6% reporta impacto significativo.
¿Es mejor comprar IA a un vendor o construirla internamente?
Para PYMES, comprar IA a vendors especializados tiene cerca de 67% de éxito, mientras que construir internamente alcanza apenas un tercio de ese ratio (cerca de 22%), según el reporte MIT NANDA reseñado por Fortune. Para una PYME de servicios profesionales de 10 a 50 empleados, la respuesta correcta es comprar especializado y dedicar el equipo interno a rediseñar workflows.

IA, low-code y automatización para equipos en LatAm y España.

Ver artículos →

Si quieres implementar esto en tu empresa, Kreante construye sistemas de low-code e IA para equipos en LatAm y España. Ofrecen una auditoría gratuita para proyectos cualificados.