La Ciencia de Datos en el ámbito de los seguros

Ciencia de Datos en seguros

Al iniciar mi trabajo en el área de tecnología de una empresa de medicina prepagada escuché por primera vez el término actuario, pero desconocía sus labores y actividades dentro de la compañía. Cada vez que nos visitaba teníamos más trabajo en el área, puesto que nos solicitaba todo tipo de información: cantidades de afiliados, número y monto de reclamos, clasificaciones por edad, género, ciudades, tipos de diagnóstico, rangos de edades, etc.

Fuente: The Balance / Theresa Chiechi

Con el tiempo entendí que el actuario usaba toda esta información histórica para realizar análisis estadísticos y matemáticos, que le permitían establecer valores de primas, en base al riesgo que representan los clientes. En este cálculo también consideraba los gastos administrativos y operativos, las comisiones, los impuestos y obviamente la ganancia que tendría la compañía de seguros. 

Por lo cual, el análisis efectuado será vital para mantener el giro del negocio y garantizar el retorno adecuado para la institución. 

El análisis del riesgo para la estimación de precios 

La estrategia de precios en el ámbito de los seguros es muy importante, si la prima es muy baja en comparación con la competencia, se atraerán clientes con alto riesgo; por lo tanto, se tendrá un mayor número de siniestros reportados, teniendo como efecto la reducción en los márgenes de ganancia. Por el contrario, si la prima es muy alta en relación a la competencia, no existirán mayores ventas. El factor principal para la definición de precios es la predicción del riesgo, de ahí la importancia de que el riesgo estimado sea lo más acertado posible.

Pero, ¿qué es el riesgo del cliente? Pues viene a ser la probabilidad de que algo malo o dañino le ocurra al cliente o al bien que tiene asegurado. Puede involucrar enfermedad, accidentes, daños en propiedades, entre otros.

¿Cómo se calcula el riesgo? Los actuarios lo hacen mediante el uso de la estadística y la regresión lineal, métodos usados hasta la década de los 80’s, cuando se estableció un modelo con ventajas sobre la regresión lineal llamado Generalized Linear Model (GLM). 

Aunque GLM es el modelo más usado en las empresas de seguros, en la actualidad y gracias a todos los avances tecnológicos en el campo de la Ciencia de Datos, se ha se ha popularizado el uso del Machine Learning para obtener tarifas basadas, tanto en la frecuencia como en la gravedad de los siniestros. Empleando modelos como Random Forests y Boosted Trees se tiene por objetivo mejorar las predicciones y garantizar un menor error en la estimación de precios. 

Las predicciones de reclamos se pueden realizar en base de datos históricos de la empresa, pero se puede complementar usando datos estadísticos de la población en general para el cálculo del riesgo, especialmente con datos provenientes del campo de la Salud. Por ejemplo, las enfermedades de temporada de una zona como el dengue, que está presente en aproximadamente el 80% del territorio ecuatoriano (sectores húmedos y cálidos), coincide que los ciclos epidémicos se asocian con la temporada de lluvias.

La Ciencia de Datos y los seguros 

La estimación de riesgos, precios y reclamos no son las únicas aplicaciones de la Ciencia de Datos en los seguros, también se dispone de los siguientes casos de uso:

  • Prevenir y detectar fraudes 

Los fraudes a las aseguradoras traen muchas pérdidas en esta industria, y no solamente pueden venir de los clientes sino también de partes interesadas como brókers o prestadores de servicios (por ejemplo, clínicas u hospitales).

Se pueden usar modelos predictivos basados en datos históricos de actividades fraudulentas, de esta manera podemos detectar un fraude en curso. También podríamos identificar enlaces y actividades sospechosas antes de que el fraude ocurra. 

  • Marketing personalizado 

En el mundo actual, donde las personas requieren cada vez más productos que se adapten a su estilo de vida, las empresas de seguros se enfrentan al desafío de mantener una comunicación fluida con sus clientes para conocer sus necesidades. 

El análisis de datos demográficos, preferencias, intereses, hobbies, estilos de vida, actividades de moda, entre otros; pueden ayudar a las compañías a establecer ofertas personalizadas, programas de recompensas o nuevos productos. 

Por ejemplo, en la actualidad ha crecido el interés sobre el cuidado de las mascotas, esta podría ser una oportunidad para ofrecer planes médicos veterinarios, incluso incluirlos dentro de los planes familiares.

  • Predicción del Customer Lifetime Value (CLV) 

El valor del tiempo de vida de un cliente (Customer Lifetime Value) es un pronóstico sobre el valor que representa un cliente a una compañía. Se basa en la diferencia entre las ganancias proyectadas y los gastos proyectados de la futura relación entre cliente y empresa. 

La aplicación directa del CLV es lo que permite decidir el monto que se puede gastar en conseguir un nuevo cliente, este monto deberá ser menor que el CLV para que el negocio sea rentable. 

Las predicciones se pueden realizar con base en datos históricos de la misma compañía, así como análisis demográficos, de intereses y preferencias como en el anterior punto. 

En conclusión, la aplicación de estadística en el ámbito de los seguros no es algo nuevo; por lo tanto, tiene mucha lógica que actualmente se usen herramientas de Machine Learning para mejorar estos procesos, principalmente para la predicción de riesgos y reclamos, permitiendo así establecer una prima con una mayor exactitud.

Adicionalmente, se puede usar la Ciencia de Datos para detectar y prevenir fraudes, realizar un marketing personalizado y establecer un Customer Lifetime Value (CLV) más claro; estas aplicaciones no solo se emplean en el ámbito de seguros, sino que pueden ser usados en cualquier tipo de industria. En este sentido, la aplicación práctica sería identificar posibles casos de uso para tu giro de negocio y dar los primeros en la implementación de iniciativas enfocadas en el análisis de datos. 

Fuentes de consulta: 

ActiveWizards (s.f.). Top 10 Data Science Use Cases in Insurance. Recuperado de: https://activewizards.com/blog/top-10-data-science-use-cases-in-insurance/ 

Tober, S. (29 de junio de 2020). Basics of Insurance Pricing. Recuperado de: https://towardsdatascience.com/basics-of-insurance-pricing-47243c2630b9 

Henckaerts, R., Coté, M. P., Antonio, K. y Verbelen, R. (2021). Boosting insights in insurance tariff plans with tree-based machine learning methods. North American Actuarial Journal, 25(2), 255-285. 

Ministerio de Salud Pública. Boletín epidemiológico No. 39 de la situación de Dengue en el Ecuador 2013. Recuperado de: https://www.salud.gob.ec/boletin-epidemiologico-no-39-de-la-situacion-de-dengue-en-el-ecuador-2013/ 

Chavez, P. (20 de febrero de 2020). Customer Lifetime Value (CLTV): ¿cómo calcularlo en 5 minutos? Recuperado de: https://www.inboundcycle.com/blog-de-inbound-marketing/customer-lifetime-value-cltv-como-calcularlo 



Fernanda Reyes

Autor: Fernanda Reyes

Desarrolladora de software en Corporación Inmedical. Experiencia de desarrollo en varios ámbitos, principalmente el de medicina prepagada. Ingeniera de Sistemas y Máster en Administración de Empresas con mención en Gerencia de la Calidad y Productividad por la Pontificia Universidad Católica del Ecuador. Con interés por la Ciencia de Datos y sus aplicaciones, actualmente Alumni de la Carrera de Científico de Datos con Python ofertada por handytec Academy. 

Deja un comentario