buena onda, cerveza, experimental

“Si nos hubieran escuchado probablemente hubiéramos estado terminando esta pandemia”

#CuarentenaConsciencia entrevista a Jorge Castillo, Ingeniero Civil Matemático. PhD en Ciencias de la Complejidad Social. Actualmente trabaja en Z DATA LAB como Data Scientist e Investigador de proyecto en la Universidad del Desarrollo.

  • ¿Cómo te ha afectado la pandemia?

    La pandemia me permitió re encantarme con la ciencia y con el rol del científico, porque en el transcurso de mis estudios, sentí cierta decepción de la academia y de la manera en que funciona hoy en día. En ese contexto, tuve la grata oportunidad de trasladar mis conocimientos a una empresa de datos.

    Lo que hago en Z DATA LAB en ciencia de datos, la única diferencia a la ciencia tradicional, es que el foco aquí es respecto a una pregunta específica asociada a un problema de la industria, más que a hipótesis científicas que está sujetas a intereses de investigación particulares.

    Por ejemplo, uno de los problemas que estamos enfrentando en Z DATA LAB, es lograr la evaluación y optimización de promociones ocupando una metodología innovadora que generalmente no se ocupa. Ensamblamos varios métodos de machine learning para calcular ese tipo de cosas, y en la academia -hasta donde sé-, sólo hay soluciones basadas en métodos econométricos convencionales respecto a este tema.


    • ¿Entonces, según tú experiencia, en tu trabajo aplican el método científico?

    Sí, lo aplicamos. Pero diría que falta más integración entre ambos mundos. Creo que esta falta se debe a los defectos de ambos. Hay mucho que podemos decir a la academia, desde la industria (como está pasando con los gigantes tecnológicos), y viceversa que tiene que ver con la incorporación de capital humano avanzado en el sector productivo.


    • ¿Puede que haya un problema con los métodos o la manera de aplicarlos por el Estado? Considerando que se ocupa el método científico de buena manera.

    Hace unos años tuve una entrevista con un ente gubernamental donde necesitaban análisis de datos ya que ocupaban métodos muy antiguos, de los años 80. Lo que se hacía en ese entonces era que abarcaban grandes bases de datos con numerosas variables, entonces si nos imaginamos el método como una juguera gigante, introducían todas estas variables en la juguera para obtener un índice que nos diera información sobre algún fenómeno. En este contexto, el trabajo que me ofrecían era aplicar un método distinto que se llama “Lasso”, este es un método que sirve para reducir un montón de variables a unas pocas pero aún así, este método ya está dentro del mainstream para las exigencias de hoy en día.

    Quiero destacar que “La econometría es un excelente método pero depende del problema a resolver para utilizarla”. En mis investigaciones la he usado para diferentes fines. Al final se trata de poder relacionar variables de alguna manera, que den explicación a un fenómeno.

    Por otro lado, creo que el Estado tiene un rol tal, que es muy delicado hablar de los temas técnicos ya que inevitablemente se cruza con lo ético. Por lo tanto, cualquier uso metodológico por parte de las instituciones públicas debe estar debidamente ejecutada y considerando las repercusiones que tienen sus estudios.


    • En este reencuentro con la ciencia. Cuéntanos cómo surgió el artículo relacionado con el Covid-19

    Cuando comenzó la pandemia empecé a trabajar por mi cuenta con los datos que había hasta el momento, ya que sabía que mis conocimientos científicos eran relevantes para lo que estaba ocurriendo en Chile y el mundo.

    En el proceso me llamo Héctor Pastén, quien para mí y muchos más del circuito matemático chileno, es uno de los matemáticos más destacados en Chile. Nos conocemos hace varios años, nos hicimos amigos cuando estudiamos en Concepción.  Con Héctor empezamos a explorar un diseño de un modelo que modele la evolución de una epidemia, sin usar conceptos matemáticos complicados que se ven en la Universidad. Este modelo ve cómo iba variando la población de personas que son susceptibles a ser contagiadas, que se infectan, y luego se retiran (recuperan o mueren). Nuestro modelo tenía intenciones de llegar a una audiencia general, para así hacer dar herramientas que permitieran entender lo grave de la pandemia, en particular, que quedara claro que había que bajar la tasa de contactos infecciosos, que es una muy buena aproximación de la tasa de contagio usual. Al par de semanas, otro grupo de investigadores realizaron una publicación llamativa que se difundió en varios medios de comunicación, que decía que los hospitales colapsarían en junio si la tasa de contagio que se tenía hasta el 12 de abril, se mantenía. En esta publicación utilizaron el modelo que estábamos trabajando con Héctor y sinceramente, no estaba pensado para realizar predicciones tan precisas.

    Esto nos inspiró para comenzar a trabajar en un modelo más robusto, no solo para público general, que estudiará la variación de la tasa contactos infecciosos, donde identificamos tres zonas (roja-gris-verde). Cada zona se diferencia en el valor de la tasa de contagio y su valor de predicción de personas contagiadas, específicamente si la tasa de contagio estaba en cierta zona la predicción se podría tornar en una buena o mala predicción con respecto al número de contagiados. Para más detalle revisar artículo:

    http://www.mat.uc.cl/~hector.pasten/preprints/TasaColor.pdf.

    Un ejemplo claro es lo que sucedió a comienzos de abril, donde nos encontramos en la zona verde con una menor tasa de contagio. Si el gobierno hubiera visto nuestro modelo se hubieran percatado que la tasa de contagio no era lo suficientemente baja como para relajar las políticas en torno a la cuarentena en Chile. “Si nos hubieran escuchado probablemente hubiéramos estado terminando esta pandemia”  ya que estábamos cercanos a un futuro punto de inflexión importante. Pero este trabajo lamentablemente no fue tan difundido como queríamos, y la discusión estaba centrada en la calidad de los datos, por lo tanto empezamos a trabajar sobre cómo sacar información relevante a pesar de que los datos estuvieran malos, y ahí generamos un tercer documento:

    (http://www.mat.uc.cl/~hector.pasten/preprints/InfoEscondida.pdf)


    • ¿A qué te refieres con punto de inflexión?

    El 12 abril es el punto de inflexión porque la tasa de contagio iba bajando pero ese día rebotó y empezó a subir nuevamente. El 12 de abril es una fecha clave porque fue el domingo de semana santa donde hubo un fin de semana largo y mucha gente empezó a salir de Santiago y a sus alrededores, paralelamente existía un ambiente de triunfalismo por parte del Gobierno y de la población.

    Cabe agregar que si hubiesen existido más controles estrictos con respecto a la cuarentena en este  momento estaríamos hablando de otro panorama y no con más de 65.000 infectados.

    Es importante decir que nuestro modelo es una manera de entender cómo evolucionan los fenómenos a partir de un parámetro, en este caso la tasa de contagio, pero este parámetro puede ser explicado por muchos factores y como científico no tenemos los proxys ni las variables instrumentales para medir estos factores como aislamiento social, decisiones de autoridades, motivaciones personales, etc.


    • ¿Entonces qué datos usaron?

    Los datos que se usaron fueron los datos oficiales del Minsal, total oficial, lista total recuperados, lista total fallecidos y lista total de infectados. Una consideración importante respecto a los modelos, si me permito completar un poco la respuesta anterior, es que no es un “éxito” que el modelo le achunte a una predicción, sobre todo en un tema tan sensible como éste. Lo ideal es tomar acciones para mitigar lo máximo posible los efectos no deseados, y eso es justamente lo que no se hizo en Chile.


    • ¿Que se viene para ti?

    Con respecto al Covid-19 estoy observando que es lo que pasa con el virus día a día pero es poco lo que se puede hacer en modelamiento porque cambió la metodología de testeo y otras cosas más y al estar en cuarentena cambia mucho el comportamiento así que hay que ser muy meticuloso en esta etapa. Estoy pensando en incorporarme a algún equipo de postulación de fondos de emergencia que sacó la ANID.

    En lo personal, sólo espero no contagiarme.

    • ¿Cómo podemos hacer que las personas se interesen más por la ciencia?

    Una buena forma es preguntarle a sus familiares o conocidos que sean científicos y pedirles que les expliquen con palabras sencillas de temas científicos que son sujetos al escrutinio público, por ejemplo: las vacunas, el sistema inmune y otras cosas más.

    También recomiendo buscar información fidedigna en páginas web oficiales, y aprender a diferenciar una noticia falsa de una no falsa, siguiendo las recomendaciones al respecto.

    Con respecto a los científicos, que son los que pueden motivar a las personas, les recomiendo acercarse con bastante humildad a intentar resolver dudas que las personas tienen. Se sabe que en general, un científico estudia con bastante pasión los temas que le interesan, y por supuesto sabe más sobre su tema y esto puede aportar a generar consciencia.

    Rescato mucho lo que se está haciendo con esta entrevista en particular, y con la difusión de la ciencia que hace #CuarentenaConsciencia.


    *Entrevista realizada por María Teresa Barbato, redacción por Eduardo Briseño.

    *Auspiciada por Chaitún Lab