La importancia de los datos FAIR en la ciencia de la tierra

Jans Aasman, Ph.D.13 septiembre 2019

La valoración de los datos como un activo empresarial se realiza de manera más aguda con el tiempo. Cuando se gestiona adecuadamente, el mismo conjunto de datos admite una pluralidad de casos de uso, está disponible casi instantáneamente a pedido y es intercambiable entre departamentos u organizaciones para aumentar sistemáticamente su rendimiento con cada implementación.

Estos beneficios de aprovechar los datos como un activo empresarial son la base de los principios de FAIR (Interoperable, Interoperable, Accesible y Accesible de GO FAIR) que afectan profundamente los rigores de la gestión de datos de la ciencia geológica. Numerosas organizaciones en este espacio han adoptado estos principios para compartir rápidamente información entre una diversidad de disciplinas para guiar de manera segura la administración de la tierra.

Según la Dra. Annie Burgess, Directora de Laboratorio de Earth Science Information Partners (ESIP), “una sola organización no puede resolver los desafíos globales más apremiantes. Los científicos requieren que se recopilen datos a través de múltiples disciplinas, que a menudo son administradas por diferentes agencias e instituciones ”. Como muchos miembros de la comunidad de ciencias de la tierra se están dando cuenta, la forma más efectiva de administrar esos datos dispares de acuerdo con los principios FAIR es mediante la utilización de los estándares semánticos. apuntalando gráficos de conocimiento.

Estos enfoques uniformes para la gestión de metadatos, modelos de datos y terminología son el meollo del movimiento de datos FAIR, asegurando el lugar de los datos como un activo preciado de la comunidad científica.

Ciencia comunal
Los estándares semánticos que soportan gráficos de conocimiento están diseñados para identificar, acceder y compartir datos de manera única en un formato legible por máquina. Son los mismos estándares responsables de facilitar estas ventajas en la World Wide Web, y son inmensamente beneficiosos para reutilizar datos dentro del campo de la ciencia geológica. Este campo es una de las áreas científicas más desafiantes porque es muy extenso, abarca la vida marina, las preocupaciones atmosféricas, las masas de tierra y los desarrollos subterráneos. La capacidad de compartir datos rápidamente en estas diferentes especializaciones es un aspecto integral del avance del campo en su conjunto, al igual que las otras ventajas de identificar datos de manera única y acceder rápidamente a ellos mediante técnicas legibles por máquina.

Observó el Dr. Lewis McGibbney, científico de datos del Laboratorio de Propulsión a Chorro del Instituto de Tecnología de California y copresidente del Grupo de Trabajo de Relevancia de Búsqueda ESDSWG de la NASA, "Estamos en una etapa emocionante en la que hay una masa crítica de expertos y organizaciones en todo el mundo con objetivos similares, así como la comprensión de que necesitamos aplicaciones intensivas en conocimiento. La pila de tecnología semántica es una pieza crucial para crear aplicaciones inteligentes para casos de uso intensivos en conocimiento dentro del área de la geociencia ”. Además, los estándares semánticos permiten a esas organizaciones publicar datos y hallazgos en un formato reutilizable para que diferentes organizaciones se beneficien directamente del trabajo de cada una.

Vinculación de humanos y máquinas
El enfoque FAIR gira en torno a la vinculación de diferentes datos en un gráfico de conocimiento. Esos gráficos de conocimiento a su vez pueden vincularse entre diferentes organizaciones o 'publicarse' en la web para acceso universal, lo cual es crítico para la interoperabilidad. Este enfoque no solo requiere que cada dato individual tenga su propio identificador único, sino también una rica descripción de sus metadatos basados en vocabularios y taxonomías estandarizados que se entienden rápidamente y se acceden a través de máquinas. Los modelos de datos semánticos (ontologías) estandarizan las diferencias inherentes en el esquema utilizado por diferentes organizaciones para diferentes aplicaciones, ayudando aún más a la interoperabilidad de los sistemas de TI que adoptan los principios FAIR.

El ingeniero de software sénior del Monterey Bay Aquarium Research Institute, Carlos Rueda, comentó que “el Proyecto de interoperabilidad de metadatos marinos desarrolló el Registro y repositorio de ontologías MMI (ORR), que aprovecha AllegroGraph para proporcionar potentes servicios semánticos interoperables que hacen que el contenido de la web esté interconectado de manera significativa tanto para humanos como para máquinas ”. Al permitir que diferentes organizaciones científicas del Proyecto de interoperabilidad de metadatos marinos registren ontologías de sus innumerables repositorios de esta manera estandarizada, se agiliza la integración de datos y la accesibilidad.

Diversidad unificada

Quizás la ventaja capital de aplicar los principios FAIR con gráficos de conocimiento dentro de la comunidad de ciencias de la tierra es la capacidad de estandarizar la variedad de datos de buzos relevantes para los científicos. La gran cantidad de especializaciones diferentes en este campo requiere datos de variedades aparentemente infinitas. Las fuentes incluyen datos de sensores de fuentes de agua, aéreas y terrestres, además de datos satelitales y de muestras físicas. Además, estos datos se caracterizan por muchas resoluciones espaciales y temporales diferentes, que se suman a la complejidad general de administrarlas de manera homogénea. A este respecto, los modelos de datos semánticos son considerablemente ayudados a uniformar vocabularios para describir datos. El Dr. Burgess aludió al mérito del "repositorio de ontología comunitaria ESIP, una plataforma comunitaria para administrar e intercambiar términos y vocabularios que ayudan a los científicos a publicar, descubrir y reutilizar datos".

Propagación a largo plazo
Como revelan los abundantes casos de uso dentro de la comunidad de ciencias geológicas, la verdadera estima de los datos se basa en su reutilización duradera y accesibilidad inmediata. Estas prioridades generaron el movimiento FAIR, que depende de tecnologías semánticas para su implementación. Este enfoque ofrece el mismo beneficio cuando se aplica a las organizaciones contemporáneas: un aumento en el valor de los datos como un activo empresarial.

Sobre el Autor
Jans Aasman es Ph.D. psicólogo, experto en Ciencia Cognitiva y CEO de Franz Inc., uno de los primeros innovadores en Inteligencia Artificial y proveedor de AllegroGraph, la principal base de datos de gráficos semánticos. Como científico y CEO, el Dr. Aasman continúa abriendo camino en las áreas de Inteligencia Artificial y Gráficos de Conocimiento, mientras trabaja de la mano con numerosas organizaciones Fortune 500, así como con gobiernos de EE. UU. Y extranjeros. El Dr. Aasman ha pasado gran parte de su carrera profesional especializándose en proyectos de Inteligencia Artificial aplicada, interfaces de usuario inteligentes e investigación de telecomunicaciones. Ha reunido patentes en las áreas de tecnología del habla, interacción multimodal del usuario, motores de recomendación mientras desarrolla tecnología precursora para tabletas y asistentes personales. Fue profesor en el departamento de Diseño Industrial de la Universidad Técnica de Delft y conferencista destacado en eventos como Smart Data, NoSQL Now, International Semantic Web Conference, GeoWeb, AAAI, Enterprise Data World, Global Graph Summit, Text Analytics, y TTI Vanguard.