Determinación de la opción correcta del almacén de datos

Prácticas recomendadas para el desarrollo de soluciones > Modelado de los activos > Determinación de la opción correcta del almacén de datos

La determinación de la opción de almacén de datos es específica de la solución. Es posible que se deba tener en cuenta el proceso y el coste de la opción de almacén de datos que se elija para la solución. Hay varias opciones de almacenamiento de datos disponibles:

• La base de datos interna que ThingWorx utiliza, por ejemplo, PostgreSQL, MS SQL o SAP HANA. Por lo general, PostgreSQL funciona correctamente hasta aproximadamente 500 GB de almacenamiento de datos.

• Utilice cualquier servidor de almacenamiento de datos que proporcione un conector JDBC. En ThingWorx Platform se pueden utilizar controladores JDBC para conectarse a una base de datos relacional, como Oracle.

Los proveedores de persistencia permiten la conexión a un almacén de datos y la capacidad de realizar una operación CRUD en esos datos. Los proveedores de persistencia son un tipo de entidad en ThingWorx. Para obtener más información sobre los proveedores de persistencia, consulte el manual ThingWorx Model and Data Best Practices.

En la siguiente tabla se proporcionan recomendaciones para el almacén de datos que se debe utilizar en función del tipo de datos de la solución:

Opción de almacén de datos	Tipo de datos
Base de datos relacional	• Datos que utilizan SQL complejo, como uniones, cursores, tablas temporales, etc. • Para conjuntos de datos de serie no temporal de gran tamaño, que tienen una relación débil entre los datos que se deben utilizar y ejecutar en el servidor de bases de datos.
Almacenamiento de datos de ThingWorx Platform, como PostgreSQL, MS SQL o SAP HANA	Datos históricos simples, datos de serie temporal o datos que no requieren cálculos compuestos o recursivos.

Prácticas recomendadas para elegir la opción del almacén de datos

Utilice las siguientes prácticas recomendadas para elegir la opción de almacén de datos:

• Utilice una opción de almacén de datos externo si es necesario realizar cualquiera de las siguientes tareas:

◦ Consultar una gran cantidad de datos de flujos o flujos de valor

◦ Consultar resultados con millones de filas

◦ Implementar cálculos y lógica personalizada en el nivel de base de datos, por ejemplo: procedimientos almacenados, activadores, uniones, consultas de datos relacionales, etc.

◦ Utilizar ThingWorx como data lake

◦ Integrar con herramientas de análisis e informes de terceros

◦ Añadir índices e infraestructura de base de datos adicionales

Se recomienda archivar los datos históricos a los que no se accede con frecuencia.

• Decidir la cantidad de datos que se deben almacenar. Si los datos se pueden almacenar en conjuntos de datos pequeños (alrededor de 100.000 registros o menos), se debe utilizar el almacenamiento de ThingWorx Platform.

• Decida qué tipo de datos tiene la solución.

• La frecuencia con la que se consultan los datos afecta al rendimiento de la solución. En función de la frecuencia con la que desee consultar los datos, se recomienda utilizar una de las siguientes opciones:

◦ Para consultar los datos con frecuencia, utilice un conector JDBC para consultar la base de datos. Este conector JDBC se puede utilizar con PostgreSQL

◦ Si no es necesario recuperar datos históricos con frecuencia, se pueden mover todos los datos a una instancia separada de ThingWorx (en una tabla de datos o un flujo) o a un servidor de base de datos.

¿Fue esto útil?