Lista de funciones de gobierno de la información de SAS
Datos
Datos
- Importe datos de una variedad de fuentes: bases de datos, Hadoop, hojas de cálculo de Excel, redes sociales, etc.
- Arrastre un archivo de Excel, un conjunto de datos CSV o SAS a su espacio de trabajo y comience a crear informes o tableros rápidamente.
- Utilice funciones estándar de calidad de datos como cambiar mayúsculas y minúsculas; convertir, renombrar, eliminar y dividir columnas; y cree columnas calculadas y transformaciones usando código personalizado.
- Prepare datos utilizando funciones de adjuntar, unir, filtrar y transponer.
- Reutilice, programe y supervise los trabajos.
- Ver linaje con diagramas de red.
- Vea rápidamente estadísticas descriptivas sobre medidas para ayudarlo a ver las características de sus datos.
- Administre las conexiones de datos (capacidad para fuentes de datos locales, en la nube o de archivos) y la autorización de conjuntos de datos.
Catálogo de datos
Catálogo de datos
- Proporciona agentes de descubrimiento automatizados que rastrean fuentes de datos para descubrir datos para que sepa qué datos están disponibles.
Preparación de datos
Preparación de datos
- Incluye una interfaz de autoservicio para herramientas integradas de calidad de datos e integración de datos. Proporciona una vista de qué preparación de datos se necesita.
Clasificación automática de contenido y descubrimiento de datos de privacidad
Clasificación automática de contenido y descubrimiento de datos de privacidad
- Proporciona identificación y clasificación de contenido de campo utilizando SAS Quality Knowledge Base.
Descubrimiento de información
Descubrimiento de información
- Ayuda a los usuarios a localizar y obtener acceso rápido a datos, informes, modelos y otros activos analíticos difíciles de encontrar.
Capacidades de búsqueda flexibles
Capacidades de búsqueda flexibles
- Permite a los consumidores de datos buscar mediante texto libre o búsqueda por facetas y aplicar filtros en los resultados de búsqueda para refinar sus consultas. También permite a los usuarios utilizar la búsqueda elástica para encontrar activos de datos.
Acceso con un clic a las aplicaciones de SAS Viya
Acceso con un clic a las aplicaciones de SAS Viya
- Permite a los usuarios pasar directamente de los datos seleccionados en el Catálogo de información a la siguiente aplicación, por ejemplo, para construir una canalización analítica o crear un reporte.
linaje de datos
linaje de datos
- Proporciona un linaje de extremo a extremo: desde el flujo de datos hasta los datos, informes, modelos y decisiones. Esto incluye trabajos de proceso, como planes de preparación de datos, mientras se visualizan detalles adicionales, propiedades y otros objetos relacionados para cada activo de linaje.
Etiquetado
Etiquetado
- Las etiquetas se pueden asignar a los activos de datos para proporcionar colaboración en toda la organización o con otros usuarios de datos. Las palabras clave de etiqueta se pueden usar para buscar y descubrir activos de datos. Las etiquetas se rigen según quién puede crear o asignar, leer o eliminar etiquetas.
Intercambio de metadatos y gobernanza
Intercambio de metadatos y gobernanza
- Un conector SAS Viya para Egeria permite a los usuarios leer nuevos objetos de catálogo en Egeria y establecer relaciones entre ellos. Luego, los metadatos se pueden compartir entre usuarios y diferentes herramientas, proporcionando visibilidad y contexto en torno a los datos para mejorar el uso, la reutilización y la confianza.
Nube nativa
Nube nativa
- La arquitectura de SAS Viya es compacta, nativa de la nube y rápida. Ya sea que prefiera utilizar SAS Cloud o un proveedor de nube pública o privada, podrá aprovechar al máximo su inversión en la nube.
Motor en memoria SAS Viya
Motor en memoria SAS Viya
- CAS (SAS Cloud Analytic Services) realiza el procesamiento en la memoria y distribuye el procesamiento entre los nodos de un clúster.
- Las solicitudes del usuario (expresadas en un lenguaje procedural) se traducen en acciones con los parámetros que se necesitan procesar en un entorno distribuido. El conjunto de resultados y los mensajes se devuelven al procedimiento para que el usuario ejecute acciones adicionales con ellos.
- Los datos se gestionan en bloques y se pueden cargar en memoria y bajo demanda.
- Si las tablas superan la capacidad de la memoria, el servidor almacena en caché los bloques en el disco. Los datos y los resultados intermedios se guardan en la memoria tanto tiempo como sea necesario, entre trabajos y usuarios.
- Incluye comunicación de nodo a nodo altamente eficiente. Un algoritmo determina el número óptimo de nodos de un trabajo determinado.
- La capa de comunicación admite la tolerancia a fallas y le permite eliminar o agregar nodos de un servidor mientras se está ejecutando. Todos los componentes se pueden replicar para una alta disponibilidad.
- Compatibilidad con código SAS heredado e interoperabilidad directa con clientes SAS 9.4M5.
- Admite la implementación de múltiples inquilinos, lo que permite que una pila de software compartida admita inquilinos aislados de manera segura.