Skip to content

This is the ingestion and creation of a SQL Database from an excel file. Additionally, the main principles of data governance are analyzed throughout the findings.

Notifications You must be signed in to change notification settings

JCOM127/SQL-for-Data-Governance

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 

Repository files navigation

SQL para Gobernanza de Datos

Contexto

Este proyecto de SQL_A documenta un ejercicio de gobernanza de datos en español. El notebook Caso_Estudio.ipynb integra los marcos éticos de referencia (GDPR, HIPAA), la ingesta de datos desde caso_etico_avanzado.xlsx, la generación de una base SQLite temporal y la ejecución de tres consultas críticas que responden preguntas de justicia, acceso y riesgo en atención médica.

Datos

  • caso_etico_avanzado.xlsx: contiene las mediciones clínicas y demográficas utilizadas en las consultas. Trátalo como un artefacto sensible; mantén las copias locales y no las publiques en repositorios públicos.
  • Caso_estudio.pdf: guía de marco ético (referencia local solamente; no se sube a GitHub).

Flujo de trabajo del notebook

  1. Cargar el Excel y normalizar los nombres de columna con pandas.
  2. Crear una base SQLite en memoria para probar las consultas y mantener los resultados agregados (sin valores de identificación directa).
  3. Revisar los dilemas éticos antes de ejecutar SQL (Grupo étnico vs. ubicación, Privacidad vs. equidad, etc.).
  4. Resolver tres consultas principales:
    • Consulta 1: desigualdades comunitarias en marcadores clínicos (diabetes, cardiovascular, IMC) y proporción de exámenes fuera de rango por estrato.
    • Consulta 2: patrones de riesgo crónico según edad y nivel de actividad física.
    • Consulta 3: acceso y calidad del servicio según cobertura (contributivo/subsidiado/sin seguro).
  5. Registrar hallazgos y salvaguardas en celdas de texto con recomendaciones de políticas.

Salvaguardas y buenas prácticas

  • Las consultas deben devolver salidas agregadas sin exponer identificadores sensibles.
  • Se citan GDPR Art. 5, Recital 26 y cláusulas HIPAA de mínimo necesario como guía para cada paso.
  • El notebook documenta el razonamiento detrás de cada consulta antes de ejecutarla.

Cómo reproducirlo

  1. Crear un entorno virtual: python -m venv .venv && .\\.venv\\Scripts\\Activate.ps1.
  2. Instalar dependencias: pip install -r requirements.txt.
  3. Ejecutar Caso_Estudio.ipynb en JupyterLab/Notebook; las celdas contienen el flujo completo.
  4. Usa el archivo README.md y los comentarios en markdown del notebook para interpretar cada consulta y sus resultados.

Próximos pasos sugeridos

  • Extraer los SQL usados en el notebook a un script .sql o a sqlalchemy para automatizar validaciones de gobernanza.
  • Generar una tabla temporal con triangulación de riesgo (edad, estrato, cobertura) y visualizar (opcional) usando matplotlib o seaborn.
  • Añadir un apartado de “cómo auditar esta ejecución” para describir los mecanismos de control de acceso sobre el Excel fuente.

About

This is the ingestion and creation of a SQL Database from an excel file. Additionally, the main principles of data governance are analyzed throughout the findings.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published