Este proyecto de SQL_A documenta un ejercicio de gobernanza de datos en español. El notebook Caso_Estudio.ipynb integra los marcos éticos de referencia (GDPR, HIPAA), la ingesta de datos desde caso_etico_avanzado.xlsx, la generación de una base SQLite temporal y la ejecución de tres consultas críticas que responden preguntas de justicia, acceso y riesgo en atención médica.
caso_etico_avanzado.xlsx: contiene las mediciones clínicas y demográficas utilizadas en las consultas. Trátalo como un artefacto sensible; mantén las copias locales y no las publiques en repositorios públicos.Caso_estudio.pdf: guía de marco ético (referencia local solamente; no se sube a GitHub).
- Cargar el Excel y normalizar los nombres de columna con
pandas. - Crear una base SQLite en memoria para probar las consultas y mantener los resultados agregados (sin valores de identificación directa).
- Revisar los dilemas éticos antes de ejecutar SQL (
Grupo étnico vs. ubicación,Privacidad vs. equidad, etc.). - Resolver tres consultas principales:
- Consulta 1: desigualdades comunitarias en marcadores clínicos (diabetes, cardiovascular, IMC) y proporción de exámenes fuera de rango por estrato.
- Consulta 2: patrones de riesgo crónico según edad y nivel de actividad física.
- Consulta 3: acceso y calidad del servicio según cobertura (contributivo/subsidiado/sin seguro).
- Registrar hallazgos y salvaguardas en celdas de texto con recomendaciones de políticas.
- Las consultas deben devolver salidas agregadas sin exponer identificadores sensibles.
- Se citan
GDPR Art. 5,Recital 26y cláusulas HIPAA de mínimo necesario como guía para cada paso. - El notebook documenta el razonamiento detrás de cada consulta antes de ejecutarla.
- Crear un entorno virtual:
python -m venv .venv && .\\.venv\\Scripts\\Activate.ps1. - Instalar dependencias:
pip install -r requirements.txt. - Ejecutar
Caso_Estudio.ipynben JupyterLab/Notebook; las celdas contienen el flujo completo. - Usa el archivo
README.mdy los comentarios en markdown del notebook para interpretar cada consulta y sus resultados.
- Extraer los SQL usados en el notebook a un script
.sqlo asqlalchemypara automatizar validaciones de gobernanza. - Generar una tabla temporal con triangulación de riesgo (edad, estrato, cobertura) y visualizar (opcional) usando
matplotliboseaborn. - Añadir un apartado de “cómo auditar esta ejecución” para describir los mecanismos de control de acceso sobre el Excel fuente.