Releases: HC-ONLINE/LexGuard
Release v0.7.0
Nueva regla NIT_CO para detección de NIT/RUT colombiano.
Añadido
- Nueva regla NIT_CO para detección de NIT (Número de Identificación Tributaria) y RUT (Registro Único Tributario) colombianos
- Validador del dígito verificador mediante el algoritmo oficial DIAN
- Soporte de formatos: numérico continuo (900456789-4), con puntos de miles (900.456.789-4) y con prefijos NIT / RUT (case-insensitive)
- Datos de prueba en nit_co (test y prod) en formato .txt, .csv, .json y .sql.
Notas
- Los 9 dígitos base de un NIT pueden generar un falso positivo CEDULA_CO (UNCERTAIN, confianza 0.65) al estar en el rango 7-10 dígitos
- Pendiente implementar supresión de overlaps en el scanner.
- El dígito verificador es obligatorio en el patrón; NITs sin guion separador no son detectados por diseño.
- No se realizaron cambios en el formato de salida ni en la CLI (salvo la inclusión de NITCORule() en el pipeline).
Changelog
Full Changelog: v0.6.0...v0.7.0
Release v0.6.0
Integración de IA asistida (clasificación contextual)
Añadido
- Integración opcional de IA como clasificador auxiliar para resolver casos ambiguos de PII.
- Clasificación contextual asistida por IA para reducir falsos positivos en zonas de confianza intermedia.
- Soporte para decisión asistida en PII sin contexto determinístico suficiente (emails genéricos, teléfonos ambiguos, identificadores aislados).
- Campo explícito ai_assisted y ai_reason en el reporte cuando la IA participa en la decisión.
- Flag --enable-ai para activar explícitamente la ejecución de IA (desactivada por defecto).
Notas
- La IA no detecta PII, no calcula riesgo y no modifica el scoring determinístico.
- La IA solo se ejecuta en zona gris de confianza y actúa como apoyo explicable, no como decisor.
- El riesgo individual y el riesgo agregado (cross-PII) permanecen gobernados por reglas determinísticas.
- En entornos CI/CD, la IA permanece deshabilitada salvo activación explícita.
- La integración de IA se realiza a través de ModelRouter, permitiendo desacoplar el motor de clasificación del proveedor LLM subyacente.
Changelog
Full Changelog: v0.5.0...v0.6.0
Release v0.5.0
Correlación cross-PII
Añadido
- Agregación de riesgo cross-PII basada en exposición combinada.
- Identificación explícita del nivel de exposición (SINGLE, COMBINED, CRITICAL).
- Elevación conservadora del riesgo agregado cuando coexisten múltiples tipos de PII.
- Soporte para escenarios de auditoría donde la combinación de datos incrementa el impacto.
Notas
- La correlación cross-PII se calcula a nivel de ejecución y archivo.
- El riesgo individual de los hallazgos no se modifica; solo se ajusta el riesgo agregado.
Changelog
Full Changelog: v0.4.0...v0.5.0
Release v0.4.0
Nueva regla EMAIL para detección de Emails.
Añade
- Nueva regla EMAIL para detección de direcciones de correo electrónico.
- Detección conservadora basada en estructura válida.
- Lista de dominios excluidos para reducir falsos positivos.
- Clasificación por contexto semántico.
- Enmascaramiento seguro de evidencia en reportes.
Fixed
- Versiones de dependencias fijadas en el pipeline de CI para garantizar builds reproducibles.
Notes
- Direcciones válidas en contextos técnicos pueden clasificarse como UNCERTAIN.
- No se realizaron cambios en el formato de salida ni en la CLI.
Changelog
Full Changelog: v0.3.0...v0.4.0
Release v0.3.0
Nueva regla PHONE_CO para detección de Teléfonos colombianos.
Añadido
- Nueva regla PHONE_CO para detección de números de teléfono móvil colombianos.
- Soporte para formatos nacionales e internacionales (+57).
- Validación de prefijos móviles válidos.
- Descarte de secuencias triviales y números inválidos.
- Clasificación basada en contexto semántico cercano.
- Enmascaramiento seguro de evidencia en reportes.
Notas
- Los números válidos sin contexto explícito pueden clasificarse como UNCERTAIN según el umbral configurado.
- La detección de teléfonos fijos permanece fuera de alcance en esta versión.
Changelog
Full Changelog: v0.2.0...v0.3.0
v0.2.0 - Nueva regla para la detección de Cédulas de ciudadanía colombianas
Nueva regla CEDULA_CO para detección de Cédulas de Ciudadanía colombianas.
Añadido
- Soporte para formatos continuo, con puntos y con espacios.
- Validaciones estrictas para descartar secuencias triviales.
- Scoring basado en contexto semántico cercano.
- Enmascaramiento seguro de evidencia en reportes.
Notas
- Esta versión prioriza precisión sobre recall.
- Los hallazgos sin contexto explícito pueden clasificarse como UNCERTAIN según el umbral configurado.
- La detección de direcciones físicas y otros tipos de PII permanece fuera de alcance en esta versión.
Changelog
Full Changelog: v0.1.1-Corrección-Ingesta...v0.2.0
v0.1.1 — Corrección de Ingesta y Detección de Archivos
Corregido
-
Los archivos CSV eran clasificados incorrectamente como binarios en sistemas Windows.
-
La lógica de detección MIME podía omitir silenciosamente archivos de texto válidos.
-
Se fortaleció la detección basada en contenido para reducir falsos negativos.
Añadido
-
Soporte explícito para tipos MIME asociados a CSV (application/vnd.ms-excel, text/csv, etc.).
-
Pruebas de regresión específicas para ingestión y escaneo de archivos.
Notas
-
Esta versión corrige escenarios de falsos negativos presentes en la versión v0.1.0.
-
No se introducen cambios funcionales en las reglas de detección de PII.
Changelog
Full Changelog: v0.1.0-detection-core...v0.1.1
v0.1.0-detection-core
LexGuard v0.1.0
Estado
Vista previa técnica temprana. Solo CLI.
¿Qué funciona?
- Detección de tarjetas de crédito (Visa/Mastercard/Amex)
- Validación de Luhn
- Distinción DROP vs ENCONTRADO
- Escaneo de archivos en streaming
- Salida de informe JSON|MD
Lo que falta intencionalmente
- Detección de teléfono, correo electrónico, cédula
- API
- interfaz de usuario
- Clasificación de IA
- Reclamaciones de cumplimiento legal
Principios de diseño
- Precisión sobre recuperación
- Primero las reglas deterministas.
- Manejo explícito de falsos positivos.
Uso
lexguard scan <ruta>Changelog
Full Changelog: https://github.com/HC-ONLINE/LexGuard/commits/v0.1.0-detection-core