Skip to content

Releases: HC-ONLINE/LexGuard

Release v0.7.0

05 Mar 20:33

Choose a tag to compare

Nueva regla NIT_CO para detección de NIT/RUT colombiano.

Añadido

  • Nueva regla NIT_CO para detección de NIT (Número de Identificación Tributaria) y RUT (Registro Único Tributario) colombianos
  • Validador del dígito verificador mediante el algoritmo oficial DIAN
  • Soporte de formatos: numérico continuo (900456789-4), con puntos de miles (900.456.789-4) y con prefijos NIT / RUT (case-insensitive)
  • Datos de prueba en nit_co (test y prod) en formato .txt, .csv, .json y .sql.

Notas

  • Los 9 dígitos base de un NIT pueden generar un falso positivo CEDULA_CO (UNCERTAIN, confianza 0.65) al estar en el rango 7-10 dígitos
  • Pendiente implementar supresión de overlaps en el scanner.
  • El dígito verificador es obligatorio en el patrón; NITs sin guion separador no son detectados por diseño.
  • No se realizaron cambios en el formato de salida ni en la CLI (salvo la inclusión de NITCORule() en el pipeline).

Changelog

Full Changelog: v0.6.0...v0.7.0

Release v0.6.0

23 Jan 17:43

Choose a tag to compare

Integración de IA asistida (clasificación contextual)

Añadido

  • Integración opcional de IA como clasificador auxiliar para resolver casos ambiguos de PII.
  • Clasificación contextual asistida por IA para reducir falsos positivos en zonas de confianza intermedia.
  • Soporte para decisión asistida en PII sin contexto determinístico suficiente (emails genéricos, teléfonos ambiguos, identificadores aislados).
  • Campo explícito ai_assisted y ai_reason en el reporte cuando la IA participa en la decisión.
  • Flag --enable-ai para activar explícitamente la ejecución de IA (desactivada por defecto).

Notas

  • La IA no detecta PII, no calcula riesgo y no modifica el scoring determinístico.
  • La IA solo se ejecuta en zona gris de confianza y actúa como apoyo explicable, no como decisor.
  • El riesgo individual y el riesgo agregado (cross-PII) permanecen gobernados por reglas determinísticas.
  • En entornos CI/CD, la IA permanece deshabilitada salvo activación explícita.
  • La integración de IA se realiza a través de ModelRouter, permitiendo desacoplar el motor de clasificación del proveedor LLM subyacente.

Changelog

Full Changelog: v0.5.0...v0.6.0

Release v0.5.0

20 Jan 15:33

Choose a tag to compare

Correlación cross-PII

Añadido

  • Agregación de riesgo cross-PII basada en exposición combinada.
  • Identificación explícita del nivel de exposición (SINGLE, COMBINED, CRITICAL).
  • Elevación conservadora del riesgo agregado cuando coexisten múltiples tipos de PII.
  • Soporte para escenarios de auditoría donde la combinación de datos incrementa el impacto.

Notas

  • La correlación cross-PII se calcula a nivel de ejecución y archivo.
  • El riesgo individual de los hallazgos no se modifica; solo se ajusta el riesgo agregado.

Changelog

Full Changelog: v0.4.0...v0.5.0

Release v0.4.0

19 Jan 18:17

Choose a tag to compare

Nueva regla EMAIL para detección de Emails.

Añade

  • Nueva regla EMAIL para detección de direcciones de correo electrónico.
  • Detección conservadora basada en estructura válida.
  • Lista de dominios excluidos para reducir falsos positivos.
  • Clasificación por contexto semántico.
  • Enmascaramiento seguro de evidencia en reportes.

Fixed

  • Versiones de dependencias fijadas en el pipeline de CI para garantizar builds reproducibles.

Notes

  • Direcciones válidas en contextos técnicos pueden clasificarse como UNCERTAIN.
  • No se realizaron cambios en el formato de salida ni en la CLI.

Changelog

Full Changelog: v0.3.0...v0.4.0

Release v0.3.0

18 Jan 00:56

Choose a tag to compare

Nueva regla PHONE_CO para detección de Teléfonos colombianos.

Añadido

  • Nueva regla PHONE_CO para detección de números de teléfono móvil colombianos.
  • Soporte para formatos nacionales e internacionales (+57).
  • Validación de prefijos móviles válidos.
  • Descarte de secuencias triviales y números inválidos.
  • Clasificación basada en contexto semántico cercano.
  • Enmascaramiento seguro de evidencia en reportes.

Notas

  • Los números válidos sin contexto explícito pueden clasificarse como UNCERTAIN según el umbral configurado.
  • La detección de teléfonos fijos permanece fuera de alcance en esta versión.

Changelog

Full Changelog: v0.2.0...v0.3.0

v0.2.0 - Nueva regla para la detección de Cédulas de ciudadanía colombianas

14 Jan 19:43

Choose a tag to compare

Nueva regla CEDULA_CO para detección de Cédulas de Ciudadanía colombianas.

Añadido

  • Soporte para formatos continuo, con puntos y con espacios.
  • Validaciones estrictas para descartar secuencias triviales.
  • Scoring basado en contexto semántico cercano.
  • Enmascaramiento seguro de evidencia en reportes.

Notas

  • Esta versión prioriza precisión sobre recall.
  • Los hallazgos sin contexto explícito pueden clasificarse como UNCERTAIN según el umbral configurado.
  • La detección de direcciones físicas y otros tipos de PII permanece fuera de alcance en esta versión.

Changelog

Full Changelog: v0.1.1-Corrección-Ingesta...v0.2.0

v0.1.1 — Corrección de Ingesta y Detección de Archivos

12 Jan 17:15

Choose a tag to compare

Corregido

  • Los archivos CSV eran clasificados incorrectamente como binarios en sistemas Windows.

  • La lógica de detección MIME podía omitir silenciosamente archivos de texto válidos.

  • Se fortaleció la detección basada en contenido para reducir falsos negativos.

Añadido

  • Soporte explícito para tipos MIME asociados a CSV (application/vnd.ms-excel, text/csv, etc.).

  • Pruebas de regresión específicas para ingestión y escaneo de archivos.

Notas

  • Esta versión corrige escenarios de falsos negativos presentes en la versión v0.1.0.

  • No se introducen cambios funcionales en las reglas de detección de PII.

Changelog

Full Changelog: v0.1.0-detection-core...v0.1.1

v0.1.0-detection-core

12 Jan 02:18

Choose a tag to compare

LexGuard v0.1.0

Estado

Vista previa técnica temprana. Solo CLI.

¿Qué funciona?

  • Detección de tarjetas de crédito (Visa/Mastercard/Amex)
  • Validación de Luhn
  • Distinción DROP vs ENCONTRADO
  • Escaneo de archivos en streaming
  • Salida de informe JSON|MD

Lo que falta intencionalmente

  • Detección de teléfono, correo electrónico, cédula
  • API
  • interfaz de usuario
  • Clasificación de IA
  • Reclamaciones de cumplimiento legal

Principios de diseño

  • Precisión sobre recuperación
  • Primero las reglas deterministas.
  • Manejo explícito de falsos positivos.

Uso

lexguard scan <ruta>

Changelog

Full Changelog: https://github.com/HC-ONLINE/LexGuard/commits/v0.1.0-detection-core