Karthigai Selvan Murugesan karthigaiselvanm

Hi, I'm Karthigai Selvan — Data Platform & DE Lead

10+ yrs in data engineering • AWS • Databricks & Spark • PySpark • Trino • Apache Ranger • Terraform • Kubernetes
k2ddna.com · LinkedIn · Email

🚀 What I’m focused on

Building reliable platform data engineering foundations (governance, scalability, cost).
Modern DE stack: Spark, Delta/Parquet, Trino, dbt, Airflow, Kafka, Terraform, AWS.
Secure data access with Apache Ranger and policy-driven controls.

🧰 Toolbox

Python · PySpark · Spark SQL · Databricks · Delta · Kafka · Airflow · Trino · Apache Ranger · dbt · Postgres · S3 · Glue · Terraform · Docker · Kubernetes · Great Expectations

⭐ Featured Projects

Trino + Apache Ranger on Kubernetes (Helm)

Custom images, init-containers, and StatefulSet deployment for Trino with Ranger plugin.
Solves real issues: missing cred.jceks, JVM opts updates, ranger.service.name validation, and config mounts.
Built for repeatable, secure platform setups.

Spark Learning Lab

Practical notebooks on DataFrame APIs, Structured Streaming, optimization.
Companion to my “Spark Deep Dive” study plan.

PySpark Samples

Hands-on patterns for joins, windowing, UDFs/UDAs, and incremental data processing.

📚 Writing & Speaking

Apache Ranger × Trino deep-dive (design, gotchas, Helm) — coming soon on k2ddna.com.
Data platform patterns for secure multi-tenant analytics.

🏅 Highlights

Databricks Certified Data Engineer Associate (Dec 2024)
Built OCSF-aligned feed mappings and pipelines; working on Benthos ingestion and policy-guarded changes.

🤝 Let’s collaborate

If you’re building secure, scalable data platforms (Ranger, Trino, Spark, Terraform on AWS/K8s), I’m always up for pairing on design reviews, POCs, and OSS improvements.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Karthigai Selvan Murugesan karthigaiselvanm

Achievements