Add readParquetFiles for partitioned parquet datasets #131

samimshoaib01 · 2026-01-17T22:07:28Z

The function:

Accepts either a single Parquet file or a directory

Recursively discovers .parquet files when given a directory

Reads each file using the existing readParquet

Vertically merges the results using the existing DataFrame Semigroup / Monoid instance

The existing readParquet behavior is unchanged.

readParquetFiles is re-exported from DataFrame so it is available as D.readParquetFiles.

Performance considerations

The implementation relies on existing DataFrame merge semantics (mconcat) and performs a recursive filesystem traversal for file discovery. No changes were made to Parquet decoding or in-memory column handling.

Testing

Manually tested by reading a partitioned dataset stored as nested directories of Parquet files.

If there is something Which i am missing kindly mention and all suggestions are welcom.

src/DataFrame/IO/Parquet.hs

samimshoaib01 · 2026-01-19T19:33:43Z

Kindly check if its alright

Add readParquetFiles for partitioned parquet datasets

b0ac551

mchav reviewed Jan 17, 2026

View reviewed changes

src/DataFrame/IO/Parquet.hs Show resolved Hide resolved

mchav reviewed Jan 17, 2026

View reviewed changes

src/DataFrame/IO/Parquet.hs Outdated Show resolved Hide resolved

Add readParquetFiles using glob for partitioned parquet datasets

0448c3e

mchav added 2 commits January 19, 2026 12:27

Refactor variable naming for pattern matching

daacbd9

Fix formatting of module exports in Parquet.hs

266df87

mchav merged commit 74565ef into mchav:main Jan 19, 2026
6 of 7 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Add readParquetFiles for partitioned parquet datasets #131

Add readParquetFiles for partitioned parquet datasets #131

samimshoaib01 commented Jan 17, 2026

Uh oh!

Uh oh!

Uh oh!

samimshoaib01 commented Jan 19, 2026

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Add readParquetFiles for partitioned parquet datasets #131

Add readParquetFiles for partitioned parquet datasets #131

Conversation

samimshoaib01 commented Jan 17, 2026

Uh oh!

Uh oh!

Uh oh!

samimshoaib01 commented Jan 19, 2026

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants