normalize_text dolly-15k-ja datasetに対して、正規表現を使った修正を行うコードです。 このコードを使用して修正したデータセットは以下にアップしています。 https://huggingface.co/datasets/morizon/databricks-dolly-15k-ja