From f6d9d4b76d944512a6e952d28af16800feae1449 Mon Sep 17 00:00:00 2001
From: streino <streino@disroot.org>
Date: Mon, 6 Oct 2025 16:07:03 +0200
Subject: [PATCH 01/11] feat: Add remote URL prefix option to csw-dcat
 harvester

---
 udata/harvest/backends/dcat.py           | 18 +++----
 udata/harvest/tests/test_dcat_backend.py | 62 ++++++++++++++++++++++++
 2 files changed, 71 insertions(+), 9 deletions(-)

diff --git a/udata/harvest/backends/dcat.py b/udata/harvest/backends/dcat.py
index 1f61b9d45d..f1cce34329 100644
--- a/udata/harvest/backends/dcat.py
+++ b/udata/harvest/backends/dcat.py
@@ -258,6 +258,15 @@ class CswDcatBackend(DcatBackend):
 
     display_name = "CSW-DCAT"
 
+    extra_configs = (
+        HarvestExtraConfig(
+            _("Remote URL prefix"),
+            "remote_url_prefix",
+            str,
+            _("A prefix used to build the remote URL of the harvested items."),
+        ),
+    )
+
     # CSW_REQUEST is based on:
     # - Request syntax from spec [1] and example requests [1] [2].
     # - Sort settings to ensure stable paging [3].
@@ -426,15 +435,6 @@ class CswIso19139DcatBackend(CswDcatBackend):
 
     display_name = "CSW-ISO-19139"
 
-    extra_configs = (
-        HarvestExtraConfig(
-            _("Remote URL prefix"),
-            "remote_url_prefix",
-            str,
-            _("A prefix used to build the remote URL of the harvested items."),
-        ),
-    )
-
     CSW_OUTPUT_SCHEMA = "http://www.isotc211.org/2005/gmd"
 
     def __init__(self, *args, **kwargs):
diff --git a/udata/harvest/tests/test_dcat_backend.py b/udata/harvest/tests/test_dcat_backend.py
index a19ec9761f..b2ec63415c 100644
--- a/udata/harvest/tests/test_dcat_backend.py
+++ b/udata/harvest/tests/test_dcat_backend.py
@@ -1021,6 +1021,68 @@ def test_disallow_external_dtd(self, rmock):
         assert job.status == "done"
         assert len(job.items) == 1
 
+    @pytest.mark.parametrize(
+        "remote_url_prefix",
+        [
+            None,
+            "http://catalog.example.com",  # no trailing slash
+            "http://catalog.example.com/",  # trailing slash
+        ],
+    )
+    def test_url_prefix(self, rmock, remote_url_prefix: str):
+        xml = """<?xml version="1.0" encoding="UTF-8"?>
+        <csw:GetRecordsResponse xmlns:csw="http://www.opengis.net/cat/csw/2.0.2"
+                                xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
+                                xsi:schemaLocation="http://www.opengis.net/cat/csw/2.0.2 http://schemas.opengis.net/csw/2.0.2/CSW-discovery.xsd">
+          <csw:SearchStatus timestamp="2023-03-03T16:09:50.697645Z" />
+          <csw:SearchResults numberOfRecordsMatched="1" numberOfRecordsReturned="1" elementSet="full" nextRecord="0">
+            <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
+                     xmlns:dct="http://purl.org/dc/terms/"
+                     xmlns:dcat="http://www.w3.org/ns/dcat#"
+                     xmlns:foaf="http://xmlns.com/foaf/0.1/">
+              <dcat:CatalogRecord rdf:about="record-1">
+                <foaf:primaryTopic rdf:resource="dataset-1"/>
+                <dct:identifier>id-1</dct:identifier>
+              </dcat:CatalogRecord>
+              <dcat:Dataset rdf:about="dataset-1">
+                <dct:identifier>dataset-1</dct:identifier>
+                <dct:title>Dataset 1</dct:title>
+                <dcat:landingPage rdf:resource="http://data.example.com/datasets/dataset-1"/>
+              </dcat:Dataset>
+            </rdf:RDF>
+          </csw:SearchResults>
+        </csw:GetRecordsResponse>
+        """
+        rmock.get("http://data.example.com/datasets/dataset-1", status_code=200)
+        rmock.head(rmock.ANY, headers={"Content-Type": "application/xml"})
+        rmock.post(rmock.ANY, text=xml)
+
+        source = HarvestSourceFactory(
+            backend="csw-dcat",
+            config={
+                "extra_configs": [
+                    {
+                        "key": "remote_url_prefix",
+                        "value": remote_url_prefix,
+                    }
+                ]
+            },
+        )
+
+        actions.run(source)
+        source.reload()
+        job = source.get_last_job()
+        assert len(job.items) == 1
+
+        dataset = Dataset.objects[0]
+        if remote_url_prefix:
+            # Computed from source config `remote_url_prefix` + metadata `dct:identifier`.
+            assert dataset.harvest.remote_url == "http://catalog.example.com/id-1"
+        else:
+            # First `dct:landingPage` found in the resource.
+            # If it breaks, it's not necessarily a bug — this acts as a demonstration of current behavior.
+            assert dataset.harvest.remote_url == "http://data.example.com/datasets/dataset-1"
+
 
 @pytest.mark.usefixtures("clean_db")
 @pytest.mark.options(PLUGINS=["csw"])

From 9af9b9f64364101477deca198138a43fa249b8e2 Mon Sep 17 00:00:00 2001
From: streino <streino@disroot.org>
Date: Fri, 12 Dec 2025 18:21:27 +0100
Subject: [PATCH 02/11] feat(harvest): add GeoDCAT-AP option for csw-dcat
 harvesters

---
 udata/harvest/backends/dcat.py | 26 ++++++++++++++++++++++----
 1 file changed, 22 insertions(+), 4 deletions(-)

diff --git a/udata/harvest/backends/dcat.py b/udata/harvest/backends/dcat.py
index efab3f1d07..a8c4feeb68 100644
--- a/udata/harvest/backends/dcat.py
+++ b/udata/harvest/backends/dcat.py
@@ -15,6 +15,7 @@
 from udata.rdf import (
     DCAT,
     DCT,
+    GEODCAT,
     HYDRA,
     SPDX,
     guess_format,
@@ -261,6 +262,12 @@ class CswDcatBackend(DcatBackend):
     display_name = "CSW-DCAT"
 
     extra_configs = (
+        HarvestExtraConfig(
+            _("GeoDCAT-AP"),
+            "enable_geodcat",
+            str,
+            _("Request GeoDCAT-AP to the CSW server (must be supported by the server)."),
+        ),
         HarvestExtraConfig(
             _("Remote URL prefix"),
             "remote_url_prefix",
@@ -333,8 +340,6 @@ class CswDcatBackend(DcatBackend):
     </csw:GetRecords>
     """
 
-    CSW_OUTPUT_SCHEMA = "http://www.w3.org/ns/dcat#"
-
     SAXON_SECURITY_FEATURES = {
         "http://saxon.sf.net/feature/allow-external-functions": "false",
         "http://saxon.sf.net/feature/parserFeature?uri=http://apache.org/xml/features/nonvalidating/load-external-dtd": "false",
@@ -353,15 +358,23 @@ def __init__(self, *args, **kwargs):
         self.xpath_proc = self.saxon_proc.new_xpath_processor()
         self.xpath_proc.declare_namespace("csw", CSW_NAMESPACE)
 
+    @property
+    def output_schema(self):
+        if self.get_extra_config_value("enable_geodcat"):
+            return str(GEODCAT)
+        else:
+            return str(DCAT)
+
     def walk_graph(self, url: str, fmt: str) -> Generator[tuple[int, Graph], None, None]:
         """
         Yield all RDF pages as `Graph` from the source
         """
+        output_schema = self.output_schema
         page_number = 0
         start = 1
 
         while True:
-            data = self.CSW_REQUEST.format(output_schema=self.CSW_OUTPUT_SCHEMA, start=start)
+            data = self.CSW_REQUEST.format(output_schema=output_schema, start=start)
             response = self.post(url, data=data, headers={"Content-Type": "application/xml"})
             response.raise_for_status()
 
@@ -438,7 +451,7 @@ class CswIso19139DcatBackend(CswDcatBackend):
     name = "csw-iso-19139"
     display_name = "CSW-ISO-19139"
 
-    CSW_OUTPUT_SCHEMA = "http://www.isotc211.org/2005/gmd"
+    extra_configs = [c for c in CswDcatBackend.extra_configs if c.key != "enable_geodcat"]
 
     def __init__(self, *args, **kwargs):
         super().__init__(*args, **kwargs)
@@ -450,6 +463,11 @@ def __init__(self, *args, **kwargs):
             "CoupledResourceLookUp", self.saxon_proc.make_string_value("disabled")
         )
 
+    @property
+    @override
+    def output_schema(self):
+        return "http://www.isotc211.org/2005/gmd"
+
     @override
     def as_dcat(self, tree: PyXdmNode) -> PyXdmNode:
         return self.xslt_exec.transform_to_value(xdm_node=tree).head

From 3633a266df9eac7d1a1cae013169739da6421bda Mon Sep 17 00:00:00 2001
From: streino <streino@disroot.org>
Date: Wed, 24 Dec 2025 14:43:44 +0100
Subject: [PATCH 03/11] refactor

---
 udata/harvest/backends/dcat.py | 84 +++++++++++++++++++++-------------
 1 file changed, 53 insertions(+), 31 deletions(-)

diff --git a/udata/harvest/backends/dcat.py b/udata/harvest/backends/dcat.py
index a8c4feeb68..20296d564c 100644
--- a/udata/harvest/backends/dcat.py
+++ b/udata/harvest/backends/dcat.py
@@ -1,4 +1,5 @@
 import logging
+from abc import abstractmethod
 from datetime import date
 from typing import ClassVar, Generator
 
@@ -252,22 +253,14 @@ def get_node_from_item(self, graph, item):
         raise ValueError(f"Unable to find dataset with DCT.identifier:{item.remote_id}")
 
 
-class CswDcatBackend(DcatBackend):
-    """
-    CSW harvester fetching records as DCAT.
-    The parsing of items is then the same as for the DcatBackend.
+class BaseCswDcatBackend(DcatBackend):
     """
+    Abstract base CSW to DCAT harvester.
 
-    name = "csw-dcat"
-    display_name = "CSW-DCAT"
+    Once items are retrieved from CSW, the parsing of these items is the same as DcatBackend.
+    """
 
     extra_configs = (
-        HarvestExtraConfig(
-            _("GeoDCAT-AP"),
-            "enable_geodcat",
-            str,
-            _("Request GeoDCAT-AP to the CSW server (must be supported by the server)."),
-        ),
         HarvestExtraConfig(
             _("Remote URL prefix"),
             "remote_url_prefix",
@@ -359,15 +352,24 @@ def __init__(self, *args, **kwargs):
         self.xpath_proc.declare_namespace("csw", CSW_NAMESPACE)
 
     @property
+    @abstractmethod
     def output_schema(self):
-        if self.get_extra_config_value("enable_geodcat"):
-            return str(GEODCAT)
-        else:
-            return str(DCAT)
+        """
+        Return the CSW `outputSchema` property.
+        """
+        pass
+
+    @abstractmethod
+    def as_dcat(self, tree: PyXdmNode) -> PyXdmNode:
+        """
+        Return the input tree as a DCAT tree.
+        """
+        pass
 
+    @override
     def walk_graph(self, url: str, fmt: str) -> Generator[tuple[int, Graph], None, None]:
         """
-        Yield all RDF pages as `Graph` from the source
+        Yield all RDF pages as `Graph` from the source.
         """
         output_schema = self.output_schema
         page_number = 0
@@ -408,19 +410,11 @@ def walk_graph(self, url: str, fmt: str) -> Generator[tuple[int, Graph], None, N
                     return
 
             page_number += 1
-            start = self.next_position(start, search_results)
+            start = self._next_position(start, search_results)
             if not start:
                 return
 
-    def as_dcat(self, tree: PyXdmNode) -> PyXdmNode:
-        """
-        Return the input tree as a DCAT tree.
-        For CswDcatBackend, this method return the incoming tree as-is, since it's already DCAT.
-        For subclasses of CswDcatBackend, this method should convert the incoming tree to DCAT.
-        """
-        return tree
-
-    def next_position(self, start: int, search_results: PyXdmNode) -> int | None:
+    def _next_position(self, start: int, search_results: PyXdmNode) -> int | None:
         next_record = int(search_results.get_attribute_value("nextRecord"))
         matched_count = int(search_results.get_attribute_value("numberOfRecordsMatched"))
         returned_count = int(search_results.get_attribute_value("numberOfRecordsReturned"))
@@ -442,17 +436,45 @@ def next_position(self, start: int, search_results: PyXdmNode) -> int | None:
         return None if should_break else next_record
 
 
-class CswIso19139DcatBackend(CswDcatBackend):
+class CswDcatBackend(BaseCswDcatBackend):
+    """
+    CSW harvester fetching records as DCAT.
+    """
+
+    name = "csw-dcat"
+    display_name = "CSW-DCAT"
+
+    extra_configs = (
+        *BaseCswDcatBackend.extra_configs,
+        HarvestExtraConfig(
+            _("GeoDCAT-AP"),
+            "enable_geodcat",
+            str,
+            _("Request GeoDCAT-AP to the CSW server (must be supported by the server)."),
+        ),
+    )
+
+    @property
+    @override
+    def output_schema(self):
+        if self.get_extra_config_value("enable_geodcat"):
+            return str(GEODCAT)
+        else:
+            return str(DCAT)
+
+    @override
+    def as_dcat(self, tree: PyXdmNode) -> PyXdmNode:
+        return tree
+
+
+class CswIso19139DcatBackend(BaseCswDcatBackend):
     """
     CSW harvester fetching records as ISO-19139 and using XSLT to convert them to DCAT.
-    The parsing of items is then the same as for the DcatBackend.
     """
 
     name = "csw-iso-19139"
     display_name = "CSW-ISO-19139"
 
-    extra_configs = [c for c in CswDcatBackend.extra_configs if c.key != "enable_geodcat"]
-
     def __init__(self, *args, **kwargs):
         super().__init__(*args, **kwargs)
         xslt_url = current_app.config["HARVEST_ISO19139_XSLT_URL"]

From 34ca67ade01f142dfa559e9e6e772186b482a6f0 Mon Sep 17 00:00:00 2001
From: streino <streino@disroot.org>
Date: Wed, 24 Dec 2025 15:15:49 +0100
Subject: [PATCH 04/11] to_bool

---
 udata/harvest/backends/dcat.py | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/udata/harvest/backends/dcat.py b/udata/harvest/backends/dcat.py
index 20296d564c..250aa60fdc 100644
--- a/udata/harvest/backends/dcat.py
+++ b/udata/harvest/backends/dcat.py
@@ -25,6 +25,7 @@
     url_from_rdf,
 )
 from udata.storage.s3 import store_as_json
+from udata.utils import to_bool
 
 from .base import BaseBackend, HarvestExtraConfig
 
@@ -457,7 +458,7 @@ class CswDcatBackend(BaseCswDcatBackend):
     @property
     @override
     def output_schema(self):
-        if self.get_extra_config_value("enable_geodcat"):
+        if to_bool(self.get_extra_config_value("enable_geodcat")):
             return str(GEODCAT)
         else:
             return str(DCAT)

From e917dd01a422dd6e2886369a19fed191fed102e8 Mon Sep 17 00:00:00 2001
From: streino <streino@disroot.org>
Date: Wed, 24 Dec 2025 15:15:31 +0100
Subject: [PATCH 05/11] fixtures cleanup

---
 ...xml => geoide-iso19139-single-dataset.xml} |  0
 ...-page-1.xml => geonetwork-dcat-page-1.xml} |  0
 ...-page-3.xml => geonetwork-dcat-page-3.xml} |  0
 ...-page-5.xml => geonetwork-dcat-page-5.xml} |  0
 ...e-1.xml => geonetwork-iso19139-page-1.xml} |  0
 ...e-3.xml => geonetwork-iso19139-page-3.xml} |  0
 ...e-5.xml => geonetwork-iso19139-page-5.xml} |  0
 udata/harvest/tests/test_dcat_backend.py      | 32 +++++++------------
 8 files changed, 11 insertions(+), 21 deletions(-)
 rename udata/harvest/tests/csw_dcat/{geo-ide_single-dataset.xml => geoide-iso19139-single-dataset.xml} (100%)
 rename udata/harvest/tests/csw_dcat/{geonetworkv4-page-1.xml => geonetwork-dcat-page-1.xml} (100%)
 rename udata/harvest/tests/csw_dcat/{geonetworkv4-page-3.xml => geonetwork-dcat-page-3.xml} (100%)
 rename udata/harvest/tests/csw_dcat/{geonetworkv4-page-5.xml => geonetwork-dcat-page-5.xml} (100%)
 rename udata/harvest/tests/csw_dcat/{geonetwork-iso-page-1.xml => geonetwork-iso19139-page-1.xml} (100%)
 rename udata/harvest/tests/csw_dcat/{geonetwork-iso-page-3.xml => geonetwork-iso19139-page-3.xml} (100%)
 rename udata/harvest/tests/csw_dcat/{geonetwork-iso-page-5.xml => geonetwork-iso19139-page-5.xml} (100%)

diff --git a/udata/harvest/tests/csw_dcat/geo-ide_single-dataset.xml b/udata/harvest/tests/csw_dcat/geoide-iso19139-single-dataset.xml
similarity index 100%
rename from udata/harvest/tests/csw_dcat/geo-ide_single-dataset.xml
rename to udata/harvest/tests/csw_dcat/geoide-iso19139-single-dataset.xml
diff --git a/udata/harvest/tests/csw_dcat/geonetworkv4-page-1.xml b/udata/harvest/tests/csw_dcat/geonetwork-dcat-page-1.xml
similarity index 100%
rename from udata/harvest/tests/csw_dcat/geonetworkv4-page-1.xml
rename to udata/harvest/tests/csw_dcat/geonetwork-dcat-page-1.xml
diff --git a/udata/harvest/tests/csw_dcat/geonetworkv4-page-3.xml b/udata/harvest/tests/csw_dcat/geonetwork-dcat-page-3.xml
similarity index 100%
rename from udata/harvest/tests/csw_dcat/geonetworkv4-page-3.xml
rename to udata/harvest/tests/csw_dcat/geonetwork-dcat-page-3.xml
diff --git a/udata/harvest/tests/csw_dcat/geonetworkv4-page-5.xml b/udata/harvest/tests/csw_dcat/geonetwork-dcat-page-5.xml
similarity index 100%
rename from udata/harvest/tests/csw_dcat/geonetworkv4-page-5.xml
rename to udata/harvest/tests/csw_dcat/geonetwork-dcat-page-5.xml
diff --git a/udata/harvest/tests/csw_dcat/geonetwork-iso-page-1.xml b/udata/harvest/tests/csw_dcat/geonetwork-iso19139-page-1.xml
similarity index 100%
rename from udata/harvest/tests/csw_dcat/geonetwork-iso-page-1.xml
rename to udata/harvest/tests/csw_dcat/geonetwork-iso19139-page-1.xml
diff --git a/udata/harvest/tests/csw_dcat/geonetwork-iso-page-3.xml b/udata/harvest/tests/csw_dcat/geonetwork-iso19139-page-3.xml
similarity index 100%
rename from udata/harvest/tests/csw_dcat/geonetwork-iso-page-3.xml
rename to udata/harvest/tests/csw_dcat/geonetwork-iso19139-page-3.xml
diff --git a/udata/harvest/tests/csw_dcat/geonetwork-iso-page-5.xml b/udata/harvest/tests/csw_dcat/geonetwork-iso19139-page-5.xml
similarity index 100%
rename from udata/harvest/tests/csw_dcat/geonetwork-iso-page-5.xml
rename to udata/harvest/tests/csw_dcat/geonetwork-iso19139-page-5.xml
diff --git a/udata/harvest/tests/test_dcat_backend.py b/udata/harvest/tests/test_dcat_backend.py
index e63eedb353..f91ecc5a70 100644
--- a/udata/harvest/tests/test_dcat_backend.py
+++ b/udata/harvest/tests/test_dcat_backend.py
@@ -966,8 +966,8 @@ def test_connection_errors_are_handled_without_sentry(self, rmock, mocker, excep
 
 @pytest.mark.options(HARVESTER_BACKENDS=["csw*"])
 class CswDcatBackendTest(PytestOnlyDBTestCase):
-    def test_geonetworkv4(self, rmock):
-        url = mock_csw_pagination(rmock, "geonetwork/srv/eng/csw.rdf", "geonetworkv4-page-{}.xml")
+    def test_geonetwork_dcat(self, rmock):
+        url = mock_csw_pagination(rmock, "geonetwork/srv/fre/csw", "geonetwork-dcat-page-{}.xml")
         org = OrganizationFactory()
         source = HarvestSourceFactory(backend="csw-dcat", url=url, organization=org)
 
@@ -1014,7 +1014,7 @@ def test_geonetworkv4(self, rmock):
         assert resource.type == "main"
 
     def test_user_agent_post(self, rmock):
-        url = mock_csw_pagination(rmock, "geonetwork/srv/eng/csw.rdf", "geonetworkv4-page-{}.xml")
+        url = mock_csw_pagination(rmock, "geonetwork/srv/fre/csw", "geonetwork-dcat-page-{}.xml")
         get_mock = rmock.post(url)
         org = OrganizationFactory()
         source = HarvestSourceFactory(backend="csw-dcat", url=url, organization=org)
@@ -1151,14 +1151,7 @@ def test_url_prefix(self, rmock, remote_url_prefix: str):
 
         source = HarvestSourceFactory(
             backend="csw-dcat",
-            config={
-                "extra_configs": [
-                    {
-                        "key": "remote_url_prefix",
-                        "value": remote_url_prefix,
-                    }
-                ]
-            },
+            config={"extra_configs": [{"key": "remote_url_prefix", "value": remote_url_prefix}]},
         )
 
         actions.run(source)
@@ -1191,21 +1184,16 @@ class CswIso19139DcatBackendTest(PytestOnlyDBTestCase):
     def test_geo2france(self, rmock, remote_url_prefix: str):
         with open(os.path.join(CSW_DCAT_FILES_DIR, "XSLT.xml"), "r") as f:
             xslt = f.read()
-        url = mock_csw_pagination(rmock, "geonetwork/srv/eng/csw.rdf", "geonetwork-iso-page-{}.xml")
+        url = mock_csw_pagination(
+            rmock, "geonetwork/srv/fre/csw", "geonetwork-iso19139-page-{}.xml"
+        )
         rmock.get(current_app.config.get("HARVEST_ISO19139_XSLT_URL"), text=xslt)
         org = OrganizationFactory()
         source = HarvestSourceFactory(
             backend="csw-iso-19139",
             url=url,
             organization=org,
-            config={
-                "extra_configs": [
-                    {
-                        "key": "remote_url_prefix",
-                        "value": remote_url_prefix,
-                    }
-                ]
-            },
+            config={"extra_configs": [{"key": "remote_url_prefix", "value": remote_url_prefix}]},
         )
 
         actions.run(source)
@@ -1313,7 +1301,9 @@ def test_geo_ide(self):
 
         with open(os.path.join(CSW_DCAT_FILES_DIR, "XSLT.xml"), "rb") as f:
             xslt = f.read()
-        with open(os.path.join(CSW_DCAT_FILES_DIR, "geo-ide_single-dataset.xml"), "rb") as f:
+        with open(
+            os.path.join(CSW_DCAT_FILES_DIR, "geoide-iso19139-single-dataset.xml"), "rb"
+        ) as f:
             csw = f.read()
 
         # apply xslt transformation manually instead of using the harvest backend since we're only processing one dataset

From ecaa0fe3783d026b1eb886b4c7a6745ea24c8049 Mon Sep 17 00:00:00 2001
From: streino <streino@disroot.org>
Date: Wed, 24 Dec 2025 15:42:41 +0100
Subject: [PATCH 06/11] get_format

---
 udata/harvest/backends/dcat.py | 6 +++++-
 1 file changed, 5 insertions(+), 1 deletion(-)

diff --git a/udata/harvest/backends/dcat.py b/udata/harvest/backends/dcat.py
index 250aa60fdc..555192e7d3 100644
--- a/udata/harvest/backends/dcat.py
+++ b/udata/harvest/backends/dcat.py
@@ -128,7 +128,7 @@ def inner_harvest(self):
         else:
             self.job.data["graphs"] = serialized_graphs
 
-    def get_format(self):
+    def get_format(self) -> str:
         fmt = guess_format(self.source.url)
         # if format can't be guessed from the url
         # we fallback on the declared Content-Type
@@ -367,6 +367,10 @@ def as_dcat(self, tree: PyXdmNode) -> PyXdmNode:
         """
         pass
 
+    @override
+    def get_format(self) -> str:
+        return "xml"
+
     @override
     def walk_graph(self, url: str, fmt: str) -> Generator[tuple[int, Graph], None, None]:
         """

From d861ddd2ba578caf41c2efdaea8487d7f593e9e6 Mon Sep 17 00:00:00 2001
From: streino <streino@disroot.org>
Date: Wed, 24 Dec 2025 15:48:12 +0100
Subject: [PATCH 07/11] wip test geodcat option

---
 .../csw_dcat/geonetwork-geodcatap-page-1.xml  | 314 ++++++++++++++++
 .../csw_dcat/geonetwork-geodcatap-page-3.xml  | 336 ++++++++++++++++++
 .../csw_dcat/geonetwork-geodcatap-page-5.xml  | 330 +++++++++++++++++
 udata/harvest/tests/test_dcat_backend.py      |  20 ++
 4 files changed, 1000 insertions(+)
 create mode 100644 udata/harvest/tests/csw_dcat/geonetwork-geodcatap-page-1.xml
 create mode 100644 udata/harvest/tests/csw_dcat/geonetwork-geodcatap-page-3.xml
 create mode 100644 udata/harvest/tests/csw_dcat/geonetwork-geodcatap-page-5.xml

diff --git a/udata/harvest/tests/csw_dcat/geonetwork-geodcatap-page-1.xml b/udata/harvest/tests/csw_dcat/geonetwork-geodcatap-page-1.xml
new file mode 100644
index 0000000000..00e6ed182a
--- /dev/null
+++ b/udata/harvest/tests/csw_dcat/geonetwork-geodcatap-page-1.xml
@@ -0,0 +1,314 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<csw:GetRecordsResponse xmlns:csw="http://www.opengis.net/cat/csw/2.0.2" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.opengis.net/cat/csw/2.0.2 http://schemas.opengis.net/csw/2.0.2/CSW-discovery.xsd">
+  <csw:SearchStatus timestamp="2025-12-24T14:24:50.840465Z" />
+  <csw:SearchResults numberOfRecordsMatched="169" numberOfRecordsReturned="2" elementSet="brief" nextRecord="3">
+    <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:owl="http://www.w3.org/2002/07/owl#" xmlns:dct="http://purl.org/dc/terms/" xmlns:dcat="http://www.w3.org/ns/dcat#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:vcard="http://www.w3.org/2006/vcard/ns#" xmlns:prov="http://www.w3.org/ns/prov#" xmlns:org="http://www.w3.org/ns/org#" xmlns:pav="http://purl.org/pav/" xmlns:adms="http://www.w3.org/ns/adms#" xmlns:skos="http://www.w3.org/2004/02/skos/core#">
+      <rdf:Description rdf:about="https://www.geo2france.fr/insee/partmenage5ans">
+        <rdf:type rdf:resource="http://www.w3.org/ns/dcat#Dataset" />
+        <dct:type>
+          <skos:Concept rdf:about="http://purl.org/dc/dcmitype/Dataset">
+            <skos:prefLabel>Dataset</skos:prefLabel>
+          </skos:Concept>
+        </dct:type>
+        <geodcatap:resourceType xmlns:geodcatap="http://data.europa.eu/930/" rdf:resource="http://inspire.ec.europa.eu/metadata-codelist/ResourceType/dataset" />
+        <foaf:isPrimaryTopicOf>
+          <rdf:Description rdf:about="04bcec79-5b25-4b16-b635-73115f7456e4">
+            <rdf:type rdf:resource="http://www.w3.org/ns/dcat#CatalogRecord" />
+            <dct:identifier rdf:datatype="http://www.w3.org/2001/XMLSchema#string">04bcec79-5b25-4b16-b635-73115f7456e4</dct:identifier>
+            <dct:modified rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2021-01-25T14:54:30</dct:modified>
+            <dct:title xml:lang="fre">INSEE - Part des ménages présents depuis 5 ans ou plus dans leur logement actuel (2010)</dct:title>
+            <dct:description xml:lang="fre">Part des ménages présents depuis 5 ans ou plus dans leur logement actuel, par "rectangle INSEE" en Région Hauts-de-France. La taille des cercles proportionnels est relative au nombre de ménages. Le nombre de ménages présents depuis 5 ans ou plus dans leur logement actuel est indiqué dans chaque cercle. Le "rectangle" est l'objet élémentaire des données carroyées à 200 mètres de l'INSEE relatives aux ménages (Millésime 2010).</dct:description>
+            <dct:language>
+              <dct:LinguisticSystem rdf:about="http://publications.europa.eu/resource/authority/language/FRA" />
+            </dct:language>
+            <dcat:contactPoint>
+              <rdf:Description>
+                <rdf:type rdf:resource="http://www.w3.org/2006/vcard/ns#Organization" />
+                <vcard:fn>Géo2France</vcard:fn>
+                <vcard:org>
+                  <rdf:Description>
+                    <vcard:organisation-name xml:lang="fre">Géo2France</vcard:organisation-name>
+                  </rdf:Description>
+                </vcard:org>
+                <vcard:hasEmail rdf:resource="mailto:contact@geo2france.fr" />
+              </rdf:Description>
+            </dcat:contactPoint>
+            <dct:conformsTo>
+              <dct:Standard rdf:about="http://data.europa.eu/930/" />
+            </dct:conformsTo>
+            <dct:conformsTo>
+              <dct:Standard rdf:about="http://data.europa.eu/r5r/" />
+            </dct:conformsTo>
+            <foaf:primaryTopic rdf:resource="https://www.geo2france.fr/insee/partmenage5ans" />
+          </rdf:Description>
+        </foaf:isPrimaryTopicOf>
+        <dct:title xml:lang="fre">INSEE - Part des ménages présents depuis 5 ans ou plus dans leur logement actuel (2010)</dct:title>
+        <dct:issued rdf:datatype="http://www.w3.org/2001/XMLSchema#date">2020-09-22</dct:issued>
+        <dct:identifier rdf:datatype="http://www.w3.org/2001/XMLSchema#anyURI">https://www.geo2france.fr/insee/partmenage5ans</dct:identifier>
+        <dct:description xml:lang="fre">Part des ménages présents depuis 5 ans ou plus dans leur logement actuel, par "rectangle INSEE" en Région Hauts-de-France. La taille des cercles proportionnels est relative au nombre de ménages. Le nombre de ménages présents depuis 5 ans ou plus dans leur logement actuel est indiqué dans chaque cercle. Le "rectangle" est l'objet élémentaire des données carroyées à 200 mètres de l'INSEE relatives aux ménages (Millésime 2010).</dct:description>
+        <dcat:contactPoint>
+          <rdf:Description>
+            <rdf:type rdf:resource="http://www.w3.org/2006/vcard/ns#Organization" />
+            <vcard:fn>Géo2France</vcard:fn>
+            <vcard:org>
+              <rdf:Description>
+                <vcard:organisation-name xml:lang="fre">Géo2France</vcard:organisation-name>
+              </rdf:Description>
+            </vcard:org>
+            <vcard:hasEmail rdf:resource="mailto:contact@geo2france.fr" />
+          </rdf:Description>
+        </dcat:contactPoint>
+        <dcat:keyword xml:lang="fre">LOGEMENT</dcat:keyword>
+        <dcat:keyword xml:lang="fre">INSTITUT NATIONAL DE LA STATISTIQUE ET DES ETUDES ECONOMIQUES</dcat:keyword>
+        <dcat:keyword xml:lang="fre">MENAGE</dcat:keyword>
+        <dcat:keyword xml:lang="fre">POPULATION</dcat:keyword>
+        <dcat:keyword xml:lang="fre">INSEE</dcat:keyword>
+        <dcat:keyword xml:lang="fre">DONNEE OUVERTE</dcat:keyword>
+        <dcat:keyword xml:lang="fre">HAUTS-DE-FRANCE</dcat:keyword>
+        <dct:language>
+          <dct:LinguisticSystem rdf:about="http://publications.europa.eu/resource/authority/language/FRA" />
+        </dct:language>
+        <dct:provenance>
+          <dct:ProvenanceStatement>
+            <dct:description xml:lang="fre">Source : données carroyées à 200 mètres de l'INSEE. Mise en ligne et représentation : Géo2France.</dct:description>
+          </dct:ProvenanceStatement>
+        </dct:provenance>
+        <dcat:theme>
+          <skos:Concept rdf:about="http://publications.europa.eu/resource/authority/data-theme/SOCI">
+            <skos:prefLabel xml:lang="fr">Population et société</skos:prefLabel>
+          </skos:Concept>
+        </dcat:theme>
+        <geodcatap:topicCategory xmlns:geodcatap="http://data.europa.eu/930/" rdf:resource="http://inspire.ec.europa.eu/metadata-codelist/TopicCategory/society" />
+        <!--WARNING: Spatial resolution only supported in meters.
+          200 http://standards.iso.org/ittf/PubliclyAvailableStandards/ISO_19139_Schemas/resources/uom/ML_gmxUom.xml#m is ignored (can be related to unknown unit or no
+          conversion factor or not a decimal value).
+        -->
+        <dct:spatial>
+          <rdf:Description>
+            <rdf:type rdf:resource="http://purl.org/dc/terms/Location" />
+            <dcat:bbox rdf:datatype="http://www.opengis.net/ont/geosparql#geoJSONLiteral">{"type":"Polygon","coordinates":[[[1.32898744824151,51.0829997967797],[4.30533171628197,51.0829997967797],[4.30533171628197,48.79422289313],[1.32898744824151,48.79422289313],[1.32898744824151,51.0829997967797]]]}</dcat:bbox>
+          </rdf:Description>
+        </dct:spatial>
+        <foaf:page>
+          <foaf:Document rdf:about="https://www.geo2france.fr/public/vignettes_geonetwork/part_menage_5ans.jpg">
+            <dct:description xml:lang="fre">insee</dct:description>
+          </foaf:Document>
+        </foaf:page>
+        <foaf:page>
+          <foaf:Document rdf:about="https://www.data.gouv.fr/fr/datasets/donnees-carroyees-a-200-m-sur-la-population/">
+            <dct:title xml:lang="fre">Métadonnées INSEE - data.gouv.fr</dct:title>
+          </foaf:Document>
+        </foaf:page>
+        <foaf:page>
+          <foaf:Document rdf:about="https://www.insee.fr/fr/statistiques/2520034">
+            <dct:title xml:lang="fre">insee.fr - données carroyées à 200 mètres</dct:title>
+          </foaf:Document>
+        </foaf:page>
+        <foaf:page>
+          <foaf:Document rdf:about="https://www.google.fr/url?sa=t&amp;rct=j&amp;q=&amp;esrc=s&amp;source=web&amp;cd=2&amp;ved=0ahUKEwiO7-e20qLZAhVE7BQKHWU7DRwQFgg2MAE&amp;url=https%3A%2F%2Fwww.insee.fr%2Ffr%2Fstatistiques%2Ffichier%2F2520034%2Fdonnee-carroyees-documentation-generale.pdf&amp;usg=AOvVaw23DGMDgbpfAt_WkAENe3eG">
+            <dct:title xml:lang="fre">Documentation générale - données carroyées</dct:title>
+            <dct:description xml:lang="fre">Documentation générale - données carroyées</dct:description>
+          </foaf:Document>
+        </foaf:page>
+        <foaf:page>
+          <foaf:Document rdf:about="https://www.insee.fr/fr/statistiques/fichier/2520034/documentation-complete-donnees-a-200m-1.pdf">
+            <dct:title xml:lang="fre">Documentation complète - données carroyées à 200 mètres</dct:title>
+          </foaf:Document>
+        </foaf:page>
+        <dcat:distribution>
+          <dcat:Distribution>
+            <dct:title xml:lang="fre">rectangles_200m_menage_erbm</dct:title>
+            <dct:description xml:lang="fre">INSEE - Part des ménages présents depuis plus de 5 ans</dct:description>
+            <dcat:accessURL rdf:resource="https://www.geo2france.fr/geoserver/insee/ows" />
+            <dcat:accessService>
+              <rdf:Description>
+                <rdf:type rdf:resource="http://www.w3.org/ns/dcat#DataService" />
+                <dct:title xml:lang="fre">rectangles_200m_menage_erbm</dct:title>
+                <dcat:endpointURL rdf:resource="https://www.geo2france.fr/geoserver/insee/ows" />
+                <dct:conformsTo>
+                  <dct:Standard rdf:about="http://www.opengeospatial.org/standards/wms" />
+                </dct:conformsTo>
+              </rdf:Description>
+            </dcat:accessService>
+          </dcat:Distribution>
+        </dcat:distribution>
+        <dcat:distribution>
+          <dcat:Distribution>
+            <dct:title xml:lang="fre">insee:rectangles_200m_menage_erbm</dct:title>
+            <dct:description xml:lang="fre">INSEE - Part des ménages présents depuis plus de 5 ans</dct:description>
+            <dcat:accessURL rdf:resource="https://www.geo2france.fr/geoserver/insee/ows" />
+            <dcat:accessService>
+              <rdf:Description>
+                <rdf:type rdf:resource="http://www.w3.org/ns/dcat#DataService" />
+                <dct:title xml:lang="fre">insee:rectangles_200m_menage_erbm</dct:title>
+                <dcat:endpointURL rdf:resource="https://www.geo2france.fr/geoserver/insee/ows" />
+                <dct:conformsTo>
+                  <dct:Standard rdf:about="http://www.opengeospatial.org/standards/wfs" />
+                </dct:conformsTo>
+              </rdf:Description>
+            </dcat:accessService>
+          </dcat:Distribution>
+        </dcat:distribution>
+      </rdf:Description>
+    </rdf:RDF>
+    <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:owl="http://www.w3.org/2002/07/owl#" xmlns:dct="http://purl.org/dc/terms/" xmlns:dcat="http://www.w3.org/ns/dcat#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:vcard="http://www.w3.org/2006/vcard/ns#" xmlns:prov="http://www.w3.org/ns/prov#" xmlns:org="http://www.w3.org/ns/org#" xmlns:pav="http://purl.org/pav/" xmlns:adms="http://www.w3.org/ns/adms#" xmlns:skos="http://www.w3.org/2004/02/skos/core#">
+      <rdf:Description rdf:about="fr-200053742/2019/limite/bud">
+        <rdf:type rdf:resource="http://www.w3.org/ns/dcat#Dataset" />
+        <dct:type>
+          <skos:Concept rdf:about="http://purl.org/dc/dcmitype/Dataset">
+            <skos:prefLabel>Dataset</skos:prefLabel>
+          </skos:Concept>
+        </dct:type>
+        <geodcatap:resourceType xmlns:geodcatap="http://data.europa.eu/930/" rdf:resource="http://inspire.ec.europa.eu/metadata-codelist/ResourceType/dataset" />
+        <foaf:isPrimaryTopicOf>
+          <rdf:Description rdf:about="06367a09-096c-4db6-a122-52469176d619">
+            <rdf:type rdf:resource="http://www.w3.org/ns/dcat#CatalogRecord" />
+            <dct:identifier rdf:datatype="http://www.w3.org/2001/XMLSchema#string">06367a09-096c-4db6-a122-52469176d619</dct:identifier>
+            <dct:modified rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2024-02-07T17:22:30.529297Z</dct:modified>
+            <dct:title xml:lang="fre">Zonage du bassin urbain à dynamiser (BUD) de la Région Hauts-de-France - (2018-2020)</dct:title>
+            <dct:description xml:lang="fre">Zonage défini par un arrêté de 2018. Les entreprises qui se créent sur les communes du bassin urbain à dynamiser (entre le 1/1/2018 et le 31/12/2020) bénéficient pendant 3 ans d'un régime spécifique d'exonération fiscale. Dans les Hauts-de-France 159 communes du bassin minier sont concernées par ce dispositif.
+Arrêté officiel de classement : https://www.legifrance.gouv.fr/affichTexte.do?cidTexte=JORFTEXT000038436169&amp;categorieLien=id</dct:description>
+            <dct:language>
+              <dct:LinguisticSystem rdf:about="http://publications.europa.eu/resource/authority/language/FRA" />
+            </dct:language>
+            <dct:creator>
+              <rdf:Description>
+                <rdf:type rdf:resource="http://xmlns.com/foaf/0.1/Person" />
+                <rdf:type rdf:resource="http://www.w3.org/ns/prov#Agent" />
+                <foaf:name>Géo2France</foaf:name>
+                <org:memberOf>
+                  <foaf:Organization>
+                    <foaf:name xml:lang="fre">Géo2France</foaf:name>
+                  </foaf:Organization>
+                </org:memberOf>
+                <foaf:workplaceHomepage xml:lang="fre">https://www.geo2france.fr</foaf:workplaceHomepage>
+              </rdf:Description>
+            </dct:creator>
+            <dct:conformsTo>
+              <dct:Standard rdf:about="http://data.europa.eu/930/" />
+            </dct:conformsTo>
+            <dct:conformsTo>
+              <dct:Standard rdf:about="http://data.europa.eu/r5r/" />
+            </dct:conformsTo>
+            <foaf:primaryTopic rdf:resource="fr-200053742/2019/limite/bud" />
+          </rdf:Description>
+        </foaf:isPrimaryTopicOf>
+        <dct:title xml:lang="fre">Zonage du bassin urbain à dynamiser (BUD) de la Région Hauts-de-France - (2018-2020)</dct:title>
+        <dct:issued rdf:datatype="http://www.w3.org/2001/XMLSchema#date">2020-05-28</dct:issued>
+        <dct:identifier rdf:datatype="http://www.w3.org/2001/XMLSchema#string">fr-200053742/2019/limite/bud</dct:identifier>
+        <dct:description xml:lang="fre">Zonage défini par un arrêté de 2018. Les entreprises qui se créent sur les communes du bassin urbain à dynamiser (entre le 1/1/2018 et le 31/12/2020) bénéficient pendant 3 ans d'un régime spécifique d'exonération fiscale. Dans les Hauts-de-France 159 communes du bassin minier sont concernées par ce dispositif.
+Arrêté officiel de classement : https://www.legifrance.gouv.fr/affichTexte.do?cidTexte=JORFTEXT000038436169&amp;categorieLien=id</dct:description>
+        <geodcatap:resourceProvider xmlns:geodcatap="http://data.europa.eu/930/">
+          <rdf:Description>
+            <rdf:type rdf:resource="http://www.w3.org/2006/vcard/ns#Organization" />
+            <vcard:fn>Géo2France</vcard:fn>
+            <vcard:org>
+              <rdf:Description>
+                <vcard:organisation-name xml:lang="fre">Géo2France</vcard:organisation-name>
+              </rdf:Description>
+            </vcard:org>
+            <vcard:hasEmail rdf:resource="mailto:contact@geo2france.fr" />
+          </rdf:Description>
+        </geodcatap:resourceProvider>
+        <dcat:keyword xml:lang="fre">COMMUNE</dcat:keyword>
+        <dcat:keyword xml:lang="fre">BUD</dcat:keyword>
+        <dcat:keyword xml:lang="fre">BASSIN URBAIN A DYNAMISER</dcat:keyword>
+        <dcat:keyword xml:lang="fre">ECONOMIE</dcat:keyword>
+        <dcat:keyword xml:lang="fre">ENTREPRISE</dcat:keyword>
+        <dcat:keyword xml:lang="fre">FISCALITE</dcat:keyword>
+        <dcat:keyword xml:lang="fre">EMPLOI</dcat:keyword>
+        <dcat:keyword xml:lang="fre">AIDE ECONOMIQUE</dcat:keyword>
+        <dcat:keyword xml:lang="fre">BASSIN MINIER</dcat:keyword>
+        <dcat:keyword xml:lang="fre">DONNEE OUVERTE</dcat:keyword>
+        <dcat:keyword xml:lang="fre">ECONOMIE</dcat:keyword>
+        <dcat:keyword xml:lang="fre">Unités administratives</dcat:keyword>
+        <dcat:keyword xml:lang="fre">HAUTS-DE-FRANCE</dcat:keyword>
+        <dcat:keyword xml:lang="fre">PAS-DE-CALAIS</dcat:keyword>
+        <dcat:keyword xml:lang="fre">NORD</dcat:keyword>
+        <dct:rights>
+          <dct:RightsStatement>
+            <dct:description xml:lang="fre">Utilisation libre sous réserve de mentionner la source (a minima le nom du producteur) et la date de sa dernière mise à jour</dct:description>
+          </dct:RightsStatement>
+        </dct:rights>
+        <dct:rights>
+          <dct:RightsStatement>
+            <dct:description xml:lang="fre">Données ouvertes</dct:description>
+          </dct:RightsStatement>
+        </dct:rights>
+        <dct:language>
+          <dct:LinguisticSystem rdf:about="http://publications.europa.eu/resource/authority/language/FRA" />
+        </dct:language>
+        <dct:provenance>
+          <dct:ProvenanceStatement>
+            <dct:description xml:lang="fre">Source CGET
+Communes en bassin urbain à dynamiser (159 communes concernées) avec contours basés sur la BD Topo de l’IGN. (05-2020)</dct:description>
+          </dct:ProvenanceStatement>
+        </dct:provenance>
+        <dcat:theme>
+          <skos:Concept rdf:about="http://publications.europa.eu/resource/authority/data-theme/ECON">
+            <skos:prefLabel xml:lang="fr">Économie et finances</skos:prefLabel>
+          </skos:Concept>
+        </dcat:theme>
+        <geodcatap:topicCategory xmlns:geodcatap="http://data.europa.eu/930/" rdf:resource="http://inspire.ec.europa.eu/metadata-codelist/TopicCategory/economy" />
+        <dct:spatial>
+          <rdf:Description>
+            <rdf:type rdf:resource="http://purl.org/dc/terms/Location" />
+            <dcat:bbox rdf:datatype="http://www.opengis.net/ont/geosparql#geoJSONLiteral">{"type":"Polygon","coordinates":[[[1.365,51.09],[4.086,51.09],[4.086,48.827],[1.365,48.827],[1.365,51.09]]]}</dcat:bbox>
+          </rdf:Description>
+        </dct:spatial>
+        <dct:accrualPeriodicity>
+          <dct:Frequency rdf:about="http://standards.iso.org/iso/19115/resources/Codelists/cat/codelists.xml#asNeeded" />
+        </dct:accrualPeriodicity>
+        <foaf:page>
+          <foaf:Document rdf:about="https://www.geo2france.fr/public/vignettes_geonetwork/bud.jpg">
+            <dct:description xml:lang="fre">bud</dct:description>
+          </foaf:Document>
+        </foaf:page>
+        <dcat:distribution>
+          <dcat:Distribution>
+            <dct:title xml:lang="fre">bassins_urbains_a_dynamiser</dct:title>
+            <dct:description xml:lang="fre">Bassins urbains à dynamiser (BUD)</dct:description>
+            <dcat:accessURL rdf:resource="https://www.geo2france.fr/geoserver/anct/ows" />
+            <dcat:accessService>
+              <rdf:Description>
+                <rdf:type rdf:resource="http://www.w3.org/ns/dcat#DataService" />
+                <dct:title xml:lang="fre">bassins_urbains_a_dynamiser</dct:title>
+                <dcat:endpointURL rdf:resource="https://www.geo2france.fr/geoserver/anct/ows" />
+                <dct:conformsTo>
+                  <dct:Standard rdf:about="http://www.opengeospatial.org/standards/wms" />
+                </dct:conformsTo>
+              </rdf:Description>
+            </dcat:accessService>
+            <dct:format>
+              <dct:MediaTypeOrExtent>
+                <rdfs:label />
+              </dct:MediaTypeOrExtent>
+            </dct:format>
+          </dcat:Distribution>
+        </dcat:distribution>
+        <dcat:distribution>
+          <dcat:Distribution>
+            <dct:title xml:lang="fre">anct:bassins_urbains_a_dynamiser</dct:title>
+            <dct:description xml:lang="fre">Bassins urbains à dynamiser (BUD)</dct:description>
+            <dcat:accessURL rdf:resource="https://www.geo2france.fr/geoserver/anct/ows" />
+            <dcat:accessService>
+              <rdf:Description>
+                <rdf:type rdf:resource="http://www.w3.org/ns/dcat#DataService" />
+                <dct:title xml:lang="fre">anct:bassins_urbains_a_dynamiser</dct:title>
+                <dcat:endpointURL rdf:resource="https://www.geo2france.fr/geoserver/anct/ows" />
+                <dct:conformsTo>
+                  <dct:Standard rdf:about="http://www.opengeospatial.org/standards/wfs" />
+                </dct:conformsTo>
+              </rdf:Description>
+            </dcat:accessService>
+            <dct:format>
+              <dct:MediaTypeOrExtent>
+                <rdfs:label />
+              </dct:MediaTypeOrExtent>
+            </dct:format>
+          </dcat:Distribution>
+        </dcat:distribution>
+      </rdf:Description>
+    </rdf:RDF>
+  </csw:SearchResults>
+</csw:GetRecordsResponse>
diff --git a/udata/harvest/tests/csw_dcat/geonetwork-geodcatap-page-3.xml b/udata/harvest/tests/csw_dcat/geonetwork-geodcatap-page-3.xml
new file mode 100644
index 0000000000..ff267c9ee5
--- /dev/null
+++ b/udata/harvest/tests/csw_dcat/geonetwork-geodcatap-page-3.xml
@@ -0,0 +1,336 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<csw:GetRecordsResponse xmlns:csw="http://www.opengis.net/cat/csw/2.0.2" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.opengis.net/cat/csw/2.0.2 http://schemas.opengis.net/csw/2.0.2/CSW-discovery.xsd">
+  <csw:SearchStatus timestamp="2025-12-24T14:25:19.042962Z" />
+  <csw:SearchResults numberOfRecordsMatched="169" numberOfRecordsReturned="2" elementSet="brief" nextRecord="5">
+    <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:owl="http://www.w3.org/2002/07/owl#" xmlns:dct="http://purl.org/dc/terms/" xmlns:dcat="http://www.w3.org/ns/dcat#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:vcard="http://www.w3.org/2006/vcard/ns#" xmlns:prov="http://www.w3.org/ns/prov#" xmlns:org="http://www.w3.org/ns/org#" xmlns:pav="http://purl.org/pav/" xmlns:adms="http://www.w3.org/ns/adms#" xmlns:skos="http://www.w3.org/2004/02/skos/core#">
+      <rdf:Description rdf:about="https://www.geo2france.fr/risque/catnat2023">
+        <rdf:type rdf:resource="http://www.w3.org/ns/dcat#Dataset" />
+        <dct:type>
+          <skos:Concept rdf:about="http://purl.org/dc/dcmitype/Dataset">
+            <skos:prefLabel>Dataset</skos:prefLabel>
+          </skos:Concept>
+        </dct:type>
+        <geodcatap:resourceType xmlns:geodcatap="http://data.europa.eu/930/" rdf:resource="http://inspire.ec.europa.eu/metadata-codelist/ResourceType/dataset" />
+        <foaf:isPrimaryTopicOf>
+          <rdf:Description rdf:about="093789e0-af10-4861-b661-febdaf543c5c">
+            <rdf:type rdf:resource="http://www.w3.org/ns/dcat#CatalogRecord" />
+            <dct:identifier rdf:datatype="http://www.w3.org/2001/XMLSchema#string">093789e0-af10-4861-b661-febdaf543c5c</dct:identifier>
+            <dct:modified rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2024-08-02T08:54:23.954134Z</dct:modified>
+            <dct:title xml:lang="fre">Communes en état de catastrophe naturelle au 30 novembre 2023</dct:title>
+            <dct:description xml:lang="fre">Communes en état de catastrophe naturelle au 30 novembre 2023, suite aux inondations dans le Pas de Calais et le Nord.</dct:description>
+            <dct:language>
+              <dct:LinguisticSystem rdf:about="http://publications.europa.eu/resource/authority/language/FRA" />
+            </dct:language>
+            <dcat:contactPoint>
+              <rdf:Description>
+                <rdf:type rdf:resource="http://www.w3.org/2006/vcard/ns#Organization" />
+                <vcard:org>
+                  <rdf:Description>
+                    <vcard:organisation-name xml:lang="fre">Géo2France</vcard:organisation-name>
+                  </rdf:Description>
+                </vcard:org>
+                <vcard:hasEmail rdf:resource="mailto:contact@geo2france.fr" />
+              </rdf:Description>
+            </dcat:contactPoint>
+            <dct:conformsTo>
+              <dct:Standard rdf:about="http://data.europa.eu/930/" />
+            </dct:conformsTo>
+            <dct:conformsTo>
+              <dct:Standard rdf:about="http://data.europa.eu/r5r/" />
+            </dct:conformsTo>
+            <foaf:primaryTopic rdf:resource="https://www.geo2france.fr/risque/catnat2023" />
+          </rdf:Description>
+        </foaf:isPrimaryTopicOf>
+        <dct:title xml:lang="fre">Communes en état de catastrophe naturelle au 30 novembre 2023</dct:title>
+        <dct:issued rdf:datatype="http://www.w3.org/2001/XMLSchema#date">2023-11-14</dct:issued>
+        <dct:identifier rdf:datatype="http://www.w3.org/2001/XMLSchema#anyURI">https://www.geo2france.fr/risque/catnat2023</dct:identifier>
+        <dct:description xml:lang="fre">Communes en état de catastrophe naturelle au 30 novembre 2023, suite aux inondations dans le Pas de Calais et le Nord.</dct:description>
+        <adms:status>
+          <skos:Concept rdf:about="http://standards.iso.org/iso/19115/resources/Codelists/cat/codelists.xml#completed">
+            <skos:prefLabel xml:lang="fre">Finalisé</skos:prefLabel>
+          </skos:Concept>
+        </adms:status>
+        <dcat:contactPoint>
+          <rdf:Description>
+            <rdf:type rdf:resource="http://www.w3.org/2006/vcard/ns#Organization" />
+            <vcard:org>
+              <rdf:Description>
+                <vcard:organisation-name xml:lang="fre">Géo2France</vcard:organisation-name>
+              </rdf:Description>
+            </vcard:org>
+            <vcard:hasEmail rdf:resource="mailto:contact@geo2france.fr" />
+          </rdf:Description>
+        </dcat:contactPoint>
+        <dcat:theme>
+          <skos:Concept rdf:about="http://www.eionet.europa.eu/gemet/concept/5496">
+            <skos:prefLabel xml:lang="fre">catastrophe naturelle</skos:prefLabel>
+          </skos:Concept>
+        </dcat:theme>
+        <dcat:theme>
+          <skos:Concept rdf:about="http://www.eionet.europa.eu/gemet/concept/3301">
+            <skos:prefLabel xml:lang="fre">inondation</skos:prefLabel>
+          </skos:Concept>
+        </dcat:theme>
+        <dcat:theme>
+          <skos:Concept rdf:about="https://www.geo2france.fr/geonetwork/thesaurus/theme/granularite_territoriale#8e6dfea9-f3b5-4b8e-9fe0-56ac52be8421">
+            <skos:prefLabel xml:lang="fre">Commune française</skos:prefLabel>
+          </skos:Concept>
+        </dcat:theme>
+        <dcat:keyword xml:lang="fre">catnat</dcat:keyword>
+        <dcat:keyword xml:lang="fre">inondation</dcat:keyword>
+        <dct:accessRights>
+          <dct:RightsStatement rdf:about="http://inspire.ec.europa.eu/metadatacodelist/LimitationsOnPublicAccess/noLimitations" />
+        </dct:accessRights>
+        <dct:rights>
+          <dct:RightsStatement>
+            <dct:description xml:lang="fre">Licence Ouverte version 2.0  https://www.etalab.gouv.fr/wp-content/uploads/2017/04/ETALAB-Licence-Ouverte-v2.0.pdf</dct:description>
+          </dct:RightsStatement>
+        </dct:rights>
+        <dct:language>
+          <dct:LinguisticSystem rdf:about="http://publications.europa.eu/resource/authority/language/FRA" />
+        </dct:language>
+        <dct:provenance>
+          <dct:ProvenanceStatement>
+            <dct:description xml:lang="fre">Limites de communes BD Topo 2023.</dct:description>
+          </dct:ProvenanceStatement>
+        </dct:provenance>
+        <dcat:spatialResolutionInMeters rdf:datatype="http://www.w3.org/2001/XMLSchema#decimal">5</dcat:spatialResolutionInMeters>
+        <dct:spatial>
+          <rdf:Description>
+            <rdf:type rdf:resource="http://purl.org/dc/terms/Location" />
+            <dcat:bbox rdf:datatype="http://www.opengis.net/ont/geosparql#geoJSONLiteral">{"type":"Polygon","coordinates":[[[1.26761534,51.26912631],[3.25154517,51.26912631],[3.25154517,50.25455878],[1.26761534,50.25455878],[1.26761534,51.26912631]]]}</dcat:bbox>
+          </rdf:Description>
+        </dct:spatial>
+        <foaf:page>
+          <foaf:Document rdf:about="https://www.geo2france.fr/geonetwork/srv/api/records/093789e0-af10-4861-b661-febdaf543c5c/attachments/etat.jpg" />
+        </foaf:page>
+        <dcat:distribution>
+          <dcat:Distribution>
+            <dct:title xml:lang="fre">com_catnat_12_2023</dct:title>
+            <dct:description xml:lang="fre">Communes en état de catastrophe naturelle en novembre 2023</dct:description>
+            <dcat:accessURL rdf:resource="https://www.geo2france.fr/geoserver/geo2france/ows" />
+            <dcat:accessService>
+              <rdf:Description>
+                <rdf:type rdf:resource="http://www.w3.org/ns/dcat#DataService" />
+                <dct:title xml:lang="fre">com_catnat_12_2023</dct:title>
+                <dcat:endpointURL rdf:resource="https://www.geo2france.fr/geoserver/geo2france/ows" />
+                <dct:conformsTo>
+                  <dct:Standard rdf:about="http://www.opengeospatial.org/standards/wms" />
+                </dct:conformsTo>
+              </rdf:Description>
+            </dcat:accessService>
+            <dct:format>
+              <dct:MediaTypeOrExtent>
+                <rdfs:label />
+              </dct:MediaTypeOrExtent>
+            </dct:format>
+          </dcat:Distribution>
+        </dcat:distribution>
+        <dcat:distribution>
+          <dcat:Distribution>
+            <dct:title xml:lang="fre">geo2france:com_catnat_12_2023</dct:title>
+            <dct:description xml:lang="fre">Communes en état de catastrophe naturelle en novembre 2023</dct:description>
+            <dcat:accessURL rdf:resource="https://www.geo2france.fr/geoserver/geo2france/ows" />
+            <dcat:accessService>
+              <rdf:Description>
+                <rdf:type rdf:resource="http://www.w3.org/ns/dcat#DataService" />
+                <dct:title xml:lang="fre">geo2france:com_catnat_12_2023</dct:title>
+                <dcat:endpointURL rdf:resource="https://www.geo2france.fr/geoserver/geo2france/ows" />
+                <dct:conformsTo>
+                  <dct:Standard rdf:about="http://www.opengeospatial.org/standards/wfs" />
+                </dct:conformsTo>
+              </rdf:Description>
+            </dcat:accessService>
+            <dct:format>
+              <dct:MediaTypeOrExtent>
+                <rdfs:label />
+              </dct:MediaTypeOrExtent>
+            </dct:format>
+          </dcat:Distribution>
+        </dcat:distribution>
+        <foaf:page>
+          <foaf:Document rdf:about="https://www.legifrance.gouv.fr/download/pdf?id=fjWpqRjSHWc4EcobPZ_03hm68X2PepRiqhRHlZ3xpqA=">
+            <dct:title xml:lang="fre">Arrêté du ministère de l'intérieur</dct:title>
+            <dct:description xml:lang="fre">Liste des 205 communes</dct:description>
+          </foaf:Document>
+        </foaf:page>
+      </rdf:Description>
+    </rdf:RDF>
+    <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:owl="http://www.w3.org/2002/07/owl#" xmlns:dct="http://purl.org/dc/terms/" xmlns:dcat="http://www.w3.org/ns/dcat#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:vcard="http://www.w3.org/2006/vcard/ns#" xmlns:prov="http://www.w3.org/ns/prov#" xmlns:org="http://www.w3.org/ns/org#" xmlns:pav="http://purl.org/pav/" xmlns:adms="http://www.w3.org/ns/adms#" xmlns:skos="http://www.w3.org/2004/02/skos/core#">
+      <rdf:Description rdf:about="0ac1d658-b8ce-4815-975b-1dd401ce01ed">
+        <rdf:type rdf:resource="http://www.w3.org/ns/dcat#Dataset" />
+        <dct:type>
+          <skos:Concept rdf:about="http://purl.org/dc/dcmitype/Dataset">
+            <skos:prefLabel>Dataset</skos:prefLabel>
+          </skos:Concept>
+        </dct:type>
+        <geodcatap:resourceType xmlns:geodcatap="http://data.europa.eu/930/" rdf:resource="http://inspire.ec.europa.eu/metadata-codelist/ResourceType/dataset" />
+        <foaf:isPrimaryTopicOf>
+          <rdf:Description rdf:about="0ac1d658-b8ce-4815-975b-1dd401ce01ed">
+            <rdf:type rdf:resource="http://www.w3.org/ns/dcat#CatalogRecord" />
+            <dct:identifier rdf:datatype="http://www.w3.org/2001/XMLSchema#string">0ac1d658-b8ce-4815-975b-1dd401ce01ed</dct:identifier>
+            <dct:modified rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2024-02-12T15:27:29.272037Z</dct:modified>
+            <dct:title xml:lang="fre">Etablissements d'enseignement</dct:title>
+            <dct:description xml:lang="fre">Liste géolocalisée des établissements d'enseignement des premier et second degrés (tous ministères de tutelle, secteurs public et privé) situés en France. Les établissements concernés sont déterminés selon leur code nature dans la nomenclature de l'éducation nationale. Les codes entre 100 et 199 (premier degré) et entre 300 et 399 (second degré) sont retenus.
+
+Donnée téléchargée quotidiennement depuis data.gouv.fr, découpée sur le territoire de la région Hauts-de-France, et publié par Géo2France.</dct:description>
+            <dct:language>
+              <dct:LinguisticSystem rdf:about="http://publications.europa.eu/resource/authority/language/FRA" />
+            </dct:language>
+            <dcat:contactPoint>
+              <rdf:Description>
+                <rdf:type rdf:resource="http://www.w3.org/2006/vcard/ns#Organization" />
+                <vcard:org>
+                  <rdf:Description>
+                    <vcard:organisation-name xml:lang="fre">Géo2France</vcard:organisation-name>
+                  </rdf:Description>
+                </vcard:org>
+                <vcard:hasEmail rdf:resource="mailto:contact@hautsdefrance.fr" />
+              </rdf:Description>
+            </dcat:contactPoint>
+            <dct:conformsTo>
+              <dct:Standard rdf:about="http://data.europa.eu/930/" />
+            </dct:conformsTo>
+            <dct:conformsTo>
+              <dct:Standard rdf:about="http://data.europa.eu/r5r/" />
+            </dct:conformsTo>
+            <foaf:primaryTopic rdf:resource="0ac1d658-b8ce-4815-975b-1dd401ce01ed" />
+          </rdf:Description>
+        </foaf:isPrimaryTopicOf>
+        <dct:title xml:lang="fre">Etablissements d'enseignement</dct:title>
+        <dct:issued rdf:datatype="http://www.w3.org/2001/XMLSchema#date">2024-02-12</dct:issued>
+        <dct:identifier rdf:datatype="http://www.w3.org/2001/XMLSchema#string">0ac1d658-b8ce-4815-975b-1dd401ce01ed</dct:identifier>
+        <dcat:version>http://localhost:8080/demodem/editioin</dcat:version>
+        <dct:description xml:lang="fre">Liste géolocalisée des établissements d'enseignement des premier et second degrés (tous ministères de tutelle, secteurs public et privé) situés en France. Les établissements concernés sont déterminés selon leur code nature dans la nomenclature de l'éducation nationale. Les codes entre 100 et 199 (premier degré) et entre 300 et 399 (second degré) sont retenus.
+
+Donnée téléchargée quotidiennement depuis data.gouv.fr, découpée sur le territoire de la région Hauts-de-France, et publié par Géo2France.</dct:description>
+        <adms:status>
+          <skos:Concept rdf:about="http://standards.iso.org/iso/19115/resources/Codelists/cat/codelists.xml#onGoing">
+            <skos:prefLabel xml:lang="fre">Mis à jour continue</skos:prefLabel>
+          </skos:Concept>
+        </adms:status>
+        <dcat:contactPoint>
+          <rdf:Description>
+            <rdf:type rdf:resource="http://www.w3.org/2006/vcard/ns#Organization" />
+            <vcard:org>
+              <rdf:Description>
+                <vcard:organisation-name xml:lang="fre">Géo2France</vcard:organisation-name>
+              </rdf:Description>
+            </vcard:org>
+            <vcard:hasEmail rdf:resource="mailto:contact@geo2france.fr" />
+          </rdf:Description>
+        </dcat:contactPoint>
+        <dcat:keyword xml:lang="fre">donnée ouverte</dcat:keyword>
+        <dcat:keyword xml:lang="fre">Services d'utilité publique et services publics</dcat:keyword>
+        <dcat:theme>
+          <skos:Concept rdf:about="http://www.eionet.europa.eu/gemet/concept/2547">
+            <skos:prefLabel xml:lang="fre">éducation</skos:prefLabel>
+          </skos:Concept>
+        </dcat:theme>
+        <dcat:theme>
+          <skos:Concept rdf:about="http://www.eionet.europa.eu/gemet/concept/7470">
+            <skos:prefLabel xml:lang="fre">enseignement scolaire</skos:prefLabel>
+          </skos:Concept>
+        </dcat:theme>
+        <dcat:theme>
+          <skos:Concept rdf:about="https://www.geo2france.fr/geonetwork/thesaurus/theme/granularite_territoriale#dc98ea8f-6002-422f-b6ac-aa90c689d4ed">
+            <skos:prefLabel xml:lang="fre">Point d'intérêt</skos:prefLabel>
+          </skos:Concept>
+        </dcat:theme>
+        <dct:language>
+          <dct:LinguisticSystem rdf:about="http://publications.europa.eu/resource/authority/language/FRA" />
+        </dct:language>
+        <dct:provenance>
+          <dct:ProvenanceStatement>
+            <dct:description xml:lang="fre">Source : RAMSESE. Donnée d'origine publiée sur data.gouv.fr</dct:description>
+          </dct:ProvenanceStatement>
+        </dct:provenance>
+        <dcat:theme>
+          <skos:Concept rdf:about="http://publications.europa.eu/resource/authority/data-theme/AGRI">
+            <skos:prefLabel xml:lang="fr">Agriculture, pêche, sylviculture et alimentation</skos:prefLabel>
+          </skos:Concept>
+        </dcat:theme>
+        <dcat:theme>
+          <skos:Concept rdf:about="http://publications.europa.eu/resource/authority/data-theme/ENVI">
+            <skos:prefLabel xml:lang="fr">Environnement</skos:prefLabel>
+          </skos:Concept>
+        </dcat:theme>
+        <dcat:theme>
+          <skos:Concept rdf:about="http://publications.europa.eu/resource/authority/data-theme/REGI">
+            <skos:prefLabel xml:lang="fr">Régions et villes</skos:prefLabel>
+          </skos:Concept>
+        </dcat:theme>
+        <geodcatap:topicCategory xmlns:geodcatap="http://data.europa.eu/930/" rdf:resource="http://inspire.ec.europa.eu/metadata-codelist/TopicCategory/farming" />
+        <geodcatap:topicCategory xmlns:geodcatap="http://data.europa.eu/930/" rdf:resource="http://inspire.ec.europa.eu/metadata-codelist/TopicCategory/environment" />
+        <geodcatap:topicCategory xmlns:geodcatap="http://data.europa.eu/930/" rdf:resource="http://inspire.ec.europa.eu/metadata-codelist/TopicCategory/inlandWaters" />
+        <geodcatap:topicCategory xmlns:geodcatap="http://data.europa.eu/930/" rdf:resource="http://inspire.ec.europa.eu/metadata-codelist/TopicCategory/imageryBaseMapsEarthCover" />
+        <!--WARNING: Spatial resolution only supported in meters.
+            is ignored (can be related to unknown unit or no
+          conversion factor or not a decimal value).
+        -->
+        <dct:spatial>
+          <rdf:Description>
+            <rdf:type rdf:resource="http://purl.org/dc/terms/Location" />
+            <dcat:bbox rdf:datatype="http://www.opengis.net/ont/geosparql#geoJSONLiteral">{"type":"Polygon","coordinates":[[[1.3802175217118144,51.088989439843324],[4.25583684779586,51.088989439843324],[4.25583684779586,48.83720744013672],[1.3802175217118144,48.83720744013672],[1.3802175217118144,51.088989439843324]]]}</dcat:bbox>
+          </rdf:Description>
+        </dct:spatial>
+        <dct:accrualPeriodicity>
+          <dct:Frequency rdf:about="http://publications.europa.eu/resource/authority/frequency/CONT" />
+        </dct:accrualPeriodicity>
+        <foaf:page>
+          <foaf:Document rdf:about="https://www.geo2france.fr/geonetwork/srv/api/records/0ac1d658-b8ce-4815-975b-1dd401ce01ed/attachments/b572136a0046e59aa6bb77f16e0520-100.png" />
+        </foaf:page>
+        <dcat:distribution>
+          <dcat:Distribution>
+            <dct:title xml:lang="fre">etablissement_enseignement</dct:title>
+            <dct:description xml:lang="fre">Etablissements d'enseignement du premier et second degrés</dct:description>
+            <dcat:accessURL rdf:resource="https://www.geo2france.fr/geoserver/vrt-bot/ows" />
+            <dcat:accessService>
+              <rdf:Description>
+                <rdf:type rdf:resource="http://www.w3.org/ns/dcat#DataService" />
+                <dct:title xml:lang="fre">etablissement_enseignement</dct:title>
+                <dcat:endpointURL rdf:resource="https://www.geo2france.fr/geoserver/vrt-bot/ows" />
+                <dct:conformsTo>
+                  <dct:Standard rdf:about="http://www.opengeospatial.org/standards/wms" />
+                </dct:conformsTo>
+              </rdf:Description>
+            </dcat:accessService>
+            <dct:format>
+              <dct:MediaTypeOrExtent>
+                <rdfs:label />
+              </dct:MediaTypeOrExtent>
+            </dct:format>
+          </dcat:Distribution>
+        </dcat:distribution>
+        <foaf:page>
+          <foaf:Document rdf:about="https://www.data.gouv.fr/fr/datasets/adresse-et-geolocalisation-des-etablissements-denseignement-du-premier-et-second-degres-1/">
+            <dct:title xml:lang="fre">Lien vers la donnée originale sur data.gouv</dct:title>
+            <dct:description xml:lang="fre">jeu de donnée complet</dct:description>
+          </foaf:Document>
+        </foaf:page>
+        <dcat:distribution>
+          <dcat:Distribution>
+            <dct:title xml:lang="fre">vrt-bot:etablissement_enseignement</dct:title>
+            <dct:description xml:lang="fre">Etablissements d'enseignement du premier et second degrés</dct:description>
+            <dcat:accessURL rdf:resource="https://www.geo2france.fr/geoserver/vrt-bot/ows" />
+            <dcat:accessService>
+              <rdf:Description>
+                <rdf:type rdf:resource="http://www.w3.org/ns/dcat#DataService" />
+                <dct:title xml:lang="fre">vrt-bot:etablissement_enseignement</dct:title>
+                <dcat:endpointURL rdf:resource="https://www.geo2france.fr/geoserver/vrt-bot/ows" />
+                <dct:conformsTo>
+                  <dct:Standard rdf:about="http://www.opengeospatial.org/standards/wfs" />
+                </dct:conformsTo>
+              </rdf:Description>
+            </dcat:accessService>
+            <dct:format>
+              <dct:MediaTypeOrExtent>
+                <rdfs:label />
+              </dct:MediaTypeOrExtent>
+            </dct:format>
+          </dcat:Distribution>
+        </dcat:distribution>
+      </rdf:Description>
+    </rdf:RDF>
+  </csw:SearchResults>
+</csw:GetRecordsResponse>
diff --git a/udata/harvest/tests/csw_dcat/geonetwork-geodcatap-page-5.xml b/udata/harvest/tests/csw_dcat/geonetwork-geodcatap-page-5.xml
new file mode 100644
index 0000000000..828f8411bc
--- /dev/null
+++ b/udata/harvest/tests/csw_dcat/geonetwork-geodcatap-page-5.xml
@@ -0,0 +1,330 @@
+<?xml version="1.0" encoding="UTF-8"?>
+<csw:GetRecordsResponse xmlns:csw="http://www.opengis.net/cat/csw/2.0.2" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.opengis.net/cat/csw/2.0.2 http://schemas.opengis.net/csw/2.0.2/CSW-discovery.xsd">
+  <csw:SearchStatus timestamp="2025-12-24T14:25:42.753395Z" />
+  <csw:SearchResults numberOfRecordsMatched="169" numberOfRecordsReturned="2" elementSet="brief" nextRecord="7">
+    <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:owl="http://www.w3.org/2002/07/owl#" xmlns:dct="http://purl.org/dc/terms/" xmlns:dcat="http://www.w3.org/ns/dcat#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:vcard="http://www.w3.org/2006/vcard/ns#" xmlns:prov="http://www.w3.org/ns/prov#" xmlns:org="http://www.w3.org/ns/org#" xmlns:pav="http://purl.org/pav/" xmlns:adms="http://www.w3.org/ns/adms#" xmlns:skos="http://www.w3.org/2004/02/skos/core#">
+      <rdf:Description rdf:about="0ae299e7-10d6-4290-944e-c6c62e2aeabf">
+        <rdf:type rdf:resource="http://www.w3.org/ns/dcat#Dataset" />
+        <dct:type>
+          <skos:Concept rdf:about="http://purl.org/dc/dcmitype/Dataset">
+            <skos:prefLabel>Dataset</skos:prefLabel>
+          </skos:Concept>
+        </dct:type>
+        <geodcatap:resourceType xmlns:geodcatap="http://data.europa.eu/930/" rdf:resource="http://inspire.ec.europa.eu/metadata-codelist/ResourceType/dataset" />
+        <foaf:isPrimaryTopicOf>
+          <rdf:Description rdf:about="0ae299e7-10d6-4290-944e-c6c62e2aeabf">
+            <rdf:type rdf:resource="http://www.w3.org/ns/dcat#CatalogRecord" />
+            <dct:identifier rdf:datatype="http://www.w3.org/2001/XMLSchema#string">0ae299e7-10d6-4290-944e-c6c62e2aeabf</dct:identifier>
+            <dct:modified rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2025-08-21T14:44:26.275862Z</dct:modified>
+            <dct:title xml:lang="fre">Territoires d'exercice de la compétence "Collecte des déchets ménagers"</dct:title>
+            <dct:description xml:lang="fre">L'article L2224-13 du Code général des collectivités territoriales autorise un transfère partiel de la compétence de collecte et de traitement des déchets des ménages. Il est ainsi possible pour les EPCI à fiscalité propre, de ne transférer que la partie de la compétence comprenant le traitement, ou seulement celle comportant la collecte. La gestion des déchetteries étant à l'interface entre la collecte et le traitement, elle peut être rattachée à l'une ou l'autre de ces missions.
+Ainsi, on distingue 3 types de territoires différents : les territoires de collecte, les territoires de traitement, et les territoires de gestion des déchetteries.
+Ces contours ne correspondent pas nécessairement aux contours des EPCI ou syndicats mixtes.</dct:description>
+            <dct:language>
+              <dct:LinguisticSystem rdf:about="http://publications.europa.eu/resource/authority/language/FRA" />
+            </dct:language>
+            <dcat:contactPoint>
+              <rdf:Description>
+                <rdf:type rdf:resource="http://www.w3.org/2006/vcard/ns#Organization" />
+                <vcard:org>
+                  <rdf:Description>
+                    <vcard:organisation-name xml:lang="fre">Géo2France</vcard:organisation-name>
+                  </rdf:Description>
+                </vcard:org>
+                <vcard:hasEmail rdf:resource="mailto:contact@geo2france.fr" />
+              </rdf:Description>
+            </dcat:contactPoint>
+            <dct:conformsTo>
+              <dct:Standard rdf:about="http://data.europa.eu/930/" />
+            </dct:conformsTo>
+            <dct:conformsTo>
+              <dct:Standard rdf:about="http://data.europa.eu/r5r/" />
+            </dct:conformsTo>
+            <foaf:primaryTopic rdf:resource="0ae299e7-10d6-4290-944e-c6c62e2aeabf" />
+          </rdf:Description>
+        </foaf:isPrimaryTopicOf>
+        <dct:title xml:lang="fre">Territoires d'exercice de la compétence "Collecte des déchets ménagers"</dct:title>
+        <dct:issued rdf:datatype="http://www.w3.org/2001/XMLSchema#date">2023</dct:issued>
+        <dct:identifier rdf:datatype="http://www.w3.org/2001/XMLSchema#string">0ae299e7-10d6-4290-944e-c6c62e2aeabf</dct:identifier>
+        <dct:description xml:lang="fre">L'article L2224-13 du Code général des collectivités territoriales autorise un transfère partiel de la compétence de collecte et de traitement des déchets des ménages. Il est ainsi possible pour les EPCI à fiscalité propre, de ne transférer que la partie de la compétence comprenant le traitement, ou seulement celle comportant la collecte. La gestion des déchetteries étant à l'interface entre la collecte et le traitement, elle peut être rattachée à l'une ou l'autre de ces missions.
+Ainsi, on distingue 3 types de territoires différents : les territoires de collecte, les territoires de traitement, et les territoires de gestion des déchetteries.
+Ces contours ne correspondent pas nécessairement aux contours des EPCI ou syndicats mixtes.</dct:description>
+        <adms:status>
+          <skos:Concept rdf:about="http://standards.iso.org/iso/19115/resources/Codelists/cat/codelists.xml#onGoing">
+            <skos:prefLabel xml:lang="fre">Mis à jour continue</skos:prefLabel>
+          </skos:Concept>
+        </adms:status>
+        <dcat:contactPoint>
+          <rdf:Description>
+            <rdf:type rdf:resource="http://www.w3.org/2006/vcard/ns#Organization" />
+            <vcard:org>
+              <rdf:Description>
+                <vcard:organisation-name xml:lang="fre">Odema</vcard:organisation-name>
+              </rdf:Description>
+            </vcard:org>
+            <vcard:hasEmail rdf:resource="mailto:odema@cerdd.org" />
+          </rdf:Description>
+        </dcat:contactPoint>
+        <geodcatap:custodian xmlns:geodcatap="http://data.europa.eu/930/">
+          <rdf:Description>
+            <rdf:type rdf:resource="http://www.w3.org/2006/vcard/ns#Organization" />
+            <vcard:org>
+              <rdf:Description>
+                <vcard:organisation-name xml:lang="fre">Géo2France</vcard:organisation-name>
+              </rdf:Description>
+            </vcard:org>
+            <vcard:hasEmail rdf:resource="mailto:contact@geo2france.fr" />
+          </rdf:Description>
+        </geodcatap:custodian>
+        <dcat:keyword xml:lang="fre">déchets</dcat:keyword>
+        <dcat:keyword xml:lang="fre">déchets assimilés aux ordures ménagères</dcat:keyword>
+        <dcat:keyword xml:lang="fre">collecte des déchets</dcat:keyword>
+        <dcat:theme>
+          <skos:Concept rdf:about="http://geonetwork-opensource.org/administrativeAreaFr#REG_32">
+            <skos:prefLabel xml:lang="fre">Hauts-de-France (Région)</skos:prefLabel>
+          </skos:Concept>
+        </dcat:theme>
+        <dcat:keyword xml:lang="fre">odema</dcat:keyword>
+        <dct:accessRights>
+          <dct:RightsStatement rdf:about="http://inspire.ec.europa.eu/metadatacodelist/LimitationsOnPublicAccess/noLimitations" />
+        </dct:accessRights>
+        <dct:rights>
+          <dct:RightsStatement>
+            <dct:description xml:lang="fre">Licence Ouverte version 2.0  https://www.etalab.gouv.fr/wp-content/uploads/2017/04/ETALAB-Licence-Ouverte-v2.0.pdf</dct:description>
+          </dct:RightsStatement>
+        </dct:rights>
+        <dct:language>
+          <dct:LinguisticSystem rdf:about="http://publications.europa.eu/resource/authority/language/FRA" />
+        </dct:language>
+        <dct:provenance>
+          <dct:ProvenanceStatement>
+            <dct:description xml:lang="fre">Consolidation des informations Sinoe, avec veille locale de l'Observatoire déchets-matières des Hauts-de-France (Odema).</dct:description>
+          </dct:ProvenanceStatement>
+        </dct:provenance>
+        <dct:spatial>
+          <rdf:Description>
+            <rdf:type rdf:resource="http://purl.org/dc/terms/Location" />
+            <dcat:bbox rdf:datatype="http://www.opengis.net/ont/geosparql#geoJSONLiteral">{"type":"Polygon","coordinates":[[[1.3802175217118144,51.088989439843324],[4.25583684779586,51.088989439843324],[4.25583684779586,48.83720744013672],[1.3802175217118144,48.83720744013672],[1.3802175217118144,51.088989439843324]]]}</dcat:bbox>
+          </rdf:Description>
+        </dct:spatial>
+        <dct:accrualPeriodicity>
+          <dct:Frequency rdf:about="http://publications.europa.eu/resource/authority/frequency/ANNUAL" />
+        </dct:accrualPeriodicity>
+        <foaf:page>
+          <foaf:Document rdf:about="https://www.geo2france.fr/geonetwork/srv/api/records/0ae299e7-10d6-4290-944e-c6c62e2aeabf/attachments/Capture%20d%E2%80%99%C3%A9cran%20du%202024-08-09%2014-00-43.png" />
+        </foaf:page>
+        <dcat:distribution>
+          <dcat:Distribution>
+            <dct:title xml:lang="fre">territoires_collecte</dct:title>
+            <dct:description xml:lang="fre">Territoires de collecte</dct:description>
+            <dcat:accessURL rdf:resource="https://www.geo2france.fr/geoserver/odema/ows" />
+            <dcat:accessService>
+              <rdf:Description>
+                <rdf:type rdf:resource="http://www.w3.org/ns/dcat#DataService" />
+                <dct:title xml:lang="fre">territoires_collecte</dct:title>
+                <dcat:endpointURL rdf:resource="https://www.geo2france.fr/geoserver/odema/ows" />
+                <dct:conformsTo>
+                  <dct:Standard rdf:about="http://www.opengeospatial.org/standards/wms" />
+                </dct:conformsTo>
+              </rdf:Description>
+            </dcat:accessService>
+          </dcat:Distribution>
+        </dcat:distribution>
+        <dcat:distribution>
+          <dcat:Distribution>
+            <dct:title xml:lang="fre">odema:territoires_collecte</dct:title>
+            <dcat:accessURL rdf:resource="https://www.geo2france.fr/geoserver/odema/ows" />
+            <dcat:accessService>
+              <rdf:Description>
+                <rdf:type rdf:resource="http://www.w3.org/ns/dcat#DataService" />
+                <dct:title xml:lang="fre">odema:territoires_collecte</dct:title>
+                <dcat:endpointURL rdf:resource="https://www.geo2france.fr/geoserver/odema/ows" />
+                <dct:conformsTo>
+                  <dct:Standard rdf:about="http://www.opengeospatial.org/standards/wfs" />
+                </dct:conformsTo>
+              </rdf:Description>
+            </dcat:accessService>
+          </dcat:Distribution>
+        </dcat:distribution>
+        <foaf:page>
+          <foaf:Document rdf:about="https://www.geo2france.fr/mviewer/?config=apps/odema/obs_dechet.xml">
+            <dct:title xml:lang="fre">Visionneuse cartographique Odema</dct:title>
+          </foaf:Document>
+        </foaf:page>
+      </rdf:Description>
+    </rdf:RDF>
+    <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:owl="http://www.w3.org/2002/07/owl#" xmlns:dct="http://purl.org/dc/terms/" xmlns:dcat="http://www.w3.org/ns/dcat#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:vcard="http://www.w3.org/2006/vcard/ns#" xmlns:prov="http://www.w3.org/ns/prov#" xmlns:org="http://www.w3.org/ns/org#" xmlns:pav="http://purl.org/pav/" xmlns:adms="http://www.w3.org/ns/adms#" xmlns:skos="http://www.w3.org/2004/02/skos/core#">
+      <rdf:Description rdf:about="fr-200053742/2022/societe/plage_sans_plastique">
+        <rdf:type rdf:resource="http://www.w3.org/ns/dcat#Dataset" />
+        <dct:type>
+          <skos:Concept rdf:about="http://purl.org/dc/dcmitype/Dataset">
+            <skos:prefLabel>Dataset</skos:prefLabel>
+          </skos:Concept>
+        </dct:type>
+        <geodcatap:resourceType xmlns:geodcatap="http://data.europa.eu/930/" rdf:resource="http://inspire.ec.europa.eu/metadata-codelist/ResourceType/dataset" />
+        <foaf:isPrimaryTopicOf>
+          <rdf:Description rdf:about="0c232513-cb8c-473a-bbdd-8435eb3987cc">
+            <rdf:type rdf:resource="http://www.w3.org/ns/dcat#CatalogRecord" />
+            <dct:identifier rdf:datatype="http://www.w3.org/2001/XMLSchema#string">0c232513-cb8c-473a-bbdd-8435eb3987cc</dct:identifier>
+            <dct:modified rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2023-04-26T07:40:35</dct:modified>
+            <dct:title xml:lang="fre">Plages sans plastique en Hauts-de-France en 2022</dct:title>
+            <dct:description xml:lang="fre">Localisation des plages en région Hauts-de-France signataires de la charte d'engagement nationale "plages sans déchets plastique"
+Dernière données disponibles au 01/07/2022
+Plus de renseignements : https://www.ecologie.gouv.fr/plages-sans-dechet-plastique-charte-communes-eco-exemplaires</dct:description>
+            <dct:language>
+              <dct:LinguisticSystem rdf:about="http://publications.europa.eu/resource/authority/language/FRA" />
+            </dct:language>
+            <dcat:contactPoint>
+              <rdf:Description>
+                <rdf:type rdf:resource="http://www.w3.org/2006/vcard/ns#Organization" />
+                <vcard:org>
+                  <rdf:Description>
+                    <vcard:organisation-name xml:lang="fre">Région Hauts-de-France</vcard:organisation-name>
+                  </rdf:Description>
+                </vcard:org>
+                <vcard:hasEmail rdf:resource="mailto:sig@hautsdefrance.fr" />
+              </rdf:Description>
+            </dcat:contactPoint>
+            <dct:conformsTo>
+              <dct:Standard rdf:about="http://data.europa.eu/930/" />
+            </dct:conformsTo>
+            <dct:conformsTo>
+              <dct:Standard rdf:about="http://data.europa.eu/r5r/" />
+            </dct:conformsTo>
+            <foaf:primaryTopic rdf:resource="fr-200053742/2022/societe/plage_sans_plastique" />
+          </rdf:Description>
+        </foaf:isPrimaryTopicOf>
+        <dct:title xml:lang="fre">Plages sans plastique en Hauts-de-France en 2022</dct:title>
+        <dct:issued rdf:datatype="http://www.w3.org/2001/XMLSchema#date">2022-10-17</dct:issued>
+        <dct:modified rdf:datatype="http://www.w3.org/2001/XMLSchema#date">2023-02-15</dct:modified>
+        <dct:identifier rdf:datatype="http://www.w3.org/2001/XMLSchema#string">fr-200053742/2022/societe/plage_sans_plastique</dct:identifier>
+        <dct:description xml:lang="fre">Localisation des plages en région Hauts-de-France signataires de la charte d'engagement nationale "plages sans déchets plastique"
+Dernière données disponibles au 01/07/2022
+Plus de renseignements : https://www.ecologie.gouv.fr/plages-sans-dechet-plastique-charte-communes-eco-exemplaires</dct:description>
+        <adms:status>
+          <skos:Concept rdf:about="http://standards.iso.org/iso/19115/resources/Codelists/cat/codelists.xml#completed">
+            <skos:prefLabel xml:lang="fre">Finalisé</skos:prefLabel>
+          </skos:Concept>
+        </adms:status>
+        <dcat:contactPoint>
+          <rdf:Description>
+            <rdf:type rdf:resource="http://www.w3.org/2006/vcard/ns#Organization" />
+            <vcard:org>
+              <rdf:Description>
+                <vcard:organisation-name xml:lang="fre">Géo2France</vcard:organisation-name>
+              </rdf:Description>
+            </vcard:org>
+            <vcard:hasEmail rdf:resource="mailto:contact@geo2france.fr" />
+          </rdf:Description>
+        </dcat:contactPoint>
+        <dcat:keyword xml:lang="fre">SOCIETE</dcat:keyword>
+        <dcat:keyword xml:lang="fre">DECHET</dcat:keyword>
+        <dcat:keyword xml:lang="fre">PLAGE</dcat:keyword>
+        <dcat:keyword xml:lang="fre">PARLEMENT DE LA MER</dcat:keyword>
+        <dcat:keyword xml:lang="fre">ENVIRONNEMENT</dcat:keyword>
+        <dcat:keyword xml:lang="fre">PLASTIQUE</dcat:keyword>
+        <dcat:keyword xml:lang="fre">ECOLOGIE</dcat:keyword>
+        <dcat:keyword xml:lang="fre">LABEL ACCUEIL QUALITE BIEN-ETRE</dcat:keyword>
+        <dcat:keyword xml:lang="fre">DONNEE OUVERTE</dcat:keyword>
+        <dcat:keyword xml:lang="fre">Services d'utilité publique et services publics</dcat:keyword>
+        <dcat:keyword xml:lang="fre">HAUTS-DE-FRANCE</dcat:keyword>
+        <dcat:keyword xml:lang="fre">PAS-DE-CALAIS</dcat:keyword>
+        <dct:rights>
+          <dct:RightsStatement>
+            <dct:description xml:lang="fre">Utilisation libre sous réserve de mentionner la source (a minima le nom du producteur) et la date de sa dernière mise à jour</dct:description>
+          </dct:RightsStatement>
+        </dct:rights>
+        <dct:rights>
+          <dct:RightsStatement>
+            <dct:description xml:lang="fre">Données ouvertes</dct:description>
+          </dct:RightsStatement>
+        </dct:rights>
+        <dct:language>
+          <dct:LinguisticSystem rdf:about="http://publications.europa.eu/resource/authority/language/FRA" />
+        </dct:language>
+        <dct:provenance>
+          <dct:ProvenanceStatement>
+            <dct:description xml:lang="fre">Données Ministère de la transition écologique et solidaire
+BD TOPO. 2020-11</dct:description>
+          </dct:ProvenanceStatement>
+        </dct:provenance>
+        <dcat:theme>
+          <skos:Concept rdf:about="http://publications.europa.eu/resource/authority/data-theme/SOCI">
+            <skos:prefLabel xml:lang="fr">Population et société</skos:prefLabel>
+          </skos:Concept>
+        </dcat:theme>
+        <geodcatap:topicCategory xmlns:geodcatap="http://data.europa.eu/930/" rdf:resource="http://inspire.ec.europa.eu/metadata-codelist/TopicCategory/society" />
+        <dct:spatial>
+          <rdf:Description>
+            <rdf:type rdf:resource="http://purl.org/dc/terms/Location" />
+            <dcat:bbox rdf:datatype="http://www.opengis.net/ont/geosparql#geoJSONLiteral">{"type":"Polygon","coordinates":[[[1.36,51.0911],[4.086,51.0911],[4.086,48.827],[1.36,48.827],[1.36,51.0911]]]}</dcat:bbox>
+          </rdf:Description>
+        </dct:spatial>
+        <dct:accrualPeriodicity>
+          <dct:Frequency rdf:about="http://standards.iso.org/iso/19115/resources/Codelists/cat/codelists.xml#asNeeded" />
+        </dct:accrualPeriodicity>
+        <foaf:page>
+          <foaf:Document rdf:about="https://sig.hautsdefrance.fr/ext/vignettes_metadonnees/sans_plastique.jpg" />
+        </foaf:page>
+        <foaf:page>
+          <foaf:Document rdf:about="https://qgisserver.hautsdefrance.fr/cgi-bin/qgis_mapserv.fcgi?MAP=/var/www/data/qgis/applications/parlement_mer.qgz&amp;request=GetFeature&amp;typename=plage_sans_plastique&amp;outputformat=csv&amp;service=WFS">
+            <dct:title xml:lang="fre">Tableau de données (csv)</dct:title>
+            <dct:description xml:lang="fre">Données brutes au format Csv (Plage sans plastique) et encodage UTF-8</dct:description>
+          </foaf:Document>
+        </foaf:page>
+        <dcat:distribution>
+          <dcat:Distribution>
+            <dct:title xml:lang="fre">plage_sans_plastique</dct:title>
+            <dct:description xml:lang="fre">plage sans plastique</dct:description>
+            <dcat:accessURL rdf:resource="https://qgisserver.hautsdefrance.fr/cgi-bin/qgis_mapserv.fcgi?MAP=/var/www/data/qgis/applications/parlement_mer.qgz" />
+            <dcat:accessService>
+              <rdf:Description>
+                <rdf:type rdf:resource="http://www.w3.org/ns/dcat#DataService" />
+                <dct:title xml:lang="fre">plage_sans_plastique</dct:title>
+                <dcat:endpointURL rdf:resource="https://qgisserver.hautsdefrance.fr/cgi-bin/qgis_mapserv.fcgi?MAP=/var/www/data/qgis/applications/parlement_mer.qgz" />
+                <dct:conformsTo>
+                  <dct:Standard rdf:about="http://www.opengeospatial.org/standards/wms" />
+                </dct:conformsTo>
+              </rdf:Description>
+            </dcat:accessService>
+          </dcat:Distribution>
+        </dcat:distribution>
+        <dcat:distribution>
+          <dcat:Distribution>
+            <dct:title xml:lang="fre">plage_sans_plastique</dct:title>
+            <dct:description xml:lang="fre">plage sans plastique</dct:description>
+            <dcat:accessURL rdf:resource="https://qgisserver.hautsdefrance.fr/cgi-bin/qgis_mapserv.fcgi?MAP=/var/www/data/qgis/applications/parlement_mer.qgz" />
+            <dcat:accessService>
+              <rdf:Description>
+                <rdf:type rdf:resource="http://www.w3.org/ns/dcat#DataService" />
+                <dct:title xml:lang="fre">plage_sans_plastique</dct:title>
+                <dcat:endpointURL rdf:resource="https://qgisserver.hautsdefrance.fr/cgi-bin/qgis_mapserv.fcgi?MAP=/var/www/data/qgis/applications/parlement_mer.qgz" />
+                <dct:conformsTo>
+                  <dct:Standard rdf:about="http://www.opengeospatial.org/standards/wfs" />
+                </dct:conformsTo>
+              </rdf:Description>
+            </dcat:accessService>
+          </dcat:Distribution>
+        </dcat:distribution>
+        <foaf:page>
+          <foaf:Document rdf:about="https://qgisserver.hautsdefrance.fr/cgi-bin/qgis_mapserv.fcgi?MAP=/var/www/data/qgis/applications/parlement_mer.qgz&amp;request=GetFeature&amp;typename=plage_sans_plastique&amp;outputformat=geojson&amp;service=WFS">
+            <dct:title xml:lang="fre">geojson</dct:title>
+            <dct:description xml:lang="fre">Données format Geojson (plage sans plastique)</dct:description>
+          </foaf:Document>
+        </foaf:page>
+        <foaf:page>
+          <foaf:Document rdf:about="https://qgisserver.hautsdefrance.fr/cgi-bin/qgis_mapserv.fcgi?MAP=/var/www/data/qgis/applications/parlement_mer.qgz&amp;request=GetFeature&amp;typename=plage_sans_plastique&amp;outputformat=SHP&amp;service=WFS">
+            <dct:title xml:lang="fre">Label Plage sans plastique (shapefile)</dct:title>
+            <dct:description xml:lang="fre">Données format Shapefile Plage sans plastique</dct:description>
+          </foaf:Document>
+        </foaf:page>
+        <foaf:page>
+          <foaf:Document rdf:about="https://sig.hautsdefrance.fr/ext/mv/?x=703407&amp;y=6995164&amp;z=9&amp;l=plage_sans_plastique*plage_sans_plastique&amp;lb=osmgp2&amp;config=apps/parlement_mer.xml&amp;mode=d">
+            <dct:title xml:lang="fre">Visualisation de la donnée</dct:title>
+            <dct:description xml:lang="fre">Visionneuse cartographique Plages sans plastique</dct:description>
+          </foaf:Document>
+        </foaf:page>
+      </rdf:Description>
+    </rdf:RDF>
+  </csw:SearchResults>
+</csw:GetRecordsResponse>
diff --git a/udata/harvest/tests/test_dcat_backend.py b/udata/harvest/tests/test_dcat_backend.py
index f91ecc5a70..0ee016305c 100644
--- a/udata/harvest/tests/test_dcat_backend.py
+++ b/udata/harvest/tests/test_dcat_backend.py
@@ -1013,6 +1013,26 @@ def test_geonetwork_dcat(self, rmock):
         assert resource.format == "ogc:wms"
         assert resource.type == "main"
 
+    def test_geonetwork_geodcatap(self, rmock):
+        url = mock_csw_pagination(
+            rmock, "geonetwork/srv/fre/csw", "geonetwork-geodcatap-page-{}.xml"
+        )
+        source = HarvestSourceFactory(
+            backend="csw-dcat",
+            url=url,
+            config={"extra_configs": [{"key": "enable_geodcat", "value": "true"}]},
+        )
+
+        actions.run(source)
+        source.reload()
+
+        job = source.get_last_job()
+        assert len(job.items) == 6
+
+        # TODO
+        # datasets = {d.harvest.dct_identifier: d for d in Dataset.objects}
+        # assert len(datasets) == 6
+
     def test_user_agent_post(self, rmock):
         url = mock_csw_pagination(rmock, "geonetwork/srv/fre/csw", "geonetwork-dcat-page-{}.xml")
         get_mock = rmock.post(url)

From b5f7a82ae7a05d7594c926fdb582712fce8b1503 Mon Sep 17 00:00:00 2001
From: streino <streino@disroot.org>
Date: Fri, 26 Dec 2025 12:17:46 +0100
Subject: [PATCH 08/11] check output_schema

---
 udata/harvest/tests/test_dcat_backend.py | 11 ++++++++++-
 1 file changed, 10 insertions(+), 1 deletion(-)

diff --git a/udata/harvest/tests/test_dcat_backend.py b/udata/harvest/tests/test_dcat_backend.py
index 0ee016305c..116ddb400e 100644
--- a/udata/harvest/tests/test_dcat_backend.py
+++ b/udata/harvest/tests/test_dcat_backend.py
@@ -15,6 +15,8 @@
 from udata.core.dataset.factories import DatasetFactory, LicenseFactory, ResourceSchemaMockData
 from udata.core.dataset.rdf import dataset_from_rdf
 from udata.core.organization.factories import OrganizationFactory
+from udata.harvest.backends import get_backend
+from udata.harvest.backends.dcat import CswDcatBackend
 from udata.harvest.models import HarvestJob
 from udata.models import Dataset
 from udata.rdf import DCAT, RDF, namespace_manager
@@ -971,8 +973,11 @@ def test_geonetwork_dcat(self, rmock):
         org = OrganizationFactory()
         source = HarvestSourceFactory(backend="csw-dcat", url=url, organization=org)
 
-        actions.run(source)
+        backend = get_backend(source.backend)(source)
+        assert isinstance(backend, CswDcatBackend)
+        assert backend.output_schema == "http://www.w3.org/ns/dcat#"
 
+        actions.run(source)
         source.reload()
 
         job = source.get_last_job()
@@ -1023,6 +1028,10 @@ def test_geonetwork_geodcatap(self, rmock):
             config={"extra_configs": [{"key": "enable_geodcat", "value": "true"}]},
         )
 
+        backend = get_backend(source.backend)(source)
+        assert isinstance(backend, CswDcatBackend)
+        assert backend.output_schema == "http://data.europa.eu/930/"
+
         actions.run(source)
         source.reload()
 

From 79a69a88fbdf714a76edf9eb97921da01c58ac10 Mon Sep 17 00:00:00 2001
From: streino <streino@disroot.org>
Date: Fri, 26 Dec 2025 14:33:52 +0100
Subject: [PATCH 09/11] complete test

---
 .../csw_dcat/geonetwork-geodcatap-page-1.xml  |  4 +--
 .../csw_dcat/geonetwork-geodcatap-page-3.xml  |  4 +--
 .../csw_dcat/geonetwork-geodcatap-page-5.xml  |  4 +--
 udata/harvest/tests/test_dcat_backend.py      | 35 +++++++++++++++++--
 4 files changed, 38 insertions(+), 9 deletions(-)

diff --git a/udata/harvest/tests/csw_dcat/geonetwork-geodcatap-page-1.xml b/udata/harvest/tests/csw_dcat/geonetwork-geodcatap-page-1.xml
index 00e6ed182a..3ab9370cb0 100644
--- a/udata/harvest/tests/csw_dcat/geonetwork-geodcatap-page-1.xml
+++ b/udata/harvest/tests/csw_dcat/geonetwork-geodcatap-page-1.xml
@@ -1,7 +1,7 @@
 <?xml version="1.0" encoding="UTF-8"?>
 <csw:GetRecordsResponse xmlns:csw="http://www.opengis.net/cat/csw/2.0.2" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.opengis.net/cat/csw/2.0.2 http://schemas.opengis.net/csw/2.0.2/CSW-discovery.xsd">
-  <csw:SearchStatus timestamp="2025-12-24T14:24:50.840465Z" />
-  <csw:SearchResults numberOfRecordsMatched="169" numberOfRecordsReturned="2" elementSet="brief" nextRecord="3">
+  <csw:SearchStatus timestamp="2025-12-26T13:29:35.473635Z" />
+  <csw:SearchResults numberOfRecordsMatched="6" numberOfRecordsReturned="2" elementSet="full" nextRecord="3">
     <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:owl="http://www.w3.org/2002/07/owl#" xmlns:dct="http://purl.org/dc/terms/" xmlns:dcat="http://www.w3.org/ns/dcat#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:vcard="http://www.w3.org/2006/vcard/ns#" xmlns:prov="http://www.w3.org/ns/prov#" xmlns:org="http://www.w3.org/ns/org#" xmlns:pav="http://purl.org/pav/" xmlns:adms="http://www.w3.org/ns/adms#" xmlns:skos="http://www.w3.org/2004/02/skos/core#">
       <rdf:Description rdf:about="https://www.geo2france.fr/insee/partmenage5ans">
         <rdf:type rdf:resource="http://www.w3.org/ns/dcat#Dataset" />
diff --git a/udata/harvest/tests/csw_dcat/geonetwork-geodcatap-page-3.xml b/udata/harvest/tests/csw_dcat/geonetwork-geodcatap-page-3.xml
index ff267c9ee5..e8e253271c 100644
--- a/udata/harvest/tests/csw_dcat/geonetwork-geodcatap-page-3.xml
+++ b/udata/harvest/tests/csw_dcat/geonetwork-geodcatap-page-3.xml
@@ -1,7 +1,7 @@
 <?xml version="1.0" encoding="UTF-8"?>
 <csw:GetRecordsResponse xmlns:csw="http://www.opengis.net/cat/csw/2.0.2" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.opengis.net/cat/csw/2.0.2 http://schemas.opengis.net/csw/2.0.2/CSW-discovery.xsd">
-  <csw:SearchStatus timestamp="2025-12-24T14:25:19.042962Z" />
-  <csw:SearchResults numberOfRecordsMatched="169" numberOfRecordsReturned="2" elementSet="brief" nextRecord="5">
+  <csw:SearchStatus timestamp="2025-12-26T13:31:46.10218Z" />
+  <csw:SearchResults numberOfRecordsMatched="6" numberOfRecordsReturned="2" elementSet="full" nextRecord="5">
     <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:owl="http://www.w3.org/2002/07/owl#" xmlns:dct="http://purl.org/dc/terms/" xmlns:dcat="http://www.w3.org/ns/dcat#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:vcard="http://www.w3.org/2006/vcard/ns#" xmlns:prov="http://www.w3.org/ns/prov#" xmlns:org="http://www.w3.org/ns/org#" xmlns:pav="http://purl.org/pav/" xmlns:adms="http://www.w3.org/ns/adms#" xmlns:skos="http://www.w3.org/2004/02/skos/core#">
       <rdf:Description rdf:about="https://www.geo2france.fr/risque/catnat2023">
         <rdf:type rdf:resource="http://www.w3.org/ns/dcat#Dataset" />
diff --git a/udata/harvest/tests/csw_dcat/geonetwork-geodcatap-page-5.xml b/udata/harvest/tests/csw_dcat/geonetwork-geodcatap-page-5.xml
index 828f8411bc..3a22ab95d4 100644
--- a/udata/harvest/tests/csw_dcat/geonetwork-geodcatap-page-5.xml
+++ b/udata/harvest/tests/csw_dcat/geonetwork-geodcatap-page-5.xml
@@ -1,7 +1,7 @@
 <?xml version="1.0" encoding="UTF-8"?>
 <csw:GetRecordsResponse xmlns:csw="http://www.opengis.net/cat/csw/2.0.2" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.opengis.net/cat/csw/2.0.2 http://schemas.opengis.net/csw/2.0.2/CSW-discovery.xsd">
-  <csw:SearchStatus timestamp="2025-12-24T14:25:42.753395Z" />
-  <csw:SearchResults numberOfRecordsMatched="169" numberOfRecordsReturned="2" elementSet="brief" nextRecord="7">
+  <csw:SearchStatus timestamp="2025-12-26T13:32:33.469059Z" />
+  <csw:SearchResults numberOfRecordsMatched="6" numberOfRecordsReturned="2" elementSet="full" nextRecord="0">
     <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:owl="http://www.w3.org/2002/07/owl#" xmlns:dct="http://purl.org/dc/terms/" xmlns:dcat="http://www.w3.org/ns/dcat#" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:vcard="http://www.w3.org/2006/vcard/ns#" xmlns:prov="http://www.w3.org/ns/prov#" xmlns:org="http://www.w3.org/ns/org#" xmlns:pav="http://purl.org/pav/" xmlns:adms="http://www.w3.org/ns/adms#" xmlns:skos="http://www.w3.org/2004/02/skos/core#">
       <rdf:Description rdf:about="0ae299e7-10d6-4290-944e-c6c62e2aeabf">
         <rdf:type rdf:resource="http://www.w3.org/ns/dcat#Dataset" />
diff --git a/udata/harvest/tests/test_dcat_backend.py b/udata/harvest/tests/test_dcat_backend.py
index 116ddb400e..5128743324 100644
--- a/udata/harvest/tests/test_dcat_backend.py
+++ b/udata/harvest/tests/test_dcat_backend.py
@@ -1038,9 +1038,38 @@ def test_geonetwork_geodcatap(self, rmock):
         job = source.get_last_job()
         assert len(job.items) == 6
 
-        # TODO
-        # datasets = {d.harvest.dct_identifier: d for d in Dataset.objects}
-        # assert len(datasets) == 6
+        datasets = {d.harvest.dct_identifier: d for d in Dataset.objects}
+        assert len(datasets) == 6
+
+        # First dataset
+        dataset = datasets["https://www.geo2france.fr/insee/partmenage5ans"]
+        assert (
+            dataset.title
+            == "INSEE - Part des ménages présents depuis 5 ans ou plus dans leur logement actuel (2010)"
+        )
+        assert dataset.description.startswith(
+            "Part des ménages présents depuis 5 ans ou plus dans leur logement actuel"
+        )
+        assert set(dataset.tags) == set(
+            [
+                "logement",
+                "institut-national-de-la-statistique-et-des-etudes-economiques",
+                "menage",
+                "population",
+                "insee",
+                "donnee-ouverte",
+                "hauts-de-france",
+                "population-et-societe",
+            ]
+        )
+        assert dataset.harvest.issued_at.date() == date(2020, 9, 22)
+        assert dataset.harvest.created_at is None
+        # FIXME: len(resources) should be 2 but they have the same url => last wins
+        assert len(dataset.resources) == 1
+        resource = dataset.resources[0]
+        assert resource.title == "insee:rectangles_200m_menage_erbm"
+        assert resource.url == "https://www.geo2france.fr/geoserver/insee/ows"
+        assert resource.type == "api"
 
     def test_user_agent_post(self, rmock):
         url = mock_csw_pagination(rmock, "geonetwork/srv/fre/csw", "geonetwork-dcat-page-{}.xml")

From 927ec543579bd2d1df6e381150315e4b3b2a9406 Mon Sep 17 00:00:00 2001
From: streino <streino@disroot.org>
Date: Fri, 26 Dec 2025 14:50:06 +0100
Subject: [PATCH 10/11] chore: set([]) to {}

---
 udata/harvest/tests/test_dcat_backend.py | 83 +++++++++++-------------
 1 file changed, 39 insertions(+), 44 deletions(-)

diff --git a/udata/harvest/tests/test_dcat_backend.py b/udata/harvest/tests/test_dcat_backend.py
index 5128743324..78f2476ef3 100644
--- a/udata/harvest/tests/test_dcat_backend.py
+++ b/udata/harvest/tests/test_dcat_backend.py
@@ -452,8 +452,8 @@ def test_harvest_inspire_themese(self, rmock):
 
         datasets = {d.harvest.dct_identifier: d for d in Dataset.objects}
 
-        assert set(datasets["1"].tags).issuperset(set(["repartition-des-especes", "inspire"]))
-        assert set(datasets["2"].tags).issuperset(set(["hydrographie", "inspire"]))
+        assert set(datasets["1"].tags).issuperset({"repartition-des-especes", "inspire"})
+        assert set(datasets["2"].tags).issuperset({"hydrographie", "inspire"})
         assert "inspire" not in datasets["3"].tags
 
     def test_simple_nested_attributes(self, rmock):
@@ -683,9 +683,10 @@ def test_geonetwork_xml_catalog(self, rmock):
         assert dataset.temporal_coverage is not None
         assert dataset.temporal_coverage.start == date(2004, 11, 3)
         assert dataset.temporal_coverage.end == date(2005, 3, 30)
-        assert set(dataset.tags) == set(
-            ["inspire", "biodiversity-dynamics"]
-        )  # The DCAT.theme with rdf:resource don't have labels properly defined
+        assert set(dataset.tags) == {
+            "inspire",
+            "biodiversity-dynamics",
+        }  # The DCAT.theme with rdf:resource don't have labels properly defined
 
     def test_sigoreme_xml_catalog(self, rmock):
         LicenseFactory(id="fr-lo", title="Licence ouverte / Open Licence")
@@ -993,22 +994,20 @@ def test_geonetwork_dcat(self, rmock):
         assert (
             dataset.description == "Accidents corporels de la circulation en Hauts de France (2017)"
         )
-        assert set(dataset.tags) == set(
-            [
-                "donnee-ouverte",
-                "accidentologie",
-                "accident",
-                "reseaux-de-transport",
-                "accident-de-la-route",
-                "hauts-de-france",
-                "nord",
-                "pas-de-calais",
-                "oise",
-                "somme",
-                "aisne",
-                # "inspire",  TODO: the geonetwork v4 examples use broken URI as theme resources, check if this is still a problem or not
-            ]
-        )
+        assert set(dataset.tags) == {
+            "donnee-ouverte",
+            "accidentologie",
+            "accident",
+            "reseaux-de-transport",
+            "accident-de-la-route",
+            "hauts-de-france",
+            "nord",
+            "pas-de-calais",
+            "oise",
+            "somme",
+            "aisne",
+            # "inspire",  TODO: the geonetwork v4 examples use broken URI as theme resources, check if this is still a problem or not
+        }
         assert dataset.harvest.issued_at.date() == date(2017, 1, 1)
         assert dataset.harvest.created_at is None
         assert len(dataset.resources) == 1
@@ -1050,18 +1049,16 @@ def test_geonetwork_geodcatap(self, rmock):
         assert dataset.description.startswith(
             "Part des ménages présents depuis 5 ans ou plus dans leur logement actuel"
         )
-        assert set(dataset.tags) == set(
-            [
-                "logement",
-                "institut-national-de-la-statistique-et-des-etudes-economiques",
-                "menage",
-                "population",
-                "insee",
-                "donnee-ouverte",
-                "hauts-de-france",
-                "population-et-societe",
-            ]
-        )
+        assert set(dataset.tags) == {
+            "logement",
+            "institut-national-de-la-statistique-et-des-etudes-economiques",
+            "menage",
+            "population",
+            "insee",
+            "donnee-ouverte",
+            "hauts-de-france",
+            "population-et-societe",
+        }
         assert dataset.harvest.issued_at.date() == date(2020, 9, 22)
         assert dataset.harvest.created_at is None
         # FIXME: len(resources) should be 2 but they have the same url => last wins
@@ -1275,17 +1272,15 @@ def test_geo2france(self, rmock, remote_url_prefix: str):
             dataset.description
             == "Le présent standard de données COVADIS concerne les documents de plans locaux d'urbanisme (PLU) et les plans d'occupation des sols (POS qui valent PLU)."
         )
-        assert set(dataset.tags) == set(
-            [
-                "amenagement-urbanisme-zonages-planification",
-                "cartigny",
-                "document-durbanisme",
-                "donnees-ouvertes",
-                "plu",
-                "usage-des-sols",
-                "inspire",
-            ]
-        )
+        assert set(dataset.tags) == {
+            "amenagement-urbanisme-zonages-planification",
+            "cartigny",
+            "document-durbanisme",
+            "donnees-ouvertes",
+            "plu",
+            "usage-des-sols",
+            "inspire",
+        }
         assert dataset.harvest.issued_at.date() == date(2017, 10, 7)
         assert dataset.harvest.created_at.date() == date(2013, 3, 8)
         assert dataset.spatial.geom == {

From 1ef27f848fc6c8e62c6a5839d3ccf160d76ddfb4 Mon Sep 17 00:00:00 2001
From: streino <streino@disroot.org>
Date: Fri, 26 Dec 2025 14:50:27 +0100
Subject: [PATCH 11/11] chore: somewhat more consistent spacing

---
 udata/harvest/tests/test_dcat_backend.py | 58 +++++++++---------------
 1 file changed, 21 insertions(+), 37 deletions(-)

diff --git a/udata/harvest/tests/test_dcat_backend.py b/udata/harvest/tests/test_dcat_backend.py
index 78f2476ef3..f52b32c0e7 100644
--- a/udata/harvest/tests/test_dcat_backend.py
+++ b/udata/harvest/tests/test_dcat_backend.py
@@ -80,14 +80,12 @@ def test_simple_flat(self, rmock):
         source = HarvestSourceFactory(backend="dcat", url=url, organization=org)
 
         actions.run(source)
-
         source.reload()
 
         job = source.get_last_job()
         assert len(job.items) == 3
 
         datasets = {d.harvest.dct_identifier: d for d in Dataset.objects}
-
         assert len(datasets) == 3
 
         for i in "1 2 3".split():
@@ -131,8 +129,8 @@ def test_flat_with_blank_nodes(self, rmock):
         actions.run(source)
 
         datasets = {d.harvest.dct_identifier: d for d in Dataset.objects}
-
         assert len(datasets) == 3
+
         assert len(datasets["1"].resources) == 2
         assert len(datasets["2"].resources) == 2
         assert len(datasets["3"].resources) == 1
@@ -162,8 +160,8 @@ def test_flat_with_blank_nodes_xml(self, rmock):
         actions.run(source)
 
         datasets = {d.harvest.dct_identifier: d for d in Dataset.objects}
-
         assert len(datasets) == 3
+
         assert len(datasets["3"].resources) == 1
         assert len(datasets["1"].resources) == 2
         assert len(datasets["2"].resources) == 2
@@ -179,8 +177,8 @@ def test_harvest_dataservices(self, rmock):
         actions.run(source)
 
         dataservices = Dataservice.objects
-
         assert len(dataservices) == 1
+
         assert dataservices[0].title == "Explore API v2"
         assert dataservices[0].base_api_url == "https://data.paris2024.org/api/explore/v2.1/"
         assert (
@@ -223,7 +221,6 @@ def test_harvest_dataservices_keep_attached_associated_datasets(self, rmock):
         )
 
         actions.run(source)
-
         existing_dataservice.reload()
 
         assert len(Dataservice.objects) == 1
@@ -242,7 +239,6 @@ def test_harvest_dataservices_ignore_accessservices(self, rmock):
         source = HarvestSourceFactory(backend="dcat", url=url, organization=org)
 
         actions.run(source)
-
         source.reload()
 
         job = source.get_last_job()
@@ -260,6 +256,7 @@ def test_harvest_literal_spatial(self, rmock):
 
         datasets = {d.harvest.dct_identifier: d for d in Dataset.objects}
         assert len(datasets) == 8
+
         assert (
             datasets[
                 "https://www.arcgis.com/home/item.html?id=f6565516d1354383b25793e630cf3f2b&sublayer=5"
@@ -311,7 +308,6 @@ def test_harvest_big_catalog(self, rmock):
         actions.run(source)
 
         datasets = {d.harvest.dct_identifier: d for d in Dataset.objects}
-
         assert datasets["1"].schema is None
         resources_by_title = {resource["title"]: resource for resource in datasets["1"].resources}
 
@@ -462,7 +458,6 @@ def test_simple_nested_attributes(self, rmock):
         source = HarvestSourceFactory(backend="dcat", url=url, organization=OrganizationFactory())
 
         actions.run(source)
-
         source.reload()
 
         job = source.get_last_job()
@@ -493,7 +488,6 @@ def test_idempotence(self, rmock):
         actions.run(source)
 
         datasets = {d.harvest.dct_identifier: d for d in Dataset.objects}
-
         assert len(datasets) == 3
         assert len(datasets["1"].resources) == 2
         assert len(datasets["2"].resources) == 2
@@ -505,7 +499,6 @@ def test_hydra_partial_collection_view_pagination(self, rmock):
         source = HarvestSourceFactory(backend="dcat", url=url, organization=org)
 
         actions.run(source)
-
         source.reload()
 
         job = source.get_last_job()
@@ -517,7 +510,6 @@ def test_hydra_legacy_paged_collection_pagination(self, rmock):
         source = HarvestSourceFactory(backend="dcat", url=url, organization=org)
 
         actions.run(source)
-
         source.reload()
 
         job = source.get_last_job()
@@ -530,11 +522,9 @@ def test_failure_on_initialize(self, rmock):
         source = HarvestSourceFactory(backend="dcat", url=url, organization=org)
 
         actions.run(source)
-
         source.reload()
 
         job = source.get_last_job()
-
         assert job.status == "failed"
 
     def test_supported_mime_type(self, rmock):
@@ -544,11 +534,9 @@ def test_supported_mime_type(self, rmock):
         source = HarvestSourceFactory(backend="dcat", url=url, organization=org)
 
         actions.run(source)
-
         source.reload()
 
         job = source.get_last_job()
-
         assert job.status == "done"
         assert job.errors == []
         assert len(job.items) == 4
@@ -659,7 +647,9 @@ def test_geonetwork_xml_catalog(self, rmock):
         url = mock_dcat(rmock, "geonetwork.xml", path="catalog.xml")
         org = OrganizationFactory()
         source = HarvestSourceFactory(backend="dcat", url=url, organization=org)
+
         actions.run(source)
+
         dataset = Dataset.objects.filter(organization=org).first()
         assert dataset is not None
         assert dataset.harvest is not None
@@ -693,9 +683,10 @@ def test_sigoreme_xml_catalog(self, rmock):
         url = mock_dcat(rmock, "sig.oreme.rdf")
         org = OrganizationFactory()
         source = HarvestSourceFactory(backend="dcat", url=url, organization=org)
+
         actions.run(source)
-        dataset = Dataset.objects.filter(organization=org).first()
 
+        dataset = Dataset.objects.filter(organization=org).first()
         assert dataset is not None
         assert dataset.frequency == UpdateFrequency.IRREGULAR
         assert "gravi" in dataset.tags  # support dcat:keyword
@@ -723,9 +714,10 @@ def test_datara_extended_roles_foaf(self, rmock):
         url = mock_dcat(rmock, "datara--5a26b0f6-0ccf-46ad-ac58-734054b91977.rdf.xml")
         org = OrganizationFactory()
         source = HarvestSourceFactory(backend="dcat", url=url, organization=org)
+
         actions.run(source)
-        dataset = Dataset.objects.filter(organization=org).first()
 
+        dataset = Dataset.objects.filter(organization=org).first()
         assert dataset is not None
         assert len(dataset.contact_points) == 2
 
@@ -742,9 +734,10 @@ def test_datara_extended_roles_vcard(self, rmock):
         url = mock_dcat(rmock, "datara--f40c3860-7236-4b30-a141-23b8ae33f7b2.rdf.xml")
         org = OrganizationFactory()
         source = HarvestSourceFactory(backend="dcat", url=url, organization=org)
+
         actions.run(source)
-        dataset = Dataset.objects.filter(organization=org).first()
 
+        dataset = Dataset.objects.filter(organization=org).first()
         assert dataset is not None
         assert len(dataset.contact_points) == 3
 
@@ -765,15 +758,16 @@ def test_udata_xml_catalog(self, rmock):
         url = mock_dcat(rmock, "udata.xml")
         org = OrganizationFactory()
         source = HarvestSourceFactory(backend="dcat", url=url, organization=org)
-        actions.run(source)
 
+        actions.run(source)
         source.reload()
+
         job = source.get_last_job()
         assert len(job.items) == 3
 
         assert Dataset.objects.filter(organization=org).count() == 2
-        dataset = Dataset.objects.filter(organization=org, title="Bureaux de vote - Vanves").first()
 
+        dataset = Dataset.objects.filter(organization=org, title="Bureaux de vote - Vanves").first()
         assert dataset is not None
         assert "bureaux-de-vote" in dataset.tags  # support dcat:keyword
         assert len(dataset.resources) == 4
@@ -833,6 +827,7 @@ def test_user_agent_get(self, rmock):
         get_mock = rmock.get(url)
         org = OrganizationFactory()
         source = HarvestSourceFactory(backend="dcat", url=url, organization=org)
+
         actions.run(source)
 
         assert "User-Agent" in get_mock.last_request.headers
@@ -845,14 +840,11 @@ def test_unsupported_mime_type(self, rmock):
         source = HarvestSourceFactory(backend="dcat", url=url, organization=org)
 
         actions.run(source)
-
         source.reload()
 
         job = source.get_last_job()
-
         assert job.status == "failed"
         assert len(job.errors) == 1
-
         error = job.errors[0]
         assert error.message == 'Unsupported mime type "text/html"'
 
@@ -863,14 +855,11 @@ def test_unable_to_detect_format(self, rmock):
         source = HarvestSourceFactory(backend="dcat", url=url, organization=org)
 
         actions.run(source)
-
         source.reload()
 
         job = source.get_last_job()
-
         assert job.status == "failed"
         assert len(job.errors) == 1
-
         error = job.errors[0]
         expected = "Unable to detect format from extension or mime type"
         assert error.message == expected
@@ -900,8 +889,8 @@ def test_use_replaced_uris(self, rmock, mocker):
             URIS_TO_REPLACE,
             {},  # Empty dict to test the mechanism exists
         )
-        actions.run(source)
 
+        actions.run(source)
         source.reload()
 
         job = source.get_last_job()
@@ -985,7 +974,6 @@ def test_geonetwork_dcat(self, rmock):
         assert len(job.items) == 6
 
         datasets = {d.harvest.dct_identifier: d for d in Dataset.objects}
-
         assert len(datasets) == 6
 
         # First dataset
@@ -1094,10 +1082,9 @@ def test_csw_error(self, rmock):
         source = HarvestSourceFactory(backend="csw-dcat")
 
         actions.run(source)
-
         source.reload()
-        job = source.get_last_job()
 
+        job = source.get_last_job()
         assert len(job.errors) == 1
         assert "Failed to query CSW" in job.errors[0].message
         assert job.status == "failed"
@@ -1128,10 +1115,9 @@ def test_disallow_external_entities(self, rmock):
         source = HarvestSourceFactory(backend="csw-dcat")
 
         actions.run(source)
-
         source.reload()
-        job = source.get_last_job()
 
+        job = source.get_last_job()
         assert job.status == "done"
         assert Dataset.objects.first().title == "test"
 
@@ -1160,10 +1146,9 @@ def test_disallow_external_dtd(self, rmock):
         source = HarvestSourceFactory(backend="csw-dcat")
 
         actions.run(source)
-
         source.reload()
-        job = source.get_last_job()
 
+        job = source.get_last_job()
         assert not any(h.method == "GET" for h in rmock.request_history)
         assert job.status == "done"
         assert len(job.items) == 1
@@ -1211,6 +1196,7 @@ def test_url_prefix(self, rmock, remote_url_prefix: str):
 
         actions.run(source)
         source.reload()
+
         job = source.get_last_job()
         assert len(job.items) == 1
 
@@ -1252,14 +1238,12 @@ def test_geo2france(self, rmock, remote_url_prefix: str):
         )
 
         actions.run(source)
-
         source.reload()
 
         job = source.get_last_job()
         assert len(job.items) == 6
 
         datasets = {d.harvest.dct_identifier: d for d in Dataset.objects}
-
         assert len(datasets) == 6
 
         # First dataset