From 5aecab9472343259d7afa5a9b60e5c9066f6be68 Mon Sep 17 00:00:00 2001
From: Saurabh Jain <saurabhjain1592@gmail.com>
Date: Mon, 16 Feb 2026 17:17:20 +0100
Subject: [PATCH 1/9] feat: add media governance types and
 proxy_llm_call_with_media

Add MediaContent, MediaAnalysisResult, MediaAnalysisResponse Pydantic
models and proxy_llm_call_with_media method for multimodal image
governance requests.
---
 axonflow/__init__.py |  7 ++++
 axonflow/client.py   | 95 ++++++++++++++++++++++++++++++++++++++++++++
 axonflow/types.py    | 46 +++++++++++++++++++++
 3 files changed, 148 insertions(+)

diff --git a/axonflow/__init__.py b/axonflow/__init__.py
index f0529b6..0ce7194 100644
--- a/axonflow/__init__.py
+++ b/axonflow/__init__.py
@@ -148,6 +148,9 @@
     ListExecutionsResponse,
     ListUsageRecordsOptions,
     ListWebhooksResponse,
+    MediaAnalysisResponse,
+    MediaAnalysisResult,
+    MediaContent,
     Mode,
     ModelPricing,
     PlanExecutionResponse,
@@ -213,6 +216,10 @@
     "ClientResponse",
     "PolicyEvaluationInfo",
     "CodeArtifact",
+    # Multimodal Image Governance types
+    "MediaContent",
+    "MediaAnalysisResult",
+    "MediaAnalysisResponse",
     # Connector types
     "ConnectorMetadata",
     "ConnectorInstallRequest",
diff --git a/axonflow/client.py b/axonflow/client.py
index eebb07b..67f5354 100644
--- a/axonflow/client.py
+++ b/axonflow/client.py
@@ -151,6 +151,7 @@
     ListExecutionsResponse,
     ListUsageRecordsOptions,
     ListWebhooksResponse,
+    MediaContent,
     Mode,
     PlanExecutionResponse,
     PlanResponse,
@@ -770,6 +771,100 @@ async def proxy_llm_call(
 
         return response
 
+    async def proxy_llm_call_with_media(
+        self,
+        user_token: str,
+        query: str,
+        request_type: str,
+        media: list[MediaContent],
+        context: dict[str, Any] | None = None,
+    ) -> ClientResponse:
+        """Send a request with media content (images) for governance analysis.
+
+        Media items are analyzed for PII, content safety, biometric data, and
+        document classification before being forwarded to the LLM provider.
+
+        Args:
+            user_token: User authentication token.
+            query: The prompt/query text.
+            request_type: Type of request (e.g., "chat", "sql").
+            media: List of MediaContent items (images) to analyze.
+            context: Optional additional context.
+
+        Returns:
+            ClientResponse with media_analysis field populated.
+
+        Raises:
+            PolicyViolationError: If request is blocked by policy
+            AuthenticationError: If credentials are invalid
+            TimeoutError: If request times out
+        """
+        # Default to "anonymous" if user_token is empty (community mode)
+        if not user_token:
+            user_token = "anonymous"  # noqa: S105 - not a password, just a placeholder
+
+        # Plan operations are mutations and must not be cached
+        is_mutation = request_type in (
+            "execute-plan",
+            "generate-plan",
+            "cancel-plan",
+            "update-plan",
+        )
+
+        # Check cache (skip for mutations)
+        if self._cache is not None and not is_mutation:
+            cache_key = self._get_cache_key(request_type, query, user_token)
+            if cache_key in self._cache:
+                if self._config.debug:
+                    self._logger.debug("Cache hit", query=query[:50])
+                cached_result: ClientResponse = self._cache[cache_key]
+                return cached_result
+        else:
+            cache_key = ""
+
+        request = ClientRequest(
+            query=query,
+            user_token=user_token,
+            client_id=self._config.client_id,
+            request_type=request_type,
+            context=context or {},
+            media=media,
+        )
+
+        if self._config.debug:
+            self._logger.debug(
+                "Executing multimodal query",
+                request_type=request_type,
+                query=query[:50] if query else "",
+                media_count=len(media),
+            )
+
+        response_data = await self._request(
+            "POST",
+            "/api/request",
+            json_data=request.model_dump(),
+        )
+
+        response = ClientResponse.model_validate(response_data)
+
+        # Check for policy violation
+        if response.blocked:
+            # Extract policy name from policy_info if available
+            policy = None
+            if response.policy_info and response.policy_info.policies_evaluated:
+                policy = response.policy_info.policies_evaluated[0]
+            raise PolicyViolationError(
+                response.block_reason or "Request blocked by policy",
+                policy=policy,
+                block_reason=response.block_reason,
+            )
+
+        # Cache successful responses (skip mutations — plan operations)
+        if self._cache is not None and response.success and cache_key and not is_mutation:
+            self._cache[cache_key] = response
+
+        return response
+
     async def list_connectors(self) -> list[ConnectorMetadata]:
         """List all available MCP connectors.
 
diff --git a/axonflow/types.py b/axonflow/types.py
index bd081e8..485ae5a 100644
--- a/axonflow/types.py
+++ b/axonflow/types.py
@@ -77,6 +77,46 @@ class AxonFlowConfig(BaseModel):
     cache: CacheConfig = Field(default_factory=CacheConfig)
 
 
+class MediaContent(BaseModel):
+    """Media content (image) to include with a request for governance analysis."""
+
+    source: str = Field(..., description="How media is provided: 'base64' or 'url'")
+    base64_data: str | None = Field(default=None, description="Base64-encoded image data")
+    url: str | None = Field(default=None, description="Image URL")
+    mime_type: str = Field(..., description="Media content type (e.g., 'image/jpeg')")
+
+
+class MediaAnalysisResult(BaseModel):
+    """Analysis results for a single media item."""
+
+    media_index: int = Field(default=0, description="Index in the request media array")
+    sha256_hash: str = Field(default="", description="SHA-256 hash of the image data")
+    has_faces: bool = Field(default=False, description="Whether faces were detected")
+    face_count: int = Field(default=0, ge=0, description="Number of faces detected")
+    has_biometric_data: bool = Field(
+        default=False, description="Biometric data detected (GDPR Art. 9)"
+    )
+    nsfw_score: float = Field(default=0.0, ge=0, le=1, description="NSFW content score")
+    violence_score: float = Field(default=0.0, ge=0, le=1, description="Violence content score")
+    content_safe: bool = Field(default=True, description="Aggregated content safety flag")
+    document_type: str | None = Field(default=None, description="Classified document type")
+    is_sensitive_document: bool = Field(default=False, description="Sensitive document flag")
+    has_pii: bool = Field(default=False, description="PII detected in image text via OCR")
+    pii_types: list[str] = Field(default_factory=list, description="Types of PII detected")
+    estimated_cost_usd: float = Field(default=0.0, ge=0, description="Analysis cost for this item")
+    warnings: list[str] = Field(default_factory=list, description="Governance warnings")
+
+
+class MediaAnalysisResponse(BaseModel):
+    """Aggregated media analysis results in the response."""
+
+    results: list[MediaAnalysisResult] = Field(
+        default_factory=list, description="Per-item analysis results"
+    )
+    total_cost_usd: float = Field(default=0.0, ge=0, description="Total analysis cost")
+    analysis_time_ms: int = Field(default=0, ge=0, description="Total analysis time (ms)")
+
+
 class ClientRequest(BaseModel):
     """Request to AxonFlow Agent."""
 
@@ -85,6 +125,9 @@ class ClientRequest(BaseModel):
     client_id: str | None = Field(default=None, description="Client ID (optional)")
     request_type: str = Field(..., description="Request type")
     context: dict[str, Any] = Field(default_factory=dict, description="Additional context")
+    media: list[MediaContent] | None = Field(
+        default=None, description="Optional media for multimodal governance"
+    )
 
 
 class CodeArtifact(BaseModel):
@@ -148,6 +191,9 @@ class ClientResponse(BaseModel):
     block_reason: str | None = Field(default=None, description="Block reason")
     policy_info: PolicyEvaluationInfo | None = Field(default=None)
     budget_info: BudgetInfo | None = Field(default=None, description="Budget status (Issue #1082)")
+    media_analysis: MediaAnalysisResponse | None = Field(
+        default=None, description="Media governance results"
+    )
 
     def model_post_init(self, __context: Any) -> None:
         """Detect nested data.success=false and surface error."""

From 601754eb13a909fdf0a940154f121f5c0831f2bd Mon Sep 17 00:00:00 2001
From: Saurabh Jain <saurabhjain1592@gmail.com>
Date: Mon, 16 Feb 2026 17:40:18 +0100
Subject: [PATCH 2/9] fix: address code review findings for media governance

- Add extracted_text field to MediaAnalysisResult
- Add proxy_llm_call_with_media to SyncAxonFlow wrapper
- Disable response caching for media requests (cache key ignores
  media content, would return stale results for different images)
- Constrain MediaContent.source to Literal["base64", "url"]
---
 axonflow/client.py | 44 +++++++++++++++++++++++---------------------
 axonflow/types.py  |  5 +++--
 2 files changed, 26 insertions(+), 23 deletions(-)

diff --git a/axonflow/client.py b/axonflow/client.py
index 67f5354..5cf881b 100644
--- a/axonflow/client.py
+++ b/axonflow/client.py
@@ -803,24 +803,9 @@ async def proxy_llm_call_with_media(
         if not user_token:
             user_token = "anonymous"  # noqa: S105 - not a password, just a placeholder
 
-        # Plan operations are mutations and must not be cached
-        is_mutation = request_type in (
-            "execute-plan",
-            "generate-plan",
-            "cancel-plan",
-            "update-plan",
-        )
-
-        # Check cache (skip for mutations)
-        if self._cache is not None and not is_mutation:
-            cache_key = self._get_cache_key(request_type, query, user_token)
-            if cache_key in self._cache:
-                if self._config.debug:
-                    self._logger.debug("Cache hit", query=query[:50])
-                cached_result: ClientResponse = self._cache[cache_key]
-                return cached_result
-        else:
-            cache_key = ""
+        # Media requests must skip cache: analysis is non-deterministic and
+        # cache keys don't incorporate binary image data.
+        cache_key = ""
 
         request = ClientRequest(
             query=query,
@@ -859,9 +844,7 @@ async def proxy_llm_call_with_media(
                 block_reason=response.block_reason,
             )
 
-        # Cache successful responses (skip mutations — plan operations)
-        if self._cache is not None and response.success and cache_key and not is_mutation:
-            self._cache[cache_key] = response
+        # Media requests are never cached (cache_key is always empty above).
 
         return response
 
@@ -5720,6 +5703,25 @@ def proxy_llm_call(
             self._async_client.proxy_llm_call(user_token, query, request_type, context)
         )
 
+    def proxy_llm_call_with_media(
+        self,
+        user_token: str,
+        query: str,
+        request_type: str,
+        media: list,
+        context: dict | None = None,
+    ) -> ClientResponse:
+        """Send a request with media content (images) for governance analysis.
+
+        This is Proxy Mode with multimodal support - media items are analyzed
+        for PII, content safety, biometric data, and document classification.
+        """
+        return self._run_sync(
+            self._async_client.proxy_llm_call_with_media(
+                user_token, query, request_type, media, context
+            )
+        )
+
     def list_connectors(self) -> list[ConnectorMetadata]:
         """List all available MCP connectors."""
         return self._run_sync(self._async_client.list_connectors())
diff --git a/axonflow/types.py b/axonflow/types.py
index 485ae5a..761506f 100644
--- a/axonflow/types.py
+++ b/axonflow/types.py
@@ -8,7 +8,7 @@
 
 from datetime import datetime
 from enum import Enum
-from typing import Any
+from typing import Any, Literal
 
 from pydantic import BaseModel, ConfigDict, Field, field_validator
 
@@ -80,7 +80,7 @@ class AxonFlowConfig(BaseModel):
 class MediaContent(BaseModel):
     """Media content (image) to include with a request for governance analysis."""
 
-    source: str = Field(..., description="How media is provided: 'base64' or 'url'")
+    source: Literal["base64", "url"] = Field(..., description="How media is provided: 'base64' or 'url'")
     base64_data: str | None = Field(default=None, description="Base64-encoded image data")
     url: str | None = Field(default=None, description="Image URL")
     mime_type: str = Field(..., description="Media content type (e.g., 'image/jpeg')")
@@ -103,6 +103,7 @@ class MediaAnalysisResult(BaseModel):
     is_sensitive_document: bool = Field(default=False, description="Sensitive document flag")
     has_pii: bool = Field(default=False, description="PII detected in image text via OCR")
     pii_types: list[str] = Field(default_factory=list, description="Types of PII detected")
+    extracted_text: str = Field(default="", description="Text extracted from image via OCR")
     estimated_cost_usd: float = Field(default=0.0, ge=0, description="Analysis cost for this item")
     warnings: list[str] = Field(default_factory=list, description="Governance warnings")
 

From 7d4b0636276100c0becea1f0a0bd22c5956d822c Mon Sep 17 00:00:00 2001
From: Saurabh Jain <saurabhjain1592@gmail.com>
Date: Mon, 16 Feb 2026 17:58:37 +0100
Subject: [PATCH 3/9] fix: resolve ruff lint errors

- Remove unused cache_key variable in proxy_llm_call_with_media
- Break long Field description line in MediaContent.source
---
 axonflow/client.py | 4 +---
 axonflow/types.py  | 4 +++-
 2 files changed, 4 insertions(+), 4 deletions(-)

diff --git a/axonflow/client.py b/axonflow/client.py
index 5cf881b..daa1397 100644
--- a/axonflow/client.py
+++ b/axonflow/client.py
@@ -803,10 +803,8 @@ async def proxy_llm_call_with_media(
         if not user_token:
             user_token = "anonymous"  # noqa: S105 - not a password, just a placeholder
 
-        # Media requests must skip cache: analysis is non-deterministic and
+        # Media requests skip cache: analysis is non-deterministic and
         # cache keys don't incorporate binary image data.
-        cache_key = ""
-
         request = ClientRequest(
             query=query,
             user_token=user_token,
diff --git a/axonflow/types.py b/axonflow/types.py
index 761506f..b4dd732 100644
--- a/axonflow/types.py
+++ b/axonflow/types.py
@@ -80,7 +80,9 @@ class AxonFlowConfig(BaseModel):
 class MediaContent(BaseModel):
     """Media content (image) to include with a request for governance analysis."""
 
-    source: Literal["base64", "url"] = Field(..., description="How media is provided: 'base64' or 'url'")
+    source: Literal["base64", "url"] = Field(
+        ..., description="How media is provided: 'base64' or 'url'"
+    )
     base64_data: str | None = Field(default=None, description="Base64-encoded image data")
     url: str | None = Field(default=None, description="Image URL")
     mime_type: str = Field(..., description="Media content type (e.g., 'image/jpeg')")

From 09f6860f00f595fda4c24be67235a7b214c8b932 Mon Sep 17 00:00:00 2001
From: Saurabh Jain <saurabhjain1592@gmail.com>
Date: Mon, 16 Feb 2026 18:00:53 +0100
Subject: [PATCH 4/9] fix: add mypy type parameters for list and dict in sync
 wrapper

---
 axonflow/client.py | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/axonflow/client.py b/axonflow/client.py
index daa1397..76ce36b 100644
--- a/axonflow/client.py
+++ b/axonflow/client.py
@@ -5706,8 +5706,8 @@ def proxy_llm_call_with_media(
         user_token: str,
         query: str,
         request_type: str,
-        media: list,
-        context: dict | None = None,
+        media: list[MediaContent],
+        context: dict[str, str] | None = None,
     ) -> ClientResponse:
         """Send a request with media content (images) for governance analysis.
 

From 5f07e2a60b53ae8e9d5ce55c727d8c0951808a16 Mon Sep 17 00:00:00 2001
From: Saurabh Jain <saurabhjain1592@gmail.com>
Date: Mon, 16 Feb 2026 19:21:10 +0100
Subject: [PATCH 5/9] feat: replace extracted_text with has_extracted_text and
 extracted_text_length

---
 axonflow/types.py | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/axonflow/types.py b/axonflow/types.py
index b4dd732..cf3dd70 100644
--- a/axonflow/types.py
+++ b/axonflow/types.py
@@ -105,7 +105,8 @@ class MediaAnalysisResult(BaseModel):
     is_sensitive_document: bool = Field(default=False, description="Sensitive document flag")
     has_pii: bool = Field(default=False, description="PII detected in image text via OCR")
     pii_types: list[str] = Field(default_factory=list, description="Types of PII detected")
-    extracted_text: str = Field(default="", description="Text extracted from image via OCR")
+    has_extracted_text: bool = Field(default=False, description="Whether text was extracted from image via OCR")
+    extracted_text_length: int = Field(default=0, ge=0, description="Length of extracted text in characters")
     estimated_cost_usd: float = Field(default=0.0, ge=0, description="Analysis cost for this item")
     warnings: list[str] = Field(default_factory=list, description="Governance warnings")
 

From df588ceb179283541b3e9f86ddfa6afe7bfad2a6 Mon Sep 17 00:00:00 2001
From: Saurabh Jain <saurabhjain1592@gmail.com>
Date: Mon, 16 Feb 2026 20:41:50 +0100
Subject: [PATCH 6/9] style: replace em dashes with colons in changelog

---
 CHANGELOG.md | 10 +++++-----
 1 file changed, 5 insertions(+), 5 deletions(-)

diff --git a/CHANGELOG.md b/CHANGELOG.md
index d225cf4..33cc46e 100644
--- a/CHANGELOG.md
+++ b/CHANGELOG.md
@@ -13,11 +13,11 @@ and this project adheres to [Semantic Versioning](https://semver.org/spec/v2.0.0
   - `async fail_workflow(workflow_id, reason=None)` + sync wrapper
   - Sends `POST /api/v1/workflows/{id}/fail`
 - **HITL Queue API** (Enterprise): Human-in-the-loop approval queue management
-  - `list_hitl_queue(opts)` — list pending approvals with filtering
-  - `get_hitl_request(request_id)` — get approval details
-  - `approve_hitl_request(request_id, review)` — approve a request
-  - `reject_hitl_request(request_id, review)` — reject a request
-  - `get_hitl_stats()` — dashboard statistics
+  - `list_hitl_queue(opts)`: list pending approvals with filtering
+  - `get_hitl_request(request_id)`: get approval details
+  - `approve_hitl_request(request_id, review)`: approve a request
+  - `reject_hitl_request(request_id, review)`: reject a request
+  - `get_hitl_stats()`: dashboard statistics
   - New models: `HITLApprovalRequest`, `HITLQueueListOptions`, `HITLQueueListResponse`, `HITLReviewInput`, `HITLStats`
 
 ### Fixed

From 64160c690b275918a03004b2963ff5db202b5c1a Mon Sep 17 00:00:00 2001
From: Saurabh Jain <saurabhjain1592@gmail.com>
Date: Mon, 16 Feb 2026 20:59:44 +0100
Subject: [PATCH 7/9] docs: add v3.5.0 changelog entry for media governance
 (2026-02-19)

---
 CHANGELOG.md | 13 +++++++++++++
 1 file changed, 13 insertions(+)

diff --git a/CHANGELOG.md b/CHANGELOG.md
index 33cc46e..9bcf389 100644
--- a/CHANGELOG.md
+++ b/CHANGELOG.md
@@ -5,6 +5,19 @@ All notable changes to the AxonFlow Python SDK will be documented in this file.
 The format is based on [Keep a Changelog](https://keepachangelog.com/en/1.0.0/),
 and this project adheres to [Semantic Versioning](https://semver.org/spec/v2.0.0.html).
 
+## [3.5.0] - 2026-02-19
+
+### Added
+
+- **Media Governance Types**: `MediaContent`, `MediaAnalysisResult`, `MediaAnalysisResponse` for multimodal image governance
+- **`proxy_llm_call_with_media()`**: Async + sync methods to send images (base64 or URL) alongside queries for governance analysis before LLM routing
+
+### Breaking
+
+- `MediaAnalysisResult.extracted_text` replaced by `has_extracted_text` (bool) and `extracted_text_length` (int). Raw extracted text is no longer exposed in API responses.
+
+---
+
 ## [3.4.0] - 2026-02-13
 
 ### Added

From f84c3b5f3afe47467e15f0b228f430e8c8d374a6 Mon Sep 17 00:00:00 2001
From: Saurabh Jain <saurabhjain1592@gmail.com>
Date: Wed, 18 Feb 2026 03:10:19 +0100
Subject: [PATCH 8/9] fix: resolve E501 line-too-long lint errors in
 MediaAnalysisResult

---
 axonflow/types.py | 8 ++++++--
 1 file changed, 6 insertions(+), 2 deletions(-)

diff --git a/axonflow/types.py b/axonflow/types.py
index cf3dd70..5a8717e 100644
--- a/axonflow/types.py
+++ b/axonflow/types.py
@@ -105,8 +105,12 @@ class MediaAnalysisResult(BaseModel):
     is_sensitive_document: bool = Field(default=False, description="Sensitive document flag")
     has_pii: bool = Field(default=False, description="PII detected in image text via OCR")
     pii_types: list[str] = Field(default_factory=list, description="Types of PII detected")
-    has_extracted_text: bool = Field(default=False, description="Whether text was extracted from image via OCR")
-    extracted_text_length: int = Field(default=0, ge=0, description="Length of extracted text in characters")
+    has_extracted_text: bool = Field(
+        default=False, description="Whether text was extracted from image via OCR"
+    )
+    extracted_text_length: int = Field(
+        default=0, ge=0, description="Length of extracted text in characters"
+    )
     estimated_cost_usd: float = Field(default=0.0, ge=0, description="Analysis cost for this item")
     warnings: list[str] = Field(default_factory=list, description="Governance warnings")
 

From b06e153841e14897c9c2755a2f1863c5786efebd Mon Sep 17 00:00:00 2001
From: Saurabh Jain <saurabhjain1592@gmail.com>
Date: Wed, 18 Feb 2026 03:12:13 +0100
Subject: [PATCH 9/9] docs: set v3.5.0 release date to 2026-02-18

---
 CHANGELOG.md | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/CHANGELOG.md b/CHANGELOG.md
index 9bcf389..55bda7c 100644
--- a/CHANGELOG.md
+++ b/CHANGELOG.md
@@ -5,7 +5,7 @@ All notable changes to the AxonFlow Python SDK will be documented in this file.
 The format is based on [Keep a Changelog](https://keepachangelog.com/en/1.0.0/),
 and this project adheres to [Semantic Versioning](https://semver.org/spec/v2.0.0.html).
 
-## [3.5.0] - 2026-02-19
+## [3.5.0] - 2026-02-18
 
 ### Added