ysdede · AAlp22 · Feb 21, 2026 · Feb 21, 2026 · Feb 21, 2026 · kiloconnect
diff --git a/src/App.tsx b/src/App.tsx
@@ -21,6 +21,7 @@ import {
   loadSettingsFromStorage,
   saveSettingsToStorage,
 } from './utils/settingsStorage';
+import { clampWasmThreadsForDevice } from './utils/hardwareThreads';
 
 // Singleton instances
 let audioEngine: AudioEngine | null = null;
@@ -228,12 +229,22 @@ const App: Component = () => {
   const persistedSettings = loadSettingsFromStorage();
   const persistedGeneral = persistedSettings.general;
   const persistedAudio = persistedSettings.audio;
-  const persistedModelId = persistedSettings.model?.selectedModelId;
+  const persistedModel = persistedSettings.model;
+  const persistedModelId = persistedModel?.selectedModelId;
   const persistedUi = persistedSettings.ui;
 
   if (persistedModelId && MODELS.some((model) => model.id === persistedModelId)) {
     appStore.setSelectedModelId(persistedModelId);
   }
+  if (persistedModel?.backend !== undefined) {
+    appStore.setModelBackendMode(persistedModel.backend);
+  }
+  if (persistedModel?.encoderQuant !== undefined) {
+    appStore.setEncoderQuant(persistedModel.encoderQuant);
+  }
+  if (persistedModel?.decoderQuant !== undefined) {
+    appStore.setDecoderQuant(persistedModel.decoderQuant);
+  }
   if (persistedGeneral?.energyThreshold !== undefined) {
     appStore.setEnergyThreshold(persistedGeneral.energyThreshold);
   }
@@ -249,6 +260,12 @@ const App: Component = () => {
   if (persistedGeneral?.streamingWindow !== undefined) {
     appStore.setStreamingWindow(persistedGeneral.streamingWindow);
   }
+  if (persistedGeneral?.frameStride !== undefined) {
+    appStore.setFrameStride(persistedGeneral.frameStride);
+  }
+  if (persistedGeneral?.wasmThreads !== undefined) {
+    appStore.setWasmThreads(clampWasmThreadsForDevice(persistedGeneral.wasmThreads));
+  }
   if (persistedUi?.debugPanel?.visible !== undefined) {
     appStore.setShowDebugPanel(persistedUi.debugPanel.visible);
   }
@@ -297,6 +314,26 @@ const App: Component = () => {
     }
   });
 
+  // Keep quantization presets aligned with the backend mode (parakeet.js demo behavior).
+  let lastBackendMode: 'webgpu-hybrid' | 'wasm' | null = null;
+  createEffect(() => {
+    const backendMode = appStore.modelBackendMode();
+    if (lastBackendMode === null) {
+      lastBackendMode = backendMode;
+      return;
+    }
+    if (backendMode === lastBackendMode) return;
+
+    if (backendMode.startsWith('webgpu')) {
+      if (appStore.encoderQuant() !== 'fp32') appStore.setEncoderQuant('fp32');
+      if (appStore.decoderQuant() !== 'int8') appStore.setDecoderQuant('int8');
+    } else {
+      if (appStore.encoderQuant() !== 'int8') appStore.setEncoderQuant('int8');
+      if (appStore.decoderQuant() !== 'int8') appStore.setDecoderQuant('int8');
+    }
+    lastBackendMode = backendMode;
+  });
+
   let dragStart = { x: 0, y: 0 };
   let posStart = { x: 0, y: 0 };
 
@@ -364,9 +401,14 @@ const App: Component = () => {
         v4InferenceIntervalMs: appStore.v4InferenceIntervalMs(),
         v4SilenceFlushSec: appStore.v4SilenceFlushSec(),
         streamingWindow: appStore.streamingWindow(),
+        frameStride: appStore.frameStride(),
+        wasmThreads: appStore.wasmThreads(),
       },
       model: {
         selectedModelId: appStore.selectedModelId(),
+        backend: appStore.modelBackendMode(),
+        encoderQuant: appStore.encoderQuant(),
+        decoderQuant: appStore.decoderQuant(),
       },
       audio: {
         selectedDeviceId,
@@ -425,6 +467,7 @@ const App: Component = () => {
       appStore.setModelProgress(p.progress);
       appStore.setModelMessage(p.message || '');
       if (p.file) appStore.setModelFile(p.file);
+      if (p.backend) appStore.setBackend(p.backend);
     };
 
     workerClient.onModelStateChange = (s) => {
@@ -642,6 +685,7 @@ const App: Component = () => {
         features: features.features,
         T: features.T,
         melBins: features.melBins,
+        frameStride: appStore.frameStride(),
         timeOffset,
         endTime: window.endFrame / 16000,
         segmentId: `v4_${Date.now()}`,
@@ -1040,11 +1084,20 @@ const App: Component = () => {
 
   const loadSelectedModel = async () => {
     if (!workerClient) return;
-    if (appStore.modelState() === 'ready') return;
     if (appStore.modelState() === 'loading') return;
-    if (appStore.modelState() === 'loading') return;
+    if (appStore.modelState() === 'loading') return;
-    if (appStore.modelState() === 'loading') return;
+    if (appStore.modelState() === 'loading') return;
+    if (appStore.recordingState() === 'recording') {
+      console.warn('[App] Model reload blocked while recording is active');
+      return;
+    }
     setShowContextPanel(true);
     try {
-      await workerClient.initModel(appStore.selectedModelId());
+      await workerClient.initModel({
+        modelId: appStore.selectedModelId(),
+        cpuThreads: appStore.wasmThreads(),
+        backend: appStore.modelBackendMode(),
+        encoderQuant: appStore.encoderQuant(),
+        decoderQuant: appStore.decoderQuant(),
+      });
     } catch (e) {
       console.error('Failed to load model:', e);
       appStore.setModelState('error');
@@ -1078,7 +1131,10 @@ const App: Component = () => {
     if (!workerClient) return;
     setShowContextPanel(true);
     try {
-      await workerClient.initLocalModel(files);
+      await workerClient.initLocalModel(files, {
+        cpuThreads: appStore.wasmThreads(),
+        backend: appStore.modelBackendMode(),
+      });
     } catch (e) {
       console.error('Failed to load local model:', e);
     }

diff --git a/src/components/SettingsPanel.tsx b/src/components/SettingsPanel.tsx
@@ -2,6 +2,7 @@ import { Component, For, Show } from 'solid-js';
 import { appStore } from '../stores/appStore';
 import { getModelDisplayName, MODELS } from './ModelLoadingOverlay';
 import type { AudioEngine } from '../lib/audio/types';
+import { getMaxHardwareThreads } from '../utils/hardwareThreads';
 
 const formatInterval = (ms: number) => {
   if (ms >= 1000) return `${(ms / 1000).toFixed(1)}s`;
@@ -34,6 +35,7 @@ export interface SettingsContentProps {
 export const SettingsContent: Component<SettingsContentProps> = (props) => {
   const isV4 = () => appStore.transcriptionMode() === 'v4-utterance';
   const isV3 = () => appStore.transcriptionMode() === 'v3-streaming';
+  const maxWasmThreads = () => getMaxHardwareThreads();
 
   const expandUp = () => props.expandUp?.() ?? false;
   const section = () => props.section ?? 'full';
@@ -65,11 +67,11 @@ export const SettingsContent: Component<SettingsContentProps> = (props) => {
             <button
               type="button"
               onClick={props.onLoadModel}
-              disabled={appStore.modelState() === 'ready' || appStore.modelState() === 'loading'}
+              disabled={appStore.modelState() === 'loading'}
               class="flex items-center gap-1.5 px-3 py-1.5 text-sm font-medium text-[var(--color-earthy-muted-green)] hover:bg-[var(--color-earthy-sage)]/20 transition-colors disabled:opacity-50 disabled:cursor-not-allowed shrink-0"
             >
               <span class="material-symbols-outlined text-lg">power_settings_new</span>
-              {appStore.modelState() === 'ready' ? 'Loaded' : appStore.modelState() === 'loading' ? '...' : 'Load'}
+              {appStore.modelState() === 'ready' ? 'Reload' : appStore.modelState() === 'loading' ? '...' : 'Load'}
             </button>
             <Show when={props.onLocalLoad}>
               <label class="flex items-center gap-1.5 px-3 py-1.5 text-sm font-medium text-[var(--color-earthy-soft-brown)] hover:bg-[var(--color-earthy-sage)]/20 transition-colors cursor-pointer shrink-0">
@@ -92,6 +94,59 @@ export const SettingsContent: Component<SettingsContentProps> = (props) => {
           <p class="text-xs text-[var(--color-earthy-soft-brown)]">
             {appStore.modelState() === 'ready' ? getModelDisplayName(appStore.selectedModelId()) : appStore.modelState()}
           </p>
+          <div class="grid grid-cols-2 gap-x-4 gap-y-3 pt-1">
+            <div class="space-y-1">
+              <span class="text-[10px] font-bold uppercase tracking-widest text-[var(--color-earthy-soft-brown)]">Backend</span>
+              <select
+                class="w-full text-sm bg-transparent border-b border-[var(--color-earthy-sage)]/40 px-0 py-1.5 text-[var(--color-earthy-dark-brown)] focus:outline-none focus:border-[var(--color-earthy-muted-green)]"
+                value={appStore.modelBackendMode()}
+                onInput={(e) => appStore.setModelBackendMode((e.target as HTMLSelectElement).value as 'webgpu-hybrid' | 'wasm')}
+                disabled={appStore.modelState() === 'loading'}
+              >
+                <option value="webgpu-hybrid">WebGPU</option>
+                <option value="wasm">WASM</option>
+              </select>
+            </div>
+            <div class="space-y-1">
+              <span class="text-[10px] font-bold uppercase tracking-widest text-[var(--color-earthy-soft-brown)]">Stride</span>
+              <input
+                type="number"
+                min="1"
+                max="4"
+                step="1"
+                value={appStore.frameStride()}
+                onInput={(e) => {
+                  const next = Number((e.target as HTMLInputElement).value);
+                  if (Number.isFinite(next)) appStore.setFrameStride(Math.max(1, Math.min(4, Math.round(next))));
+                }}
+                class="w-full text-sm bg-transparent border-b border-[var(--color-earthy-sage)]/40 px-0 py-1.5 text-[var(--color-earthy-dark-brown)] focus:outline-none focus:border-[var(--color-earthy-muted-green)]"
+              />
+            </div>
+            <div class="space-y-1">
+              <span class="text-[10px] font-bold uppercase tracking-widest text-[var(--color-earthy-soft-brown)]">Encoder</span>
+              <select
+                class="w-full text-sm bg-transparent border-b border-[var(--color-earthy-sage)]/40 px-0 py-1.5 text-[var(--color-earthy-dark-brown)] focus:outline-none focus:border-[var(--color-earthy-muted-green)]"
+                value={appStore.encoderQuant()}
+                onInput={(e) => appStore.setEncoderQuant((e.target as HTMLSelectElement).value as 'int8' | 'fp32')}
+                disabled={appStore.modelState() === 'loading'}
+              >
+                <option value="fp32">fp32</option>
+                <option value="int8">int8</option>
+              </select>
+            </div>
+            <div class="space-y-1">
+              <span class="text-[10px] font-bold uppercase tracking-widest text-[var(--color-earthy-soft-brown)]">Decoder</span>
+              <select
+                class="w-full text-sm bg-transparent border-b border-[var(--color-earthy-sage)]/40 px-0 py-1.5 text-[var(--color-earthy-dark-brown)] focus:outline-none focus:border-[var(--color-earthy-muted-green)]"
+                value={appStore.decoderQuant()}
+                onInput={(e) => appStore.setDecoderQuant((e.target as HTMLSelectElement).value as 'int8' | 'fp32')}
+                disabled={appStore.modelState() === 'loading'}
+              >
+                <option value="int8">int8</option>
+                <option value="fp32">fp32</option>
+              </select>
+            </div>
+          </div>
           <Show when={appStore.modelState() === 'loading'}>
             <div class="space-y-1">
               <div class="flex justify-between text-xs">
@@ -134,6 +189,26 @@ export const SettingsContent: Component<SettingsContentProps> = (props) => {
 
         <Show when={showSliders()}>
           <section class="grid grid-cols-2 gap-x-4 gap-y-3">
+          <div class="space-y-1.5 min-w-0">
+            <div class="flex justify-between items-center gap-2">
+              <span class="text-[10px] font-bold uppercase tracking-widest text-[var(--color-earthy-soft-brown)]">WASM threads</span>
+              <span class="text-sm text-[var(--color-earthy-dark-brown)] tabular-nums shrink-0">{appStore.wasmThreads()} / {maxWasmThreads()}</span>
+            </div>
+            <input
+              type="range"
+              min="1"
+              max={maxWasmThreads()}
+              step="1"
+              value={Math.min(appStore.wasmThreads(), maxWasmThreads())}
+              onInput={(e) => {
+                const next = parseInt(e.currentTarget.value, 10);
+                appStore.setWasmThreads(Math.max(1, Math.min(maxWasmThreads(), next)));
+              }}
+              class="debug-slider w-full h-2 rounded-full appearance-none cursor-pointer bg-[var(--color-earthy-sage)]/30"
+            />
+            <div class="text-[9px] text-[var(--color-earthy-soft-brown)]">Applied on next model load/reload.</div>
+          </div>
+
           <div class="space-y-1.5 min-w-0">
             <div class="flex justify-between items-center gap-2">
               <span class="text-[10px] font-bold uppercase tracking-widest text-[var(--color-earthy-soft-brown)]">Energy threshold</span>