audio-multimodal

Here are 2 public repositories matching this topic...

danielrosehill / Audio-Multimodal-AI-Resources

A compilation of resources (model profiles, benchmarks, docs) for multimodal AI models with audio understanding (esp. focused on ASR and transcription use-cases)

stt asr audio-understanding multimodal-ai audio-multimodal audio-text-to-text

Updated Dec 8, 2025

danielrosehill / Gemini-Transcription-MCP

Star

MCP for Gemini multimodal audio transcription with built in post-processing

mcp gemini transcription dictation gemini-mcp audio-multimodal

Updated Dec 31, 2025
TypeScript

Improve this page

Add a description, image, and links to the audio-multimodal topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the audio-multimodal topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly