Многофункциональный AI-агент для работы с Pollinations.ai API. Поддерживает генерацию изображений, аудио, работу с файлами, интернет-поиск, анализ мультимедиа, автоматическую разработку ПО и многое другое!
- Изображения: Генерация изображений с выбором из множества моделей (flux, turbo, kontext, gptimage, deliberate и др.)
- Аудио: Text-to-Speech с 6 голосами (alloy, echo, fable, onyx, nova, shimmer) 🎵
- Текст: Общение с различными AI моделями (OpenAI GPT-4.1, DeepSeek V3, Grok-3 Mini, Mistral и др.)
- Базовые операции: Создание, чтение, запись, удаление файлов и папок
- Перемещение файлов: Перемещение, переименование, обмен файлов местами
- Навигация: Просмотр содержимого директорий
- Документы: DOCX, DOC, PDF, XLSX, XLS, PPTX, PPT
- Текстовые файлы: TXT, JSON, XML, CSV, MD, LOG
- Код: Python, JavaScript, HTML, CSS
- Изображения: Анализ и извлечение информации
- Анализ изображений: Детальное описание содержимого с помощью AI Vision
- OCR: Распознавание текста на изображениях (Tesseract + AI Vision API)
- Техническая информация: Размер, формат, EXIF данные
- Поиск файлов: Умный поиск изображений по номерам и ключевым словам
- Умное открытие: Автоматическое определение типа файла
- Программы по умолчанию: Открытие файлов в ассоциированных программах
- Исполняемые файлы: Запуск .exe, .bat, .cmd с возможностью запуска от администратора
- Поиск похожих файлов: Автоматический поиск файлов с похожими именами
- Поиск в интернете: SearchGPT, ElixpoSearch для актуальной информации
- Загрузка файлов: Скачивание любых файлов по URL
- Загрузка изображений: Специализированная загрузка изображений
- Поиск и загрузка изображений: Автоматический поиск и массовая загрузка изображений
- Системные команды: Выполнение команд с подтверждением безопасности
- Python код: Безопасное выполнение Python скриптов
- Python проекты: Создание проектов с виртуальным окружением и зависимостями
- Автоматическая разработка ПО: Создание программ по описанию с автоисправлением ошибок
- Информация о системе: CPU, RAM, диски, версия ОС
- Управление службами Windows: Запуск, остановка, перезапуск служб
- Реестр Windows: Безопасное изменение параметров реестра
- Поиск файлов: Находит файлы по номерам, ключевым словам, типу
- Анализ контента: Автоматическое определение содержимого файлов
- Распознавание намерений: Понимает что именно нужно проанализировать
| Функция | Описание | Пример использования |
|---|---|---|
createDirectory |
Создание папки | "Создай папку Проекты" |
createFile |
Создание файла с содержимым | "Создай файл hello.txt с текстом привет" |
readFile |
Чтение текстового файла | "Прочитай файл config.txt" |
readAdvancedFile |
Умное чтение любых форматов | "Что написано в document.docx" |
writeFile |
Запись в существующий файл | "Перезапиши файл с новым текстом" |
deleteFile |
Удаление файла | "Удали файл temp.txt" |
deleteDirectory |
Удаление папки | "Удали папку старые_файлы" |
moveFile |
Перемещение/переименование | "Перемести файл в папку архив" |
listDirectory |
Просмотр содержимого папки | "Покажи что в папке загрузки" |
| Функция | Описание | Пример использования |
|---|---|---|
generateImage |
Генерация изображения | "Сгенерируй картинку кота" |
analyzeImage |
Анализ изображения с AI | "Проанализируй фото.jpg" |
recognizeText |
OCR - извлечение текста | "Распознай текст на скриншоте" |
findAndAnalyzeFile |
Поиск и анализ файла | "Найди и проанализируй картинку 11" |
| Функция | Описание | Пример использования |
|---|---|---|
generateAudio |
Text-to-Speech | "Озвучь текст голосом alloy" |
sayText |
Произнести текст | "Скажи привет мир" |
| Функция | Описание | Пример использования |
|---|---|---|
openFileWithDefaultProgram |
Открыть программой по умолчанию | "Открой документ.pdf" |
runExecutable |
Запуск исполняемого файла | "Запусти программу.exe" |
smartOpenFile |
Умное открытие любого файла | "Открой файл project.docx" |
| Функция | Описание | Пример использования |
|---|---|---|
searchInternet |
Поиск в интернете | "Найди информацию о Python" |
downloadFile |
Загрузка файла | "Скачай файл с example.com/file.zip" |
downloadImage |
Загрузка изображения | "Загрузи картинку с сайта" |
searchAndDownloadImages |
Поиск и загрузка изображений | "Найди и скачай 5 фото котов" |
| Функция | Описание | Пример использования |
|---|---|---|
executeCommand |
Выполнение команды | "Выполни команду dir" |
runPythonCode |
Запуск Python кода | "Выполни код print('hello')" |
createPythonProject |
Создание Python проекта | "Создай проект калькулятор" |
developSoftware |
Автоматическая разработка ПО | "Разработай игру угадай число" |
| Функция | Описание | Пример использования |
|---|---|---|
getSystemInfo |
Информация о системе | "Покажи информацию о компьютере" |
manageServices |
Управление службами | "Перезапусти службу Print Spooler" |
changeRegistryValue |
Изменение реестра | "Измени параметр в реестре" |
- Python 3.8+
- Windows/Linux/macOS
- Интернет-соединение
-
Клонируйте репозиторий:
git clone https://github.com/Processori7/Poli_AI.git cd Poli_AI -
Установите зависимости:
pip install -r requirements.txt
-
Настройте API токен (опционально для аудио):
Создайте файл
.envв корневой папке:# Получите токен на https://auth.pollinations.ai/ POLLINATIONS_TOKEN=ваш_токен_здесь DEFAULT_MODEL=openai MAX_ATTEMPTS=3 INTERFACE_LANGUAGE=ru # Язык интерфейса по умолчанию OUTPUT_LANGUAGE=ru # Язык вывода по умолчанию FIRST_STARTUP_LANGUAGE_SELECTION=true # Показать выбор языка при первом запуске
Для генерации аудио токен обязателен! 🔑
python main.py- Выберите модель AI из списка доступных или используйте модель по умолчанию
- Выберите язык интерфейса и вывода при первом запуске (если включено)
- Введите задачу на естественном языке
- Агент автоматически выполнит задачу или предложит план
Сгенерируй изображение красивого заката над океаном
Сгенерируй аудио с текстом "Привет, мир!"
Создай папку "Проекты" и файл "README.md" в ней
Найди последние новости о искусственном интеллекте
Создай Python программу для подсчета факториала
- Перейдите на auth.pollinations.ai
- Зарегистрируйтесь или войдите в аккаунт
- Получите API токен
- Добавьте его в
.envфайл
- Обязательно: Генерация аудио 🎵
- Опционально: Генерация изображений и текста (повышает приоритет и убирает ограничения)
- ✅ Генерация изображений (с ограничениями)
- ✅ Текстовое общение с AI
- ✅ Все функции файловой системы
- ✅ Интернет-поиск и загрузки
- ❌ Генерация аудио
- OpenAI GPT-4.1 - Универсальная модель
- DeepSeek V3 - Продвинутая модель рассуждений
- Grok-3 Mini - Быстрая модель от xAI
- Mistral Small - Эффективная европейская модель
- SearchGPT - Специализированная модель для поиска
- И многие другие...
- Flux - Высокое качество (по умолчанию)
- Turbo - Быстрая генерация
- Kontext - Специализированная модель
- GPTImage - От OpenAI
- Alloy - Нейтральный голос
- Echo - Четкий и ясный
- Fable - Выразительный
- Onyx - Глубокий голос
- Nova - Женский голос
- Shimmer - Мягкий и теплый
Poli_AI/
├── main.py # Основной файл агента
├── requirements.txt # Зависимости Python
├── .env # API токены (создайте сами)
├── README.md # Документация
├── output/ # Папка для сгенерированных файлов
│ ├── images/ # Изображения
│ └── audio/ # Аудио файлы
└── pollinations_agent.log # Логи работы
- Агент запрашивает подтверждение для потенциально опасных операций
- Системные команды требуют явного разрешения
- API токены должны храниться в
.envфайле (не в коде!) - Все запросы к API помечены как
private=true
- Убедитесь, что в
.envфайле указан корректный токен - Проверьте интернет-соединение
- Токен должен иметь права на генерацию аудио
- Проверьте интернет-соединение
- Попробуйте другую модель генерации
- Добавьте токен для повышения приоритета
- Проверьте права доступа к папкам
- Убедитесь в корректности путей
- На Windows может потребоваться запуск от администратора
MIT License - см. файл LICENSE для деталей.
Приветствуются Pull Request'ы и предложения по улучшению!
Если у вас возникли вопросы:
- Проверьте этот README
- Посмотрите логи в
pollinations_agent.log - Создайте Issue в репозитории
Multifunctional AI agent for working with Pollinations.ai API. Supports image generation, audio, file management, internet search and much more!
- Images: Image generation with model selection (flux, turbo, kontext, gptimage)
- Audio: Text-to-Speech with 6 voices (alloy, echo, fable, onyx, nova, shimmer) 🎵
- Text: Chat with various AI models
- Create, read, write, delete files
- Folder management
- Move and rename files
- Internet search (SearchGPT, ElixpoSearch)
- File and image downloads
- Image search and download
- Execute system commands
- Run Python code
- Create Python projects with virtual environments
- Automatic software development with error correction
- Get system information
- Manage Windows services
- Modify Windows registry
- Python 3.8+
- Windows/Linux/macOS
- Internet connection
-
Clone the repository:
git clone <repository-url> cd Poli_AI
-
Install dependencies:
pip install -r requirements.txt
-
Configure API token (optional for audio):
Create a
.envfile in the root folder:# Get token at https://auth.pollinations.ai/ POLLINATIONS_TOKEN=your_token_here DEFAULT_MODEL=openai MAX_ATTEMPTS=3 INTERFACE_LANGUAGE=en # Default interface language OUTPUT_LANGUAGE=en # Default output language FIRST_STARTUP_LANGUAGE_SELECTION=true # Show language selection on first startup
Token is required for audio generation! 🔑
python main.py- Select AI model from available list or use default model
- Choose interface and output language on first startup (if enabled)
- Enter task in natural language
- Agent will automatically execute task or suggest a plan
Generate an image of a beautiful sunset over the ocean
Generate audio with text "Hello, world!"
Create a "Projects" folder and "README.md" file in it
Find latest news about artificial intelligence
Create a Python program to calculate factorial
| Variable | Default | Description |
|---|---|---|
POLLINATIONS_TOKEN |
- | API token for enhanced features |
DEFAULT_MODEL |
openai | Default AI model to use |
MAX_ATTEMPTS |
3 | Maximum attempts for task execution |
INTERFACE_LANGUAGE |
ru | Interface language (ru/en) |
OUTPUT_LANGUAGE |
ru | AI response language (ru/en) |
FIRST_STARTUP_LANGUAGE_SELECTION |
true | Show language selection on first run |
DEFAULT_VOICE |
alloy | Default TTS voice |
REQUIRE_CONFIRMATION |
true | Require confirmation for dangerous operations |
DEBUG_MODE |
false | Enable debug information |
The agent supports both Russian and English:
- Interface Language: Controls menu text and prompts
- Output Language: Controls AI response language
- First Startup Selection: Interactive language setup on first run
You can set a default model or choose interactively:
- Available models are fetched from Pollinations API
- Models include OpenAI GPT, DeepSeek, Grok, Mistral, and more
- Model can be changed during runtime with 'change' command
The agent automatically retries failed tasks:
MAX_ATTEMPTScontrols the number of retry attempts- Intelligent error analysis and code correction
- Progressive problem-solving approach
- Confirmation prompts for dangerous operations
- System commands require explicit permission
- API tokens stored securely in
.envfile - All API requests marked as
private=true - Registry and service operations require confirmation
- OpenAI GPT-4.1 - Universal model
- DeepSeek V3 - Advanced reasoning model
- Grok-3 Mini - Fast model by xAI
- Mistral Small - Efficient European model
- SearchGPT - Specialized search model
- And many others...
- Flux - High quality (default)
- Turbo - Fast generation
- Kontext - Specialized model
- GPTImage - By OpenAI
- Alloy - Neutral voice
- Echo - Clear and crisp
- Fable - Expressive
- Onyx - Deep voice
- Nova - Female voice
- Shimmer - Soft and warm
- Ensure correct token in
.envfile - Check internet connection
- Token must have audio generation permissions
- Check internet connection
- Try different generation model
- Add token for higher priority
- Check folder permissions
- Verify path correctness
- May require administrator rights on Windows
- Delete
.envfile to reset language selection - Set
FIRST_STARTUP_LANGUAGE_SELECTION=trueto show language menu - Manually edit language settings in
.envfile
MIT License - see LICENSE file for details.
Pull requests and suggestions for improvements are welcome!
If you have questions:
- Check this README
- Look at logs in
pollinations_agent.log - Create an Issue in the repository