🤖AI Engineer & Backend Developer

IQStocker AI Ecosystem

Экосистема AI-автоматизации контента из 5 микросервисов

"OpenAI GPT-4 Vision"
"OpenAI Batch API"
"Python"
"FastAPI"
"PySide6"
"Chrome Ext"
"PostgreSQL"

>Бизнес-задача

Полностью автоматизировать рутину стоковых фотографов и контент-мейкеров — от исследования рынка до массовой выгрузки визуального контента с AI.

>Экосистема продуктов

Проект состоит из 5 независимых, но глубоко интегрированных модулей (от парсера до SaaS):

  • -Data Extraction Pipeline: Десктоп-утилита для массового парсинга референсов со стоков.
  • -AI Generation Engine: Desktop-оркестратор для пакетной генерации контента через GPT и Midjourney.
  • -Smart Auto-Tagging: CLI-инжектор метаданных (SEO) прямо в JPG через GPT-4 Vision и OpenAI Batch API.
  • -IQStocker SaaS: Аналитическая платформа с Telegram-ботом, PostgreSQL БД и AI-прогнозированием трендов.
  • -Automation Node: Full-Stack мост (FastAPI + Next.js + Chrome Extension) для фонового управления Discord.
IQStocker AI Ecosystem — Наглядная схема взаимодействия всех пяти модулей

overview Взаимодействие компонентов экосистемы — от сбора данных до SaaS-аналитики.

>Техническая реализация

ЗадачаРешениеСложность
Stealth DOM AutomationИнжект событий в React-дерево Discord через Manifest V3Browser Extension API / Anti-fraud bypass
AI Batch ProcessingАсинхронная сборка 10,000+ картинок в .jsonl для OpenAIOrchestration & Async Polling (-50% API Cost)
EXIF/Metadata InjectionПрямая запись UTF-16 SEO-тегов в заголовки файловBinary-level Byte Modification
High-load Парсинг10-поточный краулер с динамическим обходом защитыConcurrency & Rate-Limits Automation

>Архитектура: Модульный пайплайн

Для обеспечения отказоустойчивости и высокой скорости работы, монолитный процесс был разбит на узконаправленные микро-инструменты с чистой архитектурой (Separation of Concerns). Каждый модуль выполняет свою задачу, формируя единую экосистему.

01

Data Extraction Pipeline (Adobe Stock Scraper)

PythonBeautifulSoupThreadPoolExecutortkinter

Бизнес-задача: Для обучения AI-моделей и анализа трендов заказчику требовалось массово собирать референсные изображения с Adobe Stock. Ручной поиск, применение фильтров и скачивание превью занимали у команды десятки часов еженедельно.

Техническое решение: Разработано десктопное приложение на Python с интуитивным графическим интерфейсом и строгим разделением бизнес-логики (utils.py) и UI (gui.py). Скрипт автоматизирует весь процесс: от динамического построения сложных URL-запросов до параллельного скачивания файлов.

Ключевые возможности:

  • -High-Performance Multithreading: Интеграция ThreadPoolExecutor для асинхронного скачивания изображений в 10 потоков, что ускорило процесс экстракции данных в несколько раз.
  • -Desktop GUI: Удобный интерфейс на базе tkinter для ввода поисковых запросов, настройки папок вывода и пагинации.
  • -Глубокая параметризация: Динамическая сборка URL-запросов с поддержкой параметров сортировки, фильтров по цене (Premium/Standard) и ориентации.
  • -Экстракция метаданных: Многоуровневый парсинг DOM-дерева через BeautifulSoup с извлечением специфичных микроразметок (itemprop='thumbnailUrl').
Чистая архитектура: Разделение интерфейса, ядра парсинга и логики скачивания

fig.1 Separation of Concerns Layers

02

AI Content Generation Engine (GPT + Midjourney)

PySide6OpenAI APIKey RotationTelegram Alerts

Бизнес-задача: После сбора референсов заказчику требовалось генерировать тысячи уникальных изображений и SEO-оптимизированных описаний к ним. Использование веб-интерфейсов ChatGPT или Discord для Midjourney не позволяло масштабировать процесс и занимало слишком много ручного труда.

Техническое решение: Создан десктопный комбайн на базе PySide6 (Qt), который работает как единый оркестратор для OpenAI API и Midjourney. Программа берет на себя всю рутину по пакетной генерации контента, обеспечивая обход Rate Limits (лимитов запросов) за счет умной ротации пула API-ключей.

Ключевые возможности:

  • -Multi-API Orchestration: Бесшовная интеграция текстовых (GPT) и генеративных (Midjourney) моделей в едином асинхронном пайплайне.
  • -Fault Tolerance & Key Rotation: Встроенная защита от блокировок API. Скрипт автоматически переключается между 10+ резервными ключами и умеет уходить в спящий режим (pause.py) при исчерпании глобальных лимитов.
  • -Telegram Alerting: Кастомный логгер (logger.py) отслеживает состояние потоков и моментально отправляет уведомления в Telegram-бота при возникновении критических ошибок или успешном завершении батча.
  • -Premium Desktop GUI: Профессиональный интерфейс на PySide6 с возможностью тонкой настройки параметров генерации (temperature, tokens, prompts).

Структура проекта: Интеграция UI, логгера, контроллера пауз и ядра генерации

fig.2 Модульная архитектура — Изоляция логики логирования, UI-компонентов и многопоточного процессора.

03

Smart Auto-Tagging & EXIF Injector (GPT-4 Vision)

GPT-4 VisionOpenAI Batch APIpiexifPySide6

Бизнес-задача: Создание изображений — это только половина дела. Загрузка тысяч файлов на стоки требует прописывания SEO-оптимизированных Title, Description и 50 ключевых слов для каждого изображения. Ручное тегирование убивало всю рентабельность процесса. Требовалась система, которая сама «посмотрит» на картинку, придумает теги и подготовит файл к загрузке.

Техническое решение: Разработан скрипт-инжектор на базе PySide6. Программа использует GPT-4 Vision для визуального анализа контента и библиотеку piexif для низкоуровневой записи сгенерированных метаданных напрямую в заголовки .jpg файлов.

V2.0 Optimization — OpenAI Batch API: В процессе масштабирования (при объемах в десятки тысяч файлов) была внедрена архитектура OpenAI Batch API. Программа автоматически конвертирует изображения в Base64, упаковывает их в .jsonl пакеты и отправляет в асинхронную очередь. Это позволило снизить стоимость API-запросов на 50% и снять ограничения по TPM за счет выделенной очереди.

Ключевые возможности:

  • -Visual Context Analysis: Скрипт кодирует изображение и передает его в мультимодальную LLM, получая 100% релевантные ключевые слова.
  • -EXIF Metadata Injection: Прямая манипуляция байт-кодом. Сгенерированные данные конвертируются в UTF-16 (utf-16le) и записываются в теги XPTitle, XPSubject и XPKeywords.
  • -Smart Rate-Limiting & Async Polling: Встроенная защита от исчерпания лимитов. Скрипт автономно опрашивает статус батчей и по готовности инжектит теги без блокировки UI.

Асинхронная логика формирования и отправки батчей

fig.3 Batch Orchestration Flow — Логика формирования JSONL-пакетов и асинхронного поллинга результатов от OpenAI.

04

IQStocker (AI-Powered Analytics SaaS)

aiogramPostgreSQLSQLAlchemyAlembicDockerCI/CD

Бизнес-задача: Создание контента — это лишь половина дела. Главная проблема — аналитика продаж. Авторам требовался инструмент, который может автоматически анализировать их сырые CSV-выгрузки со стоковых площадок, выявлять прибыльные ниши и с помощью ИИ прогнозировать, какой контент стоит создавать в следующем месяце для максимизации прибыли. Требовалось перевести хаотичные данные в пошаговую стратегию.

Техническое решение: Разработан коммерческий SaaS-продукт с интерфейсом через Telegram-бота (aiogram / python-telegram-bot). Проект включает сложную архитектуру данных на базе PostgreSQL и SQLAlchemy (ORM) с миграциями через Alembic, а также интеграцию с LLM-моделями для семантического анализа рынка. Платформа имеет встроенную систему монетизации (Boosty/Tribute), управления подписками и реферальную программу.

Live Demo@IQStockerBot

Ключевые возможности:

  • -Automated CSV Analytics Engine (pandas): Прогрессивные алгоритмы парсинга и расчета метрик портфолио (Revenue, RPI, bestsellers). Скрипт принимает отчеты от Adobe Stock/Shutterstock и трансформирует их в интуитивно понятные KPI-отчеты.
  • -AI Recommendation Engine (Market Producer): Семантический анализ успешных работ и тегов через LLM. Нейросеть выступает в роли продюсера, выявляя скрытые паттерны успеха и генерируя персонализированные рекомендации для будущих съемок/генераций.
  • -Integrated Monetization & Billing: Полноценная система тарифов и подписок. Реализованы модули обработки платежей через внешние шлюзы (Boosty, Tribute) с автоматическим управлением лимитами пользователей и выдачей «бустов».
  • -DevOps Maturity: Проект полностью контейнеризирован (docker-compose). Жизненный цикл приложения управляется через автоматизированный CI/CD пайплайн: при пуше в main GitHub-ветку срабатывает workflow, который собирает Docker-образ и бесшовно обновляет production-сервер.
SaaS Architecture — Микросервисный подход: Bot, Database, LLM Engine и Payment Gateways

fig.4 SaaS Ecosystem — Архитектура аналитической платформы: интеграция Telegram API, PostgreSQL и нейросетевого ядра.

05

Midjourney Automation Engine (Extension + SaaS)

Next.jsFastAPIPostgreSQLTypeScriptChrome Ext MV3

Бизнес-задача: Заказчику требовалось генерировать тысячи изображений в фоновом режиме, но Discord строго запрещает использование неофициальных API и self-ботов для Midjourney, мгновенно блокируя такие аккаунты. Требовался абсолютно безопасный, масштабируемый инструмент, который автоматизирует процесс (ввод промптов, апскейл, скачивание), не вызывая подозрений у антифрод-систем Discord.

Техническое решение: Разработана гибридная Full-Stack экосистема. Управление пулом задач происходит в облачном дашборде (frontend на Next.js, backend на FastAPI + PostgreSQL). Исполнителем выступает умное браузерное расширение (Chrome Extension на TypeScript, Manifest V3). Расширение внедряется в веб-клиент Discord и работает как «роботизированная рука»: оно берет промпты из базы и имитирует действия живого человека поверх React-дерева Discord.

Архитектура продукта (SaaS Ecosystem):

ЗадачаРешениеСложность
Web Portal (Frontend)Личный кабинет пользователя на Next.js с авторизацией через TelegramLoginButton, покупкой тарифов и балансом кредитов.Next.js · TypeScript
Chrome Extension (Executor)Невидимый Manifest V3 робот в браузере. Синхронизируется с порталом и выполняет задачи в Discord через Stealth DOM Injection.TypeScript · DOM API
Backend APIFastAPI + PostgreSQL: очередь задач, биллинг, интеграции с Boosty и Tribute для авто-начисления кредитов.FastAPI · Alembic
Admin Control CenterПанель владельца: CRM пользователей, аналитика кредитов, реестр транзакций, Audit Logs ошибок расширения и конфигурация вебхуков.Next.js · RLS

Ключевые возможности:

  • -Stealth DOM Automation (Manifest V3): Безопасный обход защит Discord. Скрипт (content.ts) фокусируется на поле ввода, эмулирует ClipboardEvent для вставки промптов и отправляет нативные KeyboardEvent (Enter), имитируя естественные задержки (Human-like typing).
  • -Smart Queue & State Machine: Асинхронная обработка очереди. Расширение непрерывно парсит DOM, отслеживая статус генерации (поиск прогресса %, ожидание кнопок U1-U4), автоматически нажимает Upscale и скачивает готовые исходники на жесткий диск.
  • -Full-Stack SaaS Platform: Полноценный веб-портал с бесшовной авторизацией через Telegram (TelegramLoginButton).
  • -Integrated Billing: Бэкенд на FastAPI имеет интеграцию с платежными шлюзами (Boosty, Tribute) для автоматического начисления кредитов (generations) и обработки подписок.
Live_Feed|1x
>Midjourney Automation Engine: Stealth DOM Injection & Discord Orchestration
Midjourney Automation Architecture — Cloud Backend & Browser Extension Bridge

fig.5 Automation Engine Architecture — Гибридная схема: Взаимодействие FastAPI, Chrome Extension и Discord DOM.

Нужна сложная разработка или AI-автоматизация?

Расскажите о задаче — обсудим архитектуру и подберем оптимальное техническое решение.