MK.
System onlineСофия, България · AI инженер · Мултиагентни системи · RAG · Автоматизация

Проектирам,пускамиподдържампродукционниAIсистемисамостоятелно,отидеятадоексплоатацията.

Две години продукционен опит в digital агенция: мултиагентни LLM пайплайни, RAG върху милиони документи и AI продукти, за които плаща реален бизнес. Всяка система по-долу е работеща или demo-ready, изградена изцяло от един човек.

7
продукционни AI системи
180k+
реда код — самостоятелно
1.5M+
векторни чънкове
800+
автоматизирани теста
13-агентен LangGraph пайплайн в продукция1,54 млн векторни чънкове · агентен RAG2–4 часа presales → 3 минутиотразен в националните медии€3,700+ преки приходи от клиенти800+ автоматизирани теста76k реда код соло за 2,5 месецаLLM-as-judge · QA гейтове · защита на фактите
[01]

Избрани проекти

Седем продукционни системи. Всеки показател по-долу е реален и проверим.

https://scout.netpeak.dev
Табло на Netpeak Scout
76k
реда код за 2,5 месеца
488
комита, соло
19
инструмента на агента
10s
вместо 30–60 минути ръчно
В продукция · 20+ ежедневни потребителимарт 2026 — сега

Netpeak Scout

Единствен архитект и разработчик — вътрешен AI co-pilot за анализи

AI co-pilot за анализи за 20+ проджект мениджъри в Netpeak Bulgaria. PM-ите питат на естествен български, руски или английски — Scout отговаря за ~10 секунди с реални числа и посочени източници от GA4, Search Console, Google/Meta/TikTok Ads, Gmail, Drive и база знания за всеки проект.

Проблем

PM-ите губеха по 30–60 минути на всеки въпрос от клиент, кликайки из пет конзоли и сглобявайки отчети на ръка.

  • Агентен рутер: LLM избира измежду 19 модула инструменти — тренд, диагностика, сравнение, KB Q&A, генериране на имейли, отчети
  • RAG база знания на pgvector + self-hosted bge-m3: файлове, Google Drive, Gmail и съобщения от Telegram групи
  • Слой за верификация LLM-as-judge (Claude Haiku) сверява всеки отговор спрямо извлечените данни
  • Сигнали за аномалии, сутрешни брифинги, NL месечни отчети, огледален Telegram бот — всичко на един VPS за €15/месец
PythonFastAPIpgvectorRedis/arqReact 19OpenRouterClaudeGA4/GSC/Ads APIsHetzner
Виж на живо
lead-agent · internal
3 min
вместо 2–4 часа ръчно
$0.20
разход за API на lead
13
агента в pipeline-а
28
файла с тестове
В продукция · използва се от отдела по продажбифевруари — май 2026

Netpeak Lead Agent

Единствен разработчик — presales pipeline от 13 агента на LangGraph

Продавачът поставя суров входящ lead — 3 минути по-късно получава готова оферта на български: проучване на компанията, одит на сайта, SEO данни за пазара, прогноза за бюджет, подбрани услуги и въпроси за подготовка на срещата. 13 агента, оркестрирани с LangGraph, с QA контрол преди човек изобщо да го види.

Проблем

Presales проучването изяждаше по 2–4 часа от времето на старши продавач за всеки lead.

  • 6 research агента работят паралелно: уеб проучване с Perplexity, одитор на сайта, Serpstat SEO, PageSpeed, Meta Ads, достъпност за AI ботове
  • RAG matcher подбира услуги от вътрешната база знания (Qdrant); Opus пише, агент-коректор държи QA контрол при score ≥ 0.72
  • Resilience-first: отказът на един агент никога не убива pipeline-а — частични резултати с graceful degradation
  • SSE прогрес в реално време, PDF експорт, чатбот за всяка оферта, админ панел с hot-swap на промптове и модели за всеки агент
PythonLangGraphFastAPIQdrantNext.js 16PostgreSQLDocker ComposeClaude Opus/SonnetPerplexity
discover · internal
13
филтъра за съответствие
$0.06
на статия
168
автоматизирани теста
3 wk
спецификация → продукция
В продукция · генерира приходимай — юни 2026

Discover Compliance Bot

Единствен технически собственик — първият AI продукт, който агенцията продава на външен клиент

AI редакционен linter и rewriter за един от водещите новинарски издатели в България. Проверява всяка статия спрямо checklist за съответствие с Google Discover от 13 филтъра, след което пренаписва нарушенията, запазвайки дословно всеки цитат, посочен източник и число — guardrail-ът, който прави AI безопасен за нюзрум.

Проблем

Трафикът от Google Discover е екзистенциален за издателите; ръчният checklist от 13 филтъра се прилагаше бавно и непоследователно.

  • Първо детерминиран YAML rule engine ($0, <50ms), след това анализатор Haiku, после rewriter Sonnet — рутиране на модели по ценови нива, ~$0.06–0.12/статия
  • Post-hoc guardrail проверява, че цитатите, източниците и числата са оцелели след пренаписването дословно
  • Bulk режим: ZIP/CSV на входа → ZIP + резюме на изхода, възобновяемо състояние на SQLite, капацитет ~100 статии/ден
  • 168 теста с напълно mock-нат LLM слой, mypy --strict, двоен deployment (VPS + Vercel) за 3 седмици от спецификация до продукция
PythonFastAPIClaude Haiku/SonnetYAML rule engineNext.js 15SQLiteDockerHetznerPlaywright
https://dabulgaria.bg/programa/chat/
Интерфейс на изборния чатбот
3,310
индексирани страници
409
профили на кандидати
3
отразявания в национални медии
~$0
разходи за инфраструктура
На живо · публиченмарт — май 2026

Изборен чатбот за национална партия

Изграден от край до край — отразен в националните медии

Публичен AI асистент на партия «Да, България» по време на парламентарните избори през април 2026, вграден в официалния сайт на партията. Избирателите питат всичко за програмата и 409-те кандидати — отговорите се основават строго на официални материали с номерирани цитати на източниците. Отразен от mediapool.bg, offnews.bg и clubz.bg.

Проблем

Никой не чете програма от 2,000+ страници; една халюцинирана отговор в политически контекст се превръща в новина.

  • Хибриден RAG: BM25 (FTS5) + векторно търсене, обединени с Reciprocal Rank Fusion, после Cohere rerank — всичко в рамките на вградена SQLite база данни
  • Трик без инфраструктура: 59 MB векторна база данни се доставя вътре в Vercel serverless бъндъла — без хостван векторен store, почти нулева цена при пикове на медиен трафик
  • Защита срещу prompt-injection, устойчиво на spoofing ограничаване на заявките, 24-часов кеш на отговорите, плавна деградация на всеки слой от извличането
  • Издържа на вниманието на националните медии и враждебни публични потребители; плюс търсачка за избирателна секция в официалния държавен регистър ГРАО
Node.jsSQLite + sqlite-vec + FTS5Gemini FlashCohere rerankVercel serverlessPlaywright
Виж на живо
https://belobradova-toolkit.vercel.app/chat
Интерфейс на чата по законодателство
1.54M
вградени чънка
26k
обработени документи
1997→
обхват на стенограмите
0
ръчни операции от старта
На живо · публиченмай — юни 2026

RAG по законодателство за кабинета на депутат

Изграден соло за 2,5 седмици — напълно автономен нощен пайплайн

Публичен AI асистент върху целия корпус на българското законодателство: всички обществени обсъждания от 2008 г., пленарни стенограми от 1997 г., законопроекти, заседания на комисии — 1,54 млн. вградени чънка. Изграден за кабинета на български депутат; обновява се всяка нощ без човешка намеса.

Проблем

Законодателните данни са разпръснати из два неудобни държавни портала, голяма част от тях като сканирани PDF файлове без текстов слой.

  • Агентен RAG: евтин LLM планировчик избира измежду 7 специфични за корпуса инструмента за извличане и сам разхлабва филтрите си при празни резултати
  • Детерминистична предпазна мрежа работи паралелно с агента — отговорите никога не зависят само от планировчика
  • OCR попълване: 515 от 733 законопроекта възстановени от сканове с Tesseract, всяка нощ
  • Нощен eval харнес: 6 златни въпроса се изпълняват срещу продукцията, регресиите се виждат на следващата сутрин; вграждането на целия корпус струва ≈ 1 цент
Next.js 15TypeScriptpgvectorOpenRouterVercel AI SDKTesseract OCRPlaywrightHetzner
Виж на живо
skuptura · internal
€4.9k
приходи от клиенти
3,395
доставени описания
516
тестови функции
~90%
брутен марж
В продукция · €4,900+ приходидекември 2025 — сега

SKUptura — AI платформа за съдържание

Архитект и оператор — платена клиентска работа, multi-tenant

Продукционна платформа за съдържание, която превръща SKU + URL в проучена, проверена за факти SEO продуктова страница — масово, директно в ERP и Google Sheets на клиента. 3,395 описания, доставени на български e-commerce клиенти на 4 езика; пайплайнът за нови клиенти е активен.

Проблем

Хиляди SKU без описания; ръчният копирайтинг струва часове на продукт — а наивният LLM измисля тегла, състави и медицински твърдения.

  • 3-етапен пайплайн: изследовател (Perplexity Sonar) → автор (Gemini) → коректор, с промптове и бази знания за всеки клиент
  • Слой срещу фабрикуване: пост-скрабер премахва измислени спецификации; агент-критик преглежда изхода като купувач; контролни суми на GTIN, разпознаване на ветеринарни продукти, оценка на увереност
  • 8 документирани фази на клиентска обратна връзка; себестойност на текст ≈ €0.14 при цена €1–2
  • 516 тестови функции; React админ интерфейс; двигател за обогатяване на фийдове на доставчици с таксономия от 222 категории
PythonFastAPILangChainPerplexityGeminiReact 19Google Sheets APInopCommerceDocker
parliament · internal
34k
реда код за 3 седмици
217
транскрибирани заседания
250
проследени депутати
66
тестови файлове
Demo-ready · 34k реда код за 3 седмициаприл — май 2026

Parliament Tracker

Най-задълбоченият end-to-end проект: scrape → Whisper → диаризация → RAG

Civic-tech система, която прави работата на комисиите в българския парламент търсима: Python worker scrape-ва комисиите, транскрибира видеата от заседанията с Whisper, приписва речта на конкретни депутати чрез диаризация + LLM, вгражда всичко в pgvector — а Next.js табло предоставя стенограми, известия по теми и RAG чат с цитати.

Проблем

Истинската законодателна работа се случва в комисиите — а се публикува като сурови видеа и разпръснати PDF файлове, без търсене и без стенограми.

  • Пълен ML пайплайн, изграден соло: транскрипция с faster-whisper, диаризация на говорители, LLM приписване с лимити на разходите за сесия и кеширане по cluster-hash
  • Хибридно извличане (BM25 + pgvector ANN с RRF), захранващо български RAG чат със заключен системен промпт и хидратация на цитати
  • Реални данни: 6 комисии, 217 заседания, 250 депутати, 3,146 сегмента от стенограми
  • Изграден чрез документиран workflow за паралелна AI разработка с 3 агента и договори за зони на отговорност — 181 комита за 3 седмици
Next.js 16PrismapgvectorPython 3.12faster-whisperCeleryClaude APIDockerMinIO
[02]

Още проекти

На живо

Netpeak AI консултант

Публичен чатбот консултант по маркетинг + вграждащ се уиджет с един скрипт. RAG върху pgvector, инструменти за анализ на сайта, събиране на лийдове. 105 сесии и SQL-квалифицирани лийдове през първите 10 дни. Включва спасяване на жив инцидент: мигриране на мъртва managed база данни към self-hosted pgvector стек без нито една промяна в клиентския код.

Next.js 16pgvectorClaudeVite widget
Вътрешен инструмент

MSA Compliance Auditor

Предварително проверява всеки сайт по 102 проверки за съответствие с Microsoft Ads, преди да се отвори рекламен акаунт. Кръстосана верификация с два модела: Claude и GPT-4o анализират паралелно — FAIL от който и да е от тях печели, разминаването отива на ръчна проверка. 73 комита за 6 дни.

Next.js 16PrismaClaude + GPT-4oRDAP/WHOIS
На живо

Telegram бот за аналитика

Версията 1, която стана Scout: свободни многоезични въпроси → валидиран JSON интент → живи данни от GA4/GSC → отговор на естествен език. Обобщен за втори платещ клиент за един ден без нито една промяна в кода — конфигурация и systemd unit.

Pythonaiogram 3GA4/GSC APIClaude
Кейс стъди

Creative-Intelligence пайплайн

115 криейтива на Meta Ads, класифицирани с GPT-4o Vision, оценени повторно по състезателен принцип от Claude Sonnet, съгласието между оценителите измерено с каппа на Коен, групирани в 6 модела — плюс модел на юнит икономиката на фунията и жив прототип. 11 роли на агенти, 7 human-in-the-loop контролни точки, $3.13 общи разходи за API.

GPT-4o VisionClaudeApifyPython
AI за редакцията

Двигател за редакционен стил

Клонира стила на писане на професионален журналист от скрейпнат корпус в машинночетима стилова карта, след което генерира и редактира новини в този стил — със строг валидатор за защита на фактите, който отхвърля всяка AI редакция, засягаща имена, дати, числа или цитати.

PythonGemini 2.5 ProTelegram Bot
На живо · за 3 дни

Търсене на избирателна секция

Личен сайт + национално търсене на избирателна секция за публична личност, пуснат за 3 дни преди пика на изборите. Реверс-инженеринг на недокументиран държавен endpoint в изчистена каскадна форма за адрес; headless WordPress блог с автоматичен импорт чрез n8n.

Next.js 16Headless WPGRAO APIVercel
2025–2026

Извличане на данни за клиенти (20 задачи)

~20 задачи за скрейпинг и извличане на данни за клиенти на агенцията през 15+ български e-commerce и медийни сайтове: продуктови фийдове, карти на канонични URL адреси, редакционен одит от 9,100 реда. Playwright, Selenium, LLM обогатяване, възобновяеми изпълнения, тактики срещу блокиране.

PythonPlaywrightSeleniumPerplexity API
2025

Пакет автоматизации n8n

Откъдето започна всичко: self-hosted n8n оркестратор, който проследява изпълнението на задачи по 60 клиентски проекта за CEO, генериране на SEO статии с GPT-4 от брифове в Sheets, автоматизирани отчети от Search Console. Историята на произхода на всяка система по-горе.

n8nDockerGPT-4Google APIs
[03]

Как доставям толкова бързо

Разработката с помощта на AI е моят производствен метод, а не пряк път. Архитектурата и всяко интеграционно решение са мои — агентите умножават ръцете ми, а guardrail-ите пазят резултата честен.

01

Мултиагентни работни потоци

Parliament Tracker беше изграден от 3 паралелни AI агента с документирани договори за зони на отговорност; creative-intelligence pipeline-ът работеше с 11 агентски роли и 7 human-in-the-loop точки за проверка. Аз проектирам процеса, агентите изпълняват, аз верифицирам.

02

Guardrail-и преди доверие

LLM-as-judge верификация в Scout, QA gate с коректор в Lead Agent, дословно запазване на фактите в compliance бота, кръстосана проверка с два модела в одитора. Нито един изход на LLM не достига до потребителя без проверка.

03

Инженерство на себестойността

Рутиране „първо по-евтиния модел“, вградени векторни бази вътре в serverless bundle-и, кешове на отговорите, rate limits. $0.20 на изпълнение на 13-агентен pipeline; ≈1 цент за ембединг на корпус от 1.5M chunk-а; VPS за €15/месец, обслужващ 20+ потребители.

04

Тестове или не се е случило

800+ автоматизирани теста в портфолиото: pytest с mock-нати LLM слоеве, Playwright e2e, mypy --strict, нощни eval прогони с golden-question срещу продукцията.

[04]

Две години, една дъга

апр 2024

Присъединих се към Netpeak Bulgaria

Изпълнителен асистент на CEO — финансови операции, юридическа документация, организация на събития, проучвания из дружествата на групата.

2025

Автоматизирах собствената си работа

Self-hosted n8n: тракер на статуси по 60 проекта за CEO, генериране на SEO съдържание с GPT-4, автоматизирани отчети за клиенти. После ~20 scraping задачи за клиенти на агенцията.

дек 2025

Първи приходи от AI

SKUptura доставя първата си платена партида AI продуктови описания. Pipeline-ът прераства в multi-tenant платформа с €4,900+ приходи до средата на 2026.

март 2026

Продукционният спринт

Четири живи системи за четири месеца: Scout (76k реда код), 13-агентният Lead Agent, изборният чатбот, отразен в националните медии, и публичният бот маркетинг консултант.

май 2026

AI продукти, за които клиентите плащат

Discover Compliance Bot става първият AI продукт, който агенцията продава на външен издател. Belobradova Toolkit доставя RAG по законодателство с 1.54M chunk-а за 2.5 седмици. Parliament Tracker: 34k реда код за 3 седмици.

[05]

Стек

AI / LLM

LangGraphLangChainRAG (pgvector, Qdrant, sqlite-vec)Hybrid retrieval + RRF + rerankLLM-as-judgePrompt engineeringClaude APIOpenAI APIGemini APIOpenRouterPerplexity APIWhisperEmbeddings (bge-m3, e5, OpenAI)

Бекенд

PythonFastAPIasyncioPostgreSQLpgvectorRedisSQLitePydanticREST APIsJWT/OAuth2SSE streaming

Фронтенд

TypeScriptNext.jsReact 19Tailwind CSSViteEmbeddable widgets

Инфра и Ops

Docker ComposeHetzner VPSsystemdNginx/CaddyVercelSupabaseMinIO/S3SentryGitHub

Автоматизация и данни

n8nMake.comZapierPlaywrightSeleniumWeb scrapingGoogle APIs (GA4, GSC, Ads, Drive, Gmail, Sheets)Meta Ads APITelegram botsOCR (Tesseract)

Качество

pytestPlaywright e2eVitestmypy --strictGolden-question evalsMocked-LLM test layers
[06]

За мен

На 20 години съм, живея в София. Започнах в Netpeak Bulgaria като асистент на изпълнителния директор и превърнах ролята в AI инженерство: първо автоматизирах собствените си задачи с n8n, после изградих вътрешните AI продукти на агенцията, а след това и продукти, за които клиентите плащат.

Извън работата водя техническата страна на българско-украински медиен проект на общността — увеличих неговия Facebook от 4,000 на 26,000 последователи, публикувах 3,000+ статии чрез AI пайплайн за превод, а нашата OSINT работа беше отразена от Българската национална телевизия и цитирана в българския Парламент. Освен това събрах €10,000+ за благотворителност чрез организирани събития.

Езици: украински и руски (роден), английски (upper-intermediate), български (intermediate). В момента уча магистратура по CS в Neoversity.

Нека създадем нещо

Отворен съм за позиции AI Engineer / AI Automation — София или remote.

или просто ми пишиmakokakovich@gmail.com

© 2026 Maksym Karmazynovskyi · Sofia, Bulgaria