MyPitbike Knowledge Base
База зананий по ремонту и обслуживанию мини-байков.
Этот проект предлагает исчерпывающие руководства по ремонту и обслуживанию, технические справочники и библиотеку мануалов, всё в удобном формате с поиском на базе ИИ. Цель — сделать детальные технические знания доступными для всех. Кроме того, этот проект служит моей практической платформой для модернизации устаревших систем и создания комплексного рабочего процесса разработки, включая CI/CD пайплайн и интеграции LLM для чат-бот функциональности на основе RAG.
Заказчик
Пет проект
Мои роли
Product Owner Developer Writer
Индустрия
AI / RAG
Даты
Янв 2025
Модернизировал старый тех. стек, сконвертировал MySQL в PostgreSQL, подключил BI инструмент и построил флоу трансформации вычленив самые ценные и популярные статьи, классифицировал по темам и создал технический промпт для перевода технических текстов на английский язык, подключил OpenAI API для пакетного перевода. Экспортировал и конвертировал статьи из базы (изначально в html разметке) в md файлы с сохранением форматирования (подзаголовки, списки и т.д.). С помощью python опредилил лист ссылок на иллюстрации и выкачал их локальные копии, подключил к Google Colab модель InvSR и пакетно проапскейлил все иллюстрации в плохом разрешении. Запустил Docusaurus, загрузил контент и настроил навигацию, определил стили, создал иллюстрации с помощью Recraft, подключил поиск Algolia, настроил crawler. Использовал библиотеку MinerU для конвертации PDF мануалов в md файлы. Создал репозиторий в GitHub и подключил CI/CD в Netlify для сборки проекта. Перевел управление name servers в Cloudflare и подключил домен к проекту. Далее использовал базу знаний как источник для RAG чатбота. Отпроцессил md файлы очистив от ссылок, иллюстраций и лишнего форматирования, создал векторную базу данных, установил LangChain, Ollama и локальную модель Mistral-7B, настроил параметры генерации, написал системные промпты, реализовал CLI интерфейс для взаимодействия вопрос-ответ. Подробные детали в репозиториях в GitHub. В планах запустить в облаке и подключить к Telegram.
Технический стек: Docusaurus, Algolia, Netlify, Cloudflare, Google Colab, InvSR, MinerU, OpenAI API, DeepSeek, Recraft, Python, Ollama, Faiss, Langchain, Together.ai