🎯 Хирургическая точность (Prompt Engineering)
Мы не просто "скармливаем" текст нейросети. Мы разработали систему из
10 принципов оценки, которые зашиты в системный промпт:
- Приоритет итога: Если ученик ошибся в расчетах, но выписал верный ответ в конце — система это засчитает (как делает лояльный учитель).
- Поиск "иголки в стоге сена": Нейросеть находит верные цифры, даже если они написаны в хаотичном порядке.
- Допуск погрешности: Система автоматически учитывает округления (±5 единиц), чтобы не снижать баллы за технические мелочи.
🛡 Надежность Enterprise-уровня
- Отказоустойчивость: Автоматические бэкапы и сохранение прогресса каждые 5 работ. Сбой интернета или API не уничтожит результаты.
- Прозрачность: Подробное логирование каждого шага. Мы знаем, почему выставлен каждый балл.
- Обработка пустот: Умная реакция на отсутствие ответа — вместо ошибки генерируется корректный комментарий.
📊 Двойной формат результатов
На выходе вы получаете не просто цифру:
- JSON (Детальный): Полное досье на каждую работу с обоснованием каждого балла от ИИ.
- CSV (Сводный): Удобная таблица для аналитики, рейтингования и публикации итогов.
Как это работает (Process)
- Загрузка данных: Система считывает базу ответов (CSV) и критерии оценки (HTML).
- Анализ контекста: Скрипт определяет вариант задачи и вырезает релевантную часть ответа, чтобы сфокусировать внимание нейросети.
- AI-Экспертиза: GigaChat-2 Max проверяет работу по каждому из 12 критериев, используя temperature=0.2 для максимальной строгости и постоянства.
- Валидация: Ответы структурируются, проверяются на соответствие формату и сохраняются.
Технологический стек (Tech Stack)
- Language: Python 3
- AI Model: GigaChat-2 Max (via Cloud.ru)
- Integration: OpenAI SDK (client adapter)
- Data Handling: Pandas, JSON, HTML Parsing