Автоматизация оценки олимпиадных работ

Автоматизация проверки олимпиадных работ на базе GigaChat-2 Max

2700+ участников. Экономия недель ручного труда.
Краткое описание: Интеллектуальная система на Python, которая делегирует рутинную проверку работ нейросети, обеспечивая скорость, объективность и детальную обратную связь для каждого ученика.

Почему ручная проверка больше не работает?
Олимпиада по экономике — это не просто тесты. Это развернутые ответы, сложные расчеты прибыли по 4 сценариям (A, B, C, D) и текстовые обоснования.

Масштаб: Более 2700 работ, каждая требует оценки по 12 критериям.
Сложность: Ученики пишут решения в свободной форме: путают порядок сценариев, делают помарки, но пишут верные ответы отдельно.
Человеческий фактор: Ручная проверка такого объема заняла бы недели работы команды экспертов с риском потери концентрации и ошибок.

Технологический прорыв в образовании
Мы разработали автоматизированный конвейер оценки, который имитирует логику живого эксперта, но работает 24/7.

Ядро системы: Python 3 + GigaChat-2 Max (cloud.ru).
Умный парсинг: Система понимает контекст задачи (бургеры, кофе или попкорн) и автоматически определяет класс ученика (9, 10 или 11).
Гибкость: Поддержка любых форматов входных данных (CSV, разные кодировки, HTML-критерии).

🎯 Хирургическая точность (Prompt Engineering)
Мы не просто "скармливаем" текст нейросети. Мы разработали систему из 10 принципов оценки, которые зашиты в системный промпт:

Приоритет итога: Если ученик ошибся в расчетах, но выписал верный ответ в конце — система это засчитает (как делает лояльный учитель).
Поиск "иголки в стоге сена": Нейросеть находит верные цифры, даже если они написаны в хаотичном порядке.
Допуск погрешности: Система автоматически учитывает округления (±5 единиц), чтобы не снижать баллы за технические мелочи.

🛡 Надежность Enterprise-уровня

Отказоустойчивость: Автоматические бэкапы и сохранение прогресса каждые 5 работ. Сбой интернета или API не уничтожит результаты.
Прозрачность: Подробное логирование каждого шага. Мы знаем, почему выставлен каждый балл.
Обработка пустот: Умная реакция на отсутствие ответа — вместо ошибки генерируется корректный комментарий.

📊 Двойной формат результатов
На выходе вы получаете не просто цифру:

JSON (Детальный): Полное досье на каждую работу с обоснованием каждого балла от ИИ.
CSV (Сводный): Удобная таблица для аналитики, рейтингования и публикации итогов.

Как это работает (Process)

Загрузка данных: Система считывает базу ответов (CSV) и критерии оценки (HTML).
Анализ контекста: Скрипт определяет вариант задачи и вырезает релевантную часть ответа, чтобы сфокусировать внимание нейросети.
AI-Экспертиза: GigaChat-2 Max проверяет работу по каждому из 12 критериев, используя temperature=0.2 для максимальной строгости и постоянства.
Валидация: Ответы структурируются, проверяются на соответствие формату и сохраняются.

Технологический стек (Tech Stack)

Language: Python 3
AI Model: GigaChat-2 Max (via Cloud.ru)
Integration: OpenAI SDK (client adapter)
Data Handling: Pandas, JSON, HTML Parsing