Автоматизация проверки олимпиадных работ на базе GigaChat-2 Max
2700+ участников. Экономия недель ручного труда.
Краткое описание: Интеллектуальная система на Python, которая делегирует рутинную проверку работ нейросети, обеспечивая скорость, объективность и детальную обратную связь для каждого ученика.
Почему ручная проверка больше не работает?
Олимпиада по экономике — это не просто тесты. Это развернутые ответы, сложные расчеты прибыли по 4 сценариям (A, B, C, D) и текстовые обоснования.
  • Масштаб: Более 2700 работ, каждая требует оценки по 12 критериям.
  • Сложность: Ученики пишут решения в свободной форме: путают порядок сценариев, делают помарки, но пишут верные ответы отдельно.
  • Человеческий фактор: Ручная проверка такого объема заняла бы недели работы команды экспертов с риском потери концентрации и ошибок.
Технологический прорыв в образовании
Мы разработали автоматизированный конвейер оценки, который имитирует логику живого эксперта, но работает 24/7.
  • Ядро системы: Python 3 + GigaChat-2 Max (cloud.ru).
  • Умный парсинг: Система понимает контекст задачи (бургеры, кофе или попкорн) и автоматически определяет класс ученика (9, 10 или 11).
  • Гибкость: Поддержка любых форматов входных данных (CSV, разные кодировки, HTML-критерии).
🎯 Хирургическая точность (Prompt Engineering)
Мы не просто "скармливаем" текст нейросети. Мы разработали систему из 10 принципов оценки, которые зашиты в системный промпт:
  1. Приоритет итога: Если ученик ошибся в расчетах, но выписал верный ответ в конце — система это засчитает (как делает лояльный учитель).
  2. Поиск "иголки в стоге сена": Нейросеть находит верные цифры, даже если они написаны в хаотичном порядке.
  3. Допуск погрешности: Система автоматически учитывает округления (±5 единиц), чтобы не снижать баллы за технические мелочи.
🛡 Надежность Enterprise-уровня
  • Отказоустойчивость: Автоматические бэкапы и сохранение прогресса каждые 5 работ. Сбой интернета или API не уничтожит результаты.
  • Прозрачность: Подробное логирование каждого шага. Мы знаем, почему выставлен каждый балл.
  • Обработка пустот: Умная реакция на отсутствие ответа — вместо ошибки генерируется корректный комментарий.
📊 Двойной формат результатов
На выходе вы получаете не просто цифру:
  1. JSON (Детальный): Полное досье на каждую работу с обоснованием каждого балла от ИИ.
  2. CSV (Сводный): Удобная таблица для аналитики, рейтингования и публикации итогов.

Как это работает (Process)
  1. Загрузка данных: Система считывает базу ответов (CSV) и критерии оценки (HTML).
  2. Анализ контекста: Скрипт определяет вариант задачи и вырезает релевантную часть ответа, чтобы сфокусировать внимание нейросети.
  3. AI-Экспертиза: GigaChat-2 Max проверяет работу по каждому из 12 критериев, используя temperature=0.2 для максимальной строгости и постоянства.
  4. Валидация: Ответы структурируются, проверяются на соответствие формату и сохраняются.


Технологический стек (Tech Stack)
  • Language: Python 3
  • AI Model: GigaChat-2 Max (via Cloud.ru)
  • Integration: OpenAI SDK (client adapter)
  • Data Handling: Pandas, JSON, HTML Parsing