概要
複数人で実施している評価・採点業務について、生成AIをどう使えば負荷を下げつつ品質を保てるかを整理した案件です。AIに評価そのものを丸投げするのではなく、一次評価と判断材料の整理をAIに任せ、人が最終判断に集中する役割分担を重視しました。
課題
- 評価が複数人の手作業で、結果が人によって分かれやすかった
- 評価基準のすり合わせに会議時間がかかり、運用負荷が大きかった
- 評価基準の言語化が十分でなく、その場のプロンプト調整だけでは安定しにくかった
施策
- 評価業務を「一次評価」「判断材料の整理」「最終確認」に分解
- AIに任せる範囲を一次評価と材料整理に限定し、最終確認は人が行う前提で設計
- 評価ルールを蓄積し、反復しながら精度を上げていく運用フローを整理
- 小さく試せる試験運用の手順を提示
成果
- 評価業務における負荷軽減の見込みと、現実的な進め方を明確化
- AIに任せる範囲と人が確認する範囲の境界を整理
- 評価ルールを資産として蓄積し、継続的に精度を高める進め方を提示
担当範囲
- 業務ヒアリング
- 現状業務とボトルネックの整理
- AI活用候補の切り分けと優先順位付け
- 試験運用計画の設計
- 診断書作成
