AI News×Hiro

採用AI内製化 Step2──一次面接の評価ブレを潰す3点セット

「書類処理のほうは、いま月30分くらいで回るようになりました。次は何をやればいいですか?」

採用AI内製化のStep1(応募書類処理)が現場に定着し始めた会社から、こういう相談を受けることが増えてきた。

書類が捌けるようになると、ボトルネックは必ず次の工程に移動する。中小企業の場合、その多くが一次面接だ。

そして一次面接に踏み込んだ瞬間、ほぼ100%の確率で出てくる相談がある。

「面接官によって、評価がバラバラなんですよね。同じ候補者を見ても、社長は『いいね』と言って、ひとり人事は『うーん』と言う。何が正解か分からないまま、なんとなく採用してる感じです」

これは中小企業の構造的な問題で、人間の感性が悪いわけではない。「評価軸が言語化されていないまま、複数人で見ている」状態が原因だ。

Step2では、ここに踏み込む。提案するのは派手な「面接AI」ではなく、地味で確実な3点セットだ。

  • 評価基準テンプレ:暗黙知を5〜7項目のシートに落とす
  • 面接議事録AI要約:録音→自社評価軸での構造化要約
  • 採用基準ドリフト検知:3ヶ月後に基準が勝手に動いていないかを点検

このうち1つだけ入れても効きにくい。3つで1セットだ。理由を順に書く。

なぜStep2は「面接そのもの」ではなく「評価の言語化」なのか

採用AIと聞くと、面接動画の表情分析やAI面接官の話を想像する人が多い。けれど中小企業に最初に勧めるStep2は、AIに面接させることではない。

人間の面接を、AIで構造化して残すこと。これを先にやる。

理由は3つある。

ひとつめ。中小企業の面接は、社長と人事担当者の合計2〜3人が候補者を見て、口頭で「で、どうする?」と決める形が大半だ。このプロセスをAIで置き換える必要はない。むしろ「人間が見て、人間が決める」構造は中小企業の強みであることが多い。

ふたつめ。AIに面接させると、規制リスクが急に重くなる。EU AI法では採用・選考に使うAIは「高リスク」分類で、人間監視・バイアステスト・透明性開示の義務が2026年8月2日から本格適用される。日本にはまだ直接の規制はないが、感情認識AI(表情・声調から感情を推測する系)はEUで既に使用禁止だ。最初から「人間監視ありの設計」にしておくほうが、後々の規制変更にも耐える。

みっつめ。一番大きい理由がこれだ。評価がバラつく根本原因は、AIではなく、評価軸の言語化不足のほうにある。AI面接官を入れても、自社の評価軸が言語化されていなければ「AI面接の結果も当てにならない」となるだけだ。

だからStep2の最初の手は、人間の面接プロセスを残したまま、評価軸を言語化して、議事録を構造化する方向に向ける。

3点セットの全体像

3点セットは、それぞれ別の目的を持っている。

| 道具 | 目的 | 効くタイミング | |---|---|---| | 評価基準テンプレ | 面接前に評価軸を揃える | 面接当日の朝 | | 面接議事録AI要約 | 面接後に評価を構造化する | 面接終了後30分以内 | | 採用基準ドリフト検知 | 数ヶ月単位で基準が動いていないかを点検する | 入社3ヶ月後・半年後 |

3点を組み合わせると、「面接前の認識合わせ → 面接後の構造化 → 中期での点検」という時間軸のループができる。これがないと、面接ごとに評価軸がリセットされて、結局「なんとなく」に戻る。

3週間で組み上げる手順を書く。Step1と同じく、3週間というのは「毎日触る前提の3週間」ではなく、「週に2〜3時間ずつ進めて3週間」というイメージだ。

Step2の進め方──3週間で組み上げる

Week 1:評価基準テンプレを作る

最初の1週間は、AIを触らない。

やるのは、Step1で言語化した「応募書類を見るときの評価軸」を、面接で確認する項目にブリッジする作業だ。

Step1で5〜10項目の評価軸を出している会社なら、それを面接用に翻訳する。具体的には、こういう形のシートに落とす。

評価基準テンプレ(一次面接用)

候補者名:
面接官:
日付:

【コア評価軸(5項目)】
1. 業界経験の深さ  /  確認質問:「直近の◯◯業務で詰まったこと」
   ・期待ライン:実例で2分以上話せる
   ・要注意ライン:抽象論しか出ない/他責表現が多い
   評価: A / B / C

2. 自社事業への理解  /  確認質問:「うちの◯◯について事前に調べたこと」
   ・期待ライン:自社サイト+もう一段先(取材記事・SNSなど)まで見ている
   ・要注意ライン:求人票の文言を繰り返すだけ
   評価: A / B / C

3. 学習姿勢  /  確認質問:「直近半年で自費で取り組んだこと」
   ・期待ライン:金額や時間の具体が出る
   ・要注意ライン:会社研修以外に出てこない
   評価: A / B / C

…(5〜7項目)

【総合所見】
(自由記述、3行以内)

【面接後の判断】
□ 次に進める  □ 保留  □ 見送り

ポイントは3つ。

  • A/B/Cの3段階にする。5段階や10段階にすると評価がブレる。中小企業の年間採用数では3段階で十分だ
  • 確認質問を1項目につき1つ書いておく。これがないと面接官ごとに聞き方が変わって、評価がブレる
  • 期待ライン/要注意ラインを言葉で書く。「業界経験が深い」とだけ書くと、何をもって深いと判断するかが面接官ごとに違う

このシートを、社長・人事担当者・他の面接官で1〜2時間かけて作る。AIにテンプレ作成を手伝わせるなら、自社の評価軸を貼って「これを面接シートに落として、確認質問と期待ライン/要注意ラインを項目ごとに付けて」とお願いするのが早い。

Week 1のゴールは、面接担当者全員が同じシートを使って面接できる状態にすることだ。

Week 2:面接議事録AI要約を組む

シートが揃ったら、次に組むのが議事録AI要約だ。

中小企業のひとり人事で多いのが、面接中にメモを取ろうとして候補者の話が頭に入らない、面接後にメモが断片的すぎて評価が書けない、という詰まり方だ。

これをAIで解く。

仕組みはシンプルだ。

  1. 面接を録音する(候補者に必ず同意を取る。「面接の精度を上げるため、社内記録用に録音させてください」と最初に伝えれば、ほぼ断られない)
  2. 面接終了後、録音をAI(Claude Opus 4.7やGPT系)に渡す
  3. プロンプトでWeek 1の評価基準テンプレに沿った構造化要約を出力させる
  4. 面接官が30分以内に出力を確認し、必要な修正と総合所見を追記する

プロンプトの骨格はこんな形になる。

あなたは採用面接の議事録を構造化する役割です。

以下の評価基準テンプレに沿って、添付の面接録音文字起こしから
各項目の評価素材を抽出してください。

【評価基準テンプレ】
1. 業界経験の深さ / 期待ライン:…/要注意ライン:…
2. 自社事業への理解 / …
…(Week 1で作ったシートを丸ごと貼る)

【出力フォーマット】
- 各項目ごとに、候補者の発言を1〜2本引用
- 引用に対して「期待ラインに近い/要注意ラインに近い/判断保留」のいずれかをタグ付け
- 評価は付けないでください(評価は人間が後でつけます)

【守ること】
- 引用は原文ママ。要約せず、候補者の言葉そのままを使う
- 言外の意図を勝手に補完しない
- 録音にない情報を足さない

ここで重要なのが、AIに評価をつけさせないことだ。

評価素材(引用と分類)だけAIに出させて、A/B/Cの判定は必ず人間が下す。EU AI法の人間監視義務にも沿うし、何より「AIが判定した」と説明する会社に応募者は来なくなる。

Week 2のゴールは、「録音→AI処理→構造化要約→人間が評価」の流れが、面接後30分以内に1サイクル回る状態にすることだ。

Week 3:採用基準ドリフト検知を仕込む

3週間目に仕込むのが、いちばん地味で、いちばん効く道具だ。

中小企業の採用でよく起きるのが、「半年前は『業界経験5年以上』で見ていたのに、いまは未経験OKで採ってる。なぜ動いたのか、誰も覚えていない」という状態だ。

これを採用基準ドリフトと呼んでいる。基準が悪いわけではない。市場が変われば基準は動く。問題は「動いたことに気づかないまま動いている」ことだ。

ドリフト検知の仕込みは、こういう形でやる。

  • 入社者ごとに、面接時の評価シート(Week 1で作ったやつ)を採用日付とセットで残す
  • 3ヶ月後・半年後・1年後の現職評価を、人事担当者が1〜2行のメモで追記する
  • 半年に1回、過去6ヶ月分の評価シートをAIに渡して「採用基準が半年前と比べてどう動いているか」を分析させる

AIに渡すときのプロンプトはこんな形だ。

以下は過去6ヶ月分の一次面接評価シートと、入社後3ヶ月時点の現職評価です。

【質問】
1. 採用基準の中で、半年前と比べて緩んだ項目はあるか
2. 緩んだ項目について、入社後の現職評価との相関は見えるか
3. 逆に、半年前は重視していなかったが、いま重視されている項目はあるか

【守ること】
- データから読み取れることだけ書く
- 「こうすべき」の提案は不要。事実の整理だけ

これを半年に1回回すだけで、「気づいたら基準が動いていた」が「動かしたなら、なぜ動かしたかを言葉にする」に変わる。

Week 3のゴールは、評価シートの保管ルールと、半年後の点検タイミングをカレンダーに入れることだ。実際の点検は半年後にやるから、Week 3で完了するのは「仕込み」までで十分だ。

現場で詰まる3つの失敗パターン

Step2でよく起きる詰まり方を書いておく。

失敗1:評価基準テンプレを作らずに、いきなり議事録AIを入れる

「録音してAIに要約させれば、評価が揃うんじゃないか」と思って、Week 1を飛ばしてWeek 2から入る会社がある。

これは必ず失敗する。

評価基準テンプレがないと、AIが構造化要約を出しても、面接官ごとに見るポイントがバラバラのまま評価される。AIの出力が悪いのではなく、評価する側の軸が揃っていないだけだ。

Week 1で1〜2時間使うほうが、結果的に早い。

失敗2:AIに「採用すべきかどうか」を判定させる

これはStep1でも書いた話の繰り返しになる。

「AIに合否を判定してもらえれば、面接官の負担が減る」という発想は、最初は誰もが通る。けれど中小企業の年間採用数では、AIが自社のパターンを学習する材料が足りない。そして判定の責任を「AIが」と説明する構造は、応募者からの信頼を確実に削る。

AIは素材整理まで。判定は必ず人間が握る。この線を引かない設計は、3ヶ月以内に空中分解する。

失敗3:録音の同意プロセスを軽く扱う

候補者に録音の同意を取らずに録音する、あるいは「録音します」とだけ言って何に使うかを伝えない、という運用は絶対にやめる。

伝えるべきは3点だ。

  • 何のために録音するか(社内の評価精度を上げるため)
  • 誰がアクセスするか(面接官と人事担当者のみ)
  • 何ヶ月で削除するか(採用結果確定から3ヶ月など)

これを面接の冒頭で口頭で伝え、シートに「録音同意:あり/なし」のチェック欄を作っておく。同意がなかった場合は、メモベースで議事録を起こす旧来の方法で進める。

法的な必須要件かどうかとは別に、応募者への配慮として外せない部分だ。中小企業の採用は、応募者が「この会社、面接の扱いが雑だった」と1人にSNSで書くだけで応募が止まる。

ひとり人事が今日から試せること

Step2は3週間でフルセットを組むのが理想だが、明日から1つだけ試すなら、何をやるか。

優先順位はこの3つだ。

① 直近3回の面接を振り返って、評価がバラついた候補者を1人選ぶ バラついた理由を、「どの評価軸で見ていたか/見ていなかったか」で書き出してみる。これだけで、Week 1のテンプレに入れる項目が見える。

② 過去の入社者で、面接時の評価と入社後の活躍度がズレた人を1人思い出す ズレた理由を1行で書く。これがWeek 3のドリフト検知の素材になる。

③ 次の一次面接から、録音の同意を取る運用を試す 録音データが手元に1〜2件溜まってから、Week 2の議事録AIに進む。先に録音だけ始めておくと、Week 2に入ったときの立ち上がりが早い。

ここまでは、外部に頼まずに自社で進められる準備だ。

まとめ──Step2は「人間の面接を、AIで構造化して残す」

中小企業の採用AI内製化Step2は、AI面接官を入れることではない。

人間の面接プロセスを残したまま、評価軸を言語化し、議事録を構造化し、基準のドリフトを点検する。この3点セットで、「面接ごとに評価がリセットされる」状態を抜ける。

道具立てとしては地味だが、Step1の応募書類処理と組み合わさったときの効果は大きい。

  • Step1:応募書類処理が月7時間→月30分に
  • Step2:面接の評価ブレが減り、入社後のミスマッチが減る

入社後のミスマッチが1人減るだけで、中小企業の採用コストは数十万〜百数十万円単位で軽くなる。Step1の時間短縮よりも、本当はこちらのほうがインパクトが大きい。

ただし、Step2はStep1が回っていない段階で入っても効きにくい。書類処理が手元で安定して回ってから、面接の構造化に進むほうが、3ヶ月後の景色が変わる。

順番を守って、地味な3点セットを揃える。それが、Step2のいちばん再現性の高い進め方だ。

NEXT STEP

採用AIの内製化を、自社で始める。

この記事を読んで「自分の状況でも整理したい」と感じた方は、SUNAOの各入口から現在地を一緒に整理できます。

採用AI内製化チェックリストと週1メルマガで、何から手をつけるかが具体になる。情報収集の段階から、自社で動ける状態へ。

SUNAO FAMILY

SUNAOブランドの3つのサイト