再犯予測AIとは、過去の犯罪データをもとに「この人が再び罪を犯す確率」を算出するシステムです。米国で広く使われたCOMPASというツールが、黒人に対して不当に高いリスクスコアを出していたことが2016年に発覚し、「AIが差別を自動化する」という深刻な倫理問題が世界的に議論されるきっかけになりました。
そもそも再犯予測AIとは何か
この話の主役は、COMPAS(コンパス)というシステムです。
米国のNorthpointe社(現Equivant)が開発したもので、やることはシンプル。被告人に137問のアンケートに答えさせ、過去の膨大な犯罪データと照合して、「この人が再び罪を犯す可能性」を1〜10の点数で出します。
いわば、人の未来を数字に変換するマシンです。
質問の中身は、たとえば「初めて警察に関わったのは何歳か」「友人に犯罪歴のある人はいるか」といったもの。朝日新聞GLOBEの報道によれば、直接「あなたの人種は?」と聞く設問はありません。それなのに、のちに深刻な人種格差が発覚することになります。
190万人の収監者を抱える米国の「効率化」要請
なぜこんなシステムが広まったのか。背景には米国の刑事司法が抱える物量の問題があります。
米国の収監者数は約190万人。裁判所も刑務所もパンク寸前で、一人ひとりの再犯リスクを丁寧に見極める余裕がありません。「データで効率化できないか」という発想は、ある意味で自然な流れでした。
ただし、ここに落とし穴がありました。
COMPASはもともと、出所後にどんな更生プログラムが必要かを判断するための支援ツールでした。「この人には薬物依存の治療が必要」「職業訓練を優先すべき」──そういう振り分けに使う道具だったのです。
ところが2012年から、このツールが量刑の判断にも使われ始めます。「更生を助けるための道具」が、「刑の重さを決める道具」にすり替わった。これがすべての発端です。
そして、このすり替わりが一人の人間の人生を大きく変えることになります。
ある受刑者の訴え──COMPAS事件の真相
Eric Loomisの問い──「なぜ中身を知れないのか」
2013年、ウィスコンシン州。Eric Loomisという男性が、逃走運転に関わった罪で裁判を受けていました。
彼に言い渡されたのは、懲役6年という重い量刑。裁判官がその判断の根拠として挙げたのが、COMPASが算出した「再犯リスクスコア」でした。
Loomisは当然、こう問いかけます。「なぜ自分がその点数なのか、中身を教えてほしい」と。
しかし、答えは返ってきませんでした。COMPASのスコアがどう計算されているかは、開発元の企業秘密だったのです。
つまり、Loomisは「あなたは危険人物です」という判定を受け、その判定が刑期を重くする根拠に使われたのに、「なぜ危険と判断されたのか」を知る手段がなかった。
反論しようにも、何に反論すればいいのかすらわからない状態です。
Loomisは最高裁まで争いましたが、ウィスコンシン州最高裁は「COMPASのスコアは量刑の唯一の根拠ではなく、参考情報の一つに過ぎない」として、その使用を認めました。
ただしこの判決には、「COMPASを量刑の決定的な根拠にしてはならない」という但し書きがついています。裁判所自身も、このツールへの全面的な信頼には慎重だったわけです。
この事件は、ある問題を浮き彫りにしました。
中身がわからないアルゴリズムに、人の自由を左右する判断を委ねていいのか。
当時はまだ、この問いに正面から向き合う人は多くありませんでした。しかし3年後、ある調査報道がすべてを変えます。
偽陽性率44.9%──ProPublicaが突きつけた数字
2016年、米国の非営利調査報道メディアProPublica(プロパブリカ)が、フロリダ州ブロワード郡の約7,000人分のCOMPASスコアと、その後の実際の再犯データを独自に突き合わせる検証を行いました。
その結果は、衝撃的なものでした。
注目すべきは「偽陽性率」という数字です。
偽陽性率とは、「この人は再犯するだろう」とAIが予測したのに、実際には再犯しなかった人の割合のこと。いわば「無実なのに危険人物扱いされた率」です。
ProPublicaの検証によると、この偽陽性率が黒人で約44.9%、白人で約23.5%でした。
黒人は白人のほぼ2倍、「再犯しないのに危険と見なされていた」のです。
逆のパターンもありました。「再犯しないと予測されたが、実際には再犯した人(偽陰性)」の割合は、白人のほうが高かった。つまり白人は「安全寄り」に、黒人は「危険寄り」に、システムが偏っていたことになります。
ここで思い出してほしいのが、COMPASの質問項目に「あなたの人種は?」という設問はないという事実です。
人種を聞いていないはずのシステムが、なぜこれほど人種間で結果が偏ったのか──その謎は、次のセクションで解き明かします。
![[グラフ] COMPASの偽陽性率の人種間比較。左が黒人(約44.9%)、右が白人(約23.5%)の棒グラフ。グラフタイトル「再犯すると予測されたが、実際には再犯しなかった率」](https://ai-industry.jp/wp/wp-content/uploads/2026/04/autopress-51.jpeg)
「公平の定義が2つある」という厄介な事実
ProPublicaの報道に対して、COMPAS開発元のNorthpointe社は真っ向から反論しました。
「私たちのシステムは公平だ。同じスコアが出た人の再犯率は、黒人でも白人でもほぼ同じ」と。
たとえば「リスクスコア7」と判定された人が実際に再犯する確率は、人種に関係なくほぼ同じだった。開発元の言い分も、データ上は間違っていません。
では、ProPublicaの指摘が間違いだったのかというと、そうでもない。
黒人のほうが無実なのに「危険」と判定される割合が高い、というデータもまた事実です。
どちらも正しい。 ここがこの問題の一番厄介なところです。
実は、「公平」の定義には大きく2つあります。
| 公平の定義 | 意味 | 主張した側 |
|---|---|---|
| 予測の的中率が同じ | 同じスコアなら、黒人でも白人でも実際の再犯率が同じ | 開発元(Northpointe社) |
| 予測ミスの割合が同じ | 「危険」と誤判定される率が、黒人でも白人でも同じ | ProPublica |
そして2016年以降の研究で明らかになったのが、この2つの公平は、数学的に同時には成り立たないという事実です。
人種間で実際の再犯率に差がある限り(そしてそれは社会構造上の理由で現実に差がある)、片方を満たせばもう片方が崩れる。これは設計ミスでも技術の未熟さでもなく、数学的な制約です。
![[図解] 2つの公平性の定義が天秤にかけられている図。左の皿に「予測の的中率を揃える(開発元の立場)」、右の皿に「予測ミスの割合を揃える(ProPublicaの立場)」。天秤は傾いており、「両方同時には成り立たない」というラベルが中央に配置されている](https://ai-industry.jp/wp/wp-content/uploads/2026/04/autopress-50.jpeg)
どれだけ優秀なエンジニアがAIを作り直しても、社会が「公平とは何か」を一つの答えに決めない限り、誰かにとっては不公平なシステムしか作れない。
技術のバグを直せば解決する話ではありません。
「どちらの不公平を、社会として許容するのか」──COMPASが突きつけたのは、私たちの社会が避けてきた、この根本的な問いでした。
しかし、ここでもう一つ解かなければならない疑問が残っています。そもそもCOMPASは人種を質問していないのに、なぜこれほどの格差が生まれたのか。
なぜ「人種を聞いていない」AIが差別するのか
結論から言うと、人種を直接聞かなくても差別は起きます。
そのカラクリは、COMPASの質問項目をよく見ると浮かび上がってきます。
郵便番号が「人種」を語る──代理変数の罠
COMPASの137問には「あなたの人種は?」という設問はありません。
でも、こんな質問はあります。
- 「あなたが住んでいる地域の郵便番号は?」
- 「親は逮捕されたことがあるか?」
- 「友人に犯罪歴のある人はいるか?」
一見、人種とは関係なさそうに見えます。
しかし米国の現実を知ると、話は変わります。
米国では、歴史的な人種差別政策の結果として、居住地域が人種によって大きく偏っています。かつて黒人の居住を制限する法律や慣行があったため、現在でも特定の郵便番号エリアには黒人住民が集中し、そうした地域は貧困率が高く、犯罪率も高い傾向があります。
親の逮捕歴も同様です。過去に黒人が不均衡に多く逮捕されてきた以上、「親が逮捕された経験がある」と答える確率は黒人のほうが高くなります。友人の犯罪歴も、住む地域が偏っていれば自然と偏ります。
つまり、郵便番号や家族・交友関係の情報が、人種の「代わり」として機能してしまうのです。
この現象を専門的には代理変数(だいりへんすう)と呼びます。「本当に見たいもの(人種)」を直接入力しなくても、別の情報が事実上その代役を果たしてしまう、という問題です。
日本総研のレポートでも、COMPASの人種間格差の要因としてこの代理変数の構造が指摘されています。
過去の差別がデータになり、未来の判断を歪める
代理変数だけでも十分厄介ですが、問題はもう一段深いところにあります。
AIが学習するデータそのものが、過去の差別を反映しているという点です。
たとえば、ある地域に黒人住民が多いとします。
警察がその地域に重点的にパトロールを配置すれば、当然その地域での逮捕件数は増えます。逮捕件数が増えれば、統計上「この地域は犯罪が多い」というデータが蓄積されます。
そのデータでAIを学習させると、AIは「この地域の住民は再犯リスクが高い」と判定します。すると、さらに警察がその地域に集中配置される──。
差別 → 偏ったデータ → AIの偏った予測 → 差別の強化 → さらに偏ったデータ。
このループが一度回り始めると、人間が意図しなくても差別が自動で再生産され続けます。
![[図解] 循環構造を示すフロー図。「過去の差別的な取り締まり」→「偏った逮捕データの蓄積」→「AIがそのデータで学習」→「特定の人種に高リスク判定」→「その地域への警察集中配置」→最初に戻る矢印。中央に「差別の自動再生産ループ」というラベル](https://ai-industry.jp/wp/wp-content/uploads/2026/04/autopress-49.jpeg)
中部大学の情報倫理の分析でも、COMPASが過去の犯罪データの偏りをそのまま出力に反映してしまう構造的な問題が指摘されています。
これがCOMPAS事件の核心であり、再犯予測AIに限らず、あらゆるAI活用に共通する構造的な問題です。
データは社会の鏡です。社会に差別があれば、データにも差別が映り込む。そのデータで学んだAIは、過去の差別を「正解」として未来に引き継いでしまいます。
では人間の裁判官は公平なのか?
AIの差別メカニズムを知ると、「AIがダメなら、人間が判断すればいい」と思いたくなります。
でも、人間の裁判官の判断は本当に公平なのでしょうか。
裁判官の「空腹バイアス」と人種バイアス
人間の裁判官の判断も、実は安定していません。
昼食前の空腹時には仮釈放の許可率が大幅に下がるという有名な研究があります。
ただ、もっと深刻なのは人種バイアスです。
日本総研のレポートでも触れられている通り、米国では黒人被告に対して白人被告よりも量刑が重くなる傾向が複数の研究で確認されています。裁判官が意識的に差別しているわけではなく、無意識の偏見が判断に入り込んでしまう。これは個人の善意だけでは防げない問題です。
つまり、AIを外したからといって公平になるわけではありません。
「AIの方がまだマシ」という主張と、それでも残る問題
こうした事実を踏まえて、「少なくともAIは毎回同じ基準で判定する。気分で判決が変わる人間よりまだ一貫性がある」という主張もあります。
実際、それは一面では正しいです。AIは空腹にならないし、機嫌も悪くなりません。
しかし、AIの間違いには別の深刻さがあります。
人間の裁判官が偏った判決を出したなら、被告は「なぜそう判断したのか」を問いただし、反論する機会があります。ところがCOMPASのようなブラックボックスのAIには、理由を聞くことすらできません。Eric Loomisが直面したのは、まさにこの壁でした。
だから問いの立て方を変える必要があります。
「AIか、人間か」ではなく、「AIをどう使い、どう監視し、間違いにどう反論できる仕組みを作るか」。
AIも人間も完璧ではない──その前提に立ったとき、社会に残された選択肢は「ルールで縛る」ことです。では世界各国は、実際にどんな手を打っているのでしょうか。
世界と日本はどう動いているのか──倫理とルールの現在地
EU AI Actが突きつけた「高リスク」の烙印
EU(ヨーロッパ連合)は2024年、世界で初めてAIを包括的に規制する法律「EU AI Act(AI規制法)」を成立させました。
この法律の最大のポイントは、AIをリスクの高さで分類し、リスクが高いものほど厳しいルールを課すという仕組みです。
再犯予測AIは、ここで「高リスク」に分類されました。具体的に義務づけられたのは、大きく3つです。
- 透明性の確保: AIがどうやって判断を下したのか、その仕組みを説明できなければならない
- 人間による監視: AIの判定結果を人間がチェックし、最終判断は人間が行う体制を整えること
- 差別防止: 人種・性別などで不当な偏りが出ていないか、継続的にテストする義務
Eric Loomisが「なぜその点数なのか教えてほしい」と訴えて拒否された問題──あれをもう起こさせない、というのがEUの答えです。
違反した企業には最大3,500万ユーロ(約55億円)または全世界売上高の7%という重い制裁金が科されます。
なお、こうした透明性の要請に応えるために、「AIの判断理由を説明できるようにする技術」=説明可能AI(XAI)の研究も世界中で進んでいます。ただし、日本総研のレポートでも指摘されている通り、説明しやすくすると予測精度が落ちるというトレードオフがあり、万能の解決策にはまだ至っていません。
米国の現在地──COMPASは今も使われているのか
結論から言うと、COMPASは批判を受けながらも複数の州で今も使われています。
米国には連邦レベルでAIを包括的に規制する法律がありません。CIO.comの報道でも触れられているように、対応は州ごとにバラバラです。
ある州はCOMPASの使用を続け、別の州は利用を制限し、また別の州では独自のツールを開発する──統一されたルールがないまま、現場判断に委ねられている状態が続いています。
ProPublicaの報道から10年近く経っても、この問題は解決していないのです。
日本の司法にAI再犯予測は来るのか
日本は今のところ、再犯予測AIを実際の司法で使ってはいません。
ただし「まったく無関係」でもありません。
法務省は再犯予測AIに関する研究報告書を公表しており、その中で再犯予測AIに特有のリスクについて有識者を交えた議論が行われたことが記されています。また、東京大学の研究プロジェクトでも、再犯予測AIのリスクシナリオを具体的に検討した報告がまとめられています。
日本の刑事司法は米国ほどの「物量の問題」を抱えていないため、すぐに導入が進む状況ではありません。しかし、COMPASで起きた問題は「もし日本で導入するなら何に気をつけるべきか」を考える上で、避けて通れない教訓です。
