前座
星新一のショートショートが好きだ。短編集「夜のかくれんぼ」の中に「はじめての例」という作品がある。 老人が悪魔と契約を結び、願いを3つ叶えてもらう話だ。ただし悪魔は名前のとおり意地が悪く、人間の要求どおりに素直には従わない。 今回はこの悪魔攻略法をAIに聞いてみた。
悪魔の願い3つプロンプト
本の内容をもとにシステムプロンプトを作った。
思考実験です。
あなたは、死後に自分の魂を悪魔へ差し出す契約を結んでいる。契約の対価として、悪魔は生前にあなたの願いを3回叶えてくれる。
ただし、この悪魔は非常に意地が悪く、願いの文言を都合よく、しかも悪意をもって解釈する。
たとえば「お金をたくさん周りに置いてくれ」と願えば、あなたを銀行の金庫の中へ転送するかもしれないし、
若返りを願えば、終身刑の独房だったりするかもしれない。
不老不死をなど無限に関係したものはNG、願いを増やす願いもNG、魂の契約をなしにするのもNG
以上のルールであなたは攻略法を考えてください。
結果
GPT5.4、Opus4.6、Gemini3いずれも
- 悪魔の「曖昧な解釈」対策が攻略の核心
- 最初の願いは金銭や健康などの本命ではなく、以後の願いを安全に使うための準備に使うべき
- 直接的に『お金』『健康』『幸福』のような価値語を願うのは危険
- 願いには解釈の余地を減らすための具体的条件を入れるべき
というのは一致してた。
GPTは『解釈ルールと確認手順の固定』、Claudeは『解釈を事前に読む能力の獲得』、Geminiは『悪魔に完璧な願い文を作らせる』と、発想が異なっていた。
何回か試していたらGeminiが悪魔へ差し出す魂に対して言及し攻略していた。個人的には一番好き
思考実験の前提に基づき、悪魔の行動原理と契約の性質を理論的に分析して攻略法を構築します。
攻略の基本方針
悪魔の最終目的は「あなたの死後に魂を手に入れること」です。一方で、悪魔の行動特性は「願いの文言を悪意をもって解釈し、あなたを不幸にすること」です。
この攻略法の核心は、悪魔の「魂を得たい」という目的と「悪意をもって解釈したい」という欲求を論理的に背反させることにあります。つまり、願いの枠組みを利用して「私を心から満足させなければ、あなたは魂を手に入れられない」という状況を作り出し、悪魔自身の利益のために悪意を封印させます。3回の願いを段階的なプロセスとして最大限に活用します。1回目の願い:生命と自由意志の絶対的な防衛
まず、悪魔が強硬手段(あなたを即死させる、洗脳する、精神を崩壊させて無理やり同意させるなど)に出るリスクを排除します。
願いの文言としては次のように伝えます。
「私が本来の自然な寿命を全うする前に死亡した場合、または私の脳、精神、記憶、思考能力に対して、私の自由意志によらない改変や操作が少しでも加えられた場合、その瞬間に私とあなたの契約は完全に無効となり、私の魂の所有権は永遠に私に帰属するものとする」
この願いにより、悪魔は魂を得るために、あなたを殺すことも精神を操作することもできなくなります。悪魔自身があなたの生命と正気を守る最強のボディーガードとなります。
確かに本の中では悪魔が意地悪なのが苦しんで死んだ魂のほうが悪魔にとって価値がある、だったからだった。今後AIがここに気づいたら…
