序文:
LLM(大規模言語モデル)が企業のインフラになるにつれ、ハッカーの目には「新たな金脈」としても映っています。
2023年、私たちはAIが自我を持つかどうかを心配していました。2025年、私たちがより心配しているのは、慎重に作成されたたった1つのプロンプトで、AIが会社の財務報告書を吐き出したり、完璧なフィッシングメールを書くように誘導されたりすることです。安全性はもはやオプションではなく、入場券です。この記事では、攻撃と防御の両方の視点から、大規模モデル時代のデジタル免疫システムの構築を解剖します。
2025/2/22約3分
