TT AI Log

人工知能 / AI / 脳機能解析に関する「個人」の調査・研究・参照ログ

攻撃手法: データポイズニング

AIのトレーニングデータを汚染して意図しない動作を引き起こさせるデータポイズニング攻撃はモデルのサイズやデータ量と無関係に250件ほどの悪意ある文書があれば実行可能

攻撃手法: データポイズニング

【要点】 ◎AI研究機関の調査で、LLMへのデータポイズニングはモデル規模に関係なく約250件の悪意文書で実行可能と判明。公開データ汚染の危険性が浮上。

Copyright (C) 谷川哲司 (Tetsuji Tanigawa) 1997 - 2023