SD1.5系を使うなら知っておきたいNAIリーク問題

2024年5月1日

NovelAIというwebサービスで使われているモデルが不正に流出したことがあって、そのモデルが色んなモデルに混じってるかもしれないという話です。

私はこの事件の後にAIを使い始めたので、細かい部分に間違いがあったらすみません。

経緯

NovelAIコミュニティの皆さま いつもNovelAIをご利用いただき誠にありがとうございます。 ご迷惑をおかけし申し訳ごぜいません。 2022年10月6日に弊社のGitHubとセカンダリリポジトリに権限のない第三者による不正なアクセスを許してしまいました。

@novelaiofficial

上記はNovelAIの公式ポストです。この時に流出したモデルを「NAIリークモデル」と呼びます。

このNAIリークモデルをマージして(混ぜて)別のモデルが作られました。実際に「NAIリークモデルをマージした」と明言されているモデルや、そのマージモデルをさらにマージして作られたモデル、そしてさらに…と、どんどん増えたようです。

「NAIリークモデルをマージした」と明言されてはいないけど、マージしているモデルもあると思われます。そのモデルをさらにマージ…と繰り返していけば、もうリークモデルが含まれているのかどうかわからない。もちろんそういったことを嫌って、NAIリークモデルをマージしてないモデルもあると思います。

今のSD1.5系モデルはこのように混沌とした状況です。

リークモデルを使用することは、カスタマーサポート、ドキュメンテーション、UXと一般的な品質基準、私たちのサービスの標準である暗号化を提供できません。また、これらのモデルはNovelAIを正確に反映したものではなく、私達はリークモデルを使用しないことを強く勧めます。自身のパソコンへのインストールやオンラインホストバージョンは、セキュリティとプライバシーのリスクを引き起こすかもしれません。 リークモデルを見かけた場合、法的措置を取る場合もあります

@novelaiofficial

その後、NovelAIはこのポストをしました。このツリーで「マージモデルはどうか?」と質問がありますが、NovelAIからの返信はありません。

アスカテスト

NovelAIによる「リークモデル使わないでね」のポストがあってから、「アスカテスト」「アスカチャレンジ」といわれる手法でモデルをチェックするのが一瞬流行りました。NAIリークモデルの出力に近いものが出たら黒、みたいなテストです。

アスカテストって「アスカが足を組んで椅子に座ってる」画像を表示させるテストなので、正しくアスカを学習した高性能のモデルならNAIみたくなるのは当たり前なんですよね。 一致(または酷似も?)したらリークなんだろうけど。

@Ai_tensa

ただし、このようなことをおっしゃる方もいて、現状NAIリークモデルが混ざってるかどうかは判別することはできないようです。

問題

知的財産権の侵害という法的な問題、「盗品とわかってて使うのはよくないよね」という倫理的な問題があります。

調べた限りだと、NAI流出は不正競争防止法の営業秘密侵害行為類型に該当して、3つの要件を満たし且つ、パリ条約等により外国であっても適用され、更に平成28年施行法により三次的取得者以降の者も処罰対象になる (資料は経済産業省 知的財産政策室による)

しかし、図に書かれているように、法では知らなければ対象外、知らずに契約して取得したものは契約の範囲内なので、隠せば無罪、賢いという指摘は正しいような気がする なお不正競争防止法は昨日初めて読んだので詳しい人の指摘いただけると勉強になります

@K4JZ2fj6ek96984

不正競争防止法についてはこのような解釈もあるようです。ただし、この方は法曹や法学者ではないと思われますのでその点はご留意ください。

NAIリークモデルを使用して金銭を稼いでいたという事実はクリエイターにとっての汚点となる可能性がある。

AI絵師と著作権の問題、いろいろごっちゃにしてません? -①AIモデル編- Sepia

倫理的な問題として、特にプロクリエイターの方、プロを目指している方はこのことを認識しておいた方がいいでしょう。(この「リークモデル」という単語はリークマージモデルを含むと思います)

例えば、現在著名なゲーム制作者の方が「昔マジコンを使っていた」と暴かれて炎上するような、そういう事例と似た事がSD1系でも起こらないとは言えません。

画像AIのSDXL+加筆で、AIっぽい違和感が気にならない縦読みカラー漫画が作れないか実験してみた のびsiro

こちらのnoteでも言及されています。

関わりたくない方は…

NAIリークモデルはSD1.5系のモデルで、マージできるのは同じSD1.5系のモデルのみです。ですので、SD2系やSDXL系のモデルを使えば大丈夫だと言われています。(個人的には、リークモデルの生成物で学習しててもいいのか?というのが気になっていますが)(多分大丈夫なのかな)

この問題に関わりたくないなら、SD1.5系の「リークを含まない」と明記しているモデル(あるのかな?あるはず)も避けた方がいいと思います。生成したものを見て、何のモデルを使ってるかがわからなくても「SD1.5系だな」というのはわかる場合が多いからです。SD1.5系=NAIリークモデルが含まれている、と判断されるかもしれません。

私がSD1.5系を使っている理由

ここまで書いたリスクを認識した上で、ControlNetの精度がいいから使っています。SD2やSDXL用のControlNetの精度が上がるか、自分が妥協できるようになれば、SD1.5系を使うのはやめると思います。

このブログでは主にSD1.5系を扱っているので、一応書いておいたほうがいいかなと思って書きました。「みんな知ってるよ!」って感じかもしれないけど…。

2024/5/1追記

現在は1.5系のモデルは使っていません。相変わらずXL系の ControlNet は1.5系ほどの精度は出ないのですが、自分がそこまでの精度を求めなくなったというところが大きいです。AIにかけることで自分の絵が多少変わっても「まあ加筆すればいいだけだし」というマインドになってきました。慣れですね。

それと lineart を使ったAI塗りに関しては、copainter が優秀なので自分で webUI でやる必要がなくなったというのもあります。今までありがとう lineart 。

おわり。

その他,未分類SD1.5系

Posted by 令五