音速きなこおはぎ

技術ブログです。

AIを不適切コメントフィルターとして活用してみる

小ネタです。ChatGPT のすごいところは自然言語をインターフェースとして使える点ですね。今まで人間にしか無理だと思われていた仕事が、機械で代用できるようになります。

そこで、プライベートの時間をほとんど受動的な YouTube の配信の垂れ流しで過ごす VTuber のオタクでもある私は、配信の不適切コメントを除去する役割 - YouTube でいうモデレーター - を AI に代替させられないかと試してみました。その様子がこちら!

かなり期待が持てそうだと感じました!(注:実際にモデレーターを実装したわけではありません。それは誰かの手に任せた…)

感じたこと

単純な単語によるフィルタリングでは除去できないコメントを不適切と判断できているのが特に印象的でした。理由も "繰り返し表現が冗長で意図が不明" と非常に妥当ですね。

「ここセーブしといた方がいいよ」のようないわゆるネタバレコメントはゲーム配信では忌避されるものですが、今回は不適切と判定されませんでした。この辺は文脈をより学習させる必要があるでしょう。

「炎上不可避」は逆に文脈次第で適切な場面もあるでしょうね。

適切度を数値で評価せよ、としか指示していないのに、理由付きで評価してくれたのは嬉しい誤算でした。空気を読んでくれる ChatGPT の面目躍如ですね。

展望

そもそも ChatGPT 自体が不適切な出力を行わないよう注意深くチューニングされたモデルであることも手伝って、このような不快な表現を除外する仕事は ChatGPT が真っ先に活躍できるシーンだと感じました。

ほとんど何も文脈を学習させていない現状ですら、古典的な単語によるフィルタリングより遥かに便利であるように思います。フィルタをかいくぐるのも、GPT の前では単純な検索避けでは敵わないですし。

さらに文脈やコメントの事例を学習させることでより性能の高いフィルタリングが出来そうで、将来にも期待できますね。whisper で文字起こししたものを GPT に食わせて、フィルタリングするなど。

おしまい

人間にしか出来なかった仕事をどんどんAIにやらせよう。

このアイデア著作権は主張しないので、実用したい方はご自由にどうぞ!