クソリプを分類しよう。
目次
概要
このレポートでは「クソリプAI」を開発するために、クソリプをいくつかの分類にグルーピングすることを試みました。今回は「ツイート主の不快さ」という視点から17の分類を定義し、その結果として明らかになった課題や今後の展望について述べます。
背景
前回までの研究では「クソリプを減らすためには第三者機関が必要だ」という視点から「クソリプAIを開発する」という研究方針を立てました。
また、そのAIを開発するためには第一段階としてクソリプとは何かを自動的に判定する「クソリプ判定器」が必要であり、これを開発するためにクソリプの定義を深める必要があるという部分までが明らかになっていました。
では具体的にAIを開発する上で必要な「クソリプの定義を深める」とは何なのか、本件の共同研究者である竹之内さん(株式会社わたしは)に伺いしました。
「クソリプ判定器を作るためには、まずはクソリプをグルーピングしなければなりません。そしてこの作業はおそらく地獄です。逆に言えばこの部分ができあがれば、ほとんど完成したようなものです。」
つまり、1面からラスボスが来たということです。
クソリプの定義
まずクソリプをグルーピングする前に、そもそもどこまでがクソリプに入るの?という定義を決める必要があります。本研究ではクソリプを「ツイート主を不快にさせる理不尽なリプライ」と定義しました。
この定義ではクソリプを決める主体を2つ登場させています。
まず「ツイート主を不快にさせる」の部分で、クソリプかどうかを決めるのはツイート主であるとしました。パワハラを定義する際の「被害者がパワハラだと思ったらパワハラ」と同じですね。
一方で「理不尽な」とつけたのには一定の客観性をもたせるためです。
例えばツイート主が飲酒運転をしていることを投稿したとして、その投稿に「犯罪なのでやめた方がいいですよ」とリプライしたら、ツイート主は不快に感じるでしょう。
もし「ツイート主が不快に感じたらクソリプ」と定義してしまった場合はこの注意もクソリプになってしまいます。しかし、そこにクソ性は無いため、やはり客観的に見たときに理不尽か否かを定義に入れる必要があったのです。
この定義をわかりやすく図解してみました。
要するに「ツイート主が不快」であり「客観的に見て理不尽」であることを兼ね備えたものがクソリプということになります。
ただクソリプをサンプリングする度にいちいちツイート主へ「不快に感じましたか?」と聞いていくわけにもいかないので、本研究に限っては「ツイート主が不快に感じているだろう」という客観的な指標に置き換えることにします。
「不快さ」で分類した17個のクソリプパターン
クソリプを分類する上で、定義に採用した「ツイート主を不快にさせる」という部分に着目してみました。
そもそも「不快」とは脳の反応であり、人間の脳は「快を求めて、不快を回避する」という働きがあるそうです。
快・不快は行動を理解するための最も基本的な心的属性の1つであり、快をもたらす刺激には接近するが、不快をもたらす刺激からは遠ざかろうとする。
快・不快 – 脳科学辞典
例えば冬場に布団から出られないのは「快(=布団のぬくもり)を求めている」からであり、嫌いな上司がいる職場に行きたくないと感じるのは「不快(=嫌いな上司)を回避する」からです。
また、これらの反応は人間が動物として生きていくために必要な本能で、不快な時に「不安」や「恐怖」「怒り」などを感じます。
ではクソリプが来たときに我々はどんな「不快」を感じるのでしょうか。
例えば「おはよう」とツイートしだけで「ナイスおっぱい!」というクソリプが返ってきたとします。これは「クソリプかるた」の中でセクハラ系クソリプと定義したものです。
この時に感じる感情は「獣的・性的嫌悪感」と呼び、自分のことを性的な目で見られるときに感じる不快感のことを指すそうです。
動物の本能として考えれば、性的な目で見られることで「望まない性行をされるかもしれない」という身体的不安を感じるからだと考えられます。
また違う例として「FPSって何?」とツイートした時に「そんなことも知らないんですね」と上から目線のクソリプが来たとします。これはおそらく自分よりも上の立場に立たれることで、自分の尊厳が失われることに対する精神的不安を感じるからでしょう。
ここで私は「何を脅かされるのか?」つまり「何を不安に感じるのか」という部分において不快さの種類は分類できると仮定しました。
そこから導き出されたクソリプのパターンは以下の通りです。
分類する時に考慮したポイントを3つご紹介します。
まだ完全とは言えませんが、一旦ここまでが著者が有する集中力の限界でした。
今回のグルーピングを踏まえて見えた課題
著者が作ったこの17分類を元に、竹之内さんに加えてイシカワさん、劉さんを加えたプロジェクトメンバー4人で意見交換をしました。その結果として見えてきた課題を2つ紹介します。
課題①「クソリプ判定するには元ツイートとセットでの判断が必要なものが存在する」
17分類の中にある「セクハラ」や「脅迫」は、おそらくどんな投稿に対して送られた場合でもクソリプになり得る絶対的クソリプと言えます。
一方で「煽り」の例には「みんな寝てるやん…最悪や…」というツイートに対して「よかったね!」というクソリプが送られています。もし仮にこのリプライが「結婚しました!」という投稿に送られていたらどうでしょう。クソリプとは言えないかもしれません。
つまり、クソリプには元ツイートとの組み合わせにクソ性が発揮される限定的クソリプも存在するため、パターン分けをするのであればこの部分も考慮に入れる必要があるということです。
課題②「より単純なパターンで生み出されるクソリプの法則が存在する可能性」
「クソリプはブロックしています」というツイートに対する「クソリプって何ですか?」というクソリプは今回「愚問」という分類をしました。
しかし、仮にこのクソリプのクソ性を「オウム返しである点」とした場合、元ツイートの属性に関係なくオウム返しをしていればクソリプであると判定できます。
実際に「オウム返し」がクソリプになるかはまだ断定できませんが、こういった単純なパターンで生み出されるクソリプの法則があるかもしれません。そういった法則がもしあれば、カテゴリ分けするよりも簡単にクソリプとしてAIが認知できるので、現段階から見つけていくのが得策というわけです。
まとめ
地獄の入り口に立つことができた
「地獄です」という竹之内さんの言葉通りクソリプを17のパターンに分類する作業は地獄そのものでした。何より先行研究がないので、手当たり次第に心理学やら脳科学の記事、書籍などを当たり、暗中模索で突き進むしかない日々。
しかし、この分類がたたき台になったおかげでクソリプの輪郭がぼんやりと見えてきたことも事実です。どうせなら最後までやり遂げたい。
ちなみに、仏教では「地獄」は8つのステージがあると考えているそうです。その中で「邪見」という“仏教の教えとは相容れない考えを説き、また実践する”をした人はその中でも3番目に過酷な焦熱地獄 / 炎熱地獄に落とされるそうです。
クソリプ研究なんてものを面白半分で始めている以上、この地獄に堕ちることは確定しています。そこではずーっと極熱の火で何度もあぶられ焼かれ焦がされ、その苦しみがずっと続くんだとか。
それに比べればこの研究はまだまだ天国です。
そう言い聞かせて研究を続けていこうと思います。