2ちゃんねるのコメント
ネット上のコメントにヘイトスピーチが含まれているかどうかを正確に識別できる「罵り検知アルゴリズム」をヤフーが開発した。
ヤフーのアルゴリズム(PDF)は、テストケースの90パーセントで罵りコメントを正しく識別することができた。
論文によると、ディープラーニングなどの「最新式」の手法よりも性能がいいという。
現状では、罵り言葉を検知するプログラムはそのほとんどが、コメントに含まれるヘイト的な語句を探し出す仕組みになっている。
ヘイト投稿によく使われる特定のキーワードがコメントに使われていたら、アルゴリズムがそれを「罵り」だと判断し、
コメントを自動的に削除するか、モデレーターに転送して確認をする。
しかしこのようなキーワードに基づくシステムは、微妙な種類のヘイトスピーチをとらえるのが得意ではない。
荒らしが曖昧な罵り言葉を使う場合はフィルターをすり抜けてしまうし、これといった罵り言葉を含まないヘイト投稿もありうる。
また、従来のアルゴリズムは、辛辣なコメントを罵り言葉だと間違えてラベリングする可能性があるし、
ヘイトの新しい表現を認識できないことがある。文法的に正しい英語で書かれている、という理由で荒らし投稿を見過ごしてしまうこともある。
正確なアルゴリズムは、人間が育てることで生まれる
ヤフーは、最高に正確なヘイト検知アルゴリズムを開発するため、キーワードに基づくシステムを超えたシステムを開発しようとした。
そこで、「Yahoo! News」と「Yahoo! Finance」の記事に付いた罵り言葉のコメントとそうでないコメントで構成されたデータセットを用い、
コメントの長さ、侮辱語の数、および句読法をアルゴリズムに分析させて、罵りのメッセージの典型的な特徴を割り出した。
また、訓練を受けた人間の評価者が、同じコメントの集まりを分析し、罵り言葉であるかどうかを評価した。
これを、人間から見れば無条件に罵りだとわかる投稿についてアルゴリズムを訓練するのに役立てた。「暗黙の罵り」を見分ける人間の能力を生かそうというわけだ。
ヤフーはさらに、アマゾンのサイト「Mechanical Turk」を利用して、罵り言葉の評価をアウトソースした(Mechanical Turkでは、
誰もがサインアップして、画像の分類や言葉の分析といった一定の人間の知能を必要とする仕事ができる)。
今回の研究では、訓練を受けていない人が、ネット上のコメント1件あたり0.02ドル相当の額で、罵り言葉かそうで
ないかの分類に取り組んだ。ヤフーの訓練されたスタッフに比べると、Mechanical Turkの作業者は検知の成績がかなり悪かった。
このことは、罵りの検知にはよく訓練された人間のスタッフの存在が重要だということを示している。
アルゴリズムはヤフーのデータベース以外ではテストされていないが、同社はこのアルゴリズムは自然言語処理におけ
る「大きな前進」だと自信をもっている。罵り言葉のデータベースは「Yahoo Webscope」でまもなく公開される予定だ。
【AI】馬鹿「人工知能?自動運転?ないないw」医師の9割「人工知能が診療に参画する時代がすぐに来る」
【AI】人工知能「Alpha」、模擬空戦で一度も被弾せず米空軍の元エースに勝利
【朗報】インターネットが始まって10000日が経過。
windows10のデフォルト設定怖すぎわろたwww
磯山さやかに実況やらせてたフジテレビwwwww
日給6,800円の肉体労働を働いてきた結果、晩飯が・・・
【驚愕】二週間炭水化物抜いてみたらwww
暇だからベトナム旅行した時の写真うpしてみる
【画像あり】Facebookで3000万人が見たポケモンGOの風刺画がこちらです
おもしろい化学のgif見せたろか?(GIF動画画像あり)
【悲報】おのののかの見下し発言に視聴者の不快感が限界超え
韓国人「EU”世界最高の革新国家は韓国”…米国、日本、EUよりも上」
鷲見玲奈アナ、ヤクルト山田哲人と交際中だった。
参照記事 : http://2ch.sc/
ホンマ近い将来1984の世界来るで?
責任のない自由は存在しない。
やるなあ。
はい、逮捕ww
アメリカじゃ "KOREAN" は差別用語らしいぞ。
よほど嫌われてんだな。
女から一度も告白されたことない奴多そう wwww
最近の吉野家マズくないか?
【悲報】渡辺徹がヤバイらしい・・・・・
美人すぎるタクシードライバーとして話題の生田佳那
【悲報】宮脇咲良が凄まじく劣化・・・・・・(画像あり)
【衝撃】嵐が相当ヤバイらしい・・・・・
28:高低差速報
安心しろ、ジャップも差別用語だ。
なら「じゃっぷぅ」で
これがないと国交断絶、経済制裁、日本人パスができないからだ
あらゆる形態の人種差別の撤廃に関する国際条約
2 この条約は、締約国が国民と外国人との間に設ける区別、排除、制限又は優先については、適用しない。
そのとおりだけど知らない人多すぎる
外国人を区別できなきゃ国家として成り立たん
国民同士の差別「区別、排除、制限又は優先」は重大な国際法違反である。
本家じゃないの?
本家の Yahoo.com は買収されて消滅したよ。
言論弾圧システムにも使えるぞ
日本人向けのヘイトワードはフリーパスなんだろ
大絶賛ですわwwwwwwwwwwwww
Twitterのコメント
この1984感しびれる.どうせならヘイトスピーチが気づかぬうちにポジティブな言葉に変わるようにしてほしい. / どんな「ヘイトスピーチ」も見逃さない人工知能、ヤフーが開発 (WIRED.jp)https://t.co/LO6ufnyxAs #NewsPicks
— 落合陽一 /新刊 #これセカ (@ochyai) 2016年8月2日
どんな「ヘイトスピーチ」も見逃さない人工知能、ヤフーが開発 https://t.co/Fk9z0HYFDF #最新記事
— WIRED.jp (@wired_jp) 2016年8月1日
管理人YU(Twitter始めました!)より:
( ・∀・)ノ凄いですね。ジョージオーウェルの世界。
剛力彩芽 原作破壊の黒歴史www
加藤綾子アナ、フラれる。
【悲報】佐々木希さん、気持ち悪くなる(画像あり)
【警告】夏に見るダサ男大学生のファッションがこちらwwwwww
三日間歯を磨かずにすごした結果www
【衝撃告白】水川あさみ、“大嫌いだった女優”の実名を暴露wwwwwwwwww
海外「日本の神々が守ったんだ」 神社の鳥居の驚異的な強度が台湾で話題に
日本の「整形シンデレラオーディション」が韓国の整形と違いすぎるwww【台湾人の反応】
世界一モラルが高い!?日本の警察の礼儀正しさが海外で話題に(海外反応)
アニメで町おこしに失敗した町一覧wwwwwww
ミスド食べ放題「ドーナツビュッフェ」が超危険なことが判明。これは下手したらヤバいかも。。。
北条氏政とかいう無能のエピソードで打線組んだwwwwwwwww
【一般】各国のふざけた兵器あげてこうぜ!
韓国人「最近のガールズグループの顔の大きさレベルをご覧ください」
コメント
コメント一覧 (5)
はっきりわかんだね
はい、ネトウヨ
こういう言葉ガリするあほw
コメントする