ハイブリッド・メディア空間でのリアルタイム・テクノロジーアセスメント技術の開発
田中 幹人 先生

早稲田大学 大学院 政治学研究科 ジャーナリズムコース
准教授

では、ご研究の内容について、具体的に教えてください。

まずは、ハイブリッド・メディア空間において「誰がどのような議論をしているのか」を把握するため、本研究プロジェクトの吉永大祐研究員が行った研究を紹介しましょう。彼は科学計量学の分野で用いられている「共被引用分析(co-citation analysis)」の考え方を、Twitter空間での議論分析に応用しました。

たとえば、ある課題についてAさんの発言が多くの人にリツイート(Retweet:RT)されているとします。そして、Aさんの発言をリツイートしている人々は、Bさん・Cさんの発言も高い頻度でリツイートしています。この場合、三者の間に直接関係(相互フォローやリツイートなど)がなくても、「Aさん・Bさん・Cさんは(Twitterの議論空間上では)同じカテゴリである」と分類します。

下図は、AIに関する日本のTwitter上の議論を分析し、ネットワーク図で表したものです。意見が近いアカウントや、呟きをリツイートしたアカウントは近くに配置され、複数のアカウントが相互に関連するサブネットワークは「クラスタ」と呼ばれます。

この図では、左にマスメディアなどが「情報発信源」クラスタとしてまとまり、中央にAIの専門家クラスタがあります。そして右端にはAIに関して気の利いた「ネタ」を言った一般市民のクラスタが見て取れます。これは、従来型のメディア情報源から発せられた情報を専門家が批判的に解説し、市民はそれをネタに大喜利を行っているという、ある意味で「わかりすい」議論の有様です。

実はもともとこの分析は、「市民はマスメディアに不安を煽られているのではないか」というAI研究者の疑念をきっかけに行ったものです。しかし、このネットワーク分析を含む分析から私たちが出した見立ては、「市民はずっとしたたかで、専門家の解説を踏まえながらマスメディアのニュースをきっかけに楽しんでいる」に過ぎない、ということです。

この「CoRTed ネットワーク分析」手法の確立が、初年度の大きな成果です。

AIに関する日本のSNS議論のCoRTed ネットワーク分析図

多様な意見があり、各クラスタの関係性を距離で表した「議論の配置図」のようなものですね。

科学に対する社会の意見が二極化していること、それぞれのクラスタがどのような関係にあるのかは、この方法によって可視化できました。次に、各クラスタの意見の相違を定量的に測定する手法を構築するため、まずは自然言語アルゴリズムとして政治分野での実績がある「Wordfish法」を使い、ロンドン・スクール・オブ・エコノミクスの渡辺幸平氏(現・早稲田大学高等研究所)と共に、彼らが開発したQuantedaというテキスト分析パッケージを使い、意見の分断が著しいヘイトスピーチの分析を試みました。

具体的には、Yahoo! 掲示板に投稿されたヘイトスピーチに関する約32万コメントを分析し、頻出語句の抽出と分類、および使用頻度などの時間傾向の分類を行いました。その結果が、下図です。一緒に使われる頻度が高い言葉ほど近くに配置されるため、「叩く」「息の根」「止め」などの言葉を頻繁に使っている層と、「良い」「無い」「契約」といったヘイト的に価値中立的な言葉を使っている層で二極化していることが分かります。

今後はこの手法を、科学技術の社会議論に適用していきます。

Wordfishを用いたヘイトスピーチの極性分類結果。
6,599記事についた323,620コメントから抽出

先ほど、一般人でも科学技術について議論している人がいるとおっしゃいましたが、その人たちの意見も、この方法で観測できるのですか。

ビッグデータから少数派の意見を抽出することは、極めて困難ですが、方法はあると考えています。

例えば、ある問題に対する賛否を調査するため、その問題となるキーワードを含む600万ツイートのデータを入手したとします。しかし、実際に有用なデータとして分類・分析されるデータは20〜30万ツイート程度であり、残りの570万以上ツイートは「未使用データ」になります。

その未使用データのうち、1000ツイートを実際に目で見て確認し、倫理的な危惧とそうではないものを「1」「0」で分類することで「倫理的なツイートとはどういうものか」の基礎データを作成します。この基礎データを機械学習させた後、残りの未使用データを自動分類させ、特徴的な言葉や、一緒に使用されている言葉などを抽出すると、二極化された議論の中間にいる少数派の層が、どのような意見を持っているのかがある程度は見えてきます。

もちろん、ここではまず人間の手で倫理的議論を抽出しなければならないので、それは強いバイアスになります。「何が倫理的な議論なのか」については、応用倫理学などの人文社会学的な知の蓄積をきちんと導入しようと試みることが大切なプロセスになると考えています。

倫理的議論を発信する人々の間に、共通した特徴などはありますか。

ひとつには、倫理的議論は「堅苦しい」話題だからこそ、ポップカルチャーの影響が見過ごせないということです。中国で世界初の「ゲノム編集ベビー」が生まれた時に発信された、倫理的な意見や感想の内容には、主に3つの元ネタがありました。『ガタカ』というSF映画、カズオイシグロの長編小説で、日本でもテレビドラマ化された『私を離さないで』、そしてアニメの『ガンダムSEED』です。この3作品のいずれかを好む層が、何らかの設定やシーンを思い出し、「ゲノム編集ベビーが生まれる社会」について倫理的な話を始めたのです。

現実の問題に対して、関連性を持つ映画や小説、サブカルチャー作品の設定やワンシーンが「科学技術の倫理的課題を考えるきっかけ」となる。この現象はとても興味深く、他にもフックとなるものがないか調べるため、分析方法の開発に取り組んでいます。

「多様性を守ることが民主主義の基板であり、多様な議論が社会の健全な発展の活力と考えている」と語る田中先生