個人情報とビッグデータ:原論文を見ないとよく分からないが原論文に当たる余裕もない。
クレジットカードの利用者特定、わずか4件の利用情報から 研究 写真1枚 国際ニュース:AFPBB News(2015年01月30日 11:38 発信地:マイアミ/米国)
はてなブックマーク - クレジットカードの利用者特定、わずか4件の利用情報から 研究 写真1枚 国際ニュース:AFPBB News
こちらに原論文のリンクを貼ってくれている人がいる。
以前書いた記事
Tポイントと個人情報の記事
では、
つまり自分が誰かは知られていないが、それ以外の情報はほとんど知られている、という不思議な状況がここにあります。という引用をして、
それって大阪城の外堀を埋められているような話で、あとは城攻めをするかしないかだけ、ほぼチェックメイト状態ということなのだろう。と書いたのですけど、それよりも状況はもう少し厳しいのかもしれない、という話。
でも、記事の90%を特定したという辺り、不特定多数の人から一人を見つけ出すということではないようにも見えます。クレジットカードの利用履歴からその人のプロファイルを描けたとして、それをどうやってターゲットと照合したのだろうというのが分かりません。直感的には、カード情報とは異なる情報源で描き出した別のプロファイルの人物データが既にあって、それとクレジットカードからのプロファイルとをマッチさせたということのような気がします。
それなら、「個人を特定」という言葉のニュアンスとは少し違うような気もします。でも、上述の「外堀を埋める」ということが実際にできるというということであるような気もします。
【1月30日 AFP】クレジットカードの利用情報わずか4件から、カード利用者の大半の身元を特定できるとした研究論文が、29日の米科学誌サイエンス(Science)に掲載された。匿名化したビッグデータでさえも、個人のプライバシー侵害に悪用される恐れがあることを示唆する結果だという。米マサチューセッツ工科大学(Massachusetts Institute of Technology、MIT)のイブ・アレキサンダー・デモントジョイ(Yves-Alexandre de Montjoye)氏とデンマーク・オーフス大学(Aarhus University)の共同研究者らが率いるチームは、国名不明の先進工業国に住む110万人のクレジットカード記録3か月分のデータを詳細に分析した。
その結果、ある日どこでコーヒーを買ったかや、新しいセーターや靴をどこで購入したかなどの情報4件から、90%の個人を一意に特定できた。
このことは、誰かの身元を特定する場合に、クレジットカード利用情報が携帯電話の使用記録と同等に頼りになる手掛かりであることを意味していると論文は指摘する。
さらに購入したものの価格が判明すると再識別リスクが22%高くなる恐れがあるという。
論文は「一部、または全部の側面において精度の粗い情報を提供するデータセットでさえも、匿名性はほとんど実現できない」と述べている。
特定の店名ではなく、買い物が行われた大まかな地域などの一部の明細情報がカードから抜き取られた場合や、対象となる時間範囲を1日から15日間に拡大した場合でも、「ほんの数個のデータ点を追加する」ことで再識別される可能性があると論文は説明する。割合としては「クレジットカードのメタデータでは、男性より女性の方が再識別されやすい」という。
また所得が高い人ほど、身元を特定されやすかった。理由はおそらく、高所得の人々は「店舗を訪れる時間の振り分けに特有のパターンがある」からだろうと論文は推測している。
研究チームは、匿名化されただけのデータを保護するために、より高度な技術が必要と呼び掛けた。(c)AFP
「日記・コラム・つぶやき」カテゴリの記事
- 日本大使館、正しい日本理解「日本は検閲の国」というイメージ広報に成功。(2019.11.06)
- 伊勢市教委、日本の戦争責任批判・犠牲者の鎮魂は許さないという姿勢を明瞭にする。(2019.10.31)
- 歴史修正主義の走狗となりアメリカで破廉恥な圧力を掛ける日本外務省(2019.10.30)
- 反天皇や日本の戦争責任を問う展示は中止、朝鮮人差別の展示は続行。(2019.10.28)
- 朝鮮学校の無償化訴訟、東京と大阪で敗訴が確定。(2019.09.03)
この記事へのコメントは終了しました。
コメント