Data for Good ― データを活用した人道支援/社会支援:消費者を不公正な商習慣から保護
アナリティクスは米消費者金融保護局の取り組みをいかに支援しうるか?
アン-リンゼイ・ビール(Anne-Lindsay Beall)、「SAS Insights」編集者
米国ノースカロライナ州ウェイク郡に在住のジョーン・モーガン(Joan Morgan)氏は、自宅の固定資産税に関する滞納通知が届いたとき、驚きました。彼女は住宅ローン会社にエスクロー(預託管理)口座を持っており、固定資産税はそこから支払われていると思っていたからです。
「住宅ローン会社に何度も電話をかけ、長時間の保留と別の担当者への転送が繰り返されたあと、ようやく、ある社員から『支払いは完了しておりました』と言われたのです。ほっとしました。ところが、ほどなく2度目の延滞通知が届き、また同じプロセスを繰り返すはめになりました。」
残念ながら、この住宅ローン会社はその後もモーガン氏を裏切り続けました。彼女の最後の手段は、消費者金融保護局(CFPB)に苦情を訴えることでした。CFPBは、不公正/詐欺的/威圧的な商行為から消費者を保護し、法律を破る企業に対して是正措置を講じるために設立された、米国連邦政府の機関です。CFPBがモーガン氏の代わりにその住宅ローン会社に接触した結果、問題は解決しました。
CFPBでは、金融商品や金融サービスに関する消費者の苦情を何千件も企業に送付し、回答を求めています。2011年の設立以降、CFPBは120万件以上の苦情を処理してきており、同局の監督と指導によって実現した救済総額は119億ドル(1ドル107円換算で約1兆2,740億円)に達しています(2017年7月の資料より)。
詳細情報:SAS Global Forumで発表された論文
消費者金融に関する苦情の評価にテキスト・アナリティクスと機械学習を適用する取り組みの成果の詳細は、SAS Global Forumで発表された論文でお読みいただけます。
論文をダウンロード(英語)
増大するニーズを遅滞なく満たしながら、全てのデータを活用した業務拡充も実現
しかし、年々苦情が激増する中、CFPBはどのようにして、単に対応に遅れを生じさせないだけでなく、保有する大量のデータを活用して以前よりも多くの人々を救済することができているのでしょう?例えば、多様なトレンドに関するデータを定量的に評価するための手段はあるのでしょうか? あるいは、消費者にとって最大の懸念となる領域を特定し、それらの問題が管理不能となる前にマクロレベルで対策を講じることを可能にするような、優れた手段を持っているのでしょうか?
「手作業によるテキスト分析のために読解担当者を増員することは解決策になりません」と話すのは、この問題を詳細に調査してきたSASのトム・サボー(Tom Sabo)です。「まず、極めて詳細な基準を採用しないかぎり、ある読解担当者が苦情への対応やタグ付けのために用いる手法は、別の読解担当者のそれとは大きく異なる可能性があります。こうした違いが多数の読解担当者の間で大規模に生じると、テキストデータの定性的解釈に多種多様なバリエーションを抱えることになります。」
読解担当者の疲労も問題になる、とサボーは指摘します。人間が1日に100件以上の苦情のレビューを担当するような場合には、最初の10件と最後の10件を全く同じ精度で評価できるとは限りません。
「また、何らかのトレンドを意識せずに作業していた読解担当者たちが、過去1年間のデータについて、この新たなトレンドを踏まえてタグ付けをやり直すよう指示されるとします。これは手作業の分析では対応しきれない規模拡大の典型例であり、トレンドのパターン[の文字列]を単純に検索する作業だけでは不十分でしょう」(サボー)。
手作業によるテキスト分析のために読解担当者を増員することは解決策になりません。 トム・サボー(Tom Sabo) プリンシパル・ソリューション・アーキテクト SAS
テキスト・アナリティクスと機械学習の適用
サボーには解決策がありました。それは、消費者の苦情を評価するプロセスにSASのテクノロジーを適用することです。彼はまず、CFPBが公開しているデータにテキスト・アナリティクスを適用し、消費者の苦情のセンチメントを探索できるようにしました。また、機械学習を用いて、フリーフォームで入力された1つひとつの苦情に含まれている自然言語をモデル化しました。
この手法には多くの利点があります。まず、個々のレコードは既に整理コードでタグ付けされており、苦情対象の組織によって取られた行動が分かるようになっています。「これらの整理コードに関連したフリーフォームのコメントに対して機械学習を適用すれば、CFPBが処理すべき重要な問題を浮かび上がらせるタクソノミー(分類法)を半自動的に生成することができます」と、サボーは説明します。
「分析担当者は対話操作型のレポート機能を活用することで、テキスト・アナリティクスから生成されたセンチメントとルールによって強化された状態で、既存の苦情データを探索することができます。これにより、分析担当者は各カテゴリのセンチメントの相対的なレベルを参考にしながら、探索パスを分割したり、それらの優先順位を設定したりすることが可能になります。このドリルダウン・レポートには、時間の経過に沿ってトレンドを観察できる時系列折線グラフも含まれています。
「この情報があれば、苦情に対する組織側のアクションのトレンドを明らかにできます。例えば、問題の組織が個人に対して金銭的補償を行った苦情と、組織側の説明だけで苦情が解決した苦情との違いを決定付けているのはどのような特徴か、といったことが見えてきます」(サボー)。
この分析によって多大な時間と資金の節約が実現する可能性の裏付け
サボーはデモの目的で、苦情データの2015年3~10月のセグメントを使用しました。そこには分析対象の苦情が約3万7,000件も含まれていました。彼はテキスト・アナリティクスを用いて、COMPANY_RESPONSE_TO_CONSUMER(消費者に対する企業の対応)という独自のカテゴリ変数を作成し、苦情への対応を分類しました。
「私が明らかにしたかったのは、"金銭的な救済を受けた苦情をそれ以外から区別するような特定のフレーズや用語の共起パターン" が存在するかどうかでした」とサボーは振り返ります。「手作業によるレビューの後に人間がルールを記述するという手法とは対照的に、これはまさに、機械学習が極めて短時間で魔法のような効果を発揮し、ビジネスルールという入力がなくてもパターンを特定できる領域なのです」(サボー)。この手法は、個々の苦情を整理コードで符号化する方法に基づいているため、その作業に不可欠なこの分野の専門知識も有効に活用していることになります。
金銭的な救済を受けた苦情に関する概略レベルの分析結果で判明したのは、「good faith estimate(GFE)」(直訳は「誠実な見積書」)という用語が頻繁に使われていることでした。GFEとは、住宅ローンの契約に際して貸付側が事前に利用者に提示しなければならない、諸費用や手数料も含む概算支払総額の明細を記した書類です。
分析担当者であれば、この結果から、貸付側の組織がGFEの複雑さを悪用して手数料を低く見せかける、あるいは全く提示しない、といった詐欺的行為を働いている可能性を推察できるでしょう。
「このようなケースでは、テキスト・アナリティクスは、貸付側の組織による乱用または悪用と疑われる商行為が存在する実態を定量的に描き出し、CFPBのような監督機関が適切な措置を講じる機会を生み出すことができます」と、サボーは説明します。
サボーが苦情データを時系列に沿ってドリルダウンしたところ、2015年9月を境に、GFEに関する苦情の累計数がほぼ横ばいに転じたことが判明しました。
「2015年10月、米国の連邦議会はCFPBに対し、消費者目線でコストの透明性が高まるようにGFEの記載内容を改定することを命じました。その結果、貸付側の組織による悪用が難しくなったのです。ただ、もし以前からGFEの評価にアナリティクスを活用していれば、消費者を守るためのこの最終的な決断に至る時期はもっと早かったのではないか、という疑問は残ります。そうだとしても、このような定量分析が、旧式のGFEの廃止という連邦議会やCFPBの意思決定を支える根拠となりうることは変わりません」(サボー)。
より広範な応用の可能性
テキスト・アナリティクスと機械学習が、増え続けるデータと消費者保護の強化に関してCFPBのような監督機関が責務を果たすために役立つことは間違いありませんが、他にも興味深い応用用途が幅広く存在します。
「私はこの方法論を、通報回線データ、アンケート調査、医療機会に適用してみました。例えば、巨大ハリケーンの襲来後は、(正常に機能する病院が不足することから)臨時の診療所が数多く開設されます。こうした診療所は緊急支援の拠点となり、自然災害後に人々が何を体験しているのかの最新情報が記録されていきます。私たちには、そのデータを活用して行えることが沢山あります。例えば、各診療所で必要とされている医薬品や医療品の種類と量を判断できれば、生存者の医療ニーズを確実に満たすことが可能になります」(サボー)。
「同様の分析は、疫学者が伝染病の流行を早い段階で捉え、大流行を未然に防ぐ取り組みや、公衆衛生の研究者が処方薬の過剰摂取リスクに瀕している人物を特定する取り組みに関しても、実効性の改善に役立つでしょう。可能性は無限に広がっているのです」(サボー)。
お勧めの関連記事
- 記事 チャットボットとは?チャットボットとは、人間とコンピューターのやり取りを簡素化するために設計された会話型AIの一種です。この記事では、チャットボットがビジネスでどのように利用されているか、また、チャットボットをアナリティクス・アプリケーションにどのように組み込めるかを説明します。
- 記事 和歌山県データ利活用コンペティション次世代の日本を担うデータサイエンティストを育成すべく全国の高校生及び大学生等を対象として開催される「第2回和歌山県データ利活用コンペティション」では、SASと伊藤忠テクノソリューションズ株式会社が共同で協賛し、コンペティションの参加者に「データサイエンス教育プラットフォーム」を提供します。
- 特集:データサイエンティストのキャリアデータサイエンティストはどのようなスキル・能力を持って、どのように組織の中で活躍するのでしょうか。SAS Forum Japna2018 データサイエンティスト・キャリア・トラックでは、データサイエンティストを活用する組織や、データサイエンティストとして活躍する個人、また、人材育成に取り組む大学や企業の方に、仕事例やキャリア、学生時代に習得すべきスキルなどについて、学生の皆様に向けて講演いただきました。データサイエンティストにも、さまざまな活躍の形、それぞれの役割に応じて求められる能力があります。ここでは、各講演の内容をご紹介します。
- 記事 オープンなAIプラットフォーム - SAS ViyaSAS® Viya®は、一つの環境でアナリティクスに必要な機能を全て実現したクラウド対応のプラットフォームです。アジャイルなIT環境に欠かせない高い信頼性、スケーラビリティ、セキュリティを備えたアナリティクス環境とガバナンスを提供することにより、 データ・サイエンティストからビジネス・アナリスト、アプリケーション開発者、そして経営幹部まで、あらゆる人々のニーズに対応します。