11月22日に東京・品川で開催された「数理システム ユーザーコンファレンス2019」にて事例紹介の講演をしてきました。本稿では発表した講演内容の紹介とコンファレンスの簡単なレポートをしていきます。
数理システムのソフトウェアユーザーによる事例発表や講演を通じて、ユーザー間での情報共有や交流が行われる場です。講演は製造やマーケティングなどのセッションに分けられ、それぞれの最新事例について発表されました。
今回sodaはCS向上セッションとして数理システムソフトウェア「Visual Mining Studio」、「Text Mining Studio」、「Deep Learner」を活用した事例を発表させていただきました。
講演タイトル「VMS・TMS・Deep Learnerでサクッと自然言語処理」
※VMS = Visual Mining Studio、TMS = Text Mining Studio
発表を行う弊社倉田
事例概要はアンケート内のフリーアンサーをテキストマイニングすることで、どのような意見がどの程度あるのかを可視化するというものです。本講演の前半ではTMSを活用したテキストマイニングの分かち書きから類義語辞書の作成、集計・分析までの手順を説明しました。
後半ではテキストマイニングのタスクにおいて特に時間を要してしまう類義語辞書の作成をDeep Learnerを活用して効率化が図れないか、実際に検証した結果を紹介しました。
Deep Learnerの機能「Word Embedding」を用いて単語の分散表現を獲得し、クラスタリングすることで類義語の一覧を作成しています。
精度としては改善の余地がありますが、大幅に作業の効率化ができる可能性を示しています。
また、似通った内容のフリーアンサーをテーマ毎に分類するために、単語の分散表現と語句の並びのルールを学習するseq2seqモデルを用いた手法を紹介しました。
コンファレンスでは様々な分野におけるデータ分析の活用事例が発表されていました。その中でも特に気になった講演を紹介します。
株式会社パルコ
CRMプランニングにおける顧客データ分析事例の紹介とプランニングにおけるデータ分析の重要性についての講演でした。
Life Time Value(顧客生涯価値)の向上を成果指標としたときに、単に「客単価」を見るのではなく、LTVが「維持(継続)」と「頻度」により形成されていると仮説立て、「維持(継続)」に影響のある変数は何であるのかを分析し、顧客育成ロードマップの作成に取り組まれていました。成果指標の向上のための変数をデータ分析により探していくことが、ディープラーニングにおける目的変数に対して重要な説明変数を選択する点に近く、大変興味深く参考になった講演でした。
最後に
当日はあいにくの天気でしたが、多くの参加者が集まり大変盛況していました。データを分析したうえで何に活用していくべきか、さらに注目が集まっているのだと実感します。多くの最新事例が集まるこのコンファレンスは情報収集としても大いに役立ちますので、また次回も参加したいと思います。