同社ECサイトでは数千のブランドを取扱っており、さらに商品点数も常時数十万の取扱いがあり、その品揃えも年々拡大していました。
拡大に伴い、「以前より商品が探しにくくなった。」、「掘り出し物はあるけど、毎日探すのは非常に手間。」、という声もあり、多くの商品の中から自分に合ったブランド、ジャンル、状態、価格の商品を探し出すストレスが増大していました。
ユーザーの過去1年分の行動履歴データから、各ユーザーが本当に必要としているものを高精度で予測出来るレコメンドエンジンをデータ分析コンペティションを通じて高精度で開発しました。
データには過去の実際の購買履歴だけではなく、商品のカテゴリやブランドなど、各ユーザーの購買行動特性や趣味・嗜好に関するデータを含めました。
400チーム以上の個人・企業が参加し、レコメンドの精度を競い合いました。
トップソリューションではいずれも50回以上の試行錯誤によりモデルの精度を向上させ、高難易度のタスクながら高精度のモデル開発が実現されました。
手法としては、ユーザーの行動履歴、ユーザー属性、商品属性を組み合わせた特徴量をもとに、勾配ブースティングの代表的手法であるLightGBMにより構築したモデルが効果的でした。
最終的に到達した精度は、normalized Discounted Cumulative Gain (nDCG) @20で評価すると0.1となり、非常にざっくり言えば、数十万の商品の中から10個に1つは実際にユーザーがアクションを行う商品を提案することができるソリューションが完成しました。
また、上位にはレコメンドエンジンの研究を専門とするプロフェッショナルが入賞するなど、通常開発を依頼するのが容易でないスキルレベルの参加者にも参加いただき、オープンイノベーションの特性が発揮される結果となりました。