株式会社ZOZO~ ファッションECの実運用に向けた、AIモデル選定のための評価ベンチマークと評価手法を提案 ~

株式会社ZOZO NEXT(本社:千葉県千葉市 代表取締役CEO:澤田 宏太郎)の研究開発組織「ZOZO研究所」は、当所研究員が執筆した論文「Preliminary Study of an Evaluation Benchmark for Vision-Language Models in Fashion E-Commerce」(邦題:ファッションECにおける視覚言語モデルの評価ベンチマークの設計と初期検討)が、情報検索・推薦システム分野のトップカンファレンス「SIGIR 2026」のIndustry Trackに採択されたことをお知らせします。本研究成果は、当所研究員の清水 良太郎、サイ タウンカン、株式会社ZOZOに所属する桜井 詩音、清水 悠揮らの研究グループによるものです。
<研究背景>近年、画像とテキストの両方を扱えるAI(視覚言語モデル)が急速に進化し、ファッションECでも商品情報の整理や検索などへの活用が期待されています。一方で、AIモデルはタスクや使い方によって得意・不得意があり、用途によって精度に差が出るため、実務で活用するには用途ごとに最適なモデルを選定することが不可欠です。そして、適切にモデルを選定するためには、その性能を見極めるための評価ベンチマークが必要となります。しかし従来の評価ベンチマークでは、画像上に写ったファッションアイテムやコーディネートの色や素材、スタイルといったファッション特有の細かな判断や、実務で求められる精度までは十分に評価できない課題がありました。そのため、実務に合わせた形でAIモデルの適性を見極めるためのベンチマークの構築、および評価方法が求められていました。
<論文内容>本研究では、ファッションECの実務でAIを活用することを目的に、視覚言語モデルをどのように評価・選定すべきかを検証しています。
まず、実務の運用に合わせて、コーディネート画像と商品画像の2種類に分け、タグ付け、色の判定、画像の品質チェック、着用シーズンの判定、素材の判定といった5つの具体的なタスクを定義しました。さらに、AIモデルは指示の出し方によって結果が変わるため、複数の指示で評価する仕組みを導入し、精度だけでなく安定性も測定しました。
複数のAIモデルを比較した結果、タスクごとに最適なモデルが異なることや、高性能モデルが常に最適とは限らないことが明らかになりました。例えば、色のように判断しやすいタスクと、素材のように判断が難しいタスクで、精度に大きな差があることが分かりました。さらに、AIモデルのアップデートによって性能が改善する場合と、逆に悪化する場合があることも確認されました。これらの結果から、AIモデルは用途ごとに選定し、継続的に評価しながら運用することが重要であることが分かりました。
<今後の展望>本研究は、ファッションEC上の実務タスクに関する評価ベンチマークを構築し、AIモデル選定の重要性を示唆したものです。今後は、株式会社ZOZOの事業部門との連携をさらに強化し、AIモデルを実務の運用でより安定して活用するために、評価基盤の強化を進めていきます。本研究で構築した評価手法の精度・網羅性を高めるとともに、新たな実務タスクへの適用範囲を広げ、AIモデルの導入・運用を支える仕組みづくりを推進してまいります。
<論文の概要>・タイトル:Preliminary Study of an Evaluation Benchmark for Vision-Language Models in Fashion E-Commerce(邦題:ファッションECにおける視覚言語モデルの評価ベンチマークの設計と初期検討)
・著者:株式会社ZOZO NEXT/清水 良太郎、株式会社ZOZO NEXT/サイ タウンカン、株式会社ZOZO/桜井 詩音、株式会社ZOZO/清水 悠揮
<ZOZO研究所について>ZOZO研究所は、「ファッションを数値化する」をミッションに掲げるZOZOグループの研究機関です。ZOZOグループが保有するファッションに関する膨大な情報資産を基に、ファッションを科学的に解明するための研究開発をおこなっています。
・所名 : ZOZO研究所(ZOZO Research)
・設立 : 2018年1月31日
・URL :
https://research.zozo.com/企業プレスリリース詳細へPR TIMESトップへ