RAKUTEN DATA RELEASE (EN)

Rakuten Group recognizes that in today’s era of accelerating AI research and development, data is indispensable for our progress. Therefore, through our “Rakuten Data Release” initiative, we empower AI research and development by providing real-world data held by Rakuten to academia, including university laboratories.

This program offers university professors and students engaged in AI research access to large-scale and diverse datasets accumulated in real business environments. This enables not only theoretical research but also research and development on more practical topics that directly address real-world societal challenges.

Rakuten Data Release aims to combine the creativity of academia with Rakuten’s data to break new ground in AI technology and jointly develop innovations that contribute to society. We hope that this data will help further advance your research.

Data Samples

Rakuten Ichiba
All product data (Approx. 283 million items), review data (Approx. 70 million reviews), shop review data ( Approx. 22.5 reviews) 
https://www.rakuten.co.jp/ (JA)

The largest eCommerce marketplace in Japan is used for a variety of applications including:

  • Customer understanding recognition and products
  • Extraction of service interest items, Review analysis, Product Extraction of service interest items, Review analysis, Product evaluation search methods, Recommender systems, Structured product descriptions, Product images
  • Video analysis, Data solutions
  • Machine learning search methods
Products data
ColumnSample
item nameスターウォーズモデル 限定 CITIZEN ATTESA シチズン GPS衛星 ソーラー電波 腕時計 メンズ アテッサ CC4005-63L 250,0 スター・ウォーズモデル[12月5日発売]12月発売
shop codeblessyou
item codecc4005-63l
item urlhttps://item.rakuten.co.jp/blessyou/cc4005-63l/
price200000
genre ID301981
item image URLhttps://image.rakuten.co.jp/blessyou/cabinet/citizen/attesa/cc4005-63l_5.jpg
other descriptionCITIZEN ATTESA シチズン GPS衛星 ソーラー電波 腕時計 メンズ アテッサ スターウォーズモデル 限定 CC4005-63L 250,0
description チタニウムのパイオニアブランド、シチズン アテッサ。2019年12月、『スター・ウォーズ/スカイウォーカーの夜明け』の映画公開にあわせてタイムリーに発売。・ 映画の世界観を意識した「スター・ウォーズモデル」と人気キャラクターをモチーフにした「ダース・ベイダーモデル」の2製品を発売します。・「 スター・ウォーズモデル」は、反乱軍が手にするライトセイバーの代表的な色、ブルーをベースにデザイン。宇宙空間を想起させるラメを施した文字板、りゅうずには反乱軍のマーク、裏ぶたにはスター・ウォーズのロゴと、代表的なセリフ「May the Force be with you.(フォースと共にあれ)」が入ります。・「 スター・ウォーズ」を連想させるディテールをさりげなくデザイン。デイリーユースのウオッチとして様々なスタイルにフィットします。キャリバー: F950 [T025528]精度: ±5秒/月(非受信時)光発電: 5年(パワーセーブ作動時)機能: パーペチュアルカレンダー 衛星電波受信機能 位置情報取得機能ライトレベル インディケータークロノグラフ機能(1/20秒, 24時間計)防水性能: 10気圧防水厚み: 15.1mm/横幅:45.7mmガラス: デュアル球面サファイアガラス(99% クラリティ・コーティング)ケース: スーパーチタニウム デュラテクト(チタンカーバイト・DLC)(シルバー色・ブラック色)バンド: スーパーチタニウム デュラテクトチタンカーバイト(シルバー色)(先)ばね棒タイプ/幅:22.0mm(留)三ツ折れプッシュタイプ(ア)割パイプタイプ付加仕様:耐メタル耐磁1種 夜光(針+インデックス) フィットアジャスターペアウォッチ ブレスユー クリスマス プレゼント に 最適 人気 の ギフト。
User Review Data
ColumnSample
reviewer IDuser_412192
shop nameペットの専門店コジマ楽天市場店
shop ID208134
item name【SALE】大地の恵み La Terra ハムスター・リス プレミアムミックスフード 野菜 180g
item ID10085022
item URLhttps://item.rakuten.co.jp/pets-kojima/25031528/
genre ID565702
genre ID pass/0/101213/565699/565702
usage趣味
purpose自分用
frequencyリピート
review point5
review titleお気に入りです
review contentひまわりのタネが入っていないエサが基本です。 こちらのエサはハムスターがお気に入りなので愛用してます。
reference number3
review date2019-12-01 00:48
Shop review Data
ColumnSample
reviewer IDuser_85350
shop name楽天24
shop ID261122
review point5
review content色々なジャンルの商品が品揃えされていて実店舗を買い回る必要が無くて有難いです。 4000円の購入で10%割引クーポンも使えるのでより割安感が有ります。
reference number7
review date2018-11-01 09:47:00

Rakuten Recipe
Recipe data (Approx. 800,000 recipes), recipe images (Approx. 800,000 images), Pickup recipe (1,854 recipes), Daylicious news (362 news)
https://recipe.rakuten.co.jp/ (JA)

Rakuten recipe, a free-to-use recipe site that features more than one million crowd-sourced recipes, is used for a variety of research applications including:

  • Cooking ingredients
  • Taste precision, Recipe name and titles
  • Automated category creation structured recipe text, Cooking image and ingredient analysis
  • Cooking improvement search methods, Data analysis
  • Machine learning search methods
Recipe Information
ColumnSample
recipe ID1000000008
user ID1000000016
top level categoryお菓子
second level category和菓子
third level categoryまんじゅう
recipe title栗きんとん
motivation of cooking this recipeシーズン中はほぼ毎日、規格外の栗で夜なべに栗きんとんを作っています。長年試行錯誤したレシピで、人に差し上げると「お店のより美味しい」とおっしゃっていただるので、疲れていても作っちゃいます。
introduction of recipe栗を生産しています。長年試行錯誤して作ってきました。栗きんとんに親しんでいただきたいので、こっそり公開。
recipe image file name1000000008.jpg
recipe name栗きんとん
tag 1秋の味覚レシピ2010
tag 2
tag 3栗きんとん
tag 4圧力鍋
tips栗は1,5kg以上のほうが作りやすいです。食べ切れなかったら冷凍保存して自然解凍でどうぞ。一日で作らなくても、1の状態で冷蔵庫に保管し、夕食を準備しながら2~4をし、一晩冷まして翌日に絞ると楽です。栗正味20~25gで一つ分くらい。
cooking time ID6
occasion ID1,2,3,6,7
cost ID4
servingsたくさん
publication date2010/10/01
Ingredient Information
ColumnSample
recipe ID1000000008
ingredient
amount1k以上
Process Information
ColumnSample
recipe ID1000000008
step3
procedure descriptionポテトマッシャーでつぶし、砂糖、塩を加える。
“I made it!” Report Information
ColumnSample
recipe ID1000000014
user ID1370000024
commentジャガイモが芽を出していたので皮向いて作りました。子供も大絶賛でした。
owner’s replyお子様にも喜んでもらえて嬉しいです☆とっても美味しそうですね^-^
create date2010/10/05
Recipe Image
Pickup Recipe
ColumnSample
pick up date2016/01/01 00:00:00
recipe ID1980000139
Daylicious
ColumnSample
article ID4
published date2015-07-06 07:00:00
writer ID4
genre ID健康・ダイエット
article title気をつけて!家庭で起こる夏の食中毒を防ぐために取るべき方法
article (main part)食中毒は主に細菌とウイルスによって引き起こされます。手や食品には目に見えない細菌とウイルスがたくさん付着しており、細菌にとって快適な温度と湿度になると増殖し、吐き気・嘔吐・発熱・腹痛・下痢などさまざまな症状を伴った食中毒を引き起こします。\n\n[STRONG_START]「三原則」を守れば、夏でも安全![STRONG_END]\n\n食中毒予防の三原則は、食中毒の原因を「つけない」「増やさない」「やっつける」ということです。\nまず「つけない」ために、調理の前には指輪などのアクセサリーを外して必ず石鹸で手洗いをしましょう。手を怪我しているときは、使い捨ての手袋をはめましょう。そして、調理中に髪の毛や顔を触ったり、鼻をかんだり、トイレに行った後も必ず再度手洗いをし、清潔なタオルやペーパータオルで手を拭きましょう。もちろん、食事の前にも手を洗うようにしましょう!\n\nまな板や包丁は、肉、魚、野菜用と分けると安全です。それが難しい場合は、加熱しないで調理するサラダや和え物などを先に作り、最後に肉や魚の調理をするというように、順番を変えると良いでしょう。\n\n[STRONG_START]「温度」に注意[STRONG_END]\n\n「増やさない」ためには、温度管理が重要です。室温では細菌が増殖しやすいため、購入した食品は必ず冷蔵庫や冷凍庫で保存しましょう。この時に冷蔵庫の中がいっぱいだと、冷気がすみずみまで行きわたらないので注意。また、冷凍食品を解凍するときは、室温ではなく冷蔵庫で解凍してください。加熱調理後の食品はすぐに食べるか、粗熱をとって冷蔵庫で保存しましょう。長時間室温においておくと、雑菌が増殖してしまいます!\n\n「やっつける」というのは、細菌を死滅させるということです。細菌やウイルスの多くは、加熱することによって死滅します。中心部を75度で1分間加熱するようにしましょう。使用したまな板や包丁はよく洗い、熱湯をかけて消毒します。ふきんも熱湯消毒をしてよく乾かすことが重要です。\n\n[STRONG_START]危険性が潜む「お弁当」[STRONG_END]\n\n最後にお弁当を作るときの注意点。お弁当を作るときも、必ず石鹸で手洗いをしてから調理します。おかずの汁気はよく切ってから弁当箱に詰めましょう。また、ごはんとおかずはよく冷ましてからふたをしましょう。保冷剤と一緒に持ち歩き、涼しいところに保管すると安全です。\n\n(テキスト: 桑原 典子)

Rakuten Travel
Facility data (Approx. 27,000 facilities), review data (Approx. 7.3 million reviews)
https://travel.rakuten.co.jp/ (JA)

Japan’s largest online travel site is used for a variety of research applications including:

  • Review analysis, Recommender systems, Structured product descriptions, product evaluation and review search methods
  • Auto-recommender search methods, customer understanding recognition and products
  • Extraction of service interest items
  • Extraction of service improvements, data analysis
  • Machine learning search methods
User Evaluation Data
ColumnSample
reviewer IDuser_21
review date2018-05-08 21:15:00
facility ID5547
plan ID4174514
plan titleカード決済限定★GWの1室売プラン!4~5名様1室利用がお得!1室60000円税別から【本館】S21
room typeheya5uriy
room name■5名1室販売■【禁煙】本館和洋室(山側)
purposeレジャー
accompanying person家族
evaluation 1 (location)5
evaluation 2 (room)5
evaluation 3 (food)5
evaluation 4 (bath)5
evaluation 5 (services)5
evaluation 6 (facilities)5
evaluation 7 (total)5
review body風呂、食事、プール、すべて大満足でした。子供たちも大喜びでした。また利用したいです。
reply from the facilityこの度は杉乃井ホテルをご利用いただきまして、誠にありがとうございます。お風呂、お食事、プールと全てにご満足いただけたとの事、何よりでございます。お子様達もお喜びになられたとの事、私どもも嬉しい次第でございます。今後も多くのお客様にご満足いただけるホテルでありますよう、最善を尽くしてまいります。またのお越しを心よりお待ち申し上げております。ありがとうございました。
Hotel Master Data
ColumnSample
facility number87
facility nameベルビューガーデンホテル関西空港

GORA (Rakuten’s golf service)
Facility data (1,669 facilities), review data (320,000 reviews)
https://gora.golf.rakuten.co.jp/ (JA)

Rakuten GORA , a Rakuten-operated golf course booking site, is used for a variety of research applications including:

  • Review analysis, Recommendation systems, Product evaluation search methods, Customer understanding recognition and products
  • Extraction of service interest items, data analysis
  • Machine learning search methods
Golf Course Data
ColumnSample
golf course ID1407
golf course name茅ヶ崎ゴルフ倶楽部
zip code 1253
zip code 20037
address茅ヶ崎市
date of opening1957-11-17 00:00:00
facily comment湘南は茅ヶ崎。R134を挟んで湘南の海岸沿いにあるシーサイドコース。\nコース設計家「上田 治」氏による監修のもと、9ホールながら何度周っても味わいのあるコースが造りが施させ、フロンとナインとバックナインでは、海風によっては攻め方も変わり、しかもバンカーはあのアリソンバンカーで1度入れるとスコアメイクにはならず、プレーヤーの挑戦意欲をかきたてるようなゴルフ場としても有名です。また古くから社交の場として仲間が集まり、ゴルフ談話に沸きかえる、倶楽部ライフを満喫できるゴルフ倶楽部としても知られております。
golf course comment6月1日(月)より全日セルフプレーが可能になりました!!
shoe specification1
dress specificationソックスは必ず履きシューズから見えるようにする。シャツは必ず襟付きのものを着用しシャツの裾は著しく見苦しいものはズボンの中に入れるようお願いしております。
non business day1/1 , 8/26,27 の3日間
number of hole9
number of par35
yard3025
course area20
course rate67.5
highway code55057
interchange code1075
distance from interchange4
Course Data
ColumnSample
course ID5570
course number1
golf course ID1407
course numberOUT
par 14
par 23
sum of par in whole hole35
handicap 17
handicap 215
hole explanation 1短い距離ながら、確実なショットを求められるホール。ティーショットを左目に打つと、落としどころには2つのバンカーが待ち構えている。正面の丘に向かって打つようにしたい。
hole explanation 2グリーンの奥行きの判断が難しいため、正確な距離感が必要なホール。左に曲げると、茅ヶ崎最難のバンカーにつかまる可能性あり。このバンカーだけは避けたい。
User Review Data
ColumnSample
review ID782999
course ID1148
reviewer nameuser6
prefecture code13
age40
average score90
recommended purpose8
recommended type32
usage count13
total evaluation4
cost performance4
staff service5
course/difficulty4
food5
facility2
fairway2
distance2
title面白い
commentコースは戦略的で面白い。スタッフの方の対応が親切丁寧。お酒が旨い。
registration date of review2010-02-23 10:08:58
date of playing2010-02-22
Highway Code
ColumnSample
highway Code11011
highway Name道央道
Interchange Code
ColumnSample
interchange Code101
interchange Name士別剣淵
Prefecture Code
ColumnSample
prefecture code1
prefecture name北海道

Annotated Data

Emotional polarity analysis, extraction of service interest items, extraction of service improvements, supplementary data analysis, machine learning methods.

Tsukuba sentiment-tagged corpus (TSUKUBA corpus)

Corpus with sentiment polarity information for each sentence of Rakuten Travel’s review data provided by University of Tsukuba

ColumnSample
sentence ID123
document ID10
local sentence ID in each document1
annotated sentiment label by annotator 1p
annotated sentiment label by annotator 2p
sentence女将さんをはじめ、スタッフの方みなさんのおもてなしに感動しました。
Product images dataset with category labels

Image dataset of products which belong to Rakuten genres corresponding to some categories in Caltech-256 dataset

ColumnSample
ID123456
categoryairplane
filename extensionjpg
judgementy
genre ID112224
item coderakutenstore:12345678
item image URLhttp://image.rakuten.co.jp/rakutenstore/cabinet/img.jpg
Images with character area

Images with rectangle coordinates of character area

ColumnSample
coordinate information10,5,90,45,””
Floor plan from Rakuten Real Estate and pixel-wise wall label

500 real estate floor plans (provided by Lifull Co., Ltd.) with the wall positions annotated in pixels.

Parsing Floor Plan Images

Floor plan

sample_image

Pixel-wise wall label

sample_image

Rakuten France

User review (training:80,000 records / test:36,395 records), products reviews interests (training: 80,000 records), book item information (11,846,511 records), annotated book item information with normalized author name (training: 500 records / test: 500 records)

https://fr.shopping.rakuten.com/ (FR)

Who wrote this book? A challenge for e-commerce

Products Reviews Interests (training)
ColumnSample
ID12345
interest flag1
User Reviews (test)
ColumnSample
ID54321
review contentIl etait bon d’acheter
review titleAgreable
evaluated point5
item key34316B5CD035810B28625A475B83CCE794B9A1DF9A7 86C75BEF81F504FAAC99803462AA0EF9BDF454E470C 8277B45B2EE7B9830F82E98D0226061DEA3E59F50C
BookItem Information
ColumnSample
ISBN9782749103662
authorClaude Estier
titleUn Combat Centenaire – 1905-2005 Histoire Des Socialistes Français
Annotated Book Item Information with Normalized Author Name
ColumnSample
ISBN9782283019795
authorrichler mordecai
titleJoshua
true authorMordecai Richler
User Reviews (training)
ColumnSample
ID12345
review contentCe produit est tres bon!
review titletres bien!
evaluated point5
item key34316B5CD035810B28625A475B83CCE794B9A1DF9A7 86C75BEF81F504FAAC99803462AA0EF9BDF454E470C 8277B45B2EE7B9830F82E98D0226061DEA3E59F50C
Rakuten France: Multi-modal Product Dataset (training/test)
y_test / train
Integer_idImage_idProduct_idPrdtypecode
1123456789098765432101111
x_test / train
Integer_idTitle
1La Naissance De La Tragédie
DescriptionImage_idProduct_id
Thème : Poches12345678909876543210
catalog english taxonomy
PrdtypecodeTop level category
1111Child
image training / test

laser

Rakuten Books bibliographic information for author disambiguation test
Author name master
ColumnSample
author ID2214
author name楽天太郎
Book, magazine data by same name authors
ColumnSample
ISBN1234567891011
title楽天のすべて
author 1楽天太郎
author 2楽天花子
publisher楽天出版株式会社
publication_date2019-01-01
category_id123456789
annotated data to distinguish between different authors with the same name by job title, field, years of birth and death
ColumnSample
field / years of birth and death情報工学/1900-
book list9771234567891,977123456779,…
Rakuten Travel Review aspects and sentiment-tagged corpus
Sample Data
ColumnSample
Review ID1
Sentence ID3
Review sentenceお部屋も広くて、お料理もとても美味しく、部屋の露天風呂からは星がプラネタリウムのように広がっていて、とにかく最高でした。
Breakfast_positive1
Breakfast_negative
Dinner_positive1
Dinner_negative
Spa_positive1
Spa_negative
Service_positive
Service_negative
Location_positive
Location_negative
Facility/Amenity_positive
Facility/Amenity_negative
Room_positive
Room_negative

Apply for Access

In collaboration with the National Institute of Informatics (NII) and ALAGIN, this service is made available for download via their respective websites. Upon successful completion of the prescribed procedures through either organization, a download password will be issued to you.
Please access one of the following websites to apply.