お客様のDXの推進やクラウド活用をサポートする
NRIグループのプロフェッショナルによるブログ記事を掲載

データアナリティクス

2つのKaggleコンペティションにて銅賞!若手チームに突撃インタビュー

NRIの塚上 賢太、中島 琢登、木本 晴久、倉友 遼太、坂井 吉弘、安田花純、田中 慎太郎、中曽 禎啓の8名が、データサイエンスや機械学習の分野で世界中の人々が集まるオンラインプラットフォーム「Kaggle」の2つのコンペティションで、銅メダルを取得しまし…

Snowflake Summit 2025参加報告

こんにちは、NRIのSnowflakePOの松浦です。 今回は2025年6月2日から5日、サンフランシスコにて開催された「Snowflake Summit 2025」に参加しました。

Double/Debiased Machine Learningのご紹介

こんにちは、NRIでデータ分析や機械学習技術を応用したプロジェクトを担当している徳田です。 今回のブログでは、手持ちのデータで迅速に因果効果の推定を可能にするライブラリEconMLを活用した、Double/Debiased Machine Learning(DML)による因果効果の推…

atlaxプロフェッショナルの鷺森 崇が「生成AI」について解説!NRI Voiceのご紹介

ビジネスのヒントになるテーマを各分野の専門家が語るNRIのオリジナル音声コンテンツ「NRI Voice」にatlaxのプロフェッショナルでもあり、NRI認定データサイエンティストとして活動する鷺森 崇が出演しました。

Solafune 衛星画像から太陽光パネルを検出するコンペティションに参加して(7th Solution)

この度、Solafuneで開催された「衛星画像から太陽光パネルを検出するコンペティション」に参加しました。 再生可能エネルギーの普及が進む中、太陽光パネルの正確な設置場所や設置領域を把握することはエネルギー供給の計画やインフラの最適化、災害予測にお…

プライバシー向上とデータ転送コスト削減を目指す分散型機械学習

本投稿ではFederated Learningについてご紹介します。

関西Kaggler会2023秋に参加してきました

10/20(金)に大阪で開催された「関西Kaggler会2023秋」に参加してきました。

「イマドキの若いもん」は1タイプじゃない?~NRI生活者1万人アンケートを活用したZ世代クラスタリング~

本記事ではNRI独自の調査アンケートである「生活者1万人アンケート」を活用した価値観クラスタリングの事例第2弾をご紹介します。今回は、皆様の職場に加わってくる若手社員がどのような価値観・就労観を持っているのか、昔の若者と比べて今の若者(Z世代)…

日本人唯一のOracle ACE Director!世界基準のトップエンジニアへ先進的な取り組みや技術の活かし方をインタビュー!

「Oracle ACE」の中でも最上位となるOracle ACE Directorに2023年4月、唯一の日本人としてNRIの大塚紳一郎が認定されました。 今回のブログでは大塚の先進的な取り組みや技術の活かし方への熱い思いを取材しました。

Kaggle - AMP®-Parkinson's Disease Progression Prediction 3位解法のご紹介

データサイエンティストの田村です。Kaggleで2023年5月に終了した「AMP®-Parkinson's Disease Progression Prediction」において参加1,805チーム中3位となり、ソロ金を獲得できました。私自身はまだまだKaggle初心者ではありますが、本記事ではコンペティシ…

Nishika 睡眠コンペ 1位 解法の紹介

2022年11月~2023年1月の期間でNishikaで開催されていた「睡眠段階の判定 〜”睡眠の深さを判別しよう”〜」コンペ(以下、睡眠コンペ)に、同じくNRIデジタル データサイエンスの滝口さんと松崎さんと柴の計3名のチームで参加し、参加者636人中1位で優勝の結果…

NRI's Data Scientists Attempt to Predict NFT Prices (Part 1)

"NFT" has been attracting a lot of attention recently, and many of you may be wondering about it. I will share you how to collect data from the NFT marketplace using API and how to perform a simple analysis. We hope anyone interested in NF…

お金持ちには価値観の異なる3タイプが存在する?~NRI生活者1万人アンケートを活用した価値観クラスタリング~

本記事ではNRI独自の調査アンケートである「生活者1万人アンケート」を活用した価値観クラスタリングの事例についてご紹介します。特にお金持ちの価値観の違いに基づいて、どのような行動特性があるかを分析する手法とその結果を説明していきます。

Practical Theory for Time Series Forecasting Models 4 -A Case of the Past Kaggle Competition-

Satyaki Roy, Shimpei Ikeno, and Yuta Suzuki Global ML-powered methods such as Gradient Boosted Trees for time series Why do we need global models? In the last blog post, we saw how to train and forecast individual time series data and aggr…

時系列予測モデルの実践論5 -昔のKaggleを事例に-

時系列のクラスタリングとアンサンブル 鈴木雄大, 池野心平, サトヤキ・ロイ こんにちは、NRIの時系列予測チームの鈴木です。第4弾までの記事で、iterativeモデルとglobalモデルを導入し、それぞれ優れた点があることを紹介しました。今回は第5弾として、…

時系列予測モデルの実践論4 -昔のKaggleを事例に-

サトヤキ・ロイ 池野心平 鈴木雄太 GBTなどの機械学習を用いたグローバルモデルでの時系列予測 なぜグローバルモデルが必要なのか 皆さんこんにちは。NRIの時系列予測チームのデータサイエンティスト、Satyakiです。今回も時系列モデルについて、機械学習(ML…

Kaggle Community Competition機能を使ったコンペ開催までの工夫と留意点

Kagggle Community Competition機能を使った内輪コンペを開催する際に工夫した点や、今後の開催時に注意すべきポイントなどをまとめたいと思います。

Kaggle RSNA 2022 10位 解法の紹介 ~頸椎のCT画像から骨折の有無を予測する~

2022年10月までKaggleで開催されていた「RSNA 2022 Cervical Spine Fracture Detection」コンペ(以下、RSNA2022)に、NRIデジタルの大崎さんと奥山、そして社外の方1名を加えた計3名のチームで参加し、883チーム中10位で金メダル入賞となりました。 この記…

「個人情報」に該当する情報の考え方

皆さんが普段分析対象としているデータに関して、これって個人情報にあたるのかな?と疑問に思われたことはありませんか。もし個人情報に該当する場合は、分析環境や分析者の方に対して、様々な制約を設ける必要が出てきます。今回はデータサイエンティスト…

時系列予測モデルの実践論3 -昔のKaggleを事例に-

前回の振り返りパート2では多系列・時系列予測モデルを行うための、特徴量エンジニアリングを行いました。 生成された特徴量は、外生的なものだけでなく、時系列特有の要素を表現していることが重要でした。 Iterativeモデルによる多系列・時系列予測みなさ…

NRIのデータサイエンティストがNFT価格推定に挑戦(第1回)

最近、「NFT」というキーワードが話題を集めており、気になっている方も多いのではないでしょうか。NFTのマーケットプレイスからAPIを使って、データを抽出する方法と簡単な分析方法を共有します。NFTに興味がある方やデータサイエンスに興味がある方に、ぜ…

ProbSpace 日本画の登場人物分類 1st Solution

データ分析コンペサイトProbSpaceで開催された「日本画の登場人物分類」コンペティションに参加させていただき、 参加ユーザ数165名のうち1位を獲得することができました。 こちらの記事に私が取り組んだコンペの概要と解法をご紹介します。

Practical Theory for Time Series Forecasting Models 2 -A Case of the Past Kaggle Competition-

We introduced our approach to building a practical multivariate time series forecasting model. We introduced the data set from a past Kaggle Competition and created a seasonal naive model which will be our baseline.

Practical Theory for Time Series Forecasting Models -A Case of the Past Kaggle Competition-

Shimpei Ikeno, Satyaki Roy, Yuta Suzuki, and Takeru Sone2022-07-12 Purpose of This Blog Series: Introduce How to Use a Practical Multivariate Time Series Forecasting Model Welcome to our Data Science Blog! I am Shimpei Ikeno, a data scient…

なぜF1スコアでは「調和平均」が使われるのか。調和平均の意味を考える

NRIのデータサイエンティスト、田村です。本記事では、よく使われる相加平均と異なり、普段あまり馴染みのない「調和平均」の意味について考えてみたいと思います。 さまざまな代表値と、さまざまな平均値 世の中には様々なデータがありますが、複数のデータ…

航空経路(ウェイポイント)の推定 ~SIGNATEコンペ~

はじめに ~分析の組み立てメインです~ みなさま初めまして。NRIの小川と申します。 先日、データ分析コンペサイトSIGNATEにて開催された「テクノプロ・デザイン社 飛行機の航空経路の推定チャレンジ」(https://signate.jp/competitions/721)に参加し、一般…

時系列予測モデルの実践論2 -昔のKaggleを事例に-

Part2 特徴量エンジニアリング 前回の振り返り... パート1では、実践的な多変量時系列予測モデルを構築するためのアプローチを紹介し、過去のKaggleコンペティション のデータセットを用いて、ベースラインとなるSeasonal Naiveモデルを作成しました。 今回…

新型コロナウイルスで消費行動はどう変わったか~酒の消費額の変化を因果推論で検証してみた~

こんにちは、NRIデータサイエンス 因果推論チーム(阿部泰己、井形健太郎、大島拓人、曽根建、松井拓郎、鈴木雄大)です。因果推論のビジネス上での活用方法を簡単な事例を用いてご紹介します。テーマは新型コロナウイルスによる酒の消費額の変化です。 1章 …

時系列予測モデルの実践論 -昔のKaggleを事例に-

Part1 なにはなくともEDA&ベースモデルつくりから! Shimpei Ikeno2022-07-12 本連載の目的:実践的な”多系列”時系列予測モデルの解き方を紹介 みなさんはじめまして。NRIのデータサイエンティスト、時系列予測プラクティスチームの池野です。Wikipediaによ…