
こんにちは、atlax 編集部 中の人です。
野村総合研究所(NRI)の 塚上 賢太、中島 琢登、木本 晴久、倉友 遼太、坂井 吉弘、安田花純、田中 慎太郎、中曽 禎啓の8名が、データサイエンスや機械学習の分野で世界中の人々が集まるオンラインプラットフォーム「Kaggle」の2つのコンペティションで、銅メダルを取得しました。
コンペティションについて
- 「Yale/UNC-CH - Geophysical Waveform Inversion」
開催期間:2025年4月9日 ~ 7月1日
テーマ:地震波形から地下の速度構造を推定
参加チーム:
- チームA:倉友 遼太、坂井 吉弘、安田 花純、田中 慎太郎
- チームB:塚上 賢太、中曽 禎啓、中島 琢登、木本 晴久 - 「CMI - Detect Behavior with Sensor Data」
開催期間:2025年5月30日 ~ 9月3日
テーマ:手首装着型デバイスのセンサー情報から身体集中反復行動症の動作を識別
参加メンバー:
- 単独参加:中島 琢登
- チーム参加:塚上 賢太、中曽 禎啓、坂井 吉弘、田中 慎太郎、木本 晴久

左下段から中曽 禎啓、塚上 賢太、中島 琢登
今回は、Kaggleコンペティションにて受賞を果たしたNRIの若手データサイエンティストチームにインタビューを実施しました。チームメンバーそれぞれの専門性を活かした役割分担や情熱をもって挑戦した取り組みについて伺いました!
Q1:今回受賞されたそれぞれのコンペティションのテーマや課題について、簡単に説明していただけますか?
中曽:最初に参加した「Yale/UNC-CH - Geophysical Waveform Inversion」では、地震波の波形データから速度マップなどの地下特性を推定することが課題でした。地面に振動が加わった際の波形をシミュレーションし、その波形データを用いて地下地層の物理特性、特に波の伝播速度を予測します。
高く評価されたソリューションの多くは、波形データを単なる時系列データとして扱うのではなく、画像として表現するフォーマットを作成し、それを活用して精度の高い地層構造予測を実現していました。
次に参加した「CMI Detect Behavior with Sensor Data」では、センサー付きの腕時計型デバイスから取得した手首の動きデータを解析して、人間の細かな行動を検知・分類するモデルを作成する課題でした。「髪を触る」や「眉毛を抜く」といった非常に繊細な動作を判別する必要があり、特徴が似ている動作を正確に区別することが最大の難関でした。
この細かな違いを捉えるために、高度な特徴量抽出やモデルの工夫が求められました。

Q2:各コンペティションで特に難しかった点や、それをどのように乗り越えたかを教えてください。
坂井:どちらのコンペティションも非常に難易度が高く、簡単には取り組めない課題ばかりでした。
まず、「CMI Detect Behavior with Sensor Data」では、特に「まつげを抜く」や「眉毛を抜く」といった非常に似ている細かな動作の区別が大きな課題でした。似た動作の切り分けに時間がかかり、この難しさを乗り越えられなかったため、銅メダルにとどまった悔しさもあります。
それでも、他のチームがあまり試みない独自のアイデアや、自作デバイスを活用した専門領域のモデル開発に取り組めたことは大きな学びでした。単に精度を追求するだけでなく、新しいアプローチに挑戦できた点が印象深かったです。
一方、「Yale/UNC-CH - Geophysical Waveform Inversion」では、地下地層の構造予測という根本的かつ難解な課題の理解に約一週間を要しました。
典型的なデータ分析の手法が適用しづらい課題であったため、他の参加者のアイデアや技術を参考に議論を重ねました。アイデアは豊富にあったものの、初めてのコンペティションだったこともあり実装力が不足していたことを反省しました。その経験を踏まえ、「CMI Detect Behavior with Sensor Data」では、とにかく手を動かして試行錯誤すること、他チームに先んじる新しいアイデアを積極的に実践することを心がけました。

Q3:それぞれの受賞に繋がったポイントや戦略はどのようなものでしょうか?
田中:私たちが最初に参加した「Yale/UNC-CH - Geophysical Waveform Inversion」は、もともと非常に難しい課題でした。公開されているノートブックなどの共有リソースですでに高スコアが出ており、それを超えるのは非常に困難でした。同じ手法で高スコアを達成しても、多くの参加者と差別化するのが難しい状況でした。
単体のモデルの性能が伸び悩む中、複数のモデルを組み合わせるアンサンブル学習の調整を粘り強く続けたことが勝因の一つです。特にコンペティション最終日前夜にはオンラインで集まり、深夜までExcelで結果を分析しながら細かく調整を行いました。その努力が銅メダル圏内に入る最後の一押しとなりました。
「CMI Detect Behavior with Sensor Data」では、自作のデバイスを作成したことが非常に独自性のある戦略でした。元々提供されているデータが少なかったため、その不足を補うために主催者が使っていたものと同じセンサーを自分たちで作り、実際に「まつげを抜く」などの動作を行いながら約2000件のデータを収集しました。約3000人の参加者の中で、こうしたデータを一からの収集しラベル付けを行ったチームはほとんどいなかったと思います。
この独自に収集したデータをモデル学習に活用したことで、非常に思い入れの強いモデルを作ることができました。
また、メンバーの専門性が最大限に活かされたことも、大きな成果につながったと考えています。

Q4:チームでの役割分担や協力の仕方について教えてください。
木本:私たちは8名で活動していますが今回のコンペティションには人数制限があり、全員で1つのチームに参加することはできませんでした。そこで、各メンバーの参加したいコンペティションやコミットできる時間に応じて、複数のチームに分かれて活動しています。
役割はメンバーの得意分野を活かして決めています。例えば、画像処理が得意なメンバー、自然言語処理が得意なメンバー、データの特徴を分析するEDAが得意なメンバー、モデル構築が得意なメンバー、さらにはハードウェア技術に長けたメンバーもおり、各自の専門性に合わせて役割分担を行いました。
また、知識の習得も重要と考えているため、コンペティションで何を学びたいかや、コンペティションに必要なGPUなどの計算リソースをどれだけ持っているかも考慮し、最適な分担を行っています。
チーム内では、コミュニケーションツールのDiscordを活用してオンラインで情報共有をしています。さらに、コンペティションに参加している期間の週末には貸し会議室を借りて対面で議論し、締切間近には進捗共有や方針確認を行うために朝6時からオンライン朝会を開催するなど、活発にコミュニケーションを取りました。
メンバー同士の出会いは新人研修期間で、コンペティションに参加する前から毎週交流を続けてきました。こうした積み重ねが強いチームの結束につながっています。

Q5:技術面でチャレンジしたことや、受賞に向けて工夫した点はありますか?
塚上:「CMI Detect Behavior with Sensor Data」では、締め切りの約1か月前に自作デバイスを作るアイデアが早めに出たことが、本当に良かったと思っています。ハードウェアの技術力を持つメンバーを迎え、デバイスをチーム内で回しながら1日に約300件ものデータを収集することができました。データ収集のために実際にまつげや眉毛を抜くので痛みもありましたが…(笑)そうした大変さも含めて、この独自データの収集が大きな強みとなりました。
「Yale/UNC-CH - Geophysical Waveform Inversion」では、波形や地形データを画像として扱う課題に対して、画像生成に強いAI技術である拡散モデル(Diffusion Model)を活用しました。この技術は、最近のChatGPTなどでも応用されているもので、試してみたところ、公開されていた既存のスコアを超える成果を出すことができました。
さらに、高性能なGPUであるGeForce RTX™ 5090を2台保有していたことも大きな強みとなり、大容量の拡散モデルの学習・推論をスムーズに実行できたことが受賞に繋がった要因の一つだと思います。

Q6:どのような評価指標を重視し、モデルの改善を進めましたか?
中島:実務では「何を評価すべきか」という議論から始まりますが、Kaggleでは評価基準が明確なので、その指標に沿って提出物のスコアが決まります。
例えば「Yale/UNC-CH - Geophysical Waveform Inversion」では、予測する速度マップと真の値との差を示すMAE(平均絶対誤差)が評価指標でした。一方「CMI Detect Behavior with Sensor Data」ではF1スコア*1が用いられました。
こうした評価指標に基づいて、モデルの改善をどう進めるかが腕の見せどころとなります。中でも特に重要だったのは、実験を高速に繰り返していくことです。私たちのチームでは各自の作業内容をリポジトリにまとめ、AI開発者向けプラットフォーム「Weights & Biases」を活用して、パラメータやモデル改良の影響をほぼリアルタイムで監視しながら、多くの実験を実施しました。これにより、どの変更がスコアを上げ、どの変更が逆効果かを素早く把握して、効率的に改善を続けていきました。
「Yale/UNC-CH - Geophysical Waveform Inversion」は地震波や音波などの波形から地層構造を予測する課題です。主催者が用意したMATLABの関数を使うことで、速度マップから波形を生成できます。上位者はこの関数を活用して精度向上に挑んでいました。私たちもこの関数を使ったモデル改善を試みましたが、うまく組み込めず、銅メダルという結果にとどまりました。
今後は、これまで以上に仮説検証を高速に進めることや課題の理解に基づいた筋の通った仮説立てが、さらなるスコア向上や金・銀メダル獲得に重要だと考えています。今回の成果はアンサンブル学習によって公開スコアを上回れた点で良かったものの、さらに上を目指すためには実験の効率化と深いドメイン理解が不可欠だと感じています。

Q7:今回の経験を踏まえて、今後のデータサイエンス活動や業務にどう活かしていきたいですか?
安田:今回の経験を通じて得た知識や技術は、社会実装に活かしたいと考えています。Kaggleでは限られたデータや時間の中で高精度なモデルを構築することが重要ですが、実務ではモデルを作るだけでなく、モデルの信頼性や再現性、そして長期間にわたる安定した運用も非常に重要です。
今後はモデルの構築技術だけでなく、品質管理や継続的な運用面に関する知識や技術も深めていきたいと思います。
また、実務でデータサイエンス業務に携わる機会があれば、お客様の意思決定をどのように反映させるかを考慮し、将来にわたり継続利用が可能なAIシステムの仕組みを取り入れたモデル開発を目指したいと考えています。技術面にとどまらず、ビジネスや運用など幅広い観点から価値を提供できるデータサイエンティストとして成長していきたいです。

Q8:atlaxブログの読者やNRIのお客様にメッセージがあれば、最後にお願いします。
倉友:私たちチーム全員がAIに真剣に向き合い、何よりもAIが大好きだということを皆さんにお伝えしたいです。朝6時から議論を重ね、コンペティションが開催されていない期間でも毎週のように集まってディスカッションを続ける熱意は「AIや技術が好き」という気持ちがなければなかなか続けられないと感じています。
Kaggleを通じて得られた経験や知見は、今後のNRIの業務やAI分野の発展にしっかりと活かしていきたいと考えています。

また、この活動を通じて優秀な仲間に出会えたことにも心から感謝しています。
これからもメンバーと切磋琢磨しながら、将来的には、NRIを代表するAI人材として社会に貢献できるよう努力を続けていきます。

編集部の感想
今回のインタビューを通じて、技術力だけではなく課題に対する深い理解や新たな発想、そして何よりもAIへの情熱こそが受賞につながったのだと感じました。
また、各メンバーが得意分野を活かして役割分担を行い、コミュニケーションを密に取りながら切磋琢磨している様子から、今後のNRIのデータサイエンティストのさらなる活躍が期待できると思います。
atlax blogsでは、こうした先進的な挑戦と取り組みを今後も積極的に紹介してまいります。
atlax公式SNS
各種SNSでも情報を発信しています。ぜひフォローをお願いいたします。
お問い合わせ
atlax では、ソリューション・サービス全般に関するご相談やお問い合わせを承っております。
関連リンク・トピックス
・atlax / ソリューション / データサイエンス関連コンペティションの受賞履歴
・2022/06/16 量子アルゴリズムコンテスト QHack 2022 で 上位獲得! ~ コンテスト参加者に 突撃インタビュー ~
-

採用情報
NRIの IT基盤サービスでは、キャリア採用を実施しています。様々な職種で募集しておりますので、ご興味を持たれた方は キャリア採用ページも ぜひご覧ください。
※ 記載された会社名 および ロゴ、製品名などは、該当する各社の登録商標または商標です。
※ アマゾン ウェブ サービス、Amazon Web Services、AWS および ロゴは、米国その他の諸国における、Amazon.com, Inc.またはその関連会社の商標です。
※ Microsoft、Azure は、米国 Microsoft Corporation の米国およびその他の国における登録商標または商標です。
※ Google Cloud、Looker、BigQuery および Chromebook は、Google LLC の商標です。
※ Oracle、Java、MySQL および NetSuite は、Oracle Corporation、その子会社および関連会社の米国およびその他の国における登録商標です。NetSuite は、クラウド・コンピューティングの新時代を切り開いたクラウド・カンパニーです。
*1:ターゲットのジェスチャーかどうかに関するBinary F1とターゲットでないジェスチャーをnon_targetとみなした場合のジェスチャーラベルに関するMacro F1の平均




お問い合わせ