お客様のDXの推進やクラウド活用をサポートする
NRIグループのプロフェッショナルによるブログ記事を掲載

Oracle AI Vector Search Professionalを受験してみた

高橋佑輔 - Oracle Cloud Infrastructure 2023 Certified Architect Professional

はじめに

NRIで、Oracle Cloud Infrastructure(以下OCI)サービスの運営を担当している高橋です。先日、2025年2月より新たに開始されたOracle資格である「Oracle AI Vector Search Professional」認定試験を受験しました。

本試験はその名の通りOracle Database 23aiの目玉の一つである新機能「AI Vector Search」を使いこなすための専門性を証明する試験です。AI Vector Searchを活用するうえで重要なVECTOR データ型の概要と使い方や、Oracle DatabaseをベクトルストアとしてRetrieval-Augmented Generation (RAG) の構成などに焦点が置かれています。

試験勉強を通じて生成AIを活用したアプリケーションにおけるベクトルストアの活用方法やRAGアプリケーションの基本的な作り方などを学ぶことができるため、今後Oracle Database 23aiの保守運用を行うデータベース管理者(DBA)の方のみならず、生成AIアプリケーション開発を行う開発者の方にもお勧めできる試験です。

この記事では本資格の受験に興味がある方やこれから受験される方へ向けて、試験範囲や傾向の解説と、実際に受験してみて気づいた効果的な学習方法についてご紹介します。

 

Oracle AI Vector Search Professional (1Z0-184-25)認定資格の概要

試験概要

Oracle AI Vector Search Professional認定資格は、オラクルのDBA、AIエンジニア、クラウド開発者を対象に、Oracle Database 23aiの潜在能力を引き出し、AI主導のアプリケーションを構築できるように設計されています。この認定資格の対象者は、PythonとAI/MLの概念に基本的に精通している必要があります。この認定資格は、Oracle Database 23aiの機能を活用してベクトル・データを扱い、セマンティック検索と類似検索を可能にすることに重点を置くことで、従来のデータベース管理と最先端のAIテクノロジーとのギャップを埋めるものです。

詳細なトレーニングを通じて、受験者は、PL/SQLおよびPythonを使用したRAGアプリケーションの構築などの高度なアプリケーションとともに、ベクトル・データの格納、インデックス作成、埋め込みデータの生成と格納などの技術を習得します。Exadata AI Storage、Oracle GoldenGate、およびSelect AIに関する見識を備えたこの認定資格は、エンタープライズ・レベルのデータベースにAIをシームレスに統合して最適化するためのプロフェッショナルを養成します。

 

項目 内容
試験時間 90分
出題数 50問
回答形式 多肢選択式
合格ライン 68%(34問の正解で合格)
受験料 $245
提供言語 英語


記事執筆時点の情報です。試験詳細についてはOracle社の資格試験情報ページを参照ください。

 

試験範囲

目標

出題割合

出題項目

ベクトルの基礎の理解

20%

  • 埋め込みデータを格納し、セマンティッククエリを可能にするVECTORデータ型の使用
  • AI Vector Searchのためのベクトル距離関数とメトリックの使用
  • ベクトルに対するDML操作の実行
  • ベクトルに対するDDL操作の実行

ベクトル索引の使用

15%

  • AI Vector Searchを高速化するベクトル索引の作成
  • 検索クエリへのHNSWベクトル索引の使用
  • 検索クエリへのIVFベクトル索引の使用

近似類似検索の実行

15%

  • 完全類似検索の実行
  • ベクトル索引を用いた近似類似検索の実行
  • 複数文書の検索のためのマルチベクトル類似検索の実行

ベクトル埋め込みの使用

15%

  • Oracle Database外部でのベクトル埋め込み生成
  • Oracle Database内部でのベクトル埋め込み生成
  • ベクトル埋め込みのOracleデータベースへの格納

RAGアプリケーションの構築

25%

  • 取得拡張生成(RAG)の概念の理解
  • PL/SQLを使用したRAGアプリケーションの作成
  • Pythonを使用したRAGアプリケーションの作成

関連するAI機能の活用

10%

  • Exadata AI Storageを使用したAI Vector Searchの高速化
  • Select AI with Autonomousで自然言語プロンプトを使用した検索の実行
  • SQL Loaderを使用したベクトル・データのロード
  • Oracle Data Pumpを使用したベクトル・データのロード


一見すると出題範囲が広く分布しているように感じられますが、AI Vector Searchは生成AIを活用するための機能であるため、全ての要素がつながっています。学習の際にはOracle Database 23aiを活用した生成AIアプリケーションを構築する、という目標感の中で、今はどの部分を学習しているのか?という点を意識することで現在地を見失わずに学習に集中できるかと思います。

また、前提知識として生成AIとOracle DatabaseのDBAとしての基礎知識があると、スムーズに学習を進めることが出来るかと思います。

Oracle Database 23aiではAI関連の機能のためのアップデートが入っており、Oracle Databaseの基本的な用語やアーキテクチャを理解しておくことで、理解が進みやすいです。例えば、「Oracle Database 23aiではSGA上に新たなメモリ・プールが追加されておりAI Vector Searchで使用するための索引の一部はそこに格納されます。」といった説明がされた際に、SGAがどういったものか理解していると、イメージがしやすいです。とはいえ、非常に専門的な内容が要求されるわけではありませんので、個人的にはBronze DBA試験で学習する程度の理解があれば十分かと感じました。

生成AIに関しては、試験範囲と学習コースにも基礎的な部分から取り込まれているため、LLM(大規模言語モデル)の特徴や、推論やエンベディングといった生成AIに関連する特徴的なアクティビティについての概要を知っておく程度で大丈夫です。

 

学習教材の紹介と学習ポイント

学習教材

■オンライン学習コース Become an Oracle AI Vector Search Professional

Oracle AI Vector Search Professional認定資格の学習教材として一番のおすすめは、Oracle社より提供されているオンライン学習コースの履修です。

コースはOracle IDがあれば誰でも無料で受講することができ、ビデオ講義・試験対策講座・練習問題/模擬試験が含まれています。試験範囲に沿ったカリキュラムで学習することが出来る上、章末問題は試験の練習問題としても有用ですので、基本的にこのコースは全て聴講すると良いと思います。

学習コース:Become an Oracle AI Vector Search Professional

mylearn.oracle.com

※2025年4月時点では英語コースのみが提供されていますが、日本語字幕を設定することが可能です。

 

Oracle AI Vector Searchユーザーズ・ガイド

筆者が受験した際には、補助的な学習教材としてヘルプ・センターに公開されているユーザーズ・ガイドを使用しました。

特に、PL/SQLパッケージやSQL関数、ベクトル距離関数および演算子のうち、主要なものについては引数などの使い方も含めてざっと見ておくと得点の向上に繋がると感じます。

Oracle AI Vector Searchユーザーズ・ガイド

docs.oracle.com

 

押さえておきたい学習ポイント

筆者が実際に受験してみて、重要と感じた分野と学習ポイントを以下に挙げます。

 

■ベクトル距離関数とメトリック

ベクトル距離関数を使うことで2つのベクトル間の距離を計算することができます。メトリックは、類似度の計算の尺度となります。ベクトル距離関数の基本的な利用方法と、各メトリックの特徴はかなり重要度が高く、確実に押さえておきたいポイントです。

ベクトル距離メトリック

メトリック

特徴

類似度

ユークリッド距離(Euclidean distance)

比較される各ベクトルの座標間の距離(基本的には2つのベクトルの間の直線距離)を反映する。

  • ベクトル間の直線距離の長さ
  • 短いほど類似度が高い

ユークリッド平方距離(Euclidean Squared Distances)

ユークリッド距離と同様にベクトル間の直線距離の長さを類似度の計算に使用するが、平方根の計算を回避するため、高速

同上

コサイン類似度(Cosine Similarity)

2つのベクトル間の角度のコサインを測定する。

  • 2つのベクトル間の角度の大きさ
  • 小さいほど類似度が高い

ドット積類似度(Dot Product Similarity)

各ベクトルのサイズに角度のコサインを掛けること。

  • サイズ×余弦
  • 大きいほど類似度が高い

マンハッタン距離(Manhattan Distance)

市街地の区画、電力網、チェスボードなど、均一なグリッド上のオブジェクトを記述するベクトルに適している。一般的にユークリッド距離より算出が高速。

  • ベクトル間の距離の長さ
  • 短いほど類似度が高い

ハミング距離(Hamming Distance)

  • バイナリベクトル等で使用される
  • シーケンス内の各ビット位置を比較し、一致するために変更が必要なビット数を示す
  • ビット列など2つの同一長の系列間の「値が異なる位置の数」
  • 少ないほど類似度が高い

ジャッカード類似度(Jaccard Similarity)

  • バイナリベクトルのみに適用できる
  • ジャッカード類似度は2つのベクトルの類似度、ジャッカード距離はベクトルの間の相違度を示す
  • 2つベクトルの共通部分に含まれる要素数を、2つのベクトルの集合全体に含まれる要素数で割ることで計算する
  • 結果が1に近いほど類似度が高い


これらのメトリックと、VECTOR_DISTANCE関数そのものの使い方(記法)は筆者の受験時には複数問題が出題されました。

また、各ベクトル距離メトリック用の関数と短縮形についても、知っているだけで得点できる問題の出題がありました。

関数

概要

短縮形

L1_DISTANCE

マンハッタン距離を計算する関数

N/A

L2_DISTANCE

ユークリッド距離を計算する関数

<->

COSINE_DISTANCE

コサイン距離を計算する関数

<=>

INNER_PRODUCT

ドット積類似度の反数を計算する関数
(-1 * VECTOR_DISTANCE(<expr1>, <expr2>, DOT)と同等)

<#>

HAMMING_DISTANCE

ハミング距離を計算する関数

N/A

JACCARD_DISTANCE

ジャッカード距離を計算する関数

N/A


特にL1がマンハッタン、L2がユークリッド、という点は押さえておくと良いと思います。

 

■ベクトル索引と近似類似検索

各ベクトル索引と近似類似検索の種類とそれぞれの特徴、利用シーンなどを押さえることが重要となります。特にベクトル索引については索引の構造や保存形式といった方式的な部分から、ディスク上のサイズ計算方法や再作成時の注意点など実運用を想定したものまで、複数の角度から理解しておくことが重要です。

ベクトル索引

HNSW(Hierarchical Navigable Small World)
索引

  • 階層化された構造を持つ索引
  • SGA上のベクトルプールに保存される
  • データがSGAに収まる場合、精度とパフォーマンスが高い
  • メモリ要求:高

IVF(Inverted File Flat)索引

  • パーティションベースのアプローチ
  • 検索品質と速度のバランスが良い
  • 大規模データセットに適している
  • メモリ要求:低
  • DB再起動後にメモリに展開するためリロード処理が必要

 

類似検索の方法

 

完全類似検索

近似類似検索

特徴

  • データセット内の他のすべてのベクトルまでの距離を計算
  • フラット検索(完全検索)とも呼ばれる
  • ベクトル索引を使用する
  • ベクトル数が多く、完全類似検索で時間がかかりすぎる場合に有効
  • ターゲット精度が使用される

精度

  • 完全な検索品質で最も正確な結果が生成される
  • ターゲット精度によるが完全類似検索より精度が低い

速度

  • 近似類似検索と比較して時間がかかる
  • 完全類似検索と比較して高速

 

■RAGアプリケーションの構築

RAGアプリケーションの構築に関しては、主にPL/SQLとPythonを使う方法が出題範囲となっています。

PL/SQLとPythonそれぞれでRAGアプリケーションを実装する際の流れと、それぞれの言語で活用可能なライブラリ/パッケージを理解しておくことが肝要と考えられます。RAGアプリケーションの処理の流れはベクトル埋め込み、ベクトル検索の箇所を中心にコーディングも見ておきましょう。

また、PL/SQLではDBMS_VECTOR、DBMS_VECTOR_CHAINパッケージのサブプログラムのよく利用する関数やプロシージャ(最低でも講義中で使用されたもの)については、ユーザーズ・ガイドで復習しておくと良いと思います。

 

■関連するAI機能の活用

Oracle Database 23aiのAI関連機能の効果を最大化するため、関連するサービスにもアップデートが行われています。本試験においては、特に「AI Vector Searchを活用するうえでどういった利点があるのか?」といった観点で各サービスのアップデートを押さえていきましょう。「Exadata AI StorageのAI Smart ScanはどのようにAIベクトル検索を高速化するのに寄与するのか」「GoldenGate 23aiでベクトル・データを使う際の利点は」といったように、ベクトル・データ活用(=生成AI活用)という文脈で考えると、学習しやすいです。

重みとしては15%という割合ですが、試験の出題数自体が50問と多めであるため、7-8問が出題される計算となり、疎かにしてはならない分野です。そこまで深く突っ込んだ問題は出題されませんでしたので、しっかりと準備をして得点源にしたいところです。

 

おわりに

本記事では、2025年2月より開始されたOCIの生成AI関連資格であるOracle AI Vector Search Professional認定試験の概要と、受験してみて気付いた学習ポイントを紹介しました。

生成AIアプリケーションの構築にRAGを利用して企業独自のデータを活用することが一般的になっている昨今ですが、AI Vector Searchは生成AIアプリケーションの精度と性能を更に向上させる可能性に満ちた技術であると感じます。そうした意味で、本試験の受験を通じて得られる知識はOracle Databaseのみならず、今後の生成AI活用の拡大を考える事にも、役立つかもしれません。

本試験は2025年5月15日までのキャンペーンを開催しており、通常$245の受験料のところ、無償で1回の受験をすることができます。

詳細についてはOracle社のWebページをご確認ください。

mylearn.oracle.com

 

「Enroll now to claim your free certification attempt!」をクリックすることで、受験権利をActivationすることができます。

本記事の内容が資格試験を受験される皆さまの一助となれば幸いです。

 

お問い合わせ

atlax では、ソリューション・サービス全般に関するご相談やお問い合わせを承っております。

 

関連リンク・トピックス

 ・atlax / クラウドの取り組み / OCI (Oracle Cloud Infrastructure)

・2025/01/29 OCI活⽤による生成AIアプリ本番化のための継続的モニタリングのアプローチ

 

※ 記載された会社名 および ロゴ、製品名などは、該当する各社の登録商標または商標です。
※ アマゾン ウェブ サービス、Amazon Web Services、AWS および ロゴは、米国その他の諸国における、Amazon.com, Inc.またはその関連会社の商標です。
※ Microsoft、Azure は、米国 Microsoft Corporation の米国およびその他の国における登録商標または商標です。
※ Google Cloud、Looker、BigQuery および Chromebook は、Google LLC の商標です。
※ Oracle、Java、MySQL および NetSuite は、Oracle Corporation、その子会社および関連会社の米国およびその他の国における登録商標です。NetSuite は、クラウド・コンピューティングの新時代を切り開いたクラウド・カンパニーです。