現在の見出し:2.1節:Azure Blob Storageに保存したPDFを取り込み、検索用インデックスを作成する
見出し一覧
- 2.1節:Azure Blob Storageに保存したPDFを取り込み、検索用インデックスを作成する
- - 本節の概要
- - Azure AI Search(無料プラン)を作成
- - Azure Searchにデータソース(Blob)を接続する
- - 「Azure Blob Storage」の接続文字列を取得する
- - Blob StorageのPDFをインポートして検索用インデックスを作成する
【PR】『Python』を学べる企業・個人向けのプログラミングコース
本節の概要
本節ではAzure AIAI(人工知能)は人工的に作られた知能で、様々な技術を組み合わせて人間のような知的行動を実現できるものです。 Search(無料プラン)を使って、Azure Blob Storageに保存したPDFを取り込み、検索用インデックスを作成する手順 を説明しています。
具体的にはRAG構成でChatGPTと連携させるために必要な「Retriever(検索担当)」の準備として、以下の流れを解説しています。
- Azure AI Search サービス(無料プラン)の作成
- Azure Blob Storage との接続設定(接続文字列文字列は文字の並びを表現するデータ型で、テキストデータを扱うための基本的な構造として広く使用されています。の取得)
- 「Import data」機能でPDFファイルをデータソースとして登録
- インデックスの構造設定(検索可能項目やキーの指定)
- インデクサインデクサはプログラミング言語における特定の構文で、クラスや構造体のインスタンスに配列のように添字でアクセスするためのものです。ーの作成と実行(実際のデータ取り込み)
- インポート完了の確認
Azure AI Search(無料プラン)を作成
Azure AI Searchはドキュメントやデータに対して「検索できる状態」を作るためのフルマネージド検索サービスです。今回取り組んでいるようなRAG構成では「Retriever(検索担当)」の役割を担います。

Microsoft Azureより
ホーム画面左上にある「Create a resource」をクリックします。

Microsoft Azureより
「Azure AI Search」で検索し、該当するサービスを選択して「Create」をクリックします。

Microsoft Azureより
プロジェクトプロジェクトは特定の目的や目標を達成するために行われる一連の開発作業です。の詳細欄が表示されます。「Project details」欄はデフォルトのままで、「Instance Details」欄は以下のように入力してください。
- Service name:任意のサービス名を入力する。(ragsearchXXXXなど)
- Location:Japan East(またはJapan West)*リソースグループ作成時と同じ内容に設定してください。
- Pricing tier:「Free」を選ぶ
Pricing tierを変更するには、プランの下にある「Change Pricing Tier」をクリックしてください。

Microsoft Azureより
するとこのようにプラン一覧が表示されます。今回はこの中から「Free」を選択して「Select」ボタンをクリックしましょう。

Microsoft Azureより
全て入力したら「Review + create」をクリックして完了です。

Microsoft Azureより