スプレッドシートのIMPORTHTML関数とは
IMPORTHTML関数は、Googleスプレッドシートでウェブページ上の表やリスト形式のデータを直接セルに取り込むことができる強力な関数です。この関数を使用することで、手動でのデータ収集やコピー・ペースト作業を大幅に削減し、リアルタイムでのデータ取得が可能になります。
基本的な構文はIMPORTHTML(url, query, index)
という形式で記述され、3つの引数を指定する必要があります。url引数には取得対象のウェブページのURL、query引数には「table」または「list」の種別、index引数には取得する表やリストの順番を数値で指定します。
【PR】プログラミングや生成AIを無料で学べる「コードキャンプフリー」
IMPORTHTML関数の基本的な構文と引数
url引数は、データを取得するウェブページの完全なURLを文字列として指定し、httpやhttpsのプロトコルを含める必要があります。URLは必ずダブルクォーテーションで囲むか、URLが記載されているセル参照を使用してください。
IMPORTHTML("http://en.wikipedia.org/wiki/Demographics_of_India","table",4)
query引数では「table」または「list」の2つの値のいずれかを指定し、取得したいデータ構造の種類を関数に伝えます。「table」を指定した場合はHTMLのtableタグで構成された表形式のデータを、「list」を指定した場合はulやolタグで構成されたリスト形式のデータを取得できます。
インデックス番号の指定方法と注意点
index引数は1から始まる整数値で、対象のウェブページ内で何番目の表またはリストを取得するかを指定します。ウェブページ上に複数の表やリストが存在する場合、HTMLソースコード内での出現順序に基づいて番号が割り振られています。
IMPORTHTML(A2,B2,C2)
表とリストのインデックス番号は独立して管理されているため、同一ページ内でtableのindex 1とlistのindex 1が両方存在する可能性があります。適切なデータを取得するためには、事前にウェブページのHTMLソースを確認し、目的のデータ構造の種類と順序を正確に把握することが重要です。
※上記コンテンツの内容やソースコードはAIで確認・デバッグしておりますが、間違いやエラー、脆弱性などがある場合は、コメントよりご報告いただけますと幸いです。
ITやプログラミングに関するコラム
- Canvaとは?使い方やアカウント登録などを初心者向けに解説
- git configで設定情報を確認・表示する方法
- 「Pythonはやめとけ」と言われる理由と学習するメリット
- Ubuntuのversionを確認する方法
- Geminiで画像を生成する方法|ChatGPTとの比較結果も紹介