【Python】selenium以外でブラウザ操作を行う2つの方法

【Python】selenium以外でブラウザ操作を行う2つの方法

公開: 更新:



Pythonのselenium以外でブラウザ操作を行う方法

  • Playwright
  • requestsとBeautifulSoup

【PR】プログラミングや生成AIを無料で学べる「コードキャンプフリー」

Playwrightでブラウザを自動操作する方法

PlaywrightはMicrosoftが提供するオープンソースのエンドツーエンドテスト自動化フレームワークです。Playwrightにはブラウザ操作でのコード生成機能が搭載されており、実際のブラウザ操作を記録してコードを自動生成できるため、プログラミング初心者でも容易にブラウザ自動化のコードを作成できます。

playwright codegen https://example.com -o test.py
行番号 詳細説明
1行目 指定URLでコード生成を実行し結果をtest.pyファイルに出力

Playwrightでは要素が存在しない時、自動的に待ってくれる「Auto-waiting機能」があるため、明示的な待機処理を省略してブラウザ操作が可能になります。また、PlaywrightはChromium、Firefox、WebKitの各ブラウザに対応し、ヘッドレスモードや複数のブラウザコンテキストの同時操作もサポートしているため、クロスブラウザテストや並列処理による処理が行えます。

requestsとBeautifulSoupでブラウザを操作する方法

requestsはHTTPリクエストを送信できるライブラリで、BeautifulSoupはHTMLを解析してデータを取得するパーサーライブラリです。requestsでHTMLを取得し、Beautiful SoupでHTMLのパース処理を行うのが基本的な使い方で、ブラウザを起動することなく軽量かつ高速にWebページからのデータ取得が可能です。

import requests
from bs4 import BeautifulSoup

url = 'https://example.com'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
titles = soup.find_all('h2')
for title in titles:
    print(title.get_text())
行番号 詳細説明
1行目 HTTPリクエスト送信用のrequestsライブラリをインポート
2行目 HTML解析用のBeautifulSoupをbs4からインポート
4行目 取得対象のURLを変数代入
5行目 指定URLにGETリクエストを送信してレスポンスを取得
6行目 レスポンスのHTMLテキストをBeautifulSoupオブジェクトに変換
7行目 find_allメソッドでh2タグの要素をすべて取得
8行目 取得したh2要素をforループで順次処理してテキストを出力

Beautiful SoupではCSSセレクターを使えば大体の要素を取得でき、findfind_allメソッドでHTMLタグの検索も可能です。この方法は静的サイトのスクレイピングに適していますが、JavaScriptで動的に生成されるコンテンツには対応できないという制限があります。

※上記コンテンツの内容やソースコードはAIで確認・デバッグしておりますが、間違いやエラー、脆弱性などがある場合は、コメントよりご報告いただけますと幸いです。

ITやプログラミングに関するコラム


ITやプログラミングに関するニュース

ブログに戻る

コメントを残す

コメントは公開前に承認される必要があることにご注意ください。

CodeCampが提供するDX人材育成が可能なプログラミングやITが学べる公開講座 - IT・プログラミングを知って学べるコネクトメディア コードキャンプが提供する無料で学べるプログラミングスクール講座 - IT・プログラミングを知って学べるコネクトメディア コードキャンプDX人材育成研修 - IT・プログラミングを知って学べるコネクトメディア 金融業界の業務効率化を加速するニッセイアセットマネジメントの生成AI×GAS活用研修事例 - IT・プログラミングを知って学べるコネクトメディア 【製造業のDX人材育成事例】デジタル人材の即戦力化を実現する、日本ガイシ株式会社の異動者向オンボーディング研修 - ITやプログラミングを知って学べるコネクトメディア フューチャーアーキテクト株式会社が実現した新入社員向けIT研修プログラムでタスクフォース制度が主体的な学びと成長を生み出す - IT・プログラミングを知って学べるコネクトメディア コードキャンプDX人材育成研修 - IT・プログラミングを知って学べるコネクトメディア コードキャンプIT・プログラミング研修事例/【IT新入社員研修】オンラインとオフラインの最適バランスを実現したFutureOneの導入事例 - IT・プログラミングを知って学べるコネクトメディア コードキャンプIT・プログラミング研修事例/【新入社員研修】柔軟なハイブリッド型Java研修で実現した新卒20名の成長と成果|サークレイス株式会社 - ITやプログラミングを知って学べるコネクトメディア コードキャンプIT・プログラミング研修事例/現場により近いところにデジタルを根付かせるDX基礎講座研修|株式会社ブリヂストン - ITやプログラミングを知って学べるコネクトメディア コードキャンプIT・プログラミング研修事例/業務の効率化・DX推進に向けたIT人材育成への第一歩|株式会社カナエ - ITやプログラミングを知って学べるコネクトメディア 企業・法人向けのIT・プログラミング研修 - ITやプログラミングを知って学べるコネクトメディア

新着記事

対象者別で探す

子供(小学生・中学生・高校生)向け
プログラミング教室検索する

子供(小学生・中学生・高校生)がロボットやプログラミング言語を学ぶことができるオフラインからオンラインスクールを検索、比較することが可能です。

子供(小学生・中学生・高校生)
プログラミング教室検索する

ITやプログラムなどの
最新情報を検索する

日々、新しいITやプログラミング言語の情報が流れていきますが、特定の情報を時系列でニュースやコラムを確認することができます。

ITやプログラムなどの
最新情報を検索する