【Python】reshapeで配列の形状を変更する方法

公開：2024年7月31日更新：2026年5月11日

CodeCampが提供するDX人材育成が可能なプログラミングやITが学べる公開講座

Pythonで多次元データを扱う場面は、機械学習における画像のリサイズやモデルへの入力データ作成など、データ分析の実務で頻繁に発生します。データ構造の変換手段でよく使われるのが「reshapeメソッド」で、要素の総数を保ったまま配列の次元や形状を柔軟に変更できるのが特徴です。

この記事では、Pythonエコシステムの中心的なライブラリにおける、形状変更処理の基本的な使い方を解説していきます。マイナス1を利用した要素数の自動推論やメモリの並び順の制御など、実践的なサンプルコード付きで解説していきますので、ぜひ参考にしてください。

Pythonのreshapeで配列の形状を変更する方法
配列の次元を増減させる
-1を指定してサイズを自動計算させる
列優先順にデータを配置する
Pythonのreshapeで発生するエラーの対処法
要素数の不一致を解消する
メモリの非連続によるエラーを回避する
Pythonのreshapeに関するよくある質問
PyTorchのviewメソッドとの違いは何ですか?
Pandasのデータフレームもreshapeできますか?

Pythonのreshapeで配列の形状を変更する方法

reshapeメソッドを活用すると、要素の総数を保ったまま配列の次元や形状を柔軟に変更できます。具体的な使い方として、以下の3つを順番に解説します。

配列の次元を増減させる
-1を指定してサイズを自動計算させる
列優先順にデータを配置する

それぞれの手法を実行可能なサンプルコード付きで紹介しますので、データの構造や用途に応じて使い分けてください。

配列の次元を増減させる

配列の次元を増やす場合や減らす場合には、reshapeメソッドに変換後の形状をタプルで渡すことで対応できます。変換前後で要素の総数が一致する必要がある点がポイントです。

NumPy公式ドキュメント numpy.reshapeは、この関数の仕様について、次のように説明しています。

The new shape should be compatible with the original shape.
出典:NumPy公式ドキュメント numpy.reshape

つまり、変換前後でデータの要素総数が互換している必要があり、順序や要素の総計は変わらないという前提です。

以下のコードは、1次元配列を2次元配列に変換する使用例です。

import numpy as np

# 1次元配列を作成（要素数6）
arr = np.arange(1, 7)
# 2行3列の2次元配列に変換
reshaped_arr = arr.reshape(2, 3)
print(reshaped_arr)

上記のコードでは、6つの要素を持つ1次元データを指定した行と列の形式に再配置しています。要素数の合計が元の配列と一致しない形状を指定すると ValueError が発生するため、詳細は後述の「要素数の不一致を解消する」を参照してください。

Python研修一覧はこちら

目的に合うPython研修を一覧形式から探したい方は、ぜひご利用ください。

Python研修を比較する

Java研修一覧はこちら

目的に合うJava研修を一覧形式から探したい方は、ぜひご利用ください。

Java研修を比較する

PHP研修一覧はこちら

目的に合うPHP研修を一覧形式から探したい方は、ぜひご利用ください。

PHP研修を比較する

新入社員研修

目的に合う新入社員研修を一覧形式から探したい方は、ぜひご利用ください。

新入社員研修を比較する

全ての研修からも探したい方はこちら

-1を指定してサイズを自動計算させる

NumPyなどの配列操作において、形状の引数に「-1」を渡すと、指定した以外の次元から残りの要素数を自動的に推論させる処理が可能です。

-1 を活用して次元のサイズを自動計算させる方法は、以下の通りです。

import numpy as np

arr = np.arange(1, 9)
# 行数を2に指定し、列数は-1で自動計算
auto_reshaped = arr.reshape(2, -1)
print(auto_reshaped)

上記のコードでは、行の長さを2と定めた上で、残りのデータ数から列の長さが自動的に計算される仕組みです。

この機能は、大量のデータセットを扱う際に全体の要素数を手動で計算する手間を省けるため非常に便利です。複数の次元に同時に「-1」を指定すると、どの次元サイズも一意に決まらないため ValueError: can only specify one unknown dimension が発生する仕様です。

列優先順にデータを配置する

メモリ上でのデータの読み書き順序を制御し、列を優先して要素を配置する機能も提供されています。Fortranなど列優先のデータと連携する際に、活用される手法です。

列優先順を指定してデータを配置する使い方は、以下の通りです。

import numpy as np

arr = np.arange(1, 7)
# order引数に'F'を指定して列優先で配置
col_major_arr = arr.reshape((2, 3), order='F')
print(col_major_arr)

上記のコードでは、order='F' という引数を追加することによって、縦方向の列から順番にデータが埋まっていきます。

order 引数は、NumPy配列のメモリ走査順序（インデックスの読み出し順序）を指定するパラメータです。order='C'（デフォルト）では行優先にインデックスが走査され、order='F'（Fortranオーダー）では列優先に走査される仕様です。

詳細な仕様はNumPy公式ドキュメント numpy.reshapeのorderパラメータを参照してください。データ連携時はどちらの順序でデータを読み出しているかを確認することが欠かせません。

Pythonのreshapeで発生するエラーの対処法

Pythonでデータの形状を変更する際、いくつか典型的なエラーに直面します。特に要素数の不一致やメモリの非連続性によるエラーは、頻繁に発生する問題です。

エラーに対処するための主なポイントは、以下の通りです。

要素数の不一致を解消する
メモリの非連続によるエラーを回避する

それぞれの対処法について、具体的なコード例とともに順番に解説していきますので、エラーに遭遇した際の参考にしてください。

Python基礎・実践(Django)

企業・法人向けのPython研修では、基礎から応用まで体系的に学べます。

Python研修の詳細

DX社員研修

企業・法人向けのDX研修では、実務に繋がるリスキリングでITレベルを向上させます。

DX研修の詳細

Javaエンジニア育成研修

企業・法人向けのJavaエンジニア育成研修では、Javaの基礎から応用まで確実に習得できます。

Java研修の詳細

新卒・新入社員向け研修

企業・法人に新入社員・新卒社員に向けたプログラミング研修を提供しています。

新入社員研修の詳細

コードキャンプのIT研修を全て見る

要素数の不一致を解消する

形状を変更する前後で、配列の要素の合計数が一致していない場合、ValueError が発生します。元のデータが持つ要素数と、変更後の次元サイズの掛け算結果を等しくする必要があります。

NumPyやTensorFlowなど一般的に多くのライブラリでは「reshape操作では要素の総数が変わらない」という仕様を採用しており、この原則は広く共通しています。

要素数を確認し、エラーを防ぐ使い方は以下の通りです。

import numpy as np

data = np.arange(1, 7)
# 要素数6の配列を2行3列（2 * 3 = 6）に正しく変更
reshaped_data = data.reshape(2, 3)

# 要素数が一致しない場合はValueErrorが発生
# error_data = data.reshape(2, 4)

上記のコードでは、要素数が6である1次元配列を2行3列の2次元配列に正しく変換する例です。コメントアウトした部分のように要素数が合わない数値を指定すると、実行時に ValueError が発生する仕組みです。

要素数の計算を自動化したい場合は、前述の「-1」指定を活用してください。指定した他の次元のサイズに合わせて、残りの次元が自動的に計算される仕様です。

メモリの非連続によるエラーを回避する

PyTorchなどのディープラーニングフレームワークでは、テンソルを転置した後などにメモリが非連続な状態になる場合があります。PyTorchの view メソッドは連続メモリが必須であるため、非連続な状態のテンソルに対して view で形状変更を試みると RuntimeError が発生します。

メモリの連続性を確保してエラーを回避する手順は、以下の通りです。

import torch

# 連続したメモリを持つテンソルを作成
tensor = torch.randn(2, 3)
# 転置によってメモリが非連続になる
transposed = tensor.t()

# contiguous()を使ってメモリを連続化してからviewやreshapeを実行
safe_reshaped = transposed.contiguous().view(6)

上記のコードでは、非連続なテンソルに対して contiguous() メソッドを呼び出し、メモリを連続的な状態に変換しています。contiguous() は非連続なテンソルに対して新しいメモリを確保してデータをコピーするメソッドです。

この連続化の後に view を実行すれば、以降の view 操作では追加コピーが発生しない構成となります。詳細な仕様はPyTorch公式ドキュメント torch.Tensor.contiguousを参照してください。

torch.reshape は、テンソルが連続である場合はビュー（コピーなし）を返し、非連続である場合は内部でコピーを作成して処理する関数です。つまり contiguous().view() は連続化コピーが確実に発生する代わりに以降の view 操作が安定する構成となっています。

一方、torch.reshape は非連続でも動作しますが、返却がビューかコピーかは状況により異なる仕様です。内部の仕組みを把握しておくと、バグの特定に役立ちます。

Pythonのreshapeに関するよくある質問

PyTorchのviewメソッドとの違いは何ですか?

PyTorchにおけるテンソルの形状変更において、両者はメモリ管理や連続性（Contiguity）の扱いが異なります。

view は必ずビューを返すメソッドであり、連続メモリが前提となっています。一方 reshape は非連続なテンソルに対しても動作しますが、返却がビューかコピーかは連続性に依存する仕様です。

Pandasのデータフレームもreshapeできますか?

Pandasのデータフレーム自体には NumPy と同名の reshape メソッドが存在しません。NumPy の reshape に相当する形状変更を行う場合は、df.to_numpy().reshape(...) や df.values.reshape(...) で NumPy 配列に変換してから reshape を適用するアプローチが実務でよく使われます。

一方、stack や unstack といったメソッドは、マルチインデックス化のような階層的な構造変形に特化した操作であり、一般的な形状変更とはやや異なる用途に向いています。目的の操作に合わせて適切な方法を選択してください。