AlexNetとは
AlexNetとは、2012年に画像認識コンペティションILSVRCで、圧倒的な性能を示した深層畳み込みニューラルネットワークのことです。トロント大学のアレックス・クリジェフスキー氏らによって開発され、エラー率を従来手法の26.2%から15.3%へと大幅に低減させました。
このネットワークは8層構造を持ち、約6000万個のパラメータと65万個のニューロンで構成されています。GPUを活用した並列計算によって学習時間を劇的に短縮し、深層学習が実用的な技術として認知されるきっかけとなりました。
AlexNetの具体的なネットワーク構造
AlexNetは「5層の畳み込み層」と「3層の全結合層」から構成され、入力画像サイズは224×224ピクセルのRGBカラー画像となっています。第1層の畳み込み層では11×11のフィルタを96個使用し、ストライドを4に設定することで特徴マップのサイズを削減しています。
各畳み込み層の後にはReLU活性化関数が適用され、特定の層ではマックスプーリングによる空間サイズの縮小が行われます。最終的な全結合層では4096個のニューロンを2層重ね、出力層で1000クラス分類のためのソフトマックス関数を使用しています。
| 層の種類 | フィルタサイズ | 出力チャンネル数 |
|---|---|---|
| 畳み込み層1 | 11×11 | 96 |
| 畳み込み層2 | 5×5 | 256 |
| 畳み込み層3 | 3×3 | 384 |
| 畳み込み層4 | 3×3 | 384 |
| 畳み込み層5 | 3×3 | 256 |
AlexNetで採用された革新的技術
AlexNetではReLU活性化関数を採用することで、従来のシグモイド関数やタンジェント関数と比較して、学習速度を約6倍高速化しました。また、過学習を防ぐためにドロップアウト技術を導入し、学習時に50%の確率でニューロンを無効化する手法を取り入れています。
| 技術名 | 効果 |
|---|---|
| ReLU活性化関数 | 学習速度を約6倍向上 |
| ドロップアウト | 過学習を抑制 |
| データ拡張 | 訓練データを増加 |
| 局所応答正規化 | 汎化性能を向上 |
| GPU並列処理 | 学習時間を大幅短縮 |
データ拡張技術として、画像の反転や切り抜き、RGB値の変更を行うことで訓練データを人工的に増やしました。2台のGPUを使用した並列処理により、単一GPUでは実現困難だった大規模ネットワークの学習を約1週間で完了させることが可能になりました。
※上記コンテンツの内容やソースコードはAIで確認・デバッグしておりますが、間違いやエラー、脆弱性などがある場合は、コメントよりご報告いただけますと幸いです。
ITやプログラミングに関するコラム
PythonをWebで実行する方法
共通テスト「情報Ⅰ」2年目で変わる、日本の教育と学び方
gitでブランチ(branch)を切り替える方法
git cloneでブランチを指定する方法
64GBのメモリが必要な人・不要な人の特徴
PCを再起動するコマンド一覧
CapsLock以外で大文字になる原因【Windows編】
パソコンで大文字になるのを解除する方法
面白いAIの活用事例を業界別に紹介
Gitでcommit(コミット)を取り消す方法
ITやプログラミングに関するニュース
サイボウズがkintone AIを正式提供、β版から約1年を経てクレジット制を導入
ロゼッタのラクヤクAIがCSRドラフト作成期間を90%以上短縮、従来4週間を約2日に
AI CROSSが不動産業界向け生成AI伴走支援を開始、アスコットの業務AI実装を実践サポート
日本情報クリエイトが「オーナー提案AIロボⅡ」売買査定を刷新、月1万円からW査定が回数無制限に
Wur株式会社がAI新規事業診断サービス「MVP事業診断レポート」をリリース、12の質問で事業構想を約10分で分析
バトンズがM&A専門家向け「AI概要書」β版を提供開始、企業概要書のドラフトを最速3分で自動生成
SCSKが観光DXサービス「Connexia」を開発、首里城公園でNFT活用の周遊促進が始動
Verdent AI発表、エンジニア不要でソフトウェアを構築する「AIエンジニアリングチーム」が登場
ゼネラルBREXAテクノロジーが外食・小売向けAIサービス「aimana」を開発、店長の意思決定をデータで支援
田中組がKencopa工程AIエージェント製品版を先行利用開始、建設現場の工程管理属人化を解消へ
