DeepSeekとは
DeepSeekは中国のAI企業「DeepSeek社」によって開発された大規模言語モデル(LLM)です。特に最新版である「DeepSeek V3」は総パラメータ数が6,710億にも及び、動作時には370億のパラメータを使用して運用されることから注目を集めています。
🚀 Introducing DeepSeek-V3!
— DeepSeek (@deepseek_ai) December 26, 2024
Biggest leap forward yet:
⚡ 60 tokens/second (3x faster than V2!)
💪 Enhanced capabilities
🛠 API compatibility intact
🌍 Fully open-source models & papers
🐋 1/n pic.twitter.com/p1dV9gJ2Sd
このモデルは数学的推論やプログラミング分野において高い精度を発揮し、最大128,000トークンという長文脈を処理できる点が特徴です。オープンソースとして公開されており、さまざまなシーンで活用できます。
DeepSeekは日本語にも対応しており、無料で誰でも利用可能。ChatGPTやClaudeのようにシンプルなUIで使いやすいのも魅力です。
DeepSeek V3の特徴
DeepSeekの新モデル「V3」はMixture of Experts(MoE)アーキテクチャを採用しているのが特徴。必要な計算を効率的に処理できる仕組みを持っています。これにより推論速度が大幅に向上し、コストパフォーマンスも優れているのです。
さらにMulti-head Latent Attention(MLA)やMulti-Token Prediction(MTP)といった技術を組み合わせることで、モデル全体の性能が強化されています。
また「DeepSeek V3」はAPIを通じて提供され、OpenAIのAPIと互換性があるのもポイントのひとつ。利用者は手軽に高精度なモデルを活用できます。
特筆すべきは同等の性能を持つ他モデルに比べて、運用コストが約10分の1と非常に経済的である点です。このコスト面での優位性は特に企業や研究機関から注目を集めています。
DeepSeekの何が凄いのか?
DeepSeek V3は低コストかつ高品質なLLMとして注目されていますが、実際にほかの生成AIモデルと比べてどのような違いがあるのでしょうか。
DeepSeek V3とほかの生成AIモデルを下記にまとめました。[1]
ベンチマーク | DeepSeek V3 | DeepSeek V2.5 | Qwen2.5 | Llama3.1 | Claude-3.5 | GPT-4.0 |
---|---|---|---|---|---|---|
アーキテクチャ | MoE | MoE | Dense | Dense | Sonnet-1022 | 0513 |
活性化パラメータ数 | 378億 | 218億 | 728億 | 405億 | - | - |
総パラメータ数 | 6718億 | 2360億 | 728億 | 405億 | - | - |
MMLU | 88.5 | 80.6 | 85.3 | 88.6 | 88.3 | 87.2 |
MMLU-Redux | 89.1 | 80.3 | 85.6 | 86.2 | 88.9 | 88.0 |
MMLU-Pro | 75.9 | 66.2 | 71.6 | 73.3 | 78.0 | 72.6 |
DROP | 91.6 | 87.8 | 76.7 | 88.7 | 88.3 | 83.7 |
English | ||||||
IF-Eval | 86.1 | 80.6 | 84.1 | 86.0 | 86.5 | 84.3 |
GPQA-Diamond | 59.1 | 41.3 | 49.0 | 51.1 | 65.0 | 49.9 |
SimpleQA | 24.9 | 10.2 | 9.1 | 17.1 | 28.4 | 38.2 |
FRAMES | 73.3 | 65.4 | 69.8 | 70.0 | 72.5 | 80.5 |
LongBench v2 | 48.7 | 35.4 | 39.4 | 36.1 | 41.0 | 48.1 |
HumanEval-Mul | 82.6 | 77.4 | 77.3 | 77.2 | 81.7 | 80.5 |
LiveCodeBench | 40.5 | 29.2 | 31.1 | 28.4 | 36.3 | 33.4 |
LiveCodeBench | 37.6 | 28.4 | 28.7 | 30.1 | 32.8 | 34.2 |
Code | ||||||
Codeforces | 51.6 | 35.6 | 24.8 | 25.3 | 20.3 | 23.6 |
SWE Verified | 42.0 | 22.6 | 23.8 | 24.5 | 50.8 | 38.8 |
Aider-Edit | 79.7 | 71.6 | 65.4 | 63.9 | 84.2 | 72.9 |
Aider-Polyglot | 49.6 | 18.2 | 7.6 | 5.8 | 45.3 | 16.0 |
AIME 2024 | 39.2 | 16.7 | 23.3 | 23.3 | 16.0 | 9.3 |
Math | ||||||
MATH-500 | 90.2 | 74.7 | 80.0 | 73.8 | 78.3 | 74.6 |
CNMO 2024 | 43.2 | 10.8 | 15.9 | 6.8 | 13.1 | 10.8 |
Chinese | ||||||
CLUEWS | 90.9 | 90.4 | 91.4 | 84.7 | 85.4 | 87.9 |
C-Eval | 86.5 | 79.5 | 86.1 | 61.5 | 76.7 | 76.0 |
C-SimpleQA | 64.1 | 54.1 | 48.4 | 50.4 | 51.3 | 59.3 |
DeepSeek V3は複雑な質問応答やコード生成、数学問題など幅広い領域で強力な性能を示しています。特に多言語対応や長文処理能力で優位性があり、ビジネスアプリケーションから研究用途まで幅広い活用が期待されるモデルなのです。
DeepSeekの料金プラン
DeepSeekのAPI料金は2025年2月8日まで、割引価格で利用できます。割引価格と割引終了後の通常価格を下記にまとめました。
DeepSeekの割引価格(2025年2月8日 16:00 UTCまで)
料金タイプ | 項目 | 料金 |
---|---|---|
入力 | キャッシュヒット | 0.07ドル |
キャッシュミス | 0.27ドル | |
出力 | 出力トークン | 1.10ドル |
DeepSeekの通常価格(2025年2月8日以降)
料金タイプ | 項目 | 米ドル |
---|---|---|
入力 | キャッシュヒット | 0.10ドル |
キャッシュミス | 0.30ドル | |
出力 | 出力トークン | 1.50ドル |
料金は100万トークンあたりの価格で、実際の使用量に応じて計算されます。
DeepSeekの使い方
はじめにDeepSeekの公式サイトへアクセスします。
DeepSeek:https://www.deepseek.com/
DeepSeekより
トップページにある「Start Now」をクリックします。
DeepSeekより
ログインページが表示されるので、メールアドレスでアカウントを作る人は画面右下にある「Sign up」をクリック。Googleアカウントを使う場合は「Log in with Google」をクリックして下さい。
今回はメールアドレスで登録する方法で進めます。
DeepSeekより
メールアドレスと任意のパスワードを入力し「Send Code」をクリックします。するとメールアドレスに認証番号が送られてくるので「#code」欄に入力して「Sign up」ボタンをクリックすると作成完了です。
DeepSeekより
上記のようにシンプルなUIのプロンプト入力画面が表示されます。テストとして中央の入力欄に下記のプロンプトを入力してみました。
入力内容
生成AIについて詳しく教えて下さい。
出力結果
生成AI(Generative AI)は、新しいデータやコンテンツを生成する人工知能の一種です。既存のデータからパターンを学習し、それに基づいて新しいテキスト、画像、音楽、ビデオなどを生成します。以下に、生成AIの主要なポイントを説明します。
1. 基本概念
生成AIは、機械学習(特に深層学習)を基盤としています。代表的なモデルには、GAN(Generative Adversarial Networks)やTransformerベースのモデル(GPTなど)があります。
GAN(Generative Adversarial Networks): 2つのニューラルネットワーク(ジェネレータとディスクリミネータ)が競合することで、本物に近いデータを生成します。
Transformerモデル: 自然言語処理(NLP)に広く使用され、テキスト生成や翻訳などに応用されます。GPT(Generative Pre-trained Transformer)が代表的です。
2. 応用分野
生成AIは多岐にわたる分野で活用されています。
テキスト生成: 記事の執筆、コード生成、チャットボット(例: ChatGPT)など。
画像生成: アート作成、写真編集、デザイン支援(例: DALL-E、Stable Diffusion)。
音楽生成: 新しい楽曲の作曲や既存の音楽のリミックス。
ビデオ生成: 動画の編集や合成、仮想キャラクターの作成。
3. 技術的な仕組み
生成AIの核心は、大量のデータを学習し、その分布を模倣して新しいデータを生成することです。
学習プロセス: モデルは大量のデータを学習し、そのデータの特徴やパターンを抽出します。
生成プロセス: 学習したパターンに基づいて、新しいデータを生成します。例えば、GPTは単語の並びを予測し、テキストを生成します。
4. 利点と課題
生成AIには多くの利点がありますが、課題もあります。
利点:
創造性の支援: 新しいアイデアやコンテンツを生み出すのに役立ちます。
効率化: 自動化により、時間とコストを削減できます。
カスタマイズ: ユーザーのニーズに合わせたパーソナライズが可能です。
課題:
倫理的問題: 偽情報やフェイクコンテンツの生成リスクがあります。
データの偏り: 学習データに偏りがあると、生成結果にも偏りが生じます。
計算リソース: 大規模なモデルの学習には大量の計算リソースが必要です。
5. 今後の展望
生成AIは急速に進化しており、今後も以下のような発展が期待されます。
精度の向上: より高品質でリアルなコンテンツが生成されるようになります。
応用範囲の拡大: 医療、教育、エンターテイメントなど、さらに多くの分野で活用されるでしょう。
倫理的なガイドライン: 生成AIの利用に関する倫理的な基準や規制が整備されることが予想されます。
生成AIは、私たちの生活や仕事のあり方を大きく変える可能性を秘めていますが、その利用には慎重さも求められます。
上記のように違和感のない高品質な日本語を出力できます。
DeepSeekより
中国製のAIということもあり、いくつかのポイントが中国語になっていますね。ただこの点は出力内容に影響しないので問題ないでしょう。
こんな感じではじめて生成AIを使う方でも簡単に利用できます。
References
- ^ DeepSeek. 「DeepSeek-V3のリリースとその性能」. https://www.deepseek.com/, (参照 2025-01-07).