この記事では4/14〜19日の間にリリースされた、AIに関するニュースをまとめています。AIに関心のある方やこれから関わる可能性のある方が読むことで、AIに関する直近の動向や新しい気づきになる可能性があります。
3分ほどで読めるのでスキマ時間にでも手軽にチェックしてみてください。
Grok-1.5vへ更新。デジタルと物理をつなぐマルチモーダルAIモデル
マルチモーダルAIモデル「Grok-1.5V」は、テキストだけでなく視覚情報の処理も可能になりました。このモデルは新しい「RealWorldQA」ベンチマークで現実世界の理解能力において優れたパフォーマンスを示しています。
Grok-1.5Vの進化により教育や医療、セキュリティなど様々な分野での応用が期待されています。
OpenAI、東京にアジア初のオフィスを開設し日本語専用GPT-4モデルをリリース
OpenAIは東京にアジア初のオフィスを設立し、日本語に特化したGPT-4カスタムモデルをリリースしました。このモデルは翻訳と要約の性能が向上し、以前のモデルよりも3倍の速度で動作します。
この取り組みは日本政府や地元企業と協力して進められており、地域社会の公共サービスと企業のデータ分析、ビジネスプロセスの自動化に寄与することが期待されています。
Windows PhotosアプリがMicrosoft Designerと連携、AI活用で画像編集・デザインを民主化
MicrosoftはWindows 11のPhotosアプリとMicrosoft Designerとの連携を開始しました。これによりPhotosアプリから直接Designerに画像を送り、テンプレート適用やAIによるカスタマイズが可能になります。
この機能は現在、特定の国々とWindows 11のプレビューチャンネルで利用でき、今後の拡張が期待されています。
アドビがAcrobat AI Assistantの一般提供を開始、PDFとの対話でナレッジワーク効率化に期待
アドビは「Acrobat AI Assistant」を公開し、PDFとの対話を可能にしました。このツールを使ってドキュメントの要約や質問に答えを得ることができます。
また、モバイル版の提供とブラウザー拡張機能の導入により、外出先でもPC上でも簡単に情報を取得できるようになりました。これによりドキュメントとの対話がより効率的で直感的になります。
Stability AIがStable Diffusion 3のAPIをリリース、高品質な生成とオープンソース志向の両立を目指す
Stable Diffusion 3は画像と言語の処理を改善する新技術「Multimodal Diffusion Transformer」を採用しました。このアップグレードによりほかの先端AIシステムと同等またはそれ以上の品質を実現しています。
また、Fireworks AIとの提携によって高速かつ信頼性の高いAPIサービスを提供しており、99.9%のサービス可用性を保証しているのが魅力。Stability AIは今後もモデルの改善を進め、より自由なクリエイティビティを支援するソリューションを提供することを目指しています。
Metaが最新の大規模言語モデル「Llama 3」を発表
Metaが新しいAIモデル「Meta Llama 3」を発表しました。この高性能モデルは多言語対応で、コード生成やコンテンツ生成など多機能です。主にクラウドプラットフォームで利用可能で、教育、医療、エンターテインメントなどの分野に革新をもたらすことが期待されています。
また、安全な使用を保証するフレームワークによりAI技術の信頼性も高められています。