量子位智庫AI週報|2026年第20週

アナリスト カロリン
量子位智庫 | 公式アカウント AI123All

今週のAI業界から複数の重要なシグナル

まず注目すべきは、モデルベンダー間の技術進化の方向性における合意です。

記憶管理は、エージェントの大規模展開における核心的なボトルネックと広く認識されており、さまざまな長文脈・低コストの記憶手法が発展しています。これに基づき、リーディング企業は「AIをオペレーティングシステムとする」ことを新たなサイクルの戦略的方向性として確立し始めています。GooglebookとGemini Intelligenceの発表は、この判断を強く裏付けるものです。同時に、垂直統合も市場シェア獲得の重要なカードとなっています。今週、OpenAIは大規模な再編を完了し、ChatGPT、Codex、APIの3つのプロダクトラインを統合、Greg Brockmanがプロダクト戦略を全面的に掌握し、モデルからアプリケーションまでの一体化したクローズドループを構築しようとしています。

もう一つの重要なシグナルは、OpenAI DeployCoの設立です。初回投資40億ドル、150名の組み込みエンジニアという体制で、OpenAIは単なるAPI提供では企業のニーズを満たせず、顧客の生産プロセスを円滑に運用できるようにすることが次世代の競争優位性であると宣言しました。モデル能力とデプロイ能力のギャップは、大規模モデルベンダーの将来の市場シェアの順位を直接左右することになります。

政策面では、国内で初めてショート動画に対するAIラベルが「公開強制」とされ、コンプライアンスのハードルが引き上げられました。すべてのAIコンテンツプラットフォームはこれを重視すべきです。

総じて、競争の焦点はモデル能力の上限から、単位コストあたりの有効なインテリジェンスへと移行しています。より低いトークン消費、より軽量なデプロイ、より緊密なエンジニアリング統合が、顧客の選択を左右するでしょう。

基礎

Cerebras IPO、20倍の申し込み超過、初日68%上昇

Cerebras Systemsがナスダックに上場、発行価格185ドル、寄り付きで350ドルまで上昇し、最終的に311.07ドルで引け、初日68%の上昇を記録しました。調達額は55.5億ドルに達し、2026年以降で世界最大のIPOです。機関投資家からの注文は発行株数の20倍を超え、時価総額は一時1000億ドルを突破しました。

データ面では、2025年のCerebrasの収益は5.1億ドルで前年比76%増、純利益は8790万ドルと黒字化を達成しました。IPO前には、顧客構造の集中度が高いという課題があり、2024年にはG42が収益の87%を占めていました。その後、OpenAIやAWSとの提携により、わずか半年でこの比率を24%にまで圧縮し、顧客リスクの分散に成功しました。

現在、OpenAIは今後数年間で最も重要な収益源であり、両社は2026年から2028年までの期間をカバーする、潜在的な総額200億ドルを超えるAI計算力協力の意向を締結しています。AWSは上場直前に、Bedrockプラットフォームで同社のCS-3チップを接続することを発表しました。

CerebrasのIPOは、ある程度、資本市場がAI計算力インフラ分野に対する信頼を一挙に具現化したものです。

モデル

エージェント記憶とコスト最適化、テンセントがAgent Memoryをオープンソース化、トークン消費を50%削減

テンセントクラウドはTencentDB Agent Memoryをオープンソース化しました。これは、エージェントの長期間タスクシナリオ向けに、短期記憶の圧縮と長期個人化記憶の能力を提供します。

本方式は、「コンテキストのアンロード」と構造化タスクキャンバスの2つのメカニズムを採用し、エージェントは非リアルタイムで必要な情報を外部ストレージに移行し、コアな状態と実行パスのみを保持することで、連続したマルチタスクセッションにおいてコンテキストを軽量な状態に保ち、かつ元のデータの段階的な追跡と復元をサポートします。

実測データによると、マルチタスク連続セッションテストでは、Agent Memoryによりトークン消費が最大61%削減されました。ウェブ検索シナリオでは、タスク成功率が相対的に52%向上。コード修正や長文書分析などのシナリオでは、完了率と正確性もそれぞれ10%と8%向上しました。

業界全体でエージェントの記憶管理に対するソリューションへの強いニーズが存在しており、今回のテンセントのオープンソース化は、エージェント型アプリケーションの商業的実現可能性にとって重要な技術的検証を提供します。投資対効果の観点から見ると、エージェントのトークン消費比率は、2026年下半期の商業化加速の重要なシグナルとなるでしょう。

面壁智能 MiniCPM-V 4.6 オープンソース化、エッジモデルは低メモリ展開を追求

面壁智能は、エッジ向けマルチモーダル大規模モデル MiniCPM-V 4.6 をオープンソース化しました。このモデルは、わずか1.3Bのパラメータサイズでありながら、権威あるベンチマークで Qwen3.5-0.8B などの競合を上回り、世界同一サイズモデルの性能ランキングでトップに立ちました。

メモリ価格の上昇が続く中、MiniCPM-V 4.6 はわずか6GBのメモリでエッジ上でスムーズに動作します。推論スループットは同サイズの競合の1.5倍、計算コストは後者の1/43にとどまります。モデルはLLaVA-UHD v4技術を採用し、画像エンコーディングの計算量を50%削減しています。

MiniCPM-V 4.6 は iOS、Android、HarmonyOS を完全にサポートし、コミュニティでの採用規模を拡大し、クラウド優先のAI市場に新たなビジネススペースを提供します。このようなモデルは、より少ないパラメータ、より低いハードウェアハードルでトップパフォーマンスを実現し、マルチモーダルAI機能をモバイルデバイスのエッジに真に浸透させることを可能にします。

アリババ Ring-2.6-1T オープンソース化、OpenRouterで公開、5月末まで割引提供

アリババ百霊は、兆規模の旗艦思考モデル Ring-2.6-1T をオープンソース化し、重みは5月15日にHugging FaceとModelScopeで公開されました。このモデルの総パラメータ数は兆規模、活性化パラメータ数は約630億で、すでにOpenRouterで無料API体験を提供しています。

Ring-2.6-1T の中核的な設計ロジックは「オンデマンド思考」であり、調整可能な Reasoning Effort メカニズムを導入し、high と xhigh の2つの推論強度をサポートします。xhigh モードは数学、科学研究などの高難度推論タスクに使用され、モデルの能力上限を引き出します。

この1か月間、アリババ百霊は複数のモデルを集中的に反復リリースし、トークン効率の方向に一斉にシフトし、より少ないトークンでより高品質なタスク出力を完了することを強調しています。

NVIDIA、26億パラメータの世界モデル SANA-WM をオープンソース化、1分で720p動画生成可能

NVIDIA NVlabs チームは、効率的な世界モデル SANA-WM をオープンソース化しました。パラメータ数は26億で、分単位(60秒)の動画生成をネイティブでサポートする初の軽量オープンソース世界モデルであり、1枚の静止画像とカメラ軌跡を入力として、720p解像度の制御可能な長尺動画を出力し、単一GPUで推論が可能です。

アーキテクチャ面では、SANA-WM は3つの重要なブレークスルーを採用しています。混合線形 Diffusion Transformer により長いシーケンスのGPUメモリ複雑性を低減、2ブランチカメラ制御システムにより6自由度の高精度な軌跡追跡を実現、2段階生成パイプラインにより17Bの補正モデルを活用して長尺動画の時間的一貫性を向上させています。

効率面でのパフォーマンスが特に際立っており、トレーニング全体はわずか213Kの公開動画クリップを使用し、64枚のH100上で15日間で完了しました。業界の観点から見ると、世界モデルは通常パラメータ数の競争と考えられますが、SANA-WM は2.6Bパラメータで単一GPU上で良好な視覚品質と高い制御精度を実現し、世界モデルの工学的実現可能性を高めました。

Thinking Machines Lab、ネイティブマルチモーダル「インタラクションモデル」を発表

Thinking Machines Lab は、初のインタラクションモデルの研究プレビューを公開し、TML-Interaction-Small をリリースしました。これは276Bパラメータの混合エキスパートモデル(活性化パラメータ12B)で、リアルタイムのマルチモーダルな人機協調のために特別に設計されています。

「インタラクション」は、このモデルがユーザーが話すと同時に応答を生成し、能動的に発言できることに現れています。Interaction は、オーディオ、ビデオ、テキストの入力ストリームを200ミリ秒単位で継続的に処理することで、この体験を実現しています。システムは2層に分かれており、表層のインタラクションモデルが継続的にユーザーと双方向通信を行い、下層の背景モデルが深い推論と長いチェーンタスクを担当し、両者が連携してリアルタイムのインタラクションとバックグラウンド思考の並行処理を実現します。

Nous、Token Superposition Training を発表、アーキテクチャ変更なしで事前学習速度を2~3倍に向上

Nous Research チームは最近、Token Superposition Training(TST)トレーニング手法を提案しました。この手法の特筆すべき点は、モデルアーキテクチャ、トークナイザー、オプティマイザー、並列戦略を変更せずに、事前学習初期のトークン表現と予測目標のみを調整することで、LLMの事前学習速度を約2.5倍向上できることです。10BパラメータのMoEモデルの場合、同等のFLOPs条件下でTSTは最大2.5倍の効果的な高速化を実現します。

TSTの技術パスは2段階に分かれています。効率的な重ね合わせ段階では、複数の連続トークンを1つのセットにマージし、マルチホットクロスエントロピー目標でトレーニングします。第2段階では標準トレーニングに戻します。

本手法は2.7億から100億パラメータの規模で広範に検証され、優れたロバスト性を示しています。計算量を一定に保つ場合、TSTは実際にはデータ利用効率を最適化しています。GPUを単純に積み上げるトレーニング戦略の限界効果が低下し続ける中、TSTのような「無痛」の高速化手法は、低コストな事前学習のための新たな技術パスを提供します。

アプリケーション

DeepSeek、チャット履歴検索機能を追加、App 2.1.0でグレースケールテスト

DeepSeek は最近、App 2.1.0(213)バージョンでチャット履歴検索機能をグレースケールテストとしてリリースしました。このバージョンにアップデートしたユーザーは、サイドバー上部に「チャット内容を検索」検索ボックスを確認でき、キーワードを入力するとそのキーワードを含む過去のチャット履歴を正確に検索し、ワンタップで該当する会話位置に移動できます。同時に、ウェブ版も同様の検索操作をサポートしています。この機能はキーワードの全文一致のみをサポートしており、検索効率にはまだ改善の余地があります。

業界ベンチマークとしては、ChatGPT、Claudeなどの主要なAI製品はすでに履歴会話検索機能を全面サポートしています。DeepSeekのヘビーユーザーにとって、これまでこの基本機能の欠如は明確なプロダクト体験の弱点でした。

今回のアップデートは、プロダクトの成熟度において業界ベンチマークに追いついたものです。現在はまだグレースケールテスト段階で、全量配信ではありませんが、高品質な会話アセットを蓄積しているヘビーユーザーにとって、重要な体験の補完となっています。

Kimi、WebBridgeブラウザ拡張機能をリリース、エージェントが直接ブラウザを操作可能に

Kimi は WebBridge ブラウザ拡張機能をリリースし、エージェントが実際のウェブページ環境で検索、スクロール、クリック、入力などの人間らしい操作を行い、ユーザーのログイン状態とCookie情報を保持したまま自動的にタスクを完了できるようにしました。

この拡張機能はすでに Claude Code、Cursor、Codex、Hermes などの主要なエージェントプラットフォームに適合しており、バックグラウンドで静かに実行され、ユーザーのマウスやキーボードを占有しません。

実際の応用面では、この拡張機能は情報整理、フォーム入力、サイト間データ統合などの反復的な操作をサポートし、固定フローをカプセル化して、大規模モデルのトークンを消費しない軽量CLIツールを形成できます。

同じ時期、Kimi K2.6 は Finance Agent Benchmark V2 評価において、44.87%の正確性でオープンソースウェイトのトップになりました。この評価では、モデルが数百ページの財務諸表から独立してデータを特定し、多段階の計算を完了することが求められ、難易度は前世代を大きく上回っています。

「話せる」から「できる」への進化は、AIエージェント開発における重要な一歩です。Kimiはブラウザプラグインという軽量な方法で、エージェントが実際のウェブページ上で複雑なタスクを実行する際の工学的ハードルを効果的に下げました。Kimi K2.6の金融エージェントベンチマークでのトップパフォーマンスと相まって、Kimiはエージェントタスク実行の完全なクローズドループを形成しつつあります。

アリババ Qoder、バージョン1.0を発表、IDEを自律型ワークベンチにアップグレード

アリババクラウドは Qoder 1.0 をリリースし、中心的なアクションはプロダクトを従来のAIコーディングアシスタントから、エージェント自律型開発ワークベンチへとアップグレードすることです。

開発者は、新しい「Quest独立ウィンドウ」で要件を定義するだけで、基盤となる Agent Harness が要件の分解、コーディング、テスト、デリバリーまでの全プロセスを実行し、さらにプロジェクト間のマルチタスク並行処理をサポートします。

技術面では、Qoder は構造化タスクランタイムと知識工学を導入し、エージェントがチームレベルのコンテキストに基づいて自律的に意思決定できるようにしました。同時にリリースされたチームレベル知識エンジンは、記憶、リポジトリ規約、ナレッジベースを統合し、実測でコード保持率が11%向上、トークン消費が40%削減されました。

Copilot 系ツールは一般的に個人の効率化を解決しましたが、その効率をどのようにチームレベルの安定したエンジニアリング成果に沈殿させるか?Qoder の答えはチーム知識エンジンとエキスパートチームモードであり、本質的にはトップ開発者の経験と規範をエージェントの組み込み行動規範として体系化することです。

現在、Qoder の全製品は世界で500万以上のユーザーにサービスを提供し、ARRが6000万ドルを突破しました。先月発表されたデジタル社員 QoderWake と合わせて、アリババクラウドは個人のコーディングから企業の中核プロセス自動化までをカバーする完全なプロダクトマトリックスを構築しつつあります。

OpenAI、DeployCoとDaybreakを発表、企業のAIシステム本番投入を支援

企業への導入が大規模モデル競争の新たな焦点となっています。

OpenAI は OpenAI Deployment Company の設立を発表し、初回として40億ドル以上の初期投資を獲得、評価額は100億ドルに達しました。DeployCo の運営モデルは独特で、約150名の最先端デプロイエンジニアを顧客組織に派遣し、AIモデルと既存のデータ、ツール、権限メカニズム、業務ワークフローとの深い統合を支援します。

企業向けに、OpenAI は ソフトウェアセキュリティ防御プロジェクト Daybreak を発表し、競合のAnthropicが提供するGlasswingソリューションに対抗します。このプロジェクトは、OpenAIモデル、Codexセキュリティエージェント、Intel、Cisco、CrowdStrikeなどの複数のセキュリティパートナーの能力を統合し、開発プロセスに組み込みます。

シスコは昨年『2025年AI対応指数』を発表し、世界的に約13%の企業のみが「AIを受け入れる完全な準備ができている」とされ、アジア太平洋地域では約11%とさらに低いことが明らかになりました。

これこそが、DeployCo や一連のセキュリティプロジェクトの意義を説明しています。それは、技術デモからビジネス導入までの大きなギャップを埋めることです。

GooglebookとGemini Intelligence:AIが会話から...