大会概要

第4回中国AIGC産業サミットが量子位主催で開催され、約20名の産業代表が参加。オンライン視聴者数は約400万人に達し、主流メディアからも注目された。

方漢(昆仑万維董事長兼CEO)

閉じたスキルセットで許容誤差がある場合、AIに代替されやすいが、判断力やセンスがあれば生き残れる。Token消費量はAI時代の「電力」であり、一般従業員は月数百万~数千万、AIコーディングは数億~数十億、ヘビーユーザーは100億超。AIにより成長階段が圧縮され、素人か達人しかいなくなり中間層が消える。AIに代替されない5つの人間:ストーリーテラー、アイデア創造者、美を定義する人、システム構築者、パラダイム再構築者。多くの業界ではAI実装で2位を目指すべき。1位は試行錯誤コストが高く、3位は利益を得られない。IT分野では1位しかないが、AIは全員を同じスタートラインに立たせる。

易正朝(风行在线CEO)

AIは大文娱業界に大きな変化をもたらした:コスト・参入障壁低下、コンテンツ多様化、創作と消費の境界消滅。AIアプリケーション企業として5つの方向性:モデルには手を出さない、AI漫劇は一部に過ぎない、成功の鍵はAIコーディング、個より組織の拡大が重要、Agentsより衆創がレバレッジ。衆創はAI時代の社会構造であり、企業は従業員・デジタル社員・外部パートナーからなるネットワークで価値を生む。AIは実行と自惚れを拡大する副作用があり、解消策は成果の納品。

林達華(商湯科技執行副総裁・首席科學家)

長期ビジョンが道のりを決める。企業AI実装ではモデル自体より、多形態データ(図表、Excel、画像など)の統合がコストの70%以上を占める。Agentのエンジン性能を発揮するには多モーダル処理が鍵。商湯小浣熊はエンドツーエンドで価値を提供し高速成長。物理空間では最先端の多モーダルモデルも脆弱であり、汎用ロボットのボトルネックは第一原理からの世界理解にある。空間知能の突破には言語・視覚の理解と生成を同一モデルに統合する必要がある。商湯SenseNova U1は理解・推論・生成を統合し、言語と視覚を自在に切り替える。統一によって生図モデルに思考を、思考モデルに想像を与える。

鄧亞峰(盛大集団副総裁・EverMind CEO)

「龍蝦(Lobster)」はAgent時代のiPhone 4であり、72時間働くAI Jarvisを実感させる製品パラダイム。Claude 4はAgent自律化の転換点で、AnthropicがOpenAIを逆転。SaaSはフロー・UIの提供からメッセージによる提供へ。Agentの特徴は自律と自己進化であり、長期記憶が鍵:コンテキストの抽象化、ユーザーの好み・目標の記憶、能動的な予測。モデルが強くなるほど記憶が差別化資産となる。AIがユーザーを熟知すれば、記憶を個人所有とし、異なるAgent間で同期すべき。

王暁野(アマゾン ウェブ サービス プロダクト技術部技術総監)

個人と企業ではAgent運用が異なり、企業は安全性・信頼性・安定性の課題を克服する必要がある。AWSはAgentic AIを5層構造で捉える:推論演算、マルチモデル選択、企業データ・知識、Agent構築プラットフォーム、直接利用可能なAgentアプリケーション。企業ではCoding Agentが成熟し、Working Agentが次の爆発点。Amazon Quickにより従業員が安全・敏捷にAgent活用可能。Agentはデータ管理に新たな課題をもたらし、記憶の共有・分離・並存が必要。Token高価の原因は無駄な情報の投入にある。Harnessはモデル以外のソフトウェア基盤であり、Amazon Bedrock AgentCoreはその実装。

GenAI Talk:沈宇軍(アント・霊波科技 首席科學家)

大モデルは過去のデータ恩恵を受けたが、ロボットの物理世界データは不足。下半期の鍵はデータのデジタル世界から物理世界への移行。汎用ロボット脳には空間知覚能力が不可欠。VLAと世界モデルの技術路線はデータがあれば、いずれ収束する。1~2年で標本事例、2~3年で量産、その後C端への展開、家庭普及。誰でもロボット用データ生成可能になった時が具身知能のChatGPT moment。

邱錫鵬(復旦大学特聘教授・上海創智学院院長助理・模思智能創始人)

AIの次は多モーダルであり、汎文脈理解(情境)が重要。実時間対話型多モーダルモデルは長コンテキスト、複雑な視覚・音声情報、高リアルタイム推論を要求。MOSS-VLはcross attentionで動画ストリームを自然に処理。MOSS-Audioは音声内容・シーン・複雑推論・音楽を理解し、専用ASRと同等。MOSS-TTSは純Transformer音声トークナイザーで、ダウンロード数100万超。将来は視覚・音声理解・音声出力を統合したエンドツーエンドモデルへ。

胡維琦(MiniMax ToB中国区商業化責任者)

AGIは「Intelligence with Everyone」、つまり誰でも使えるAI。そのために大モデルとアプリ、ToCとToBを並行。AI企業は内部でクローズドループを形成し、社員にToken補助を与えてAgentの自動化ワークフローを試させる。企業は最もやりたがらない業務からAI導入を開始すべし。AIは組織をフラット化し、製品→demo→量産の流れに。今後2~3年、AIは各産業と深く融合し、生産力を変革する。