• Ep.910 Xcode 26.3、エージェントが動く開発現場へ──ClaudeとCodexが入るXcode(2026年2月5日配信)
    Feb 4 2026

    Xcodeが大きく変わります。最新のバージョン26.3では、エージェントがXcodeの内部で自律的に動ける「エージェンティック・コーディング」に正式対応しました。具体的には、AnthropicのClaude AgentとOpenAIのCodexといったエージェントがXcodeに直接つながり、ドキュメント検索やプロジェクト設定の更新、ファイル構造の探索、Xcode Previewsのキャプチャと検証、ビルドと修正の反復までを一気通貫でこなします。これにより、設計から実装、確認までのサイクルがXcodeの中で完結し、開発者は方針決定やレビューといった“人がやるべき仕事”に集中できるようになります。


    今回のポイントは、組み込み連携にとどまらず、Xcodeの能力を外部エージェントにも開く姿勢です。Appleはオープン標準のModel Context Protocol(MCP)を通じて、互換エージェントやツールなら幅広くXcodeと接続できると説明しています。MCPはAnthropicが2024年に公開したプロトコルで、2025年にはLinux Foundation傘下のAgentic AI Foundationへ寄贈され、ベンダーをまたいだエコシステムづくりが進んでいます。XcodeがMCP対応を打ち出したことで、特定ベンダー依存ではなく“標準でつなぐ”流れが一段と現実味を帯びました。


    提供形態はリリース候補(RC)。本日からApple Developer Programのメンバーは入手でき、のちほどApp Storeでの配信が予定されています。国内向けの記事でも同内容が告知されており、言語環境を問わず同等の体験が想定されます。現場目線では、これまで“補助的な提案役”だったAIが、Xcodeという作業場で実際に手を動かす存在へと進化する転換点と言えるでしょう。


    周辺の動きも活発です。外部メディアは、XcodeがClaudeとCodexの“自律的な作業”を許可したことで、ビルド、テスト、プレビュー検証までを自走させられる点を強調しています。さらに、MCP経由で他のエージェントやツールにも道が開かれたことは、IDEを中核に据えたエージェント時代の到来を象徴するニュースだと受け止められています。


    総じて、Xcode 26.3は“コードを書くアプリ”から“開発を進める同僚”へと役割を広げました。エージェントが設計意図を踏まえながら段取りを切り、失敗を検知してやり直し、成果物を目で確かめる──そんな一連の流れがIDEの内側で動き始めます。iOSやmacOSのアプリ開発において、速度と品質をどう両立するか。その答えの一部が、標準機能としてXcodeに降りてきた、という位置づけです。

    Mostra di più Mostra meno
    4 min
  • Ep.909 小さくて強い“次のコーダー”──Qwen3-Coder-Nextが狙うローカル開発とエージェント実装(2026年2月5日配信)
    Feb 4 2026

    新たに公開されたQwen3-Coder-Nextは、「コーディングエージェントとローカル開発」に的を絞ったオープンウエイトのコード特化LLMです。ベースはQwen3-Next-80B-A3B-Baseで、MoEとハイブリッドアテンションを組み合わせた新設計を採用。学習面では、実行可能な環境での大規模タスク合成、環境との対話、さらに強化学習まで含めた“エージェント的訓練”をスケールさせ、推論コストを抑えつつエージェント動作とコーディング力を底上げしたと説明されています。総80Bに対して「3Bアクティブ」で動作する効率設計が目玉です。


    モデルカードでも、同モデルが“コーディングエージェントとローカル開発”向けに設計され、3Bアクティブ(総80B)で10〜20倍大きいアクティブ規模のモデルに匹敵する性能を狙うこと、長大な256kトークンのコンテキストを備えることが明記されています。さらに、IDE/CLI連携の現場利用を想定し、Claude CodeやQwen Code、Clineなど複数のコーディングエージェント/拡張と連携できる点も打ち出されています。


    Qwenチームのリポジトリでは、Qwen3-Coder-Nextがエージェント的コーディング、ブラウザ利用、基礎的なコーディング課題における効率‐性能のトレードオフで強みを示し、長期的な手順推論や失敗からのリカバリーを含む複雑なツール使用に対応する、と位置づけています。リポジトリには256K(拡張で最大1M)コンテキストや、サービング/推論の実装例も整理されており、実装者視点の導入しやすさも配慮された構成です。


    総じて、Qwen3-Coder-Nextは“とにかく巨大”ではなく“必要時のみ賢く計算を使う”構成で、ローカル実行や社内オンプレ運用、そしてIDEに常駐するエージェント用途に刺さる提案です。評価詳細やハードウェア要件は、モデルカードとGitHub、そしてQwen公式ブログへの参照が案内されており、今後の追加ベンチや実運用での追試も進みそうです。

    Mostra di più Mostra meno
    4 min
  • Ep.908 超軽量0.9Bの衝撃──Z.aiが放つドキュメント理解の特化型AI「GLM-OCR」(2026年2月5日配信)
    Feb 4 2026

    2026年2月3日、AI開発組織のZ.aiは、ドキュメント解析に特化した革新的な小型モデル「GLM-OCR」を公開しました。このモデルは、わずか9億パラメータ(0.9B)という極めて軽量な設計でありながら、ドキュメント理解のベンチマークである「OmniDocBench V1.5」において94.62というスコアを叩き出し、世界1位を獲得したことで業界に大きな衝撃を与えています。


    従来の高性能なドキュメント解析AIは、数十億から数千億のパラメータを持つ巨大なモデルが主流であり、運用には高価なGPUサーバーが不可欠でした。しかし、このGLM-OCRは、独自の「マルチトークン予測(MTP)」損失関数と、安定した強化学習プロセスを導入することで、小型ながらも複雑な表、高度な数式、さらには印影や手書き文字が混在するビジネス文書を正確にデジタル化する能力を備えています。


    技術的な背景としては、大規模な画像・テキストデータで事前学習された視覚エンコーダー「CogViT」と、0.5Bサイズの軽量な言語デコーダーを組み合わせたアーキテクチャを採用しています。さらに、ドキュメントのレイアウト解析には定評のある「PP-DocLayout-V3」を統合した2段階のパイプラインを構築しており、単なる文字の読み取りにとどまらず、文書の構造そのものを正確に把握することが可能です。


    競合となるDeepSeek-OCRやQwen2.5-VLといったモデルと比較しても、GLM-OCRは推論効率の高さが際立っています。PDFの解析速度では1秒間に1.86ページという高いスループットを実現しており、これは大量の書類を抱える企業のバックオフィス業務や、モバイル端末などのエッジデバイスでの活用において、決定的な優位性を持つことになります。


    今回のリリースにより、これまで多額のコストがかかっていた商用のOCRサービスに頼ることなく、オープンソースの技術だけで、最高水準の文書自動化システムを構築できる道が開かれました。AIによるドキュメント処理の民主化が、また一歩大きく前進したと言えるでしょう。

    Mostra di più Mostra meno
    3 min
  • Ep.907 ソブリンAIの台頭──国家が「自前の脳」を持つ時代(2026年2月5日配信)
    Feb 4 2026

    今回は、アンドリュー・エン博士が率いるDeepLearning.AIのニュースレター「The Batch」で取り上げられた、世界的なメガトレンド「ソブリンAI(AI主権)」について解説します。


    これまでAI開発といえば、GoogleやOpenAI、Metaといった米国の民間企業が主役でした。しかし、ここへ来てプレイヤーが劇的に変化しています。フランス、インド、シンガポール、そして日本など、世界各国の「政府」が巨額の予算を投じて、国営、あるいは国策としてのAIインフラ構築に乗り出しているのです。


    記事や周辺情報を分析すると、この動きの背景には大きく二つの動機があります。 一つ目は「経済安全保障」です。AIがあらゆる産業の基盤となる中、その計算能力(Compute)や頭脳を特定の米国企業に依存することは、国家としてリスクが高すぎると判断され始めました。 二つ目は「文化の保護」です。シリコンバレーで作られたAIは、どうしても西洋的な価値観や英語の論理に偏ります。自国の言語の機微や、固有の歴史・文化を正しく理解するAIを持つことは、その国のアイデンティティを守ることと同義になりつつあるのです。


    実際、この流れを受けてNVIDIAは各国の政府と直接契約を結び、現地にスーパーコンピュータを建設しています。日本でも、経済産業省が2026年度予算案で半導体・AI分野へ約1.23兆円という記録的な配分を行いました。これは前年度の4倍近い規模であり、Rapidusなどのハードウェア製造だけでなく、国内独自の基盤モデル開発やデータインフラ整備に巨額の資金が充てられています。


    もはやAIは単なる便利ツールではなく、道路や水道、あるいは防衛力と同じ「国家インフラ」へと格上げされました。2026年は、企業間の競争だけでなく、国家間の「知能の自給自足」競争が本格化する一年となりそうです。

    Mostra di più Mostra meno
    3 min
  • Ep.906 スペースX、xAIを39兆円で買収──「宇宙データセンター」で地球の限界を突破へ(2026年2月5日配信)
    Feb 4 2026

    2026年2月3日、人類の産業史に残るであろう巨大なM&Aが発表されました。宇宙開発の王者スペースXが、AI企業のxAIを約39兆円(2500億ドル)で買収し、完全子会社化しました。これにより、マスク氏が率いる「宇宙」と「知能」、そして「SNS(X)」の3つの事業が一つに統合されたことになります。


    この買収の最大の狙いは、ずばり「宇宙データセンター」の構築です。 ここ数年、AIの進化に伴い、地上ではデータセンターの電力不足と排熱問題が深刻化していました。土地があっても電気がない、電気があっても熱を逃がせない──そんな「地球の限界」に対し、マスク氏は「ならば宇宙でやればいい」という回答を出したのです。


    Web検索で技術的な背景を調査すると、宇宙空間には二つの大きなメリットがあります。一つは「エネルギー」です。大気に邪魔されない強力な太陽光発電が24時間利用可能です。もう一つは「冷却」です。宇宙の極低温環境を利用すれば、膨大な熱を発するAIチップを効率よく冷やすことができ、空調コストを劇的に下げられます。


    これまで、サーバーを宇宙に運ぶコストが壁となっていましたが、スペースXの巨大ロケット「Starship」の実用化で輸送コストが激減したことが、この構想を現実のものにしました。 マスク氏は声明で「2〜3年以内に、宇宙こそが最も安価な計算リソースになる」と断言しています。


    市場の反応も熱狂的です。合併後の新会社の企業価値は約1兆2500億ドル(約187兆円)に達すると試算されており、これは2026年内に予定されているIPOにおいて、上場初日からAmazonやGoogleに匹敵する巨大テック企業が誕生することを意味します。


    テスラのロボットが火星を開拓し、スペースXのロケットが物資を運び、xAIの頭脳が宇宙から全体を制御する。SF映画のような「マスク経済圏」の完成形が、いよいよ現実味を帯びてきました。

    Mostra di più Mostra meno
    4 min
  • Ep.905 MoltWorker──買ったばかりのMac miniが不要に? エージェントは「サーバーレス」へ脱皮する(2026年2月5日配信)
    Feb 4 2026

    2026年1月29日、Cloudflareが個人のAI活用におけるハードルを一気に下げる発表を行いました。サーバーレスAIエージェント「MoltWorker」の公開です。


    つい最近、昨年末あたりからエンジニア界隈で「Clawdbot(現Moltbot)」という自律型エージェントを自宅で飼うことがブームになりましたよね。「自分だけの最強の秘書が欲しい」と、そのためだけにMac miniなどの専用PCを慌てて購入した方も多かったのではないでしょうか。


    しかし、今回の「MoltWorker」の登場は、その流行を一瞬にして過去のものにするかもしれません。名前の通り「Molt(脱皮)」を意味するこのツールは、AIエージェントから「ハードウェア」という重い殻を取り払ってしまいました。


    仕組みは非常に画期的です。ユーザーは月額5ドル程度の「Cloudflare Workers」プランを利用するだけで、Dockerコンテナも自宅サーバーも使わずにエージェントを動かせます。MoltWorkerはクラウド上で「AI Gateway」を通じて最新のLLMに指示を出し、「Browser Rendering API」を使ってWebサイトを巡回し、その結果をSlackなどに報告してくれます。


    公式ブログでは、これが商用製品ではなく「概念実証(PoC)」であると控えめに述べられていますが、Web上の反応は熱狂的です。「先月Mac miniを買ったばかりなのに!」という嬉しい悲鳴とともに、「これで年間130ドル以下で、メンテナンスフリーの秘書が手に入る」と歓迎されています。


    ほんの数ヶ月前まで「ハードウェアを買って育てる」のがトレンドだったAIエージェントは、あっという間に「ネットワーク上に住まわせる」時代へと移行しそうです。技術の進化スピードには、本当に驚かされますね。

    Mostra di più Mostra meno
    3 min
  • Ep.904 OpenAI、GPT-5駆動の「社内エージェント」を公開──600ペタバイトを操る“最強の右腕”(2026年2月5日配信)
    Feb 4 2026

    2026年1月29日、OpenAIは公式ブログにおいて、同社が秘密裏に運用してきた「社内データ分析エージェント」の詳細を公開しました。これは外部向けの製品発表ではありませんが、企業がいかにしてAIを使って自らの組織能力(Organizational Intelligence)を拡張できるかを示す、極めて重要なケーススタディです。


    記事によると、OpenAI社内には600ペタバイトを超えるデータと7万以上のデータセットが存在しています。これまでは、必要なデータがどこにあるかを探すだけで数日かかっていました。しかし、このカスタムメイドのエージェントの導入により、エンジニアから人事、ファイナンスチームに至るまで、全社員が数分で「問い」から「洞察(インサイト)」にたどり着けるようになったといいます。


    技術的なハイライトは、このエージェントの中核に、同社の最新フラッグシップモデルである「GPT-5」が採用されている点です。ブログでは「CodexとGPT-5を組み合わせている」とさらりと触れられていますが、社内の実務データという最も複雑で泥臭い領域で、GPT-5がすでに実用段階にあることを証明しています。


    このエージェントは単にSQLを書くだけではありません。「継続学習メモリ」を持っており、例えば「先週のユーザー維持率は?」と聞いた時に、一度修正を指示すれば、次からは「維持率」という言葉がそのチームでどう定義されているかを理解して計算します。


    OpenAIはこれを「社内専用ツール(internal-only)」としていますが、これが将来的に企業向けエージェントサービス「Operator」のひな型になることは想像に難くありません。データを探す時間をゼロにし、全員をデータサイエンティストにする──そんな未来の働き方を、彼らは自分たち自身で実験しているのです。

    Mostra di più Mostra meno
    4 min
  • Ep.903 Anthropicの警告──AIはプログラマーを「無能」にするのか?(2026年2月5日配信)
    Feb 4 2026

    本日は、すべてのエンジニア、そしてAIと共に働くすべてのビジネスパーソンにとって、少し耳の痛い、しかし極めて重要な話題をお届けします。


    Anthropicが発表した最新の研究レポート、「AIによる支援とコーディングスキルの形成」について解説します。結論から申し上げますと、このレポートは「AIを使えば使うほど、特定の条件下では人間は『下手』になる可能性がある」という、開発元自らによる非常に誠実かつ衝撃的な警告を含んでいます。


    研究チームは、開発者を「AIを自由に使用するグループ」と「使用しないグループ」に分け、一定期間後のスキル定着率を測定する実験を行いました。その結果、AIを使用したグループは、確かにタスクの完了速度で圧倒的なパフォーマンスを見せました。しかし、その後にAIの使用を禁じたテストを行うと、特に経験の浅いジュニア層において、手動で学習したグループよりも問題解決能力が低下している傾向が見られたのです。


    この現象の背景にあるのが「Active Recall(能動的想起)」の欠如です。私たちは苦労してコードを書く過程で脳に強い負荷をかけ、それが記憶の定着を促します。しかし、AIが生成したコードを「なんとなく読んで、貼り付ける」だけの作業(コピー&ペースト・プログラミング)では、脳が汗をかかず、結果としてスキルが身につかないまま通り過ぎてしまうのです。これは、カーナビに頼りすぎて道を覚えられなくなる現象によく似ています。


    一方で、希望もあります。AIに対して「なぜそのコードになるのか?」と質問を投げかけ、対話しながら進めた「対話型利用グループ」では、むしろ手動学習よりも高い理解度と定着率を示しました。つまり、AIが人をダメにするのではなく、「AIを単なる回答マシンとして使うか、家庭教師として使うか」というユーザー側の姿勢(メタ認知)が、成長の明暗を分けていることがデータで実証されたのです。


    Anthropicはこの結果を受け、今後のClaude Codeなどのツール開発において、単に答えを出すだけでなく、ユーザーの学習を促すような「教育的介入」の機能を検討する必要があるとしています。

    Mostra di più Mostra meno
    3 min