Thinking Machines、ネイティブマルチモーダル「インタラクションモデル」を発表
元OpenAI CTOのMiraが設立したThinking Machinesが革新的な「インタラクションモデル」を発表。音声・映像・テキストをネイティブかつ継続的に受信し、リアルタイムで思考・応答する。フロントエンドが200ms単位でユーザー入力を処理し、バックエンドが長期計画やツール呼び出しを担う二層構造で、リアルタイム対話と重タスク処理を両立する。
本日のAI業界注目ニュースを 32件 厳選してお届けします。
元OpenAI CTOのMiraが設立したThinking Machinesが革新的な「インタラクションモデル」を発表。音声・映像・テキストをネイティブかつ継続的に受信し、リアルタイムで思考・応答する。フロントエンドが200ms単位でユーザー入力を処理し、バックエンドが長期計画やツール呼び出しを担う二層構造で、リアルタイム対話と重タスク処理を両立する。
AntLingAGIが旗艦の「思考モデル」Ring-2.6-1Tをリリース。5月15日までOpenRouterで無料利用可能。調整可能な思考強度、エージェント最適化、深い推論能力を備え、数学・科学研究などの複雑タスクに対応する。
OpenAIが最先端のサイバー防御AI「Daybreak」をリリース。最強のOpenAIモデル、Codex、セキュリティパートナーを統合し、サイバー防御の高速化とソフトウェアの安全性維持を目指す。
Replitが並列エージェント機能を導入。最大10のエージェントを同時実行でき、各エージェントが独立環境を持つ。開発速度の大幅な向上が期待される。
AnthropicがClaude Codeの新バージョンをリリース。Agent View(セッション一元管理)、`/goal`コマンド(目標設定して継続作業)、`/scroll-speed`コマンドなど複数の新機能を追加。20以上のバグ修正も含む。
OpenAI DevelopersプラグインでCodexが利用可能に。OpenAI APIを使ったAIアプリとエージェントの構築がより迅速に行える。
コーディングアシスタントCursorがMicrosoft Teams連携を開始。Slack、Linearに続く新たな統合先として、Microsoft製品体系を利用する企業にとって実用的なアップデートとなる。
Luma AIが「Luma Agents」を発表。参考素材をアップロードして方向性を設定するだけで、ムードボードから完成広告まで自動的に生成する。
Google Geminiがパーソナルインテリジェンス機能でカスタム旅行プラン作成に対応。Gmail、Google Photos、検索履歴、YouTube履歴を連携し、完全に個人化された旅行計画を提案する。
AnthropicがAWS上でClaude Platformを正式ローンチ。AWS顧客が既存の認証・課金・コミットメント消費で完全なClaude機能を利用可能に。管理エージェント、コード実行、File APIなどのコア機能を含む。
RunwayがMLシステム設定のためのPythonライブラリ「confingy」をオープンソース化。YAMLファイルの煩雑さを解消し、純粋なPythonで設定を記述可能にする。
GoogleがAIオーバービュー機能のソース数を過去1年で4倍に拡大。AI情報出力の信頼性向上に向けた大幅な強化。
セキュリティ機構Socketが「Mini Shai-Hulud」攻撃を発見。GitHub Actionsの脆弱性を悪用し、TanStack、Mistral AI、UiPathなどの著名パッケージに悪意あるバージョンを注入。AWS、GCP、Kubernetes、GitHubトークンなどの機密情報を窃取する160以上のパッケージが影響を受けた。
Anthropicの市場推定時価総額がわずか5日で1.2兆ドルから1.4兆ドルに急上昇。年間売上は2023年の1億ドルから現在の450億ドルに爆発的成長し、過去12ヶ月で1400%増を記録。
Googleが、犯罪目的のハッカーがAIを活用して重大なソフトウェア脆弱性を発見した事例を報告。AIのサイバーセキュリティへの影響が攻守両面で顕在化している。
浙江省杭州市中級人民法院が、AI口コミ記事の自動生成ツールに対し初の不正競争判決を下した。生成AIサービス提供者の注意義務を明確化する画期的な判例となった。
AnthropicがGitHubで金融サービス業界向けAIテンプレートライブラリを公開。10の完全なエージェント、7つの業界プラグイン、11社の金融データプロバイダーMCPコネクタを含み、投資リサーチからリスク管理まで幅広く対応。
MiniMaxが各分野の専門家を招き、AIの飛躍的進歩を推進する「10xチーム」を結成。グローバル競争力のある報酬と上海、北京、サンフランシスコなど複数拠点での勤務を提供。
Epoch AIがFrontierMathのTier 1-4をAI支援で審査し、約3分の1の問題に致命的エラーを検出。全面的な人工レビュー完了後、修正データセットで更新スコアを公開予定。
Microsoft ResearchがSocialReasoning Benchを使用した調査で、AIエージェントはタスク実行は得意だが、ユーザーの社会的立場や利益の最適化には不十分であることを発見。
最新の研究が、推論スケーリングの限界と、数学的に正確な推論をAIに実装する際の根本的課題を探求。
OpenAIの報告によると、2026年Q1にChatGPTの利用者が大幅増加。特に35歳以上のユーザー層の成長が最も速く、性別比も均衡化。AI技術が主流社会に加速的に浸透していることを示す。
GPT Image 2とKling AIを使い、詳細なプロンプトでテレビ中継視点の超リアルなF1レース画像を生成するテクニック。放送品質のディテールを忠実に再現する手法が注目を集めている。
情報の構造化と提示方法自体がAIの重要な知能要素に。LLMにHTML形式で出力させることで、デフォルトのMarkdownより豊かなレイアウトと対話性を実現可能。将来はインタラクティブ動画へ進化すると予測。
Hugging FaceがAWS上での基盤モデル訓練と推論のコア構成要素について解説。クラウド上でのAIモデル運用の実践的ガイド。
Google DeepMindとCourseraが協力し、Geminiモデルで本番環境AIソリューションを構築するための開発者向け専門コースを開設。推論・アクション、接続・自動化の3モジュールで構成。
Simon Willisonが紹介する、LLMツールをスクリプトのshebang行に組み込んで直接実行する手法。SVG生成からツール呼び出し、YAMLテンプレートまで、LLMをスクリプトインタプリタとして活用する可能性を示す。
Cognition AI本社「Cog House」の内部が初公開。創設者Scott Wuは国際情報オリンピック金メダリストで、AI開発者Devinは18ヶ月で年間4.45億ドルの売上を達成。企業価値は約250億ドルに。
AI画像生成の品質を向上させる構造化プロンプトフレームワークを紹介。画幅定義、主体設定、視覚メタファー、スタイル選択、テキストシステムなどのモジュールに分解し、体系的にプロンプトを構築する手法。
発明特許、ソフトウェア著作権、意匠権の申請書類をAIで自動生成するスキルがGitHubで公開され、知的財産分野でのAI活用が注目を集めている。
MCPをAIモデルと外部ツールの接続だけでなく、Agent間の標準通信プロトコルとして活用する新しい発想。エージェント間の協調を標準化する可能性を提示。
OpenAI Agent SDKの主要要素を網羅的に解説。エージェント構築のための包括的なガイド。