1月28日付のブルームバーグの記事によると、マイクロソフト(MSFT)とオープンAIは、中国の人工知能スタートアップ企業ディープシークに関連するグループが、オープンAIの技術から出力されたデータを不正に入手した可能性があるとして調査を進めているそうです。
データ流出の疑いとAPIの悪用
ブルームバーグの報道によると、マイクロソフトのセキュリティ研究者は2024年の秋に、ディープシークに関係しているとみられる人物が、オープンAIのアプリケーション・プログラミング・インターフェース(API)を利用し、大量のデータを取得している様子を確認しました。APIを使用することで、ソフトウェア開発者はライセンスを支払い、オープンAIの人工知能モデルを自社のアプリケーションに統合することが可能です。
マイクロソフトは、オープンAIの技術パートナーであり、最大の出資者でもあります。この問題が発覚した際、マイクロソフトは速やかにオープンAIに通知しました。このような行為はオープンAIの利用規約に違反する可能性があり、データ取得の制限を回避するために不正行為が行われた可能性があると関係者は指摘しています。
ディープシークの新技術「R1」と市場への影響
ディープシークは2025年の初めに、人間の推論方法を模倣できる「R1」と呼ばれる新しいオープンソースの人工知能モデルを発表しました。この発表により、オープンAIやグーグル(GOOGL)、メタ・プラットフォームズ(META)といったアメリカの企業が支配する市場に変革が起きる可能性が高まっています。
ディープシークは、自社のR1モデルが数学的タスクや一般的な知識に関する業界ベンチマークにおいて、アメリカの主要な開発企業の製品と同等、もしくはそれ以上の性能を発揮すると主張しています。この発表を受けて、マイクロソフト、エヌビディア(NVDA)、オラクル(ORCL)、グーグルの親会社であるアルファベット(GOOGL)などのAI関連テクノロジー銘柄は急落し、市場価値は合計で1兆ドル近く失われました。
ディープシークの技術的な進化は、いわゆる「マグニフィセント・セブン」による市場支配の終焉を意味する可能性があります。この状況に対し、オープンAIはブルームバーグによるコメントの要請に応じず、マイクロソフトもコメントを拒否しました。一方で、ディープシークおよびその設立母体であるヘッジファンド「ハイフライヤー」は、電子メールによるコメント要請に直ちに応じませんでした。
ディープシークによる「蒸留」技術の使用疑惑
ドナルド・トランプ大統領のAIアドバイザーであるデイビッド・サックス氏は、ブルームバーグの記事の中で、ディープシークがオープンAIのモデルの出力を利用し、自社技術を開発していたことを示す「実質的な証拠」があると語りました。Foxニュースとのインタビューにおいて、サックス氏は、あるAIモデルが類似した能力を開発するために、別のAIモデルの出力を訓練目的で使用する「蒸留(Distillation)」と呼ばれる技術について説明しました。
「蒸留(Distillation)」とは、大規模な人工知能(AI)モデルの知識をより小規模なモデルに転送する技術です。この技術では、強力なAIモデルの出力を利用し、同様の性能を持つが軽量なモデルをトレーニングします。これにより、計算コストを抑えつつ、高性能なAIを構築することが可能になります。
オープンAIの声明によると、「中国のグループが、蒸留を含む手法を用いて、アメリカの高度なAIモデルを模倣しようと積極的に取り組んでいる」とのことです。また、「ディープシークが当社のモデルを不適切に蒸留した可能性があることを認識しており、その兆候を確認している」と述べています。
ディープシークの反論とオープンソース技術の活用
ディープシーク側は、自社のR1システムが、他のオープンソースシステムに基づくモデルを「抽出」したものであると主張しています。オープンAIのようなクローズドなシステムとは異なり、メタのLlamaなど、いくつかのモデルはオープンソースとして自由に利用できるため、それを基に開発したという立場を取っています。
まとめ
ブルームバーグの報道によると、ディープシークの技術開発とオープンAIとの対立は、AI市場における新たな競争の幕開けを示しています。アメリカの主要テクノロジー企業にとって、中国のAI企業の台頭は大きな脅威となり得るため、今後もこの問題の行方に注目が集まりそうです。また、市場の動揺が続く中、AI関連銘柄の株価の変動にも引き続き注意が必要です。