BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース Google DeepMind社がAGI(汎用型人工知能)の安全性とセキュリティに対するアプローチを発表

Google DeepMind社がAGI(汎用型人工知能)の安全性とセキュリティに対するアプローチを発表

原文リンク(2025-04-29)

Google DeepMind社は、新たな論文の中でAGI開発における安全性とセキュリティに対する自社アプローチを概説した。AGIとは、AIシステムの中でも大方の認知タスク処理において人間と同等の能力を持つものを指す名称である。 同社の見解では、AGIによる推論、計画、タスクの自律的な実行が可能となる日も近く、AGIとエージェント機能を統合した場合は、実現がいっそう早まるとしている。

同論文では、主要なリスクとなる4分野、誤った使用、ミスアライメント、事故、構造的リスクの管理に向けた体系的なアプローチを説明している。 同社は、AIシステムが意図的な悪意を持って使用されうる「誤った使用」と、AIシステムが人間側の意図しない目標を追求する可能性のある「ミスアライメント」の2点を重点的に減らしていくことに焦点を当てている。

Google DeepMind社では、危険な機能へのアクセス制限、モデルの重みの保護を目的としたセキュリティ対策強化の実装、サイバーセキュリティ評価精度の設定など、誤った使用を防ぐためにさまざまな戦略を取り入れている。また、同社は脅威モデリング調査を進めることで、セキュリティ強化に重要な各機能の閾値特定を試みている。

ミスアライメント対策として、Google DeepMind社ではAIシステムが人間の指示に正確に従い、AIの判断による予期せぬ手順簡略化を防止する方法を模索している。具体的な方法としては、AIシステム自身でのアウトプットの品質評価を支援する「増幅された監視」や、AIシステムの幅広い実世界シナリオ対応に向けた堅牢なトレーニングが含まれている。また、監視メカニズムの開発が進められており、AIシステムによる安全でないアクションの検出、フラグ付けの方法が模索中である。

AIの意思決定プロセスのさらなる理解を可能にすべく、解釈可能性と透明性の研究も進められている。 同社では、Myopic Optimization with Nonmyopic Approval(MONA)をはじめとしたAIシステムで長期計画が可能になった場合でもAI意思決定に関する透明性を維持する手法が検討されている。

Google DeepMind社では、リスク分析と安全なプラクティスの奨励に特化した専門機関として、共同設立者のShane Legg氏の率いるAGI Safety Council (ASC)が設置されている。ASCは、ApolloやRedwood Researchなどの非営利団体を含む社内外の組織機関と連携し、幅広い視点から安全性確保に取り組んでいる。

くわえて、Google DeepMind社は、各国政府機関、市民団体、業界団体と連携し、AIの安全性評価基準への協力を促している。同社ではこうした取り組みにおいて、Frontier Model Forumなどの団体を通じた国際方針協議への貢献や、共同セーフティイニシアティブへの参加を実施している。

同社のAIセーフティ&アライメント担当シニアディレクター Anca Dragan氏が、Xに以下の投稿をしている。

一連の取り組みの主な目的は、弊社で課題を分解して体系化し、チームとしての共通認識を形成することでした。もちろん、AGIの安全性に対するアプローチを書き出すことは不可能に近いほか、まだ変更したい点もあります。また、弊社でのこうした取り組みに対する理解の促進やアップデートが日々続いています。

一方、Aligned Outcomes社のCTO Tom Bielecki氏は、次のようにコメントしている。

AIセーフティにはメッセージ性における問題があります。スピード感が要求されるIT業界の激しい競争において、AIは目覚ましい推進力となっていますが、AIは 「制御、保留、中断」といった指示を必要悪、規制要件事項、リスクマネジメントとして認識しています。AIに期待される役割は、労働安全衛生局(OSHA)ではなく、F1のようなスピード感の求められる開発です。残念なことに、「Deep Mind」まで頭文字3つに置き換えられてしまいました。ブランディング専門家の協力を仰ぎ、AIセーフティの問題をエンジニアリングにおける広大なフロンティア開拓を可能にする取り組みであると業界全体で捉え直していく必要があるのです。

Google DeepMind社は、同社で継続中の研究、開発協力、慎重な準備がAGIの責任ある開発の担保に不可欠であるとの見解を示している。

作者について

この記事に星をつける

おすすめ度
スタイル

BT
OSZAR »