Yolo 深圳
深セン
今すぐ参加
用語集

データプライバシー

AI/MLにおける主要なデータプライバシー技術(匿名化から連合学習まで)を発見し、信頼性、コンプライアンス、および倫理的なAIの実践を確保しましょう。

データ・プライバシーとは、個人情報の収集、処理、保存、社内での共有方法に関するガバナンス、慣行、倫理基準を指す。 個人情報の収集、処理、保存、共有方法に関するガバナンスの実践と倫理基準を指す。 人工知能(AI)と 機械学習(ML)システム。最新の アルゴリズム、特に 特にディープラーニング(DL)モデルは、高性能を達成するために膨大な量の学習データ 高性能を達成するためには膨大な学習データが必要となるため 個人の機密性と権利を確保することが重要な課題となっています。効果的なデータプライバシー対策は のような法的枠組みの遵守を保証します。 欧州一般データ保護規則(GDPR)や カリフォルニア州消費者プライバシー法(CCPA)のような法的枠組みの遵守を保証します。

データプライバシーのコア原則

機械学習オペレーション(MLOps)の文脈では 機械学習オペレーション(MLOps)の文脈では、データプライバシーは単なる秘密ではなく、コントロールと同意に関するものである。主な原則は以下の通り:

  • データの最小化:システムは、定義されたタスクに必要な特定のデータのみを収集すべきである、 機密情報をため込まない。
  • 目的の制限:ある目的のために収集されたデータ、例えば コンピュータビジョンによる製造の改善など、ある目的のために収集されたデータは、明示的な同意なしに無関係なタスクに使用されるべきではありません。
  • 透明性:組織は、どのようなデータが使用されているかを明確にしなければならない。これは AI倫理の基本であり、アルゴリズムによる偏見を防ぐ アルゴリズムの偏りを防ぐのに役立つ。
  • 匿名化:個人を特定する情報を削除するか、または隠蔽する。例えば 偽名化 を偽IDに置き換えることで、個人の身元を保護しながらデータ分析を可能にする。

データプライバシー vs. データセキュリティ

これらの用語はしばしば同じ意味で使われるが、AIのライフサイクルにおける異なる概念を表している。

  • データプライバシーは個人の権利とデータ利用の合法性に関わる。 また、同意や倫理的な取り扱いに関する問題も扱う。
  • データ・セキュリティデータ・セキュリティとは 不正アクセス、盗難、敵対的攻撃からデータを保護するための技術的メカニズムである。 敵対的な攻撃からデータを保護するための技術的な仕組みのことである。

セキュリティはプライバシーを強制するツールである。例えば、暗号化はプライバシーの要求を満たすためのセキュリティ手段である。 要件である。例えば 国立標準技術研究所(NIST)のような機関は、両者を効果的に統合するためのフレームワークを提供している。 両者を効果的に統合するためのフレームワークを提供している。

AIの実世界での応用

機密性の高い個人情報が自動的に処理される分野では、データプライバシーが最も重要である。

プライバシーを守るテクニック

開発者は、MLワークフローのセキュリティを確保するために、様々なプライバシー拡張技術(PET)を利用している:

  • 差分プライバシーこの方法は この方法は、データセットに統計的ノイズを加えることで、アルゴリズムの出力から、特定の個人情報が入力に含まれているかどうかが明らかにならないようにする。 特定の個人の情報が入力に含まれているかどうかが、アルゴリズムの出力で明らかにならないようにする。以下のような組織 OpenMinedのような団体は、このようなオープンソースのプライバシー・ツールを提唱している。
  • フェデレーテッド・ラーニングデータを一元化する代わりに データを集中管理する代わりに、モデルをデバイスに送信する(エッジ・コンピューティング)。モデルはローカルで学習し ユーザーのデバイスに生データを残す。これは 自律走行車やモバイル・デバイスにますます関連している。
  • 合成データ人工データの生成 実世界の統計的特性を模倣した人工データを生成することで、エンジニアは実際のユーザーデータを公開することなくモデルを訓練できる。 モデルを訓練することができます。

例Python画像の匿名化

最も一般的なプライバシータスクの1つは、視覚データ内の顔や敏感な領域をぼかすことです。次の例 を使用する方法を示します。 YOLO11を使用する方法を示します。 を検出し、その身元を保護するためにぼかしを適用する方法を示します。

import cv2
from ultralytics import YOLO

# Load the YOLO11 model
model = YOLO("yolo11n.pt")

# Read an image
img = cv2.imread("bus.jpg")

# Run object detection
results = model(img)

# Iterate through detections and blur identified objects
for box in results[0].boxes.xyxy:
    x1, y1, x2, y2 = map(int, box)
    # Extract the region of interest (ROI)
    roi = img[y1:y2, x1:x2]
    # Apply a Gaussian blur to the ROI to anonymize it
    img[y1:y2, x1:x2] = cv2.GaussianBlur(roi, (51, 51), 0)

# Save the anonymized image
cv2.imwrite("bus_anonymized.jpg", img)

Ultralytics コミュニティに参加する

AIの未来を共に切り開きましょう。グローバルなイノベーターと繋がり、協力し、成長を。

今すぐ参加