訓練資料和模型輸出的準確性原則
英國資訊專員辦公室(Information Commissioner's Office, ICO)自 2024 年 1 月開始展開一系列關於生成式人工智慧與資料保護間的新技術與新問題的公眾諮詢,第三個問題則是《訓練數據和模型輸出的準確性》(accuracy of training data and model outputs)。
根據資料保護法,組織必須確保處理的個人資料是準確且及時更新的。這意味著開發者必須採取措施確保訓練資料的準確性,並在必要時進行更新。因此,開發者和部署者必須考慮訓練資料對輸出的影響,以及輸出如何被使用。而所謂的準確性則取決於其用途,在某些情況下,處理過時的資訊(例如歷史記錄)或事實不準確的資訊(例如意見)是合適的。因此,在考慮準確性原則時,開發人員應:
- 了解訓練資料是否由準確、真實和最新的資訊、歷史資訊、推論、意見,甚至是與個人相關的人工智慧生成的資訊組成;
- 瞭解並記錄訓練資料的準確性對生成式 AI 模型輸出的影響;
- 考慮生成式人工智慧模型輸出的統計準確性是否足以滿足模型的使用目的,以及這對資料保護準確性有何影響;和
- 清晰、透明、簡潔地將步驟 1-3 傳達給部署人員和最終使用者,以確保培訓階段缺乏準確性不會對部署階段的個人產生負面影響。
留言