Felkészülés az AI Act-ra – 2. rész

Felkészülés az AI Act-ra – 2. rész

Előző blogcikkemben írtam, hogy az EU Mesterséges Intelligencia rendelete, egy újabb adatvédelmi szabályozás, amely minden adatkezelő számára kötelezően alkalmazandó. A hivatalos dátum: 2026. augusztus 1. Ennek felkészítését segíti az alábbi cikksorozat.

Az előző rész tartalmából: „A CNIL, a francia adatvédelmi hatóság több kérdéssort állított össze az adatkezelők számára, hogy minél gyorsabban és egyszerűbben tudják a mesterséges intelligencia megfelelést tanúsítani. „

A felkészítő. kérdéssor második része. Ezek a kérdéssorok már mélyebbre ásnak a technikai megvalósításban, különösen az adatok minősége és az algoritmikus elfogultság (bias) terén.


A nyers adatoktól a minőségi tanulási adatbázisig

Az algoritmus kimenetének minősége közvetlenül függ a tanítási adatok minőségétől. Bizonyos kritériumokat kötelező ellenőrizni, hogy csökkentsük a hibák kockázatát – különösen akkor, ha az AI döntéseinek közvetlen hatása van az emberek életére.

Adatminőség és annotálás

  • Ellenőrizték az adatok pontosságát?
  • Ha használtak annotálási (címkézési) módszert, annak folyamatát felügyelik?
  • Amennyiben az annotálást emberek végzik: kaptak ehhez megfelelő képzést?
  • Folyamatosan ellenőrzik az általuk végzett munka minőségét?

Reprezentativitás és módszertan

  • A használt adatok valóban reprezentálják a valós környezetben előforduló eseteket?
  • Milyen módszertannal biztosították ezt a reprezentativitást? Készült erről formális dokumentáció vagy tanulmány?
  • Federált tanulás (federated learning) esetén: Ellenőrizték, hogy a különböző központokban használt adatok függetlenek és azonos eloszlásúak (IID)? Ha nem, milyen lépéseket tettek az ebből fakadó torzítások kiküszöbölésére?

Folyamatos tanulás és monitoring

  • Folyamatosan tanuló (continuous learning) AI rendszereknél milyen mechanizmus biztosítja a beérkező adatok állandó minőségét?
  • Vannak-e rendszeres ellenőrzések az adatminőség romlásának vagy az adateloszlás megváltozásának (data drift) kiszűrésére?

A harmadik, egyben záró rész is érkezik hamarosan…