Már nagyon sokat tudunk a felkészülésről és beállításokról, hogy teljes mértékben fel tudjunk készülni az új kötelezettségeinkről, melyet az EU AI Azt támaszt elénk. A záró részben a CNIL, a francia adatvédelmi hatóság által összeállított kérdéssor harmadik kérdéssorát nézzük át.
Az elfogultság (bias) kockázatainak azonosítása és javítása
A torzított adatokon tanított algoritmusok diszkriminációhoz vezethetnek. Mivel a javítási módszerek még gyakran kísérleti fázisban vannak, a tanulási adatbázist alapos vizsgálatnak kell alávetni.
A gyűjtés körülményei
- Megfelelően ismertek a tanítási adatok gyűjtésének körülményei és módszerei?
- Fennáll-e a torzítás lehetősége a gyűjtési módszer vagy a specifikus körülmények miatt?
Különleges jellemzők és korrelációk
- Tartalmaznak-e a tanítási adatok egyénekre jellemző specifikus tulajdonságokat (pl. nem, életkor, fizikai jellemzők, szenzitív adatok)? Ha igen, melyeket?
- Megvitatták, dokumentálták és a valós helyzethez mérték a tanítási adatok alapján felállított hipotéziseket?
- Vizsgálták-e a korrelációt (összefüggést) ezen speciális jellemzők és a többi adat között, hogy azonosítsák az esetleges helyettesítő változókat (proxy-kat)?
Torzítások kezelése
- Készült-e célzott vizsgálat az elfogultságok (bias study) kimutatására? Milyen módszerrel?
- Ha azonosítottak torzítást, milyen konkrét lépéseket tettek annak csökkentésére vagy kiküszöbölésére?
Jó munkát kívánok!
