Dit gelekte rapport toont de voorkeursranglijst van Apple voor AI -reacties

Samenvatting: Een gelekt Apple -document onthult hoe het bedrijf AI -antwoorden rangschikt op basis van zes belangrijke criteria, waaronder waarachtigheid, schadelijkheid, beknoptheid en algemene gebruikerstevredenheid. Hoewel Apple ervoor wil zorgen dat zijn AI veilig en nuttig blijft, blijft de huidige appel -intelligentie nog steeds achter bij concurrenten.

De meeste AI -systemen kunnen basisvragen beantwoorden die u naar hen gooit. De kwaliteit van hun antwoorden is gebaseerd op verschillende factoren, zoals de gegevens die worden gebruikt om ze te trainen. Sommige AI -systemen verdienen echter een “gevaarlijk” label op basis van de manier waarop ze reageren. Dus de vraag is, hoe beslissen bedrijven wat een goed of slecht antwoord is? Hoewel we niet voor anderen kunnen spreken, weten we wat Apple denkt op basis van de voorkeursranglijst.

Apple’s respons rangschikkingssysteem

Danny Goodwin bij Search Engine Land slaagde erin om een Apple-document van 170 pagina’s te verkrijgen met de naam “Preference Ranking V3.3 Leverancier.” Volgens Goodwin, “Het bepaalt het systeem dat door menselijke reviewers wordt gebruikt om de antwoorden op digitale assistent te scoren. Antwoorden worden beoordeeld op categorieën zoals waarachtigheid, schadelijkheid, beknoptheid en algemene gebruikerstevredenheid. Het proces gaat niet alleen over het controleren van feiten. Het is ontworpen om ervoor te zorgen dat AI-gegenereerde antwoorden nuttig, veilig, veilig zijn en zich natuurlijk voor gebruikers voelen.”

Goodwin deelt het daadwerkelijke document niet, maar hij heeft een zeer uitgebreide samenvatting gedaan van de verschillende criteria die Apple gebruikt als het gaat om het rangschikken van de voorkeur voor AI -reacties.

Volgens het document heeft Apple zes beoordelingscategorieën. Dit bestaat uit het opvolgen van instructies, taal, bondgenoot, waarachtigheid, schadelijkheid en tevredenheid. Menselijke recensenten baseren hun beoordelingen op deze categorieën. Onder ‘het volgen van instructies’ beoordelen ze bijvoorbeeld of de digitale assistent de taak heeft voltooid zoals gevraagd.

Onder “taal” moeten recensenten niet alleen overwegen of de digitale assistent het verzoek heeft begrepen op basis van de taal van de gebruiker, maar ook of het de culturele en regionale context erachter begrijpt. Dit omvat dingen als idiomen, meeteenheden en meer.

Het belang van deze ranglijst

Dus, waarom zijn deze ranglijsten belangrijk? Het is duidelijk dat het van cruciaal belang is dat bedrijven die AI willen ontwikkelen of implementeren om te overwegen hoe het zal worden gebruikt. We hebben gezien hoe sommige slecht ontworpen AI -systemen zelfs gebruikers in staat stellen malware te genereren, instructies te geven over het maken van wapens, enzovoort.

Apple wil dit soort controverse vermijden, dus het is logisch dat ze een voorkeursranglijst hebben. Dat gezegd hebbende, de AI -inspanningen van Apple zijn underwhelming geweest en Apple Intelligence blijft nog steeds ver achter bij de concurrentie. Hopelijk werkt Apple, naast het waarborgen van een soort kwaliteitscontrole in zijn AI -reacties, ook om ervoor te zorgen dat Apple Intelligence op zijn minst nuttig is.