Pinteresque: Algorithmeregister
Inhoudsopgave
1 Antinieuws
Pinteresque gebruikt algorithmes te kust en te keur. Zo gebruikt het om over een verzameling waardes te itereren een for-loop. Dergelijke algorithmes zijn zo voor de hand liggend en weinig interessant als het gaat om betrokkenheid bij het onverwacht of suspect functioneren van Pinteresque, dat we die in dit document niet noemen. Wat wel en wat niet blijft overigens een keuze van de auteur.
2 Algorithmes Selection Automat
- Een stilte van 900ms wordt verondersteld einde tekst te zijn. De bot zal die tekst dan gaan proberen te begrijpen.
- Bij het omzetten van spraak naar tekst wordt vertrouwd op de eerste keuze van de Google Speech to Text API, zie gcptts.
- SOX, zie sox, wordt gebruikt om het audio-contrast te vergroten. Dat is een poging om achtergrondgeluid verder naar de achtergrond te drukken.
- De tekst die de deelnemer uitspreekt wordt door RASA, zie rasa, gematcht tegen het model. Het model bevat mogelijke uitspraken van deelnemers met vervolgvragen van de bot erbij.
- Gepoogd wordt om eigennaam van de menselijke deelnemer te begrijpen zonder de inhoud te kennen, maar als dat niet lukt wordt de veronderstelde naam getoetst tegen een vaste lijst van 20000 in Nederland gebruikte namen.
- De eigennaam van de deelnemer wordt gebruikt om het geslacht te bepalen. Dat geslacht is man of vrouw. Andere vormen worden niet ondersteund. Als een naam zowel bij een man als een vrouw hoort, dan wordt een van de twee mogelijkheden door toeval gekozen.
- Het model is zo gemaakt dat van een deelnemer een aantal aanwijzingen gezocht worden. Alle vragen in het model zijn gericht op het vinden van die aanwijzingen. Als er voldoende zijn, dan wordt het gesprek beëindigd en wordt rapportage opgemaakt. De belangrijkste aanwijzigingen worden eerst uitgevraagd.
De Selection Automat besluit over geschiktheid van de deelnemer als kandidaat voor de genoemde functie. De volgende meetwaardes worden uit het gesprek gehaald:
- \(R\)
- het aantal intrinsieke woorden + 1 gedeeld door het aantal extrensieke woorden + 1. De intrinsieke zijn: ‘ik’, ‘mij’, ‘zelf’ en ‘mezelf’, ‘mijn’. De extrensieke zijn: ‘wij’, ‘zij’, ‘hen’, ‘hun’, ‘hij’, ‘zij’, ‘hullie’, ‘haar’, ‘zijn’ en ‘zullie’.
- \(P\)
- het aantal keren dat een als positief gemarkeerde intent wordt gematcht.
- \(N\)
- het aantal keren dat een als negatief gemarkeerde intent wordt gematcht.
- \(H\)
- het aantal keren dat er een vraag herhaald werd.
- \(L\)
- de leeftijd van de deelnemer (30 indien onbekend).
- \(S\)
- het seconden-deel van de huidige tijd gedeeld door 3 en daar de rest van.
Dan geldt als predicaat voor geschikt (waar) en ongeschikt (onwaar): \[ \bigl( P >= N ∧ H < 6 ∧ R < 5 ∧ L < 44 \bigr) ∨ S = 0 \] De waardes voor P, N, H, R en L worden op het etiket vermeld.
- Op het te dragen etiket worden de achtergrond kleuren groen en rood worden gebruikt voor respectievelijk geschikt en ongeschikt.