Equivset
Equivset est une librairie pour la détection visuelle de caractères UTF-8 similaires.
Equivset est conçue pour empêcher des abus à travers l'imitation de mots et se concentre principalement sur les lettres et la ponctuation (pas d'emojis ou autres symboles). Elle contient des connections de caractères visuellement identiques des caractères unicode prêtant à confusion comme le latin "A" et le grec "Α" (alpha), tout comme des connections supplémentaires entre caractères visuellement similaires comme "S" et "$"(symbole dollar).
Elle est utilisé dans Wikimédia dans les logiciels AntiSpoof et AbuseFilter pour déterminer si deux caractères sont visuellement similaires.
Données
The library provides its dataset of equivalent set of characters in a standard JSON format and a plain text format (browse files)
It also provides an access library for PHP.