Des algorithmes d’IA fiables pour détecter les valeurs aberrantes dans les données d’affaires et de génie
Les valeurs aberrantes sont des données considérées comme étant dissemblables et incohérentes par rapport au reste de l’ensemble dont elles font partie. La détection de ces valeurs est un problème de taille en recherche, compte tenu de toutes les utilisations réelles qu’on en fait dans les domaines du génie, des affaires, de la sécurité et de la santé. Les fournisseurs de services Internet, par exemple, utilisent la détection des intrusions – c’est-à-dire des valeurs aberrantes – dans le trafic Internet pour s’attaquer aux menaces de cybersécurité qui les guettent en permanence.De façon similaire, les organismes de réglementation de même que les investisseurs se concentrent sur les actes frauduleux que révèlent ces valeurs, puisque ceux-ci portent grandement atteinte aux entreprises et à la société. Cela dit, la détection des valeurs aberrantes – surtout au sein d’un vaste ensemble de données non structurées incluant du texte et des nombres – est un problème complexe sur le plan informatique et nécessite des solutions novatrices, qui devront surpasser les techniques d’analyse de données habituelles.
En quoi consiste le projet de recherche?
Le professeur Bijan Raahemi, de l’École de gestion Telfer, a obtenu une subvention à la découverte du Conseil de recherches en sciences naturelles et en génie, qu’il utilisera pour étudier, concevoir, analyser et mettre en œuvre des algorithmes d’intelligence artificielle (IA) fiables qui pourront détecter les valeurs aberrantes dans de vastes jeux de données de grande dimension et non structurées. L’architecture proposée aura recours à des techniques émergentes d’incorporation des mots pour convertir du texte en vecteurs d’attributs. Elle utilisera aussi des méthodes de réduction de la dimension et des données (notamment des algorithmes bio-inspirés et évolutionnaires) ainsi qu’un ensemble de modèles avancés d’IA et d’apprentissage automatique. En combinant ces méthodes, le professeur Raahemi espère parvenir à détecter avec rapidité et exactitude les valeurs aberrantes figurant dans une multitude de documents contenant à la fois du texte et des nombres. Il prévoit de faire usage de ces nouvelles méthodes dans le cadre d’applications émergentes utilisées dans les domaines du génie et des affaires pour protéger les organisations publiques et privées contre toute atteinte socio-économique.
Comment ces travaux contribueront-ils à la conception de solutions d’IA fiables et impartiales?
Dans ses travaux, Bijan Raahemi tiendra compte de l’importante question, en recherche, de concevoir des solutions d’IA impartiales, fiables et dignes de confiance. À cette fin, il adoptera une approche en deux temps : 1) les données recueillies et prétraitées seront examinées pour éviter tout parti pris à l’égard d’organisations, de régions ou de groupes minoritaires précis; 2) pour que les résultats de recherche soient fiables et dignes de confiance, ces algorithmes d’IA devront demeurer justes, impartiaux et, autant que possible, explicables.