Le mot du blog : Hin hin hin... Mon plan fonctionne à la perfection. Vous vous souvenez son nouveau micro là ??

C’est un proof of concept assez ouf sur lequel je suis tombé et mis en évidence par Li Zhuang, Feng Zhou et J. D. Tygar de l’université de Berkeley.

Imagine. Quand tu tapes au clavier, ça fait du bruit, des clics, des tics tics tac (rangers du risque). Bref, à chaque fois que tu tapes une lettre, y a un son. Et bien dis toi que des chercheurs ont réussi à mettre au point un algo qui avec un enregistrement audio de 10 minutes est capable de te sortir ce que tu tapes au clavier après 30 minutes d’analyse sur une bécane tout à fait classique. On est bien d’accord, aucune autre liaison entre l’algorithme et ce que tu tapes, autre que le son que ça fait, n’est utilisée. Mais la façon dont ça fonctionne, est awesome.

Comment ça fonctionne ?

En fait c’est presque tout con. En théorie.

Sans forcément rentrer dans les détails de série de Fourniret Fourrier, quand on tape du texte, chaque son produit par la pression d’une touche est stocké pour consultation ultérieure et on lui donne un identifiant qui est propre à l’empreinte de ce son.

Lorsque suffisamment de ces sons sont stockés, on passe alors à l’analyse. Chaque « échantillon » qui compose le son est comparé aux autres, pour voir si il a pas la même gueule à tout hasard. Une fois les associations faites, l’algo regarde quand ils ont été utilisé, et surtout à côté desquels.

Là où ça devient vraiment ouf, c’est maintenant. En appliquant un modèle de Markov (t’inquiète, je savais pas non plus ce que c’était avant de lire l’article ce matin :-)) reliant chaque cause à ses conséquences sous forme de proba, on arrive à savoir a quoi correspond tel et tels son.

Atta, regarde un exemple de schéma :

Atta, un exemple de schéma

Les activité en fonction du temps.

Il y a, d’après ce schéma, 60% de chance qu’il flotte. Or si il pleut, il y a peu de chances que tu ailles dehors pour faire un tour. Par contre les chances sont quasi égales que tu fasses du shopping ou du ménage (c’est ça ouais, j’reste jouer bien au chaud moi, t’as vu ça où ?)

Si il fait beau par contre, il y a très peu de chance que tu fasses du ménage (tu m’étonnes John). Il y a par contre 2 fois plus de chances d’aller faire un tour que d’aller faire du shopping (toujours d’après ce modèle).

Bref tu vois que les activités sont intimement liées (ouuuuh qu’elles sont intimes les liaisons) à leurs contextes. Maintenant, remplace tout ça par des lettres. Genre « Rainy » par un « P », « Walk » par un « F », « Shop » par un « A » et « Clean » par un « E » et t’as un truc pour les lettres.

Cette partie était chiante, vite, une autre que je comprends.

Bah oui, parce que mine de rien dans notre langue, on peut tirer des statistiques. Y a quand même plus de chances qu’un « z » soit suivi d’un « e » que d’un « p »

Donc on a des sons triés (genre 534 de type 1, 322 de type 2… 12 de type 28), par voie de conséquence (MAMAN !!! REGARDE ! J’ai utilisé cette expression une fois dans ma vie !!) on sait à quelle fréquence un type de son revient. Mais aussi on sait QUAND chaque type de son est utilisé. Et oui ! Souviens toi Barbara, on a aussi un son « brut », sans montage ni découpage. Il est donc facile pour l’algo de voire que la 231 eme répétition d’un son de type 1 a eu lieu pour la 25 eme fois derrière un son de type 19 et juste avant un son de type 12 ce dernier étant répéter deux fois. Coïncidence ? JE NE CROIS PAS !

Phase finale et décryptage

On peut donc, enfin l’algo avec une bécane qui mouline par ce que nous avec un crayon et du papier on va vite se faire chier, commencer à décrypter ce bordel en comparant ça avec des statistiques lexicales (du style analyse d’un dictionnaire : Genre le type 1 là ça a tout l’air d’être une voyelle). A cela, il est possible d’ajouté un vérificateur d’orthographe et ou un schéma du clavier utilisé (azerty, qwerty ou autre) pour encore plus de précision en analysant le temps entre chaque pression le bordel est capable de mapper le clavier. A l’oreille.

Finalement, ce truc ça à tout l’air d’être un accordeur quoi. Je suis sous le charme du concept.

Bref, tout ça pour dire qu’un jour, il suffira de laisser traîner un micro pour savoir tout ce qui a été tapé sur une bécane. HEUREUSEMENT on nous dit que ces recherches servent aussi la cause de la reconnaissance vocale.

Ouf, nous voilà rassurés.

Via et le doc de pres’ des chercheurs qui est absolument passionnant mais en Anglais ou tu apprends que le taux de mots reconnus est de 75 à 90%. Et qu’au bout d’une heure le truc est capable de chopper les mots de passe avec des caractères aléatoires. Et donc qu’on est dans la merde.

4 commentaires

  1. MonsieurBlah dit :

    Je suis bluffé, ça doit être l’article le plus sérieux que tu aies fait.

    Au delà de la forme, le fond est passionnant. Je ne suis jamais à court d’algorithme prodigieux et autres découvertes du genre.

    J’adore, tout simplement.

  2. banjod dit :

    il y a même une méthode encore plus flipante, parceque là 30 minutes c’est trop long 🙂
    récupérer les émissions électro magnétiques pour recomposer ce qui est tapé sur un ordi dans un rayon de 20 mètres !
    http://www.korben.info/espionnage-de-clavier-a-distance-ci-possible.html

  3. iTonio dit :

    Idem que banjod, j’ai tout de suite pensé à l’autre méthode.

    Il serait intéressant de savoir si le truc est assez doué pour les claviers tactiles comme sur iPad qui font tout de suite beaucoup moins de bruit, ou du moins j’aurai tendance à dire à 99% le même pour chaque lettre. Et du coup ça me fait penser à cet autre concept de transformer n’importe quelle surface en surface tactile en analysant le son produit par chaque endroit de la surface (ouais faut taper partout au début pour le calibrer ^^) je sais plus comment ça s’appelle, c’est ptet toi qui l’a bloggué y a longtemps d’ailleurs, oh putain je divague (vague).

  4. Eric dit :

    @MonsieurBlah : Merci M’sieur 😉
    @Banjod et iTonio : Oui alors moi aussi hein j’ai pensé à ça. Sauf que depuis que les LCD bah les émanations électro magnétiques sont moins puissantes et on donc une portée moindre. Pour le truc du clavier mis en évidence par Banjod, j’avais jamais entendu parlé de ça. C’tassez dingue ouais O_0

    Quoi qu’il en soit, c’qui m’épate dans la méthode que je décris dans l’article, c’pas la praticité (c’est clair qu’on est loin de pouvoir utiliser ça dans un cas concret) mais la façon dont ça fonctionne.

Commenter






1 + = cinq

Page optimized by WP Minify WordPress Plugin