Blog

Algoritmo de detección de intrusos City Wifi

¿Qué es?
Es un algoritmo desarrollado para detectar a los empleados o usuarios que hagan un uso excesivo o indebido del servicio de City Wifi.
A pesar de que su objetivo principal es detectar empleados, también puede detectar otro tipo de usuarios que no son clientes de la sucursal, a estos últimos los denominamos intrusos.

Intrusos: Usuarios que hacen uso excesivo o indebido del servicio de City Wifi. (Proveedores, vigilantes, vecinos, display’s, etc.)

¿Cómo funciona? Y ¿Por qué funciona? 

El método analiza tres (3) características de un usuario, el horario en el que se conecta, la duración de sus sesiones y la cantidad de días que se conecta en el mes. Cada una de las conexiones del usuario es revisada. Cuando esta presenta comportamientos inusuales en dos de las características antes mencionadas, se considera sospechosa y por ende se le va agregando un peso a los usuarios, el cual al final nos dirá que tan seguros estamos de que ese usuario sea un empleado, si únicamente uno de los parámetros es inusual aún se considera una conexión normal.
Por la naturaleza del comportamiento de un empleado esas 3 características en el comportamiento están relacionadas. Lo cual implica que, si en uno comportamientos falla de manera significativa, es muy probable que exista un mal comportamiento en alguno de los otros dos parámetros.

CANTIDAD DE DÍAS DE CONEXIÓN

Un primer indicador para detectar a un empleado es mediante el número de días que se ha conectado a lo largo del periodo. 
La lógica indica que un empleado que debería de conectarse más días que un cliente, sabiendo esto, se establece un límite que se considere razonable del número de días que un cliente real puede ir a lo largo del periodo. Sin embargo, el límite es distinto para cada negocio, ya sea por su ubicación, el tiempo de público, el giro, etc. Por lo cual hay que automatizar el establecimiento del límite, para eso recurrimos a nuestro método que incluye frecuencias relativas de número de usuarios contra número de días de conexión. Por lo cual nos interesara hasta cuantos días de conexión, se acumula el 95% de los usuarios.

HORARIO DE SERVICIO

Adicionalmente cada posible empleado es revisado mediante su horario en el que está activa su conexión, alguien que se conecta fuera de los horarios en los que el establecimiento está abierto, de inmediato genera sospecha sobre él, de igual manera alguien que se desconecta en un horario donde ya el establecimiento está cerrado. Por lo cual igualmente si alguien inicia y termina su sesión dentro del el horario de servicio será considerado “cliente”, en caso contrario si alguien se conecta o desconecta fuera del horario de servicio será considerado “posible intruso”. Sin embargo el obstáculo con el que nos enfrentamos es determinar cuál es el horario de servicio, ya que esta igualmente varia inclusive de locación a locación aun y cuando ambas pertenezcan a la misma marca. 

Las mediciones que utilizamos para aproximarnos al horario de servicio será el horario de conexión y desconexión de cada una de las conexiones que se tengan en el periodo.

La lógica bajo la que se trabajó esto es considerando que en el horario de servicio deben de haber muchas más conexiones que cuando se está fuera de servicio. Sin embargo hay que tener en cuenta que el servicio siempre está activo y hay muchas conexiones fuera del horario de servicio ya sea de vecinos, proveedores, empleados que se quedan después de horario, etc. Teniendo en cuenta todas estas variantes, consideremos que lo que obtendremos será una aproximación al horario. El algoritmo se diseñó buscando tener el menor sesgo y evitar mucha discrepancia con los horarios reales. 

El algoritmo se explicará por pasos para facilitar el entendimiento del mismo.

Paso 1: Datos requeridos
Se necesitan todas las conexiones de un periodo seleccionado

Paso 2: Dividir el periodo en lapsos cortos de tiempo.

Paso 3: Conexiones, desconexiones y sesiones activas en el periodo.

Paso 4: Sesiones activas en el lapso.

Fórmula registrada por Servicios City Wifi SA de CV

Paso 5: Agrupamiento de conexiones reales

CONE STO APLICAMOS ALGORITMO DE DETECCIÓN

Añadimos las conexiones totales que tuvo en el periodo y la cantidad de días que asistió a la locación. 

ASIGNACIÓN DE PROBABILIDAD.Ahora solo resta ver qué tan probable es que alguien sea un intruso. 
Recordemos que puede haber macs que si sean de verdaderos clientes pero que por distintos motivos tuvieron malas conexiones.

Autores: Noel F. & Ing. Eduardo L. 

Actualizamos nuestro aviso de privacidad. Lo puedes revisar en el siguiente enlace http://citywifi.com.mx/aviso-de-privacidad/