Contador gratis

lunes, 29 de noviembre de 2010

Implicaciones éticas de la minería de datos

Creemos que somos dueños de nuestra intimidad, que sólo saben de nosotr@s lo que queremos que sepan, quienes queremos que lo sepan. Parece un trabalenguas, pero eso es lo que pensamos.

Sin embargo, todos tenemos una cuenta de correo electrónico, la tarjeta de puntos del Ikea o del Carrefour, una cuenta de Facebook y una cuenta bancaria on line. Algunas de estas cosas son accesorias, podríamos renunciar a ellas sin demasiado reparo. En cambio, otras nos facilitan mucho la vida. Por ejemplo, estar al día de la evolución de nuestra cuenta corriente es algo muy útil y nos permite evitar ir al banco a hacer algo antes muy habitual, actualizar la cartilla.

Otros elementos ya se han vuelto casi indispensables, como tener una cuenta de correo electrónico.

Y otros nos permiten ahorrarnos unos eurillos, véase tener la tarjeta del Mercadona.

En todos los casos, dar nuestros datos personales parece una cuestión menor, no nos cuesta nada hacerlo. Sin embargo, para las empresas nuestros datos y la actividad que realizamos, reflejada en nuestro historial de llamadas telefónicas, compras realizadas en el supermercado, transacciones económicas efectuadas, etc., supone una información de incalculable valor. Ésta les permite afinar mejor sus campañas de captación de clientes, de publicidad, etc.

Como dice Jorge Franganillo en el artículo que aquí comento y resumo, a las empresas no les interesa saber qué yogur me gusta o qué cantidad de gasolina echo a la semana. No le interesan los datos individuales, sino el conjunto de datos de cientos de miles de consumidores y el análisis de los mismos a través de la llamada "minería de datos", para determinar los hábitos de consumo.

Si queremos usar muchos servicios, no nos queda más remedio que aceptar las cláusulas de uso que imponen las empresas, pero ¿es ético y justo que nuestra intimidad, reflejada en nuestros hábitos de consumo, sea conocida por terceras personas, en este caso empresas? ¿A quién le importa cuál es nuestro champú preferido?

Además, el conocimiento de los mencionados datos puede llevar a realizar actos claramente discriminatorios. Por ejemplo, al saber nuestro código postal, las empresas saben en qué barrio vivimos, con lo que podemos tener más dificultades para conseguir un préstamo.
Un caso menos obvio, y que clarifica cuan sofisticados pueden ser los análisis de las empresas, es el siguiente: en Francia se ha demostrado estadísticamente que los compradores de coches rojos tienen un mayor porcentaje de impago de los préstamos. Por tanto, las personas que quieran comprar un coche rojo, están expuestos, indistintamente, a tener que pagar un tipo de interés mayor que quien adquiere un coche de color negro. No cabe duda de que esto no es justo, se trata de un acto claramente discriminatorio.

Quizá la velocidad a la que va la vida actual no nos deja pararnos a reflexionar. Por ello, artículos como el de Jorge Franganillo son muy saludables, si no para evitar lo inevitable (vivimo en un mundo informatizado, en el que todo queda registrado), al menos sí para entender el mundo que nos rodea.



Nota: el artículo original: Franganillo, Jorge Implicaciones éticas de la minería de datos. Anuario ThinkEPI, 2010, vol. 4, pp. 320-324.

Y si lo nuevo ya estuviera inventado: Dewey de El ciudadano-bibliotecario

Tod@s los que tenemos algún tipo de vinculación con las bibliotecas, sea como profesionales o como usuarios, conocemos esos numeritos que aparecen en el lomo de los libros, en los tejuelos. Forman parte de la Clasificación Decimal Universal o CDU. Desde hace mucho tiempo despreciada, principalmente porque es considerada por muchos una estructura rígida, con una sintaxis poco flexible, o porque es un sistema poco amigable para los clientes de las biblitotecas. Poco a poco, le toman territorio los grupos de interés u otra clase de sistemas de organización más inteligibles por los usuarios. Sin embargo, la CDU sigue ahí, presente mayoritariamente en las bibliotecas públicas.

La clasificación Dewey, análoga de la CDU, fue inventada incluso antes. Lleva con nosotros nada más y nada menos que desde 1876. A pesar de todas las críticas que ha recibido y de todas sus limitaciones, siempre me ha parecido un ingenio maravilloso, unos pocos números que son capaces de compendiar todo el conocimiento humano.
Lo más sorprendente es que a esta conclusión ha llegado Phil Shapiro (articulista de PC World, educador y activista del acceso a la tecnología). En un reciente artículo, comenta los problemas que ha tenido para localizar unidades USB económicas y de 256 mb (suficiente capacidad para el almacenamiento de textos) para jóvenes y adultos con bajos ingresos.
Tardó varios meses en encontrar un proveedor que proporcionaba justo el producto que buscaba. Afirma que si hubiese habido un número de la Clasificación Decimal Dewey relacionado con dicho producto, hubiera encontrado rápidamente el producto que buscaba.

Cree que tendría que crearse una codificación DDC para los contenidos de Internet. Y considera que las entidades adecuadas para crear dicha codificación, de manera participativa, sería la Fundación Wikimedia, junto con American Library Association y la Internet Archive. Y la Fundación Gates podría aportar la financiación de dicho proyecto.

Curiosamente, esta idea le surgió a Phil Shapiro cuando observó a un bibliotecario que había memorizado la Clasificación Decimal Dewey e indicaba con exactitud a los usuarios dónde se localizaban los materiales que querían.

¿Se imaginan algo similar en Internet? Desde luego, está claro que, a pesar de todos los avances en las relaciones semánticas de términos, la capacidad de brevedad y de organización que ofrecen los sistemas numéricos parece todavía inigualable. La verdad es que extrapolar un sistema análogo al Dewey a Internet, es una idea muy atractiva. Yo no acabo de verlo, me parece demasiado complicado, y no sé si práctico. Pero, ¿y si lo nuevo, si el futuro estuviera ya inventado?

Nota: artículo original aparecido en Pcworld, escrito por Phil Shapiro, con fecha de 29 de septiembre.