SlideShare una empresa de Scribd logo
1 de 60
Descargar para leer sin conexión
El “arte”del análisis de
          datos:
De las hojas de cálculo a R
                 Juan Freire
           Universidade da Coruña
            http://juanfreire.net/



    Instituto de Humanidades, Artes & Ciências Professor Milton Santos (IHAC)
                                         Universidade Federal da Bahía (UFBA)
                                                                    Abril 2010
¿Para qué el análisis de datos?


• Fuentes de información disponibles
• Hipótesis a priori
• Patrones posibles
http://en.wikipedia.org/wiki/Data_analysis

Analysis of data is a process of inspecting, cleaning,
transforming, and modeling data with the goal of
highlighting useful information, suggesting conclusions,
and supporting decision making. Data analysis has
multiple facets and approaches, encompassing diverse
techniques under a variety of names, in different
business, science, and social science domains.
Texto
                                    Cultural analytics
                                    (Lev Manovich)
Visualization shows 1048576 Manga pages
Each point represents one page

grey points - all pages in the set
red points - all pages corresponding to a single title: Anatolia Story
(artist: Chie Shinohara)

X axis - brightness mean
Y axis - entropy
Antes de iniciar el diseño
    del análisis de datos
  Análisis cuantitativos ... a veces de
  información cualitativa


• Hipótesis
• Exploración de patrones
Fuentes de información

- Unidades de información (casos)
- Contenido (variables)
- Tipos de contenido (codificación):
   cuantitativo
   semi-cuantitativo (ordenado)
   categórico
   1/0
Fases del análisis de datos

a) Diseño de bases de datos: variables
(codificación); casos
b) Exploración de datos - Visualización
c) Depuración de datos: errores, outliers,
redefinición de variables
d) Análisis estadísticos - Visualización
Análisis exploratorio
  Métodos gráficos


• Depuración de datos
• Visualización de patrones: sugerir hipótesis
• Planificar la obtención de nueva información
Gráficos estadísticos
    Visualización de datos cuantitativos


•   Box-plots
•   Histogramas
•   Scatter plots
•   ...
Blox plots
Histogramas
Pareto chart
Scatter plot
Correlation scatter-plot matrix
 for ordered-categorical data
A visualization of thousands of Wikipedia edits that were
made by a single software bot. Each color corresponds to
a different page.
Detección de outliers
An outlier is an observation that lies an abnormal
distance from other values in a random sample
from a population. In a sense, this definition leaves
it up to the analyst (or a consensus process) to
decide what will be considered abnormal. Before
abnormal observations can be singled out, it is
necessary to characterize normal observations.
                  Engeneering Statistics Handbook
Errores / Outliers
Algunos ejemplos de análisis
  de datos y visualización
     científica en arte
Harun Farocki. Deep Play
Harun Farocki – Deep Play
Ben Fry. Cartografías genéticas (Processing)
Ben Fry. Cartografías genéticas. Processing
Análisis y visualización de redes tróficas
Compilation and Network Analyses of
        Cambrian Food Webs




                               Chengjiang Shale




Burgess Shale
East River Valley Trophic Web
Little Rock Lake Trophic Web: Dynamic View 5
Software para análisis de
    datos y visualización

• Bases de datos
• Hojas de cálculo
• Paquetes de gráficos (+ estadística básica)
• Paquetes estadísticos (+visualización +
  lenguaje de programación)
Curvas de aprendizaje

                         R
resultados




                          hoja de cálculo
                          planilha eletrônica



                                tiempo
Sistemas de gestión de
        bases de datos

• OpenOffice.org Base
• Microsoft Office Access
• mySQL
• ...
Holas de cálculo
      (Planilha eletrônica)
• Open Office.org Calc
• Gnumeric
• Microsoft Office Excel
• Google Docs
• ...
http://upload.wikimedia.org/wikipedia/en/2/23/Spreadsheet_animation.gif
OpenOffice.org Calc
Gnumeric
Algunos usos de hojas de
          cálculo

• Gestión e importación de datos
• Tablas de dinámicas
• Correlación y regresión
Sofware estadítico
• SAS: Business Analytics and Business Intelligence
  Software. Windows. $$$$$$$. GUI
• IBM SPSS Statistics (antes: Statistical Package for
  the Social Sciences). Windows, Mac, Linux. $$$.
  GUI
• Statistica. Windows, Mac. $$$. GUI
• R. Software libre. Linux, Mac, Windows. Línea de
  comandos
http://www.r-project.org/
¿Qué es R?

• Lenguaje de programación
• Software libre, gratuito y multiplataforma
• Línea de comandos
• Extensible
• Área de trabajo
Paquetes en R


• Colecciones de funciones, datos y código
• compilado
• formato estandarizado
Extensiones de la interfaz

• Windows, Mac: Tienen una GUI que te deja hacer
  bastantes cosas con menús
• Edición de Scripts:
   • Interno a la GUI
   • Externo: Tinn-R, R-WinEdt, o mediante
     plugins
Tinn-R
ggplot2

Más contenido relacionado

Similar a Análisis de datos desde hojas de cálculo hasta R

Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de DatosLuisAzofeifa6
 
Bibliotecari@s en la ‪Big Data‬
Bibliotecari@s en la ‪Big Data‬Bibliotecari@s en la ‪Big Data‬
Bibliotecari@s en la ‪Big Data‬Fernando-Ariel Lopez
 
La investigación científica metodologias herramientas entornos 2016
La investigación científica metodologias herramientas entornos 2016La investigación científica metodologias herramientas entornos 2016
La investigación científica metodologias herramientas entornos 2016Erla Mariela Morales Morgado
 
Webinario sobre Periodismo de Datos
Webinario sobre Periodismo de DatosWebinario sobre Periodismo de Datos
Webinario sobre Periodismo de DatosSandra Crucianelli
 
Charla big data y data mining para gestión de información y bibliotecas
Charla big data y data mining para gestión de información y bibliotecasCharla big data y data mining para gestión de información y bibliotecas
Charla big data y data mining para gestión de información y bibliotecasFelipe Vera (Prodigio Consultores)
 
Gestión de datos de investigación
Gestión de datos de investigaciónGestión de datos de investigación
Gestión de datos de investigaciónFernando-Ariel Lopez
 
Jornadas data science Centic Info 2017
Jornadas data science Centic Info 2017Jornadas data science Centic Info 2017
Jornadas data science Centic Info 2017Manuel Garrido Peña
 
Semana 9 analisis de los datos
Semana 9 analisis de los datosSemana 9 analisis de los datos
Semana 9 analisis de los datosDiana Parada
 
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...Facultad de Informática UCM
 
1.Unidad1. Fundamentos DataScience.pptx
1.Unidad1. Fundamentos DataScience.pptx1.Unidad1. Fundamentos DataScience.pptx
1.Unidad1. Fundamentos DataScience.pptxRupertoCisneros3
 
Programa 1 semestre bachillerato
Programa 1 semestre bachilleratoPrograma 1 semestre bachillerato
Programa 1 semestre bachilleratoJennifer Montano
 
Sesion21 análisis de contenido
Sesion21 análisis de contenidoSesion21 análisis de contenido
Sesion21 análisis de contenidoGabriel Pérez
 
MINERIA DE DATOS
MINERIA DE DATOSMINERIA DE DATOS
MINERIA DE DATOSLosMorales
 
Sistemas de informacion
Sistemas de informacionSistemas de informacion
Sistemas de informacionRossana Pérez
 

Similar a Análisis de datos desde hojas de cálculo hasta R (20)

Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de Datos
 
Bibliotecari@s en la ‪Big Data‬
Bibliotecari@s en la ‪Big Data‬Bibliotecari@s en la ‪Big Data‬
Bibliotecari@s en la ‪Big Data‬
 
La investigación científica metodologias herramientas entornos 2016
La investigación científica metodologias herramientas entornos 2016La investigación científica metodologias herramientas entornos 2016
La investigación científica metodologias herramientas entornos 2016
 
Webinario sobre Periodismo de Datos
Webinario sobre Periodismo de DatosWebinario sobre Periodismo de Datos
Webinario sobre Periodismo de Datos
 
Charla big data y data mining para gestión de información y bibliotecas
Charla big data y data mining para gestión de información y bibliotecasCharla big data y data mining para gestión de información y bibliotecas
Charla big data y data mining para gestión de información y bibliotecas
 
Bibliometriamineria4mar11
Bibliometriamineria4mar11Bibliometriamineria4mar11
Bibliometriamineria4mar11
 
Gestión de datos de investigación
Gestión de datos de investigaciónGestión de datos de investigación
Gestión de datos de investigación
 
Yatel dm redes
Yatel dm redesYatel dm redes
Yatel dm redes
 
Data mining triptico
Data mining tripticoData mining triptico
Data mining triptico
 
Datamining y Machine Learning para Ciencias Biológicas
Datamining y Machine Learning para Ciencias BiológicasDatamining y Machine Learning para Ciencias Biológicas
Datamining y Machine Learning para Ciencias Biológicas
 
Jornadas data science Centic Info 2017
Jornadas data science Centic Info 2017Jornadas data science Centic Info 2017
Jornadas data science Centic Info 2017
 
Semana 9 analisis de los datos
Semana 9 analisis de los datosSemana 9 analisis de los datos
Semana 9 analisis de los datos
 
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
 
1.Unidad1. Fundamentos DataScience.pptx
1.Unidad1. Fundamentos DataScience.pptx1.Unidad1. Fundamentos DataScience.pptx
1.Unidad1. Fundamentos DataScience.pptx
 
Programa 1 semestre bachillerato
Programa 1 semestre bachilleratoPrograma 1 semestre bachillerato
Programa 1 semestre bachillerato
 
Sie 1-san juan y castillo
Sie 1-san juan y castilloSie 1-san juan y castillo
Sie 1-san juan y castillo
 
Sesion21 análisis de contenido
Sesion21 análisis de contenidoSesion21 análisis de contenido
Sesion21 análisis de contenido
 
MINERIA DE DATOS
MINERIA DE DATOSMINERIA DE DATOS
MINERIA DE DATOS
 
Sistemas de informacion
Sistemas de informacionSistemas de informacion
Sistemas de informacion
 
Técnicas de análisis de datos
Técnicas de análisis de datosTécnicas de análisis de datos
Técnicas de análisis de datos
 

Más de Freire Juan

Trend Lightbox - Análisis de Tendencias
Trend Lightbox - Análisis de TendenciasTrend Lightbox - Análisis de Tendencias
Trend Lightbox - Análisis de TendenciasFreire Juan
 
Taller diseño colectivo Economía creativa en La Laguna
Taller diseño colectivo Economía creativa en La LagunaTaller diseño colectivo Economía creativa en La Laguna
Taller diseño colectivo Economía creativa en La LagunaFreire Juan
 
El nuevo paradigma de la economía creativa
El nuevo paradigma de la economía creativaEl nuevo paradigma de la economía creativa
El nuevo paradigma de la economía creativaFreire Juan
 
Tecnologias sociales y Ecosistemas de aprendizaje (Julio 2013)
Tecnologias sociales y Ecosistemas de aprendizaje (Julio 2013)Tecnologias sociales y Ecosistemas de aprendizaje (Julio 2013)
Tecnologias sociales y Ecosistemas de aprendizaje (Julio 2013)Freire Juan
 
Content_curators_sansebastian_sep11
Content_curators_sansebastian_sep11Content_curators_sansebastian_sep11
Content_curators_sansebastian_sep11Freire Juan
 
limites_tecnologias_sociais_Agora_JUL11
limites_tecnologias_sociais_Agora_JUL11limites_tecnologias_sociais_Agora_JUL11
limites_tecnologias_sociais_Agora_JUL11Freire Juan
 
Estrategias de comunicación para el ciberactivismo
Estrategias de comunicación para el ciberactivismoEstrategias de comunicación para el ciberactivismo
Estrategias de comunicación para el ciberactivismoFreire Juan
 
Universidad medios sociales_jfreire_nov10
Universidad medios sociales_jfreire_nov10Universidad medios sociales_jfreire_nov10
Universidad medios sociales_jfreire_nov10Freire Juan
 
Identidad digital jfreire_oct2010
Identidad digital jfreire_oct2010Identidad digital jfreire_oct2010
Identidad digital jfreire_oct2010Freire Juan
 
Taller Ecología y Procomún (Laboratorio del Procomún, Medialab Prado 10 Feb10)
Taller Ecología y Procomún (Laboratorio del Procomún, Medialab Prado 10 Feb10)Taller Ecología y Procomún (Laboratorio del Procomún, Medialab Prado 10 Feb10)
Taller Ecología y Procomún (Laboratorio del Procomún, Medialab Prado 10 Feb10)Freire Juan
 
Herejías digitales y estrategias institucionales
Herejías digitales y estrategias institucionalesHerejías digitales y estrategias institucionales
Herejías digitales y estrategias institucionalesFreire Juan
 
Cultura digital y ciudad contemporánea
Cultura digital y ciudad contemporáneaCultura digital y ciudad contemporánea
Cultura digital y ciudad contemporáneaFreire Juan
 
Identidad digital
Identidad digitalIdentidad digital
Identidad digitalFreire Juan
 
Visualizando la piel digital de los espacios urbanos. ¿Cómo?, ¿para qué?
Visualizando la piel digital de los espacios urbanos. ¿Cómo?, ¿para qué?Visualizando la piel digital de los espacios urbanos. ¿Cómo?, ¿para qué?
Visualizando la piel digital de los espacios urbanos. ¿Cómo?, ¿para qué?Freire Juan
 
Modelos de gestión para organizaciones abiertas
Modelos de gestión para organizaciones abiertasModelos de gestión para organizaciones abiertas
Modelos de gestión para organizaciones abiertasFreire Juan
 
Sostenibilidad y gestion pesquera
Sostenibilidad y gestion pesqueraSostenibilidad y gestion pesquera
Sostenibilidad y gestion pesqueraFreire Juan
 
Cultura_digital_Edublogs08
Cultura_digital_Edublogs08Cultura_digital_Edublogs08
Cultura_digital_Edublogs08Freire Juan
 
El arte desde la Biología
El arte desde la BiologíaEl arte desde la Biología
El arte desde la BiologíaFreire Juan
 
Cibermedios: presente y futuro
Cibermedios: presente y futuroCibermedios: presente y futuro
Cibermedios: presente y futuroFreire Juan
 
Emprendedores y organizaciones abiertas
Emprendedores y organizaciones abiertasEmprendedores y organizaciones abiertas
Emprendedores y organizaciones abiertasFreire Juan
 

Más de Freire Juan (20)

Trend Lightbox - Análisis de Tendencias
Trend Lightbox - Análisis de TendenciasTrend Lightbox - Análisis de Tendencias
Trend Lightbox - Análisis de Tendencias
 
Taller diseño colectivo Economía creativa en La Laguna
Taller diseño colectivo Economía creativa en La LagunaTaller diseño colectivo Economía creativa en La Laguna
Taller diseño colectivo Economía creativa en La Laguna
 
El nuevo paradigma de la economía creativa
El nuevo paradigma de la economía creativaEl nuevo paradigma de la economía creativa
El nuevo paradigma de la economía creativa
 
Tecnologias sociales y Ecosistemas de aprendizaje (Julio 2013)
Tecnologias sociales y Ecosistemas de aprendizaje (Julio 2013)Tecnologias sociales y Ecosistemas de aprendizaje (Julio 2013)
Tecnologias sociales y Ecosistemas de aprendizaje (Julio 2013)
 
Content_curators_sansebastian_sep11
Content_curators_sansebastian_sep11Content_curators_sansebastian_sep11
Content_curators_sansebastian_sep11
 
limites_tecnologias_sociais_Agora_JUL11
limites_tecnologias_sociais_Agora_JUL11limites_tecnologias_sociais_Agora_JUL11
limites_tecnologias_sociais_Agora_JUL11
 
Estrategias de comunicación para el ciberactivismo
Estrategias de comunicación para el ciberactivismoEstrategias de comunicación para el ciberactivismo
Estrategias de comunicación para el ciberactivismo
 
Universidad medios sociales_jfreire_nov10
Universidad medios sociales_jfreire_nov10Universidad medios sociales_jfreire_nov10
Universidad medios sociales_jfreire_nov10
 
Identidad digital jfreire_oct2010
Identidad digital jfreire_oct2010Identidad digital jfreire_oct2010
Identidad digital jfreire_oct2010
 
Taller Ecología y Procomún (Laboratorio del Procomún, Medialab Prado 10 Feb10)
Taller Ecología y Procomún (Laboratorio del Procomún, Medialab Prado 10 Feb10)Taller Ecología y Procomún (Laboratorio del Procomún, Medialab Prado 10 Feb10)
Taller Ecología y Procomún (Laboratorio del Procomún, Medialab Prado 10 Feb10)
 
Herejías digitales y estrategias institucionales
Herejías digitales y estrategias institucionalesHerejías digitales y estrategias institucionales
Herejías digitales y estrategias institucionales
 
Cultura digital y ciudad contemporánea
Cultura digital y ciudad contemporáneaCultura digital y ciudad contemporánea
Cultura digital y ciudad contemporánea
 
Identidad digital
Identidad digitalIdentidad digital
Identidad digital
 
Visualizando la piel digital de los espacios urbanos. ¿Cómo?, ¿para qué?
Visualizando la piel digital de los espacios urbanos. ¿Cómo?, ¿para qué?Visualizando la piel digital de los espacios urbanos. ¿Cómo?, ¿para qué?
Visualizando la piel digital de los espacios urbanos. ¿Cómo?, ¿para qué?
 
Modelos de gestión para organizaciones abiertas
Modelos de gestión para organizaciones abiertasModelos de gestión para organizaciones abiertas
Modelos de gestión para organizaciones abiertas
 
Sostenibilidad y gestion pesquera
Sostenibilidad y gestion pesqueraSostenibilidad y gestion pesquera
Sostenibilidad y gestion pesquera
 
Cultura_digital_Edublogs08
Cultura_digital_Edublogs08Cultura_digital_Edublogs08
Cultura_digital_Edublogs08
 
El arte desde la Biología
El arte desde la BiologíaEl arte desde la Biología
El arte desde la Biología
 
Cibermedios: presente y futuro
Cibermedios: presente y futuroCibermedios: presente y futuro
Cibermedios: presente y futuro
 
Emprendedores y organizaciones abiertas
Emprendedores y organizaciones abiertasEmprendedores y organizaciones abiertas
Emprendedores y organizaciones abiertas
 

Análisis de datos desde hojas de cálculo hasta R

  • 1. El “arte”del análisis de datos: De las hojas de cálculo a R Juan Freire Universidade da Coruña http://juanfreire.net/ Instituto de Humanidades, Artes & Ciências Professor Milton Santos (IHAC) Universidade Federal da Bahía (UFBA) Abril 2010
  • 2. ¿Para qué el análisis de datos? • Fuentes de información disponibles • Hipótesis a priori • Patrones posibles
  • 3. http://en.wikipedia.org/wiki/Data_analysis Analysis of data is a process of inspecting, cleaning, transforming, and modeling data with the goal of highlighting useful information, suggesting conclusions, and supporting decision making. Data analysis has multiple facets and approaches, encompassing diverse techniques under a variety of names, in different business, science, and social science domains.
  • 4.
  • 5. Texto Cultural analytics (Lev Manovich) Visualization shows 1048576 Manga pages Each point represents one page grey points - all pages in the set red points - all pages corresponding to a single title: Anatolia Story (artist: Chie Shinohara) X axis - brightness mean Y axis - entropy
  • 6.
  • 7.
  • 8. Antes de iniciar el diseño del análisis de datos Análisis cuantitativos ... a veces de información cualitativa • Hipótesis • Exploración de patrones
  • 9. Fuentes de información - Unidades de información (casos) - Contenido (variables) - Tipos de contenido (codificación): cuantitativo semi-cuantitativo (ordenado) categórico 1/0
  • 10. Fases del análisis de datos a) Diseño de bases de datos: variables (codificación); casos b) Exploración de datos - Visualización c) Depuración de datos: errores, outliers, redefinición de variables d) Análisis estadísticos - Visualización
  • 11. Análisis exploratorio Métodos gráficos • Depuración de datos • Visualización de patrones: sugerir hipótesis • Planificar la obtención de nueva información
  • 12. Gráficos estadísticos Visualización de datos cuantitativos • Box-plots • Histogramas • Scatter plots • ...
  • 13.
  • 18.
  • 19. Correlation scatter-plot matrix for ordered-categorical data
  • 20. A visualization of thousands of Wikipedia edits that were made by a single software bot. Each color corresponds to a different page.
  • 21. Detección de outliers An outlier is an observation that lies an abnormal distance from other values in a random sample from a population. In a sense, this definition leaves it up to the analyst (or a consensus process) to decide what will be considered abnormal. Before abnormal observations can be singled out, it is necessary to characterize normal observations. Engeneering Statistics Handbook
  • 22.
  • 24. Algunos ejemplos de análisis de datos y visualización científica en arte
  • 26. Harun Farocki – Deep Play
  • 27.
  • 28.
  • 29. Ben Fry. Cartografías genéticas (Processing)
  • 30.
  • 31.
  • 32. Ben Fry. Cartografías genéticas. Processing
  • 33.
  • 34.
  • 35. Análisis y visualización de redes tróficas
  • 36.
  • 37. Compilation and Network Analyses of Cambrian Food Webs Chengjiang Shale Burgess Shale
  • 38. East River Valley Trophic Web
  • 39. Little Rock Lake Trophic Web: Dynamic View 5
  • 40. Software para análisis de datos y visualización • Bases de datos • Hojas de cálculo • Paquetes de gráficos (+ estadística básica) • Paquetes estadísticos (+visualización + lenguaje de programación)
  • 41. Curvas de aprendizaje R resultados hoja de cálculo planilha eletrônica tiempo
  • 42. Sistemas de gestión de bases de datos • OpenOffice.org Base • Microsoft Office Access • mySQL • ...
  • 43.
  • 44.
  • 45. Holas de cálculo (Planilha eletrônica) • Open Office.org Calc • Gnumeric • Microsoft Office Excel • Google Docs • ...
  • 46.
  • 50. Algunos usos de hojas de cálculo • Gestión e importación de datos • Tablas de dinámicas • Correlación y regresión
  • 51. Sofware estadítico • SAS: Business Analytics and Business Intelligence Software. Windows. $$$$$$$. GUI • IBM SPSS Statistics (antes: Statistical Package for the Social Sciences). Windows, Mac, Linux. $$$. GUI • Statistica. Windows, Mac. $$$. GUI • R. Software libre. Linux, Mac, Windows. Línea de comandos
  • 53.
  • 54. ¿Qué es R? • Lenguaje de programación • Software libre, gratuito y multiplataforma • Línea de comandos • Extensible • Área de trabajo
  • 55. Paquetes en R • Colecciones de funciones, datos y código • compilado • formato estandarizado
  • 56.
  • 57.
  • 58. Extensiones de la interfaz • Windows, Mac: Tienen una GUI que te deja hacer bastantes cosas con menús • Edición de Scripts: • Interno a la GUI • Externo: Tinn-R, R-WinEdt, o mediante plugins

Notas del editor

  1. http://ubergrid.tumblr.com/post/528551058 http://en.wikipedia.org/wiki/The_Wire http://en.wikipedia.org/wiki/Life_on_Mars_(TV_series)
  2. http://lab.softwarestudies.com/ http://www.flickr.com/photos/culturevis/ Manga research: http://lab.softwarestudies.com/2010/02/1000000-manga-pages-visualization.html http://www.flickr.com/photos/culturevis/sets/72157623691111589/
  3. http://www.wired.com/wired/issue/16-07
  4. http://en.wikipedia.org/wiki/File:Black_cherry_tree_histogram.svg
  5. http://www.star.bris.ac.uk/~mbt/topcat/sun253/Cartesian3DWindow.html
  6. http://www.r-statistics.com/2010/04/correlation-scatter-plot-matrix-for-ordered-categorical-data/
  7. http://www.wired.com/science/discoveries/magazine/16-07/pb_visualizing A visualization of thousands of Wikipedia edits that were made by a single software bot. Each color corresponds to a different page. Image: Fernanda B. Viégas, Martin Wattenberg, and Kate Hollenbach
  8. http://www.itl.nist.gov/div898/handbook/eda/section3/scattera.htm http://www.itl.nist.gov/div898/handbook/eda/section3/boxplot.htm
  9. http://www.farocki-film.de/deepeg.htm
  10. http://www.flickr.com/photos/architektur/sets/72157600380226624/
  11. http://www.farocki-film.de/deepeg.htm
  12. http://genome.ucsc.edu/cgi-bin/hgTables
  13. http://benfry.com/aasd/
  14. http://acg.media.mit.edu/people/fry/genocarto.html
  15. http://benfry.com/genomevalence/
  16. http://biology.plosjournals.org/perlserv/?request=get-document&doi=10.1371/journal.pbio.0060102&ct=1
  17. http://biology.plosjournals.org/perlserv/?request=get-document&doi=10.1371/journal.pbio.0060102&ct=1
  18. http://en.wikipedia.org/wiki/Database_management_system http://en.wikipedia.org/wiki/OpenOffice.org_Base
  19. http://www.openoffice.org/product/base.html
  20. http://www.openoffice.org/product/calc.html
  21. http://en.wikipedia.org/wiki/Spreadsheet
  22. http://en.wikipedia.org/wiki/OpenOffice.org_Calc