Ciencia Abierta

La intersección entre Ciencia y Código Libre

Jesús M. Castagnetto, Ph.D.
Universidad Peruana Cayetano Heredia

Agenda

  • La Ciencia, su metodología y filosofía
  • Ciencia y Código Libre/Abierto
  • Tendencias
    • Acceso Abierto (Open Access)
    • Ciencia Abierta (Open Science)
    • Investigación Reproducible (Reproducible Research)

Ciencia - Definición

La actividad intelectual y práctica que involucra el estudio sistemático de la estructura y comportamiento del universo, a través de la observación y experimentación.

Método científico

  1. Observación objetiva (mediciones y datos)
  2. Formulación del problema (considerar la evidencia)
  3. Generación de Hipótesis (explicar lo observado)
  4. Derivación de Predicciones cuantificables
  5. Experimentación/Prueba (basado en la predicción)
  6. Análisis de los resultados (escrutinio y valoración)

La Ciencia no nos da la verdad absoluta, la ciencia es un mecanismo. Es un modo de mejorar nuestro conocimiento de la naturaleza, un sistema para contrastar nuestros pensamientos con el universo y ver si coinciden.

Isaac Asimoc

Hipótesis científica

  • Provee una explicación de los fenómenos observados, la cual tiene que se comprobada fehacientemente.
  • Idealmente tiene que:
    • Poder explicar fenómenos futuros (poder predictivo)
    • Evitar la complejidad excesiva y sin razón ("Navaja de Occam")
    • Ser cuantificable y comprobable
    • Tener un alcance definido

El cuento de la oveja negra

Tres amigos estaban viajando en un tren: un abogado, un físico y un matemático.

  • El abogado vió por la ventana y dijo: "Las ovejas de esta región son negras"
  • El físico dijo: "No, eso es incorrecto: algunas ovejas de esta región son negras"
  • El matemático, algo molesto dijo: "Hay al menos un campo en esta región, conteniendo al menos una oveja, la cual tiene al menos un lado de color negro"

Teoría científica

  • Una explicación comprobada de algún aspecto de la naturaleza.
  • La comprobación debe haber sido repetida y repetible en forma independiente, a través de la observación y la experimentación.
  • Puede hacer predicciones que pueden ser probadas falsas (falsificable/falseable)
  • Es consistente con teorías científicas pre-existentes.

Falseabilidad en Ciencia

  • Un concepto central: la inherente posibilidad de comprobar (experimentalmente) que una afirmación (hipótesis o teoría) acerca del comportamiento de la naturaleza, resulta ser falsa
  • En su forma menos dura: "la afirmación resulta ser incompleta"
  • Esto implica que los científicos tienen que estar dispuestos a aceptar teorías nuevas que expliquen mejor lo observado

Toda la Ciencia es incierta y sujeta a revisión. Lo glorioso de la ciencia es el (poder) imaginar mas de lo que podemos probar.

Freeman Dyson

Ciencia \(\iff\) Código Libre

El quehacer científico

  • El trabajo en Ciencia es inherentemente colaborativo
  • Implica compartir libremente lo aprendido
  • Uso de un lenguaje común, concreto y preciso
  • Experiencia resumida en un conjunto de teorías
  • Muchas comunidades pero los mismos objetivos
  • Se fundamenta en la meritocracia

Discusión abierta

  • Revisión crítica de resultados, hipótesis y teorías
  • Revisión de (tus) publicaciones por (tus) pares
  • Mecanismos para la retracción de publicaciones
  • Objetividad y pragmatismo como presupuestos

Mejoras continuas

  • Los avances se basan en conocimiento pre-existente
  • Refinamiento de hipótesis y teorías, frente a nuevos resultados
  • Avances (y retrocesos) en investigación interdisciplinaria
  • Ocasionalmente, cambios paradigmáticos

La Ciencia es una forma de pensar mucho mas que un conjunto de conocimientos acumulados.

Carl Sagan

Acceso Abierto (Open Access)

Inicios de Acceso Abierto

Definición de Acceso Abierto

\(\ldots\)Por 'acceso abierto'\(\ldots\)queremos decir su disponibilidad gratuita en Internet público, permitiendo a cualquier usuario leer, descargar, copiar, distribuir, imprimir, buscar o usarlos con cualquier propósito legal, sin ninguna barrera financiera, legal o técnica\(\ldots\)

Definición de Budapest (2002)

Copyright en Acceso Abierto

\(\ldots\)La única limitación en cuanto a reproducción y distribución y el único rol del copyright en este dominio, deberá ser dar a los autores el control sobre la integridad de sus trabajos y el derecho de ser adecuadamente reconocidos y citados\(\ldots\)

Definición de Budapest (2002)

Acceso Abierto

  • Acceso en línea, libre, inmediato y permamente a toda la información científica y técnica que se publica.
  • Incluye: artículos en revistas, libros, bases de datos, etc.
  • Favorece a todos: Autores, Instituciones y al Público en General
  • Un movimiento que comenzó hace una década (~2003)
  • Ha pasado a ser el modo aceptable y aceptado de publicar

Publicando en Acceso Abierto

PLOS (http://www.plos.org/)

PLOS

BMJ (http://www.bmj.com/)

BMJ

La importancia de Acceso Abierto

Ciencia Abierta (Open Science)

¿Que es "Ciencia Abierta"?

  • Un término general que incluye
    • Publicar en Acceso Abierto
    • Conducir investigación en forma abierta al estilo de los proyectos de Código Libre/Abierto (Open Research)
    • Mantener los registros primarios de la investigación en forma pública (Open Notebook Science)

The Synaptic Leap

  • Un espacio para las comunidades que activamente hacen investigación biomédica
  • Comunidades
    • Malaria
    • Esquistosomiasis
    • Tuberculosis
    • Toxoplasmosis
  • Basado en Drupal
  • URL: http://www.thesynapticleap.org

Open Wetware

  • "OpenWetWare is an effort to promote the sharing of information, know-how, and wisdom among researchers and groups who are working in biology & biological engineering."
  • "Cuadernos" de laboratorio electrónicos, abiertos a todo el mundo
  • Basado en Mediawiki
  • URL: http://openwetware.org

Las "reglas" de la Ciencia Abierta

  1. Todos los datos son abiertos y las ideas se comparten
  2. Cualquier persona puede participar en cualquier nivel del proyecto
  3. No habrán patentes
  4. Las sugerencias son las mejor forma de criticar
  5. La discusión pública es mucho más valiosa que las comunicaciones privadas
  6. El proyecto es mas grande que, y no es de propiedad de, un laboratorio en particular. El objetivo es encontrar una cura, por cualquier medio, tan pronto como sea posible.

Open Source Malaria (OSM)

  • Comunidad internacional abierta, con el objetivo de encontrar una cura para la malaria
  • No importa tu nivel de conocimiento o experiencia, lo que importa es que quieras ayudar
  • Ejemplo de Open Source Drug Discovery
  • URL: http://opensourcemalaria.org/

Labtrove

  • Aplicativo web que permite a los investigadores el compartir directamente, sus planes experimentales, pensamientos, observaciones, y resultados con una amplia comunidad en línea, en una forma semáticamente rica y extensible.
  • Hecho por la Universidad de Southampton
  • URL: http://www.labtrove.org/
  • Código: http://sourceforge.net/projects/labtrove/

OSM Blog

OSM Blog

Open Science Framework

Center for Open Science

Center for Open Science @ github

figshare (http://figshare.com)

figshare

DRYAD (http://datadryad.org/)

DRYAD

Otros recursos y referencias

Investigación Reproducible

(Reproducible Research)

Objetivo

  • El poder reproducir en su totalidad investigación publicada, para poder entenderla mejor y verificarla.
  • Implica el tener acceso a:
    • Los datos experimentales (crudos y/o procesados)
    • El flujo de trabajo de proceso de los datos
    • Los algoritmos y transformaciones empleadas
    • El software empleado para el análisis

El "espectro" de reproducibilidad

Reproducibility Spectrum

(Roger Peng)

Como se está implementando

  • Publicación de datos, código e instrucciones (ej. en github)
  • Software empleado:
    • R: para el análisis de datos
    • \(\LaTeX\) y/o Markdown: para la documentación
    • knitr: para integrar documentación y código (\(\LaTeX\) + R)
    • slidify: Markdown + R a HTML
    • RStudio: Markdown o \(\LaTeX\) + R
    • git: control de versiones

Markdown + Math (\(\LaTeX\))

$$
\begin{align}
\dot{x} & = \sigma(y-x) \\
\dot{y} & = \rho x - y - xz \\
\dot{z} & = -\beta z + xy
\end{align}
$$

\[ \begin{align} \dot{x} & = \sigma(y-x) \\ \dot{y} & = \rho x - y - xz \\ \dot{z} & = -\beta z + xy \end{align} \]

Markdown + R

library(ggplot2)
library(ggthemes)
qplot(wt, mpg, data = mtcars) + theme_solarized()

plot of chunk scplot

Recursos y referencias

One thing I have learned in a long life: that all our science, measured against reality, is primitive and childlike — and yet it is the most precious thing we have.

Albert Einstein

¡Muchas Gracias!